+ deepspeed --num_nodes=1 --num_gpus=7 --master_port 30423 --module safe_rlhf.values.reward --train_datasets harmless-rlhf:1 helpful-rlhf hh-harmless-curated --eval_datasets '' --model_name_or_path /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh --max_length 512 --trust_remote_code False --loss_type sequence-wise --epochs 2 --per_device_train_batch_size 6 --per_device_eval_batch_size 6 --gradient_accumulation_steps 3 --gradient_checkpointing --learning_rate 2e-5 --lr_scheduler_type cosine --num_warmup_steps 8 --weight_decay 0.1 --seed 42 --eval_strategy epoch --output_dir /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/reward/llama-7b_hh --log_type tensorboard --log_project Safe-RLHF-RM --zero_stage 2 --bf16 True --save_16bit
2024-03-21 23:26:20.449944: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-21 23:26:20.528826: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-21 23:26:20.613257: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-21 23:26:20.617807: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-21 23:26:20.622665: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-21 23:26:20.692260: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-21 23:26:20.702846: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Filter:   0%|                                  | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/42537 [00:00<?, ? examples/s]Filter:  54%|█████████▋        | 23000/42537 [00:00<00:00, 216827.13 examples/s]Filter:  52%|█████████▎        | 22000/42537 [00:00<00:00, 208275.73 examples/s]Filter:  49%|████████▉         | 21000/42537 [00:00<00:00, 207902.00 examples/s]Filter:  49%|████████▉         | 21000/42537 [00:00<00:00, 202807.20 examples/s]Filter:  52%|█████████▎        | 22000/42537 [00:00<00:00, 204660.10 examples/s]Filter:  49%|████████▉         | 21000/42537 [00:00<00:00, 203599.93 examples/s]Filter:  49%|████████▉         | 21000/42537 [00:00<00:00, 200287.84 examples/s]Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 218818.09 examples/s]
Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 210403.98 examples/s]
Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 211951.21 examples/s]
Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 209425.71 examples/s]
Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 207823.45 examples/s]
Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 207565.62 examples/s]Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 205624.18 examples/s]
Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 204622.84 examples/s]Filter: 100%|██████████████████| 42537/42537 [00:00<00:00, 202312.26 examples/s]
Filter:   0%|                                  | 0/43835 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/43835 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/43835 [00:00<?, ? examples/s]Filter:  50%|█████████         | 22000/43835 [00:00<00:00, 207677.60 examples/s]Filter:  50%|█████████         | 22000/43835 [00:00<00:00, 203354.37 examples/s]Filter:  50%|█████████         | 22000/43835 [00:00<00:00, 207478.21 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 210812.18 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 208818.66 examples/s]
Filter:   0%|                                  | 0/43835 [00:00<?, ? examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 206112.15 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 204196.74 examples/s]
Filter:   0%|                                  | 0/43835 [00:00<?, ? examples/s]Filter:   0%|                                  | 0/43835 [00:00<?, ? examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 209048.84 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 207359.43 examples/s]
Filter:   0%|                                  | 0/43835 [00:00<?, ? examples/s]Filter:  52%|█████████▍        | 23000/43835 [00:00<00:00, 215856.80 examples/s]Filter:  50%|█████████         | 22000/43835 [00:00<00:00, 203455.25 examples/s]Filter:  50%|█████████         | 22000/43835 [00:00<00:00, 205895.37 examples/s]Filter:  48%|████████▌         | 21000/43835 [00:00<00:00, 193213.82 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 216579.95 examples/s]
Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 208126.49 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 205840.00 examples/s]
Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 209139.46 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 206853.65 examples/s]
Filter:  98%|█████████████████▋| 43000/43835 [00:00<00:00, 199844.67 examples/s]Filter: 100%|██████████████████| 43835/43835 [00:00<00:00, 197131.35 examples/s]
Filter:   0%|                                     | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████| 87/87 [00:00<00:00, 35551.88 examples/s]
Filter:   0%|                                     | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████| 87/87 [00:00<00:00, 34227.98 examples/s]
Filter:   0%|                                     | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████| 87/87 [00:00<00:00, 34151.09 examples/s]
Filter:   0%|                                     | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████| 87/87 [00:00<00:00, 32794.50 examples/s]
Filter:   0%|                                     | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████| 87/87 [00:00<00:00, 33070.91 examples/s]
Filter:   0%|                                     | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████| 87/87 [00:00<00:00, 32951.46 examples/s]
Filter:   0%|                                     | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████| 87/87 [00:00<00:00, 32229.68 examples/s]
Preprocessing raw dataset...:   0%|                   | 0/86398 [00:00<?, ?it/s]Preprocessing raw dataset...:   0%|         | 41/86398 [00:00<03:31, 408.49it/s]Preprocessing raw dataset...:   0%|         | 82/86398 [00:00<03:36, 399.27it/s]Preprocessing raw dataset...:   0%|        | 122/86398 [00:00<03:38, 395.55it/s]Preprocessing raw dataset...:   0%|        | 162/86398 [00:00<03:46, 380.97it/s]Preprocessing raw dataset...:   0%|        | 201/86398 [00:00<03:46, 380.77it/s]Preprocessing raw dataset...:   0%|        | 247/86398 [00:00<03:33, 404.28it/s]Preprocessing raw dataset...:   0%|        | 292/86398 [00:00<03:25, 418.16it/s]Preprocessing raw dataset...:   0%|        | 337/86398 [00:00<03:21, 427.67it/s]Preprocessing raw dataset...:   0%|        | 381/86398 [00:00<03:20, 428.28it/s]Preprocessing raw dataset...:   0%|        | 426/86398 [00:01<03:20, 429.44it/s]Preprocessing raw dataset...:   1%|        | 469/86398 [00:01<03:27, 414.33it/s]Preprocessing raw dataset...:   1%|        | 511/86398 [00:01<03:39, 391.54it/s]Preprocessing raw dataset...:   1%|        | 551/86398 [00:01<03:40, 389.28it/s]Preprocessing raw dataset...:   1%|        | 592/86398 [00:01<03:37, 394.00it/s]Preprocessing raw dataset...:   1%|        | 638/86398 [00:01<03:27, 412.62it/s]Preprocessing raw dataset...:   1%|        | 680/86398 [00:01<03:33, 400.69it/s]Preprocessing raw dataset...:   1%|        | 726/86398 [00:01<03:25, 416.55it/s]Preprocessing raw dataset...:   1%|        | 768/86398 [00:01<03:26, 413.84it/s]Preprocessing raw dataset...:   1%|        | 810/86398 [00:01<03:29, 408.78it/s]Preprocessing raw dataset...:   1%|        | 851/86398 [00:02<03:32, 403.09it/s]Preprocessing raw dataset...:   1%|        | 892/86398 [00:02<03:46, 377.66it/s]Preprocessing raw dataset...:   1%|        | 939/86398 [00:02<03:32, 402.76it/s]Preprocessing raw dataset...:   1%|        | 984/86398 [00:02<03:28, 410.10it/s]Preprocessing raw dataset...:   1%|       | 1026/86398 [00:02<03:35, 396.80it/s]Preprocessing raw dataset...:   1%|       | 1066/86398 [00:02<03:36, 393.89it/s]Preprocessing raw dataset...:   1%|       | 1106/86398 [00:02<03:36, 394.38it/s]Preprocessing raw dataset...:   1%|       | 1157/86398 [00:02<03:21, 423.06it/s]Preprocessing raw dataset...:   1%|       | 1200/86398 [00:02<03:31, 403.77it/s]Preprocessing raw dataset...:   1%|       | 1248/86398 [00:03<03:23, 419.14it/s]Preprocessing raw dataset...:   1%|       | 1291/86398 [00:03<03:25, 413.73it/s]Preprocessing raw dataset...:   2%|       | 1336/86398 [00:03<03:20, 423.80it/s]Preprocessing raw dataset...:   2%|       | 1379/86398 [00:03<03:33, 398.57it/s]Preprocessing raw dataset...:   2%|       | 1422/86398 [00:03<03:30, 404.26it/s]Preprocessing raw dataset...:   2%|       | 1463/86398 [00:03<03:35, 394.93it/s]Preprocessing raw dataset...:   2%|       | 1513/86398 [00:03<03:20, 424.21it/s]Preprocessing raw dataset...:   2%|▏      | 1556/86398 [00:03<03:20, 422.26it/s]Preprocessing raw dataset...:   2%|▏      | 1603/86398 [00:03<03:16, 432.62it/s]Preprocessing raw dataset...:   2%|▏      | 1647/86398 [00:04<03:25, 413.24it/s]Preprocessing raw dataset...:   2%|▏      | 1693/86398 [00:04<03:18, 425.74it/s]Preprocessing raw dataset...:   2%|▏      | 1736/86398 [00:04<03:21, 420.51it/s]Preprocessing raw dataset...:   2%|▏      | 1782/86398 [00:04<03:18, 425.31it/s]Preprocessing raw dataset...:   2%|▏      | 1836/86398 [00:04<03:04, 457.75it/s]Preprocessing raw dataset...:   2%|▏      | 1882/86398 [00:04<03:23, 415.18it/s]Preprocessing raw dataset...:   2%|▏      | 1927/86398 [00:04<03:18, 424.59it/s]Preprocessing raw dataset...:   2%|▏      | 1971/86398 [00:04<03:21, 418.96it/s]Preprocessing raw dataset...:   2%|▏      | 2014/86398 [00:04<03:23, 414.72it/s]Preprocessing raw dataset...:   2%|▏      | 2056/86398 [00:05<03:39, 384.65it/s]Preprocessing raw dataset...:   2%|▏      | 2102/86398 [00:05<03:28, 403.41it/s]Preprocessing raw dataset...:   2%|▏      | 2145/86398 [00:05<03:25, 409.94it/s]Preprocessing raw dataset...:   3%|▏      | 2187/86398 [00:05<03:34, 392.22it/s]Preprocessing raw dataset...:   3%|▏      | 2236/86398 [00:05<03:21, 418.52it/s]Preprocessing raw dataset...:   3%|▏      | 2279/86398 [00:05<03:24, 410.52it/s]Preprocessing raw dataset...:   3%|▏      | 2323/86398 [00:05<03:21, 418.01it/s]Preprocessing raw dataset...:   3%|▏      | 2370/86398 [00:05<03:14, 432.66it/s]Preprocessing raw dataset...:   3%|▏      | 2414/86398 [00:05<03:33, 392.82it/s]Preprocessing raw dataset...:   3%|▏      | 2455/86398 [00:06<03:36, 388.44it/s]Preprocessing raw dataset...:   3%|▏      | 2497/86398 [00:06<03:31, 396.05it/s]Preprocessing raw dataset...:   3%|▏      | 2538/86398 [00:06<03:30, 398.43it/s]Preprocessing raw dataset...:   3%|▏      | 2584/86398 [00:06<03:22, 412.93it/s]Preprocessing raw dataset...:   3%|▏      | 2626/86398 [00:06<03:22, 414.08it/s]Preprocessing raw dataset...:   3%|▏      | 2671/86398 [00:06<03:17, 424.07it/s]Preprocessing raw dataset...:   3%|▏      | 2721/86398 [00:06<03:08, 442.74it/s]Preprocessing raw dataset...:   3%|▏      | 2766/86398 [00:06<03:12, 435.14it/s]Preprocessing raw dataset...:   3%|▏      | 2810/86398 [00:06<03:11, 436.24it/s]Preprocessing raw dataset...:   3%|▏      | 2854/86398 [00:06<03:29, 399.28it/s]Preprocessing raw dataset...:   3%|▏      | 2901/86398 [00:07<03:19, 418.51it/s]Preprocessing raw dataset...:   3%|▏      | 2944/86398 [00:07<03:22, 413.08it/s]Preprocessing raw dataset...:   3%|▏      | 2986/86398 [00:07<03:25, 405.72it/s]Preprocessing raw dataset...:   4%|▏      | 3035/86398 [00:07<03:14, 428.87it/s]Preprocessing raw dataset...:   4%|▏      | 3079/86398 [00:07<03:15, 426.02it/s]Preprocessing raw dataset...:   4%|▎      | 3124/86398 [00:07<03:13, 429.90it/s]Preprocessing raw dataset...:   4%|▎      | 3172/86398 [00:07<03:11, 434.29it/s]Preprocessing raw dataset...:   4%|▎      | 3219/86398 [00:07<03:08, 442.26it/s]Preprocessing raw dataset...:   4%|▎      | 3264/86398 [00:07<03:08, 442.14it/s]Preprocessing raw dataset...:   4%|▎      | 3319/86398 [00:07<02:56, 470.49it/s]Preprocessing raw dataset...:   4%|▎      | 3367/86398 [00:08<03:10, 435.29it/s]Preprocessing raw dataset...:   4%|▎      | 3414/86398 [00:08<03:06, 444.41it/s]Preprocessing raw dataset...:   4%|▎      | 3459/86398 [00:08<03:15, 423.87it/s]Preprocessing raw dataset...:   4%|▎      | 3505/86398 [00:08<03:12, 430.49it/s]Preprocessing raw dataset...:   4%|▎      | 3555/86398 [00:08<03:04, 448.62it/s]Preprocessing raw dataset...:   4%|▎      | 3601/86398 [00:08<03:06, 443.38it/s]Preprocessing raw dataset...:   4%|▎      | 3646/86398 [00:08<03:13, 427.01it/s]Preprocessing raw dataset...:   4%|▎      | 3689/86398 [00:08<03:18, 416.39it/s]Preprocessing raw dataset...:   4%|▎      | 3737/86398 [00:08<03:10, 433.28it/s]Preprocessing raw dataset...:   4%|▎      | 3782/86398 [00:09<03:10, 433.06it/s]Preprocessing raw dataset...:   4%|▎      | 3826/86398 [00:09<03:22, 407.13it/s]Preprocessing raw dataset...:   4%|▎      | 3868/86398 [00:09<03:25, 401.12it/s]Preprocessing raw dataset...:   5%|▎      | 3913/86398 [00:09<03:19, 413.26it/s]Preprocessing raw dataset...:   5%|▎      | 3955/86398 [00:09<03:26, 398.54it/s]Preprocessing raw dataset...:   5%|▎      | 3998/86398 [00:09<03:23, 404.58it/s]Preprocessing raw dataset...:   5%|▎      | 4047/86398 [00:09<03:12, 428.82it/s]Preprocessing raw dataset...:   5%|▎      | 4095/86398 [00:09<03:06, 442.21it/s]Preprocessing raw dataset...:   5%|▎      | 4140/86398 [00:09<03:11, 429.33it/s]Preprocessing raw dataset...:   5%|▎      | 4184/86398 [00:10<03:11, 429.10it/s]Preprocessing raw dataset...:   5%|▎      | 4232/86398 [00:10<03:11, 428.40it/s]Preprocessing raw dataset...:   5%|▎      | 4279/86398 [00:10<03:06, 439.48it/s]Preprocessing raw dataset...:   5%|▎      | 4329/86398 [00:10<03:02, 450.57it/s]Preprocessing raw dataset...:   5%|▎      | 4375/86398 [00:10<03:04, 444.26it/s]Preprocessing raw dataset...:   5%|▎      | 4427/86398 [00:10<02:56, 464.42it/s]Preprocessing raw dataset...:   5%|▎      | 4474/86398 [00:10<03:00, 454.66it/s]Preprocessing raw dataset...:   5%|▎      | 4522/86398 [00:10<02:58, 459.89it/s]Preprocessing raw dataset...:   5%|▎      | 4569/86398 [00:10<03:04, 443.65it/s]Preprocessing raw dataset...:   5%|▎      | 4614/86398 [00:11<03:05, 441.04it/s]Preprocessing raw dataset...:   5%|▍      | 4659/86398 [00:11<03:08, 432.56it/s]Preprocessing raw dataset...:   5%|▍      | 4703/86398 [00:11<03:11, 425.52it/s]Preprocessing raw dataset...:   5%|▍      | 4747/86398 [00:11<03:10, 428.80it/s]Preprocessing raw dataset...:   6%|▍      | 4795/86398 [00:11<03:05, 440.31it/s]Preprocessing raw dataset...:   6%|▍      | 4840/86398 [00:11<03:07, 434.40it/s]Preprocessing raw dataset...:   6%|▍      | 4884/86398 [00:11<03:09, 430.78it/s]Preprocessing raw dataset...:   6%|▍      | 4928/86398 [00:11<03:08, 433.30it/s]Preprocessing raw dataset...:   6%|▍      | 4972/86398 [00:11<03:09, 430.67it/s]Preprocessing raw dataset...:   6%|▍      | 5016/86398 [00:11<03:14, 418.19it/s]Preprocessing raw dataset...:   6%|▍      | 5058/86398 [00:12<03:16, 413.92it/s]Preprocessing raw dataset...:   6%|▍      | 5100/86398 [00:12<03:34, 378.90it/s]Preprocessing raw dataset...:   6%|▍      | 5139/86398 [00:12<03:38, 372.18it/s]Preprocessing raw dataset...:   6%|▍      | 5180/86398 [00:12<03:33, 381.05it/s]Preprocessing raw dataset...:   6%|▍      | 5222/86398 [00:12<03:27, 391.06it/s]Preprocessing raw dataset...:   6%|▍      | 5264/86398 [00:12<03:23, 398.25it/s]Preprocessing raw dataset...:   6%|▍      | 5307/86398 [00:12<03:21, 403.21it/s]Preprocessing raw dataset...:   6%|▍      | 5351/86398 [00:12<03:18, 409.20it/s]Preprocessing raw dataset...:   6%|▍      | 5393/86398 [00:12<03:16, 412.09it/s]Preprocessing raw dataset...:   6%|▍      | 5435/86398 [00:13<03:21, 400.90it/s]Preprocessing raw dataset...:   6%|▍      | 5476/86398 [00:13<03:22, 398.72it/s]Preprocessing raw dataset...:   6%|▍      | 5518/86398 [00:13<03:20, 403.91it/s]Preprocessing raw dataset...:   6%|▍      | 5560/86398 [00:13<03:19, 406.04it/s]Preprocessing raw dataset...:   6%|▍      | 5601/86398 [00:13<08:09, 165.20it/s]Preprocessing raw dataset...:   7%|▍      | 5645/86398 [00:14<06:34, 204.47it/s]Preprocessing raw dataset...:   7%|▍      | 5682/86398 [00:14<05:46, 232.65it/s]Preprocessing raw dataset...:   7%|▍      | 5718/86398 [00:14<05:17, 254.30it/s]Preprocessing raw dataset...:   7%|▍      | 5763/86398 [00:14<04:32, 296.44it/s]Preprocessing raw dataset...:   7%|▍      | 5807/86398 [00:14<04:04, 330.05it/s]Preprocessing raw dataset...:   7%|▍      | 5848/86398 [00:14<03:50, 350.02it/s]Preprocessing raw dataset...:   7%|▍      | 5892/86398 [00:14<03:36, 372.59it/s]Preprocessing raw dataset...:   7%|▍      | 5933/86398 [00:14<03:32, 378.33it/s]Preprocessing raw dataset...:   7%|▍      | 5974/86398 [00:14<03:29, 383.92it/s]Preprocessing raw dataset...:   7%|▍      | 6019/86398 [00:14<03:20, 400.20it/s]Preprocessing raw dataset...:   7%|▍      | 6066/86398 [00:15<03:13, 415.91it/s]Preprocessing raw dataset...:   7%|▍      | 6109/86398 [00:15<03:15, 411.08it/s]Preprocessing raw dataset...:   7%|▍      | 6151/86398 [00:15<03:18, 403.42it/s]Preprocessing raw dataset...:   7%|▌      | 6193/86398 [00:15<03:16, 407.78it/s]Preprocessing raw dataset...:   7%|▌      | 6238/86398 [00:15<03:11, 418.26it/s]Preprocessing raw dataset...:   7%|▌      | 6281/86398 [00:15<03:10, 420.68it/s]Preprocessing raw dataset...:   7%|▌      | 6324/86398 [00:15<03:11, 418.67it/s]Preprocessing raw dataset...:   7%|▌      | 6368/86398 [00:15<03:08, 424.28it/s]Preprocessing raw dataset...:   7%|▌      | 6413/86398 [00:15<03:06, 427.82it/s]Preprocessing raw dataset...:   7%|▌      | 6461/86398 [00:15<03:00, 443.06it/s]Preprocessing raw dataset...:   8%|▌      | 6506/86398 [00:16<03:07, 425.21it/s]Preprocessing raw dataset...:   8%|▌      | 6549/86398 [00:16<03:24, 390.04it/s]Preprocessing raw dataset...:   8%|▌      | 6593/86398 [00:16<03:19, 400.52it/s]Preprocessing raw dataset...:   8%|▌      | 6634/86398 [00:16<03:30, 379.61it/s]Preprocessing raw dataset...:   8%|▌      | 6676/86398 [00:16<03:24, 390.39it/s]Preprocessing raw dataset...:   8%|▌      | 6716/86398 [00:16<03:24, 390.27it/s]Preprocessing raw dataset...:   8%|▌      | 6759/86398 [00:16<03:19, 399.84it/s]Preprocessing raw dataset...:   8%|▌      | 6800/86398 [00:16<03:18, 401.82it/s]Preprocessing raw dataset...:   8%|▌      | 6841/86398 [00:16<03:17, 401.81it/s]Preprocessing raw dataset...:   8%|▌      | 6882/86398 [00:17<03:27, 382.40it/s]Preprocessing raw dataset...:   8%|▌      | 6923/86398 [00:17<03:24, 388.83it/s]Preprocessing raw dataset...:   8%|▌      | 6963/86398 [00:17<03:30, 378.23it/s]Preprocessing raw dataset...:   8%|▌      | 7007/86398 [00:17<03:21, 394.08it/s]Preprocessing raw dataset...:   8%|▌      | 7047/86398 [00:17<03:22, 391.74it/s]Preprocessing raw dataset...:   8%|▌      | 7089/86398 [00:17<03:18, 399.74it/s]Preprocessing raw dataset...:   8%|▌      | 7130/86398 [00:17<03:30, 376.40it/s]Preprocessing raw dataset...:   8%|▌      | 7178/86398 [00:17<03:15, 404.45it/s]Preprocessing raw dataset...:   8%|▌      | 7219/86398 [00:17<03:18, 398.84it/s]Preprocessing raw dataset...:   8%|▌      | 7267/86398 [00:18<03:08, 419.81it/s]Preprocessing raw dataset...:   8%|▌      | 7310/86398 [00:18<03:17, 400.47it/s]Preprocessing raw dataset...:   9%|▌      | 7351/86398 [00:18<03:18, 397.72it/s]Preprocessing raw dataset...:   9%|▌      | 7393/86398 [00:18<03:18, 398.22it/s]Preprocessing raw dataset...:   9%|▌      | 7433/86398 [00:18<03:20, 393.86it/s]Preprocessing raw dataset...:   9%|▌      | 7481/86398 [00:18<03:10, 415.09it/s]Preprocessing raw dataset...:   9%|▌      | 7523/86398 [00:18<03:23, 387.49it/s]Preprocessing raw dataset...:   9%|▌      | 7563/86398 [00:18<03:25, 383.59it/s]Preprocessing raw dataset...:   9%|▌      | 7604/86398 [00:18<03:21, 390.44it/s]Preprocessing raw dataset...:   9%|▌      | 7649/86398 [00:19<03:13, 406.68it/s]Preprocessing raw dataset...:   9%|▌      | 7690/86398 [00:19<03:19, 394.83it/s]Preprocessing raw dataset...:   9%|▋      | 7730/86398 [00:19<03:21, 389.47it/s]Preprocessing raw dataset...:   9%|▋      | 7770/86398 [00:19<03:26, 379.89it/s]Preprocessing raw dataset...:   9%|▋      | 7810/86398 [00:19<03:24, 385.05it/s]Preprocessing raw dataset...:   9%|▋      | 7856/86398 [00:19<03:13, 405.46it/s]Preprocessing raw dataset...:   9%|▋      | 7905/86398 [00:19<03:03, 428.46it/s]Preprocessing raw dataset...:   9%|▋      | 7949/86398 [00:19<03:04, 424.53it/s]Preprocessing raw dataset...:   9%|▋      | 7992/86398 [00:19<03:08, 415.45it/s]Preprocessing raw dataset...:   9%|▋      | 8034/86398 [00:19<03:18, 394.84it/s]Preprocessing raw dataset...:   9%|▋      | 8074/86398 [00:20<03:20, 391.47it/s]Preprocessing raw dataset...:   9%|▋      | 8118/86398 [00:20<03:13, 404.97it/s]Preprocessing raw dataset...:   9%|▋      | 8159/86398 [00:20<03:21, 387.77it/s]Preprocessing raw dataset...:   9%|▋      | 8201/86398 [00:20<03:19, 391.88it/s]Preprocessing raw dataset...:  10%|▋      | 8241/86398 [00:20<03:19, 391.02it/s]Preprocessing raw dataset...:  10%|▋      | 8281/86398 [00:20<03:27, 377.32it/s]Preprocessing raw dataset...:  10%|▋      | 8325/86398 [00:20<03:17, 394.54it/s]Preprocessing raw dataset...:  10%|▋      | 8375/86398 [00:20<03:04, 422.93it/s]Preprocessing raw dataset...:  10%|▋      | 8418/86398 [00:20<03:11, 406.40it/s]Preprocessing raw dataset...:  10%|▋      | 8459/86398 [00:21<03:13, 402.98it/s]Preprocessing raw dataset...:  10%|▋      | 8500/86398 [00:21<03:23, 382.78it/s]Preprocessing raw dataset...:  10%|▋      | 8544/86398 [00:21<03:15, 398.20it/s]Preprocessing raw dataset...:  10%|▋      | 8585/86398 [00:21<03:15, 398.64it/s]Preprocessing raw dataset...:  10%|▋      | 8626/86398 [00:21<03:18, 391.41it/s]Preprocessing raw dataset...:  10%|▋      | 8672/86398 [00:21<03:09, 409.89it/s]Preprocessing raw dataset...:  10%|▋      | 8714/86398 [00:21<03:22, 382.96it/s]Preprocessing raw dataset...:  10%|▋      | 8753/86398 [00:21<03:24, 380.35it/s]Preprocessing raw dataset...:  10%|▋      | 8792/86398 [00:21<03:28, 371.51it/s]Preprocessing raw dataset...:  10%|▋      | 8839/86398 [00:22<03:15, 397.38it/s]Preprocessing raw dataset...:  10%|▋      | 8880/86398 [00:22<03:23, 380.71it/s]Preprocessing raw dataset...:  10%|▋      | 8924/86398 [00:22<03:15, 395.59it/s]Preprocessing raw dataset...:  10%|▋      | 8964/86398 [00:22<03:17, 392.58it/s]Preprocessing raw dataset...:  10%|▋      | 9004/86398 [00:22<03:24, 377.91it/s]Preprocessing raw dataset...:  10%|▋      | 9043/86398 [00:22<03:29, 369.94it/s]Preprocessing raw dataset...:  11%|▋      | 9081/86398 [00:22<03:29, 369.15it/s]Preprocessing raw dataset...:  11%|▋      | 9130/86398 [00:22<03:13, 400.03it/s]Preprocessing raw dataset...:  11%|▋      | 9171/86398 [00:22<03:22, 381.22it/s]Preprocessing raw dataset...:  11%|▋      | 9214/86398 [00:22<03:17, 391.29it/s]Preprocessing raw dataset...:  11%|▋      | 9254/86398 [00:23<03:28, 369.40it/s]Preprocessing raw dataset...:  11%|▊      | 9300/86398 [00:23<03:15, 393.48it/s]Preprocessing raw dataset...:  11%|▊      | 9340/86398 [00:23<03:28, 369.16it/s]Preprocessing raw dataset...:  11%|▊      | 9378/86398 [00:23<03:31, 363.34it/s]Preprocessing raw dataset...:  11%|▊      | 9422/86398 [00:23<03:20, 383.71it/s]Preprocessing raw dataset...:  11%|▊      | 9461/86398 [00:23<03:32, 362.82it/s]Preprocessing raw dataset...:  11%|▊      | 9499/86398 [00:23<03:29, 366.43it/s]Preprocessing raw dataset...:  11%|▊      | 9548/86398 [00:23<03:11, 400.79it/s]Preprocessing raw dataset...:  11%|▊      | 9591/86398 [00:23<03:08, 406.86it/s]Preprocessing raw dataset...:  11%|▊      | 9633/86398 [00:24<03:19, 384.42it/s]Preprocessing raw dataset...:  11%|▊      | 9679/86398 [00:24<03:10, 403.67it/s]Preprocessing raw dataset...:  11%|▊      | 9720/86398 [00:24<03:23, 377.22it/s]Preprocessing raw dataset...:  11%|▊      | 9759/86398 [00:24<03:24, 374.95it/s]Preprocessing raw dataset...:  11%|▊      | 9803/86398 [00:24<03:15, 391.48it/s]Preprocessing raw dataset...:  11%|▊      | 9843/86398 [00:24<03:36, 353.14it/s]Preprocessing raw dataset...:  11%|▊      | 9888/86398 [00:24<03:23, 375.23it/s]Preprocessing raw dataset...:  12%|▊      | 9939/86398 [00:24<03:06, 410.25it/s]Preprocessing raw dataset...:  12%|▊      | 9982/86398 [00:24<03:03, 415.47it/s]Preprocessing raw dataset...:  12%|▋     | 10025/86398 [00:25<03:12, 395.84it/s]Preprocessing raw dataset...:  12%|▋     | 10066/86398 [00:25<03:13, 394.99it/s]Preprocessing raw dataset...:  12%|▋     | 10106/86398 [00:25<03:13, 393.40it/s]Preprocessing raw dataset...:  12%|▋     | 10150/86398 [00:25<03:08, 404.53it/s]Preprocessing raw dataset...:  12%|▋     | 10191/86398 [00:25<03:08, 404.35it/s]Preprocessing raw dataset...:  12%|▋     | 10232/86398 [00:25<03:16, 387.36it/s]Preprocessing raw dataset...:  12%|▋     | 10275/86398 [00:25<03:11, 396.96it/s]Preprocessing raw dataset...:  12%|▋     | 10315/86398 [00:25<03:12, 394.98it/s]Preprocessing raw dataset...:  12%|▋     | 10355/86398 [00:25<03:15, 389.66it/s]Preprocessing raw dataset...:  12%|▋     | 10395/86398 [00:26<03:30, 361.02it/s]Preprocessing raw dataset...:  12%|▋     | 10434/86398 [00:26<03:26, 367.25it/s]Preprocessing raw dataset...:  12%|▋     | 10474/86398 [00:26<03:23, 373.18it/s]Preprocessing raw dataset...:  12%|▋     | 10520/86398 [00:26<03:12, 394.37it/s]Preprocessing raw dataset...:  12%|▋     | 10563/86398 [00:26<03:08, 402.92it/s]Preprocessing raw dataset...:  12%|▋     | 10604/86398 [00:26<03:10, 397.34it/s]Preprocessing raw dataset...:  12%|▋     | 10650/86398 [00:26<03:03, 412.45it/s]Preprocessing raw dataset...:  12%|▋     | 10692/86398 [00:26<03:03, 413.62it/s]Preprocessing raw dataset...:  12%|▋     | 10734/86398 [00:26<03:14, 388.94it/s]Preprocessing raw dataset...:  12%|▋     | 10774/86398 [00:27<03:15, 386.85it/s]Preprocessing raw dataset...:  13%|▊     | 10813/86398 [00:27<03:21, 374.38it/s]Preprocessing raw dataset...:  13%|▊     | 10854/86398 [00:27<03:17, 382.85it/s]Preprocessing raw dataset...:  13%|▊     | 10901/86398 [00:27<03:05, 407.25it/s]Preprocessing raw dataset...:  13%|▊     | 10942/86398 [00:27<03:08, 401.35it/s]Preprocessing raw dataset...:  13%|▊     | 10983/86398 [00:27<03:07, 401.71it/s]Preprocessing raw dataset...:  13%|▊     | 11024/86398 [00:27<03:08, 400.62it/s]Preprocessing raw dataset...:  13%|▊     | 11066/86398 [00:27<03:06, 403.70it/s]Preprocessing raw dataset...:  13%|▊     | 11107/86398 [00:27<03:12, 390.42it/s]Preprocessing raw dataset...:  13%|▊     | 11154/86398 [00:27<03:04, 408.91it/s]Preprocessing raw dataset...:  13%|▊     | 11196/86398 [00:28<03:11, 393.58it/s]Preprocessing raw dataset...:  13%|▊     | 11237/86398 [00:28<03:09, 397.20it/s]Preprocessing raw dataset...:  13%|▊     | 11280/86398 [00:28<03:05, 406.04it/s]Preprocessing raw dataset...:  13%|▊     | 11321/86398 [00:28<03:09, 397.16it/s]Preprocessing raw dataset...:  13%|▊     | 11361/86398 [00:28<03:23, 368.20it/s]Preprocessing raw dataset...:  13%|▊     | 11399/86398 [00:28<03:24, 365.94it/s]Preprocessing raw dataset...:  13%|▊     | 11441/86398 [00:28<03:18, 377.66it/s]Preprocessing raw dataset...:  13%|▊     | 11480/86398 [00:28<03:16, 380.62it/s]Preprocessing raw dataset...:  13%|▊     | 11521/86398 [00:28<03:13, 387.91it/s]Preprocessing raw dataset...:  13%|▊     | 11566/86398 [00:29<03:04, 404.52it/s]Preprocessing raw dataset...:  13%|▊     | 11615/86398 [00:29<02:54, 427.47it/s]Preprocessing raw dataset...:  13%|▊     | 11658/86398 [00:29<03:03, 407.39it/s]Preprocessing raw dataset...:  14%|▊     | 11703/86398 [00:29<03:00, 414.53it/s]Preprocessing raw dataset...:  14%|▊     | 11745/86398 [00:29<03:03, 407.36it/s]Preprocessing raw dataset...:  14%|▊     | 11787/86398 [00:29<03:02, 409.21it/s]Preprocessing raw dataset...:  14%|▊     | 11829/86398 [00:29<03:05, 403.06it/s]Preprocessing raw dataset...:  14%|▊     | 11870/86398 [00:29<03:11, 388.19it/s]Preprocessing raw dataset...:  14%|▊     | 11913/86398 [00:29<03:07, 397.23it/s]Preprocessing raw dataset...:  14%|▊     | 11956/86398 [00:29<03:03, 405.92it/s]Preprocessing raw dataset...:  14%|▊     | 12011/86398 [00:30<02:48, 440.48it/s]Preprocessing raw dataset...:  14%|▊     | 12056/86398 [00:30<02:54, 425.39it/s]Preprocessing raw dataset...:  14%|▊     | 12099/86398 [00:30<03:10, 389.82it/s]Preprocessing raw dataset...:  14%|▊     | 12140/86398 [00:30<03:08, 393.49it/s]Preprocessing raw dataset...:  14%|▊     | 12183/86398 [00:30<03:04, 402.55it/s]Preprocessing raw dataset...:  14%|▊     | 12225/86398 [00:30<03:02, 406.58it/s]Preprocessing raw dataset...:  14%|▊     | 12269/86398 [00:30<02:59, 413.80it/s]Preprocessing raw dataset...:  14%|▊     | 12315/86398 [00:30<02:53, 426.77it/s]Preprocessing raw dataset...:  14%|▊     | 12358/86398 [00:30<02:59, 412.72it/s]Preprocessing raw dataset...:  14%|▊     | 12400/86398 [00:31<03:01, 406.94it/s]Preprocessing raw dataset...:  14%|▊     | 12441/86398 [00:31<03:10, 387.76it/s]Preprocessing raw dataset...:  14%|▊     | 12488/86398 [00:31<03:00, 409.14it/s]Preprocessing raw dataset...:  15%|▊     | 12532/86398 [00:31<02:58, 413.26it/s]Preprocessing raw dataset...:  15%|▊     | 12574/86398 [00:31<03:01, 406.01it/s]Preprocessing raw dataset...:  15%|▉     | 12615/86398 [00:31<03:09, 388.79it/s]Preprocessing raw dataset...:  15%|▉     | 12660/86398 [00:31<03:01, 405.47it/s]Preprocessing raw dataset...:  15%|▉     | 12701/86398 [00:31<03:02, 403.90it/s]Preprocessing raw dataset...:  15%|▉     | 12747/86398 [00:31<02:55, 418.96it/s]Preprocessing raw dataset...:  15%|▉     | 12790/86398 [00:32<03:02, 404.27it/s]Preprocessing raw dataset...:  15%|▉     | 12831/86398 [00:32<03:08, 389.78it/s]Preprocessing raw dataset...:  15%|▉     | 12875/86398 [00:32<03:03, 399.73it/s]Preprocessing raw dataset...:  15%|▉     | 12916/86398 [00:32<03:12, 381.26it/s]Preprocessing raw dataset...:  15%|▉     | 12957/86398 [00:32<03:10, 386.02it/s]Preprocessing raw dataset...:  15%|▉     | 13000/86398 [00:32<03:04, 397.30it/s]Preprocessing raw dataset...:  15%|▉     | 13047/86398 [00:32<02:56, 416.05it/s]Preprocessing raw dataset...:  15%|▉     | 13091/86398 [00:32<02:54, 420.14it/s]Preprocessing raw dataset...:  15%|▉     | 13145/86398 [00:32<02:42, 449.79it/s]Preprocessing raw dataset...:  15%|▉     | 13191/86398 [00:33<02:54, 420.27it/s]Preprocessing raw dataset...:  15%|▉     | 13234/86398 [00:33<03:04, 395.96it/s]Preprocessing raw dataset...:  15%|▉     | 13275/86398 [00:33<03:04, 396.11it/s]Preprocessing raw dataset...:  15%|▉     | 13318/86398 [00:33<03:00, 404.43it/s]Preprocessing raw dataset...:  15%|▉     | 13359/86398 [00:33<03:06, 391.29it/s]Preprocessing raw dataset...:  16%|▉     | 13399/86398 [00:33<03:13, 377.90it/s]Preprocessing raw dataset...:  16%|▉     | 13441/86398 [00:33<03:07, 388.16it/s]Preprocessing raw dataset...:  16%|▉     | 13485/86398 [00:33<03:01, 402.58it/s]Preprocessing raw dataset...:  16%|▉     | 13526/86398 [00:33<03:12, 379.14it/s]Preprocessing raw dataset...:  16%|▉     | 13565/86398 [00:34<03:15, 372.74it/s]Preprocessing raw dataset...:  16%|▉     | 13603/86398 [00:34<03:27, 350.55it/s]Preprocessing raw dataset...:  16%|▉     | 13643/86398 [00:34<03:20, 363.66it/s]Preprocessing raw dataset...:  16%|▉     | 13683/86398 [00:34<03:15, 372.29it/s]Preprocessing raw dataset...:  16%|▉     | 13725/86398 [00:34<03:09, 382.73it/s]Preprocessing raw dataset...:  16%|▉     | 13764/86398 [00:34<03:23, 357.77it/s]Preprocessing raw dataset...:  16%|▉     | 13802/86398 [00:34<03:20, 361.71it/s]Preprocessing raw dataset...:  16%|▉     | 13839/86398 [00:34<03:25, 353.32it/s]Preprocessing raw dataset...:  16%|▉     | 13877/86398 [00:34<03:22, 358.94it/s]Preprocessing raw dataset...:  16%|▉     | 13922/86398 [00:34<03:08, 383.75it/s]Preprocessing raw dataset...:  16%|▉     | 13966/86398 [00:35<03:01, 399.59it/s]Preprocessing raw dataset...:  16%|▉     | 14012/86398 [00:35<02:53, 416.19it/s]Preprocessing raw dataset...:  16%|▉     | 14062/86398 [00:35<02:45, 438.28it/s]Preprocessing raw dataset...:  16%|▉     | 14106/86398 [00:35<02:47, 431.63it/s]Preprocessing raw dataset...:  16%|▉     | 14150/86398 [00:35<02:58, 405.26it/s]Preprocessing raw dataset...:  16%|▉     | 14191/86398 [00:35<02:58, 404.15it/s]Preprocessing raw dataset...:  16%|▉     | 14232/86398 [00:35<02:57, 405.63it/s]Preprocessing raw dataset...:  17%|▉     | 14273/86398 [00:35<03:04, 391.07it/s]Preprocessing raw dataset...:  17%|▉     | 14320/86398 [00:35<02:56, 407.91it/s]Preprocessing raw dataset...:  17%|▉     | 14361/86398 [00:36<03:00, 399.79it/s]Preprocessing raw dataset...:  17%|█     | 14410/86398 [00:36<02:49, 424.56it/s]Preprocessing raw dataset...:  17%|█     | 14453/86398 [00:36<03:01, 395.74it/s]Preprocessing raw dataset...:  17%|█     | 14494/86398 [00:36<03:02, 394.23it/s]Preprocessing raw dataset...:  17%|█     | 14534/86398 [00:36<03:06, 384.61it/s]Preprocessing raw dataset...:  17%|█     | 14573/86398 [00:36<03:25, 349.97it/s]Preprocessing raw dataset...:  17%|█     | 14609/86398 [00:36<03:27, 345.47it/s]Preprocessing raw dataset...:  17%|█     | 14645/86398 [00:36<03:26, 347.79it/s]Preprocessing raw dataset...:  17%|█     | 14682/86398 [00:36<03:24, 351.31it/s]Preprocessing raw dataset...:  17%|█     | 14718/86398 [00:37<03:26, 346.69it/s]Preprocessing raw dataset...:  17%|█     | 14753/86398 [00:37<03:27, 345.72it/s]Preprocessing raw dataset...:  17%|█     | 14799/86398 [00:37<03:10, 376.17it/s]Preprocessing raw dataset...:  17%|█     | 14837/86398 [00:37<03:14, 368.66it/s]Preprocessing raw dataset...:  17%|█     | 14889/86398 [00:37<02:54, 410.40it/s]Preprocessing raw dataset...:  17%|█     | 14936/86398 [00:37<02:47, 426.11it/s]Preprocessing raw dataset...:  17%|█     | 14983/86398 [00:37<02:43, 436.68it/s]Preprocessing raw dataset...:  17%|█     | 15027/86398 [00:37<02:46, 429.69it/s]Preprocessing raw dataset...:  17%|█     | 15071/86398 [00:37<02:58, 399.66it/s]Preprocessing raw dataset...:  17%|█     | 15112/86398 [00:37<03:00, 395.61it/s]Preprocessing raw dataset...:  18%|█     | 15163/86398 [00:38<02:46, 426.81it/s]Preprocessing raw dataset...:  18%|█     | 15207/86398 [00:38<02:46, 426.48it/s]Preprocessing raw dataset...:  18%|█     | 15250/86398 [00:38<02:54, 406.84it/s]Preprocessing raw dataset...:  18%|█     | 15292/86398 [00:38<03:04, 385.24it/s]Preprocessing raw dataset...:  18%|█     | 15331/86398 [00:38<03:07, 378.62it/s]Preprocessing raw dataset...:  18%|█     | 15370/86398 [00:38<03:06, 380.08it/s]Preprocessing raw dataset...:  18%|█     | 15417/86398 [00:38<02:55, 403.90it/s]Preprocessing raw dataset...:  18%|█     | 15458/86398 [00:38<03:01, 391.29it/s]Preprocessing raw dataset...:  18%|█     | 15505/86398 [00:38<02:53, 408.21it/s]Preprocessing raw dataset...:  18%|█     | 15547/86398 [00:39<02:56, 402.42it/s]Preprocessing raw dataset...:  18%|█     | 15588/86398 [00:39<03:05, 381.01it/s]Preprocessing raw dataset...:  18%|█     | 15627/86398 [00:39<03:10, 371.49it/s]Preprocessing raw dataset...:  18%|█     | 15674/86398 [00:39<02:57, 397.74it/s]Preprocessing raw dataset...:  18%|█     | 15718/86398 [00:39<02:53, 406.84it/s]Preprocessing raw dataset...:  18%|█     | 15759/86398 [00:39<02:54, 404.38it/s]Preprocessing raw dataset...:  18%|█     | 15805/86398 [00:39<02:48, 417.91it/s]Preprocessing raw dataset...:  18%|█     | 15847/86398 [00:39<02:50, 414.84it/s]Preprocessing raw dataset...:  18%|█     | 15889/86398 [00:39<02:53, 407.01it/s]Preprocessing raw dataset...:  18%|█     | 15933/86398 [00:40<02:50, 414.07it/s]Preprocessing raw dataset...:  18%|█     | 15982/86398 [00:40<02:41, 434.75it/s]Preprocessing raw dataset...:  19%|█     | 16026/86398 [00:40<02:48, 417.61it/s]Preprocessing raw dataset...:  19%|█     | 16068/86398 [00:40<03:04, 380.96it/s]Preprocessing raw dataset...:  19%|█     | 16114/86398 [00:40<02:55, 399.80it/s]Preprocessing raw dataset...:  19%|█     | 16155/86398 [00:40<03:02, 385.14it/s]Preprocessing raw dataset...:  19%|█     | 16194/86398 [00:40<03:02, 384.36it/s]Preprocessing raw dataset...:  19%|█▏    | 16237/86398 [00:40<02:57, 395.31it/s]Preprocessing raw dataset...:  19%|█▏    | 16284/86398 [00:40<02:49, 414.80it/s]Preprocessing raw dataset...:  19%|█▏    | 16327/86398 [00:41<02:47, 417.34it/s]Preprocessing raw dataset...:  19%|█▏    | 16369/86398 [00:41<02:50, 411.01it/s]Preprocessing raw dataset...:  19%|█▏    | 16411/86398 [00:41<02:56, 396.54it/s]Preprocessing raw dataset...:  19%|█▏    | 16451/86398 [00:41<02:59, 388.88it/s]Preprocessing raw dataset...:  19%|█▏    | 16491/86398 [00:41<03:09, 368.98it/s]Preprocessing raw dataset...:  19%|█▏    | 16534/86398 [00:41<03:01, 385.11it/s]Preprocessing raw dataset...:  19%|█▏    | 16575/86398 [00:41<02:58, 391.85it/s]Preprocessing raw dataset...:  19%|█▏    | 16616/86398 [00:41<02:56, 395.43it/s]Preprocessing raw dataset...:  19%|█▏    | 16661/86398 [00:41<02:50, 409.46it/s]Preprocessing raw dataset...:  19%|█▏    | 16703/86398 [00:41<02:53, 401.28it/s]Preprocessing raw dataset...:  19%|█▏    | 16744/86398 [00:42<02:56, 394.74it/s]Preprocessing raw dataset...:  19%|█▏    | 16785/86398 [00:42<02:55, 397.60it/s]Preprocessing raw dataset...:  19%|█▏    | 16829/86398 [00:42<02:50, 409.13it/s]Preprocessing raw dataset...:  20%|█▏    | 16873/86398 [00:42<02:50, 407.04it/s]Preprocessing raw dataset...:  20%|█▏    | 16916/86398 [00:42<02:47, 413.61it/s]Preprocessing raw dataset...:  20%|█▏    | 16960/86398 [00:42<02:44, 421.02it/s]Preprocessing raw dataset...:  20%|█▏    | 17003/86398 [00:42<02:52, 401.54it/s]Preprocessing raw dataset...:  20%|█▏    | 17044/86398 [00:42<02:54, 397.39it/s]Preprocessing raw dataset...:  20%|█▏    | 17086/86398 [00:42<02:52, 401.17it/s]Preprocessing raw dataset...:  20%|█▏    | 17127/86398 [00:43<02:52, 402.23it/s]Preprocessing raw dataset...:  20%|█▏    | 17168/86398 [00:43<02:53, 398.61it/s]Preprocessing raw dataset...:  20%|█▏    | 17214/86398 [00:43<02:46, 415.26it/s]Preprocessing raw dataset...:  20%|█▏    | 17256/86398 [00:43<02:46, 414.99it/s]Preprocessing raw dataset...:  20%|█▏    | 17298/86398 [00:43<02:49, 408.20it/s]Preprocessing raw dataset...:  20%|█▏    | 17340/86398 [00:43<02:48, 410.53it/s]Preprocessing raw dataset...:  20%|█▏    | 17385/86398 [00:43<02:44, 419.97it/s]Preprocessing raw dataset...:  20%|█▏    | 17429/86398 [00:43<02:43, 421.58it/s]Preprocessing raw dataset...:  20%|█▏    | 17472/86398 [00:43<03:00, 381.25it/s]Preprocessing raw dataset...:  20%|█▏    | 17511/86398 [00:43<03:04, 373.50it/s]Preprocessing raw dataset...:  20%|█▏    | 17558/86398 [00:44<02:52, 399.22it/s]Preprocessing raw dataset...:  20%|█▏    | 17599/86398 [00:44<02:55, 392.28it/s]Preprocessing raw dataset...:  20%|█▏    | 17640/86398 [00:44<02:53, 396.72it/s]Preprocessing raw dataset...:  20%|█▏    | 17682/86398 [00:44<02:50, 402.28it/s]Preprocessing raw dataset...:  21%|█▏    | 17723/86398 [00:44<02:51, 400.42it/s]Preprocessing raw dataset...:  21%|█▏    | 17764/86398 [00:44<02:54, 393.83it/s]Preprocessing raw dataset...:  21%|█▏    | 17804/86398 [00:44<03:05, 369.27it/s]Preprocessing raw dataset...:  21%|█▏    | 17846/86398 [00:44<03:00, 380.17it/s]Preprocessing raw dataset...:  21%|█▏    | 17885/86398 [00:44<03:04, 371.00it/s]Preprocessing raw dataset...:  21%|█▏    | 17925/86398 [00:45<03:00, 378.32it/s]Preprocessing raw dataset...:  21%|█▏    | 17964/86398 [00:45<03:08, 363.95it/s]Preprocessing raw dataset...:  21%|█▎    | 18001/86398 [00:45<03:08, 362.86it/s]Preprocessing raw dataset...:  21%|█▎    | 18039/86398 [00:45<03:08, 362.73it/s]Preprocessing raw dataset...:  21%|█▎    | 18080/86398 [00:45<03:01, 376.14it/s]Preprocessing raw dataset...:  21%|█▎    | 18120/86398 [00:45<02:58, 382.72it/s]Preprocessing raw dataset...:  21%|█▎    | 18159/86398 [00:45<02:59, 380.54it/s]Preprocessing raw dataset...:  21%|█▎    | 18198/86398 [00:45<03:10, 357.61it/s]Preprocessing raw dataset...:  21%|█▎    | 18237/86398 [00:45<03:06, 365.54it/s]Preprocessing raw dataset...:  21%|█▎    | 18274/86398 [00:46<03:18, 343.49it/s]Preprocessing raw dataset...:  21%|█▎    | 18309/86398 [00:46<03:22, 336.56it/s]Preprocessing raw dataset...:  21%|█▎    | 18353/86398 [00:46<03:07, 362.67it/s]Preprocessing raw dataset...:  21%|█▎    | 18392/86398 [00:46<03:04, 368.46it/s]Preprocessing raw dataset...:  21%|█▎    | 18434/86398 [00:46<02:58, 381.47it/s]Preprocessing raw dataset...:  21%|█▎    | 18476/86398 [00:46<02:55, 387.47it/s]Preprocessing raw dataset...:  21%|█▎    | 18516/86398 [00:46<02:53, 390.61it/s]Preprocessing raw dataset...:  21%|█▎    | 18556/86398 [00:46<03:07, 362.57it/s]Preprocessing raw dataset...:  22%|█▎    | 18595/86398 [00:46<03:03, 370.09it/s]Preprocessing raw dataset...:  22%|█▎    | 18640/86398 [00:46<02:53, 390.70it/s]Preprocessing raw dataset...:  22%|█▎    | 18680/86398 [00:47<02:54, 387.30it/s]Preprocessing raw dataset...:  22%|█▎    | 18719/86398 [00:47<02:56, 383.01it/s]Preprocessing raw dataset...:  22%|█▎    | 18758/86398 [00:47<02:57, 380.61it/s]Preprocessing raw dataset...:  22%|█▎    | 18797/86398 [00:47<02:57, 381.37it/s]Preprocessing raw dataset...:  22%|█▎    | 18836/86398 [00:47<02:58, 378.38it/s]Preprocessing raw dataset...:  22%|█▎    | 18874/86398 [00:47<03:02, 370.74it/s]Preprocessing raw dataset...:  22%|█▎    | 18912/86398 [00:47<03:04, 364.80it/s]Preprocessing raw dataset...:  22%|█▎    | 18950/86398 [00:47<03:02, 368.71it/s]Preprocessing raw dataset...:  22%|█▎    | 18987/86398 [00:47<03:07, 358.86it/s]Preprocessing raw dataset...:  22%|█▎    | 19023/86398 [00:48<03:11, 352.04it/s]Preprocessing raw dataset...:  22%|█▎    | 19062/86398 [00:48<03:05, 362.51it/s]Preprocessing raw dataset...:  22%|█▎    | 19106/86398 [00:48<02:55, 382.92it/s]Preprocessing raw dataset...:  22%|█▎    | 19145/86398 [00:48<02:57, 379.41it/s]Preprocessing raw dataset...:  22%|█▎    | 19187/86398 [00:48<02:52, 390.56it/s]Preprocessing raw dataset...:  22%|█▎    | 19227/86398 [00:48<03:08, 356.39it/s]Preprocessing raw dataset...:  22%|█▎    | 19270/86398 [00:48<03:00, 372.68it/s]Preprocessing raw dataset...:  22%|█▎    | 19308/86398 [00:48<03:04, 363.00it/s]Preprocessing raw dataset...:  22%|█▎    | 19347/86398 [00:48<03:02, 367.60it/s]Preprocessing raw dataset...:  22%|█▎    | 19386/86398 [00:48<02:59, 372.59it/s]Preprocessing raw dataset...:  22%|█▎    | 19424/86398 [00:49<03:07, 357.68it/s]Preprocessing raw dataset...:  23%|█▎    | 19462/86398 [00:49<03:05, 361.42it/s]Preprocessing raw dataset...:  23%|█▎    | 19500/86398 [00:49<03:04, 362.52it/s]Preprocessing raw dataset...:  23%|█▎    | 19540/86398 [00:49<02:59, 373.25it/s]Preprocessing raw dataset...:  23%|█▎    | 19581/86398 [00:49<02:54, 381.88it/s]Preprocessing raw dataset...:  23%|█▎    | 19620/86398 [00:49<02:57, 377.10it/s]Preprocessing raw dataset...:  23%|█▎    | 19660/86398 [00:49<02:54, 383.27it/s]Preprocessing raw dataset...:  23%|█▎    | 19707/86398 [00:49<02:44, 405.49it/s]Preprocessing raw dataset...:  23%|█▎    | 19751/86398 [00:49<02:40, 414.95it/s]Preprocessing raw dataset...:  23%|█▎    | 19793/86398 [00:50<03:04, 360.53it/s]Preprocessing raw dataset...:  23%|█▍    | 19831/86398 [00:50<03:12, 346.08it/s]Preprocessing raw dataset...:  23%|█▍    | 19872/86398 [00:50<03:03, 362.30it/s]Preprocessing raw dataset...:  23%|█▍    | 19910/86398 [00:50<03:01, 366.31it/s]Preprocessing raw dataset...:  23%|█▍    | 19948/86398 [00:50<03:05, 358.04it/s]Preprocessing raw dataset...:  23%|█▍    | 19992/86398 [00:50<02:54, 380.13it/s]Preprocessing raw dataset...:  23%|█▍    | 20031/86398 [00:50<02:55, 377.52it/s]Preprocessing raw dataset...:  23%|█▍    | 20070/86398 [00:50<02:58, 371.88it/s]Preprocessing raw dataset...:  23%|█▍    | 20108/86398 [00:50<02:57, 373.41it/s]Preprocessing raw dataset...:  23%|█▍    | 20146/86398 [00:51<02:58, 371.82it/s]Preprocessing raw dataset...:  23%|█▍    | 20184/86398 [00:51<03:01, 364.13it/s]Preprocessing raw dataset...:  23%|█▍    | 20229/86398 [00:51<02:51, 386.48it/s]Preprocessing raw dataset...:  23%|█▍    | 20275/86398 [00:51<02:42, 407.22it/s]Preprocessing raw dataset...:  24%|█▍    | 20317/86398 [00:51<02:43, 403.84it/s]Preprocessing raw dataset...:  24%|█▍    | 20358/86398 [00:51<02:47, 395.02it/s]Preprocessing raw dataset...:  24%|█▍    | 20398/86398 [00:51<02:47, 393.91it/s]Preprocessing raw dataset...:  24%|█▍    | 20438/86398 [00:51<02:51, 384.62it/s]Preprocessing raw dataset...:  24%|█▍    | 20480/86398 [00:51<02:47, 394.04it/s]Preprocessing raw dataset...:  24%|█▍    | 20520/86398 [00:51<02:54, 377.83it/s]Preprocessing raw dataset...:  24%|█▍    | 20562/86398 [00:52<02:50, 386.49it/s]Preprocessing raw dataset...:  24%|█▍    | 20601/86398 [00:52<02:51, 384.69it/s]Preprocessing raw dataset...:  24%|█▍    | 20644/86398 [00:52<02:46, 395.47it/s]Preprocessing raw dataset...:  24%|█▍    | 20684/86398 [00:52<02:52, 381.26it/s]Preprocessing raw dataset...:  24%|█▍    | 20726/86398 [00:52<02:47, 391.21it/s]Preprocessing raw dataset...:  24%|█▍    | 20770/86398 [00:52<02:41, 405.20it/s]Preprocessing raw dataset...:  24%|█▍    | 20811/86398 [00:52<02:45, 396.80it/s]Preprocessing raw dataset...:  24%|█▍    | 20851/86398 [00:52<02:46, 393.98it/s]Preprocessing raw dataset...:  24%|█▍    | 20893/86398 [00:52<02:43, 401.12it/s]Preprocessing raw dataset...:  24%|█▍    | 20934/86398 [00:53<02:44, 398.21it/s]Preprocessing raw dataset...:  24%|█▍    | 20974/86398 [00:53<02:44, 397.30it/s]Preprocessing raw dataset...:  24%|█▍    | 21014/86398 [00:53<02:56, 370.20it/s]Preprocessing raw dataset...:  24%|█▍    | 21052/86398 [00:53<02:56, 370.00it/s]Preprocessing raw dataset...:  24%|█▍    | 21090/86398 [00:53<03:13, 336.85it/s]Preprocessing raw dataset...:  24%|█▍    | 21125/86398 [00:53<03:13, 337.03it/s]Preprocessing raw dataset...:  24%|█▍    | 21160/86398 [00:53<03:17, 330.22it/s]Preprocessing raw dataset...:  25%|█▍    | 21201/86398 [00:53<03:06, 350.30it/s]Preprocessing raw dataset...:  25%|█▍    | 21242/86398 [00:53<02:57, 366.92it/s]Preprocessing raw dataset...:  25%|█▍    | 21284/86398 [00:54<02:51, 380.08it/s]Preprocessing raw dataset...:  25%|█▍    | 21323/86398 [00:54<02:56, 369.66it/s]Preprocessing raw dataset...:  25%|█▍    | 21363/86398 [00:54<02:52, 376.34it/s]Preprocessing raw dataset...:  25%|█▍    | 21406/86398 [00:54<02:47, 388.50it/s]Preprocessing raw dataset...:  25%|█▍    | 21446/86398 [00:54<02:49, 382.43it/s]Preprocessing raw dataset...:  25%|█▍    | 21485/86398 [00:54<02:57, 366.27it/s]Preprocessing raw dataset...:  25%|█▍    | 21522/86398 [00:54<03:02, 355.72it/s]Preprocessing raw dataset...:  25%|█▍    | 21559/86398 [00:54<03:01, 357.48it/s]Preprocessing raw dataset...:  25%|█▍    | 21597/86398 [00:54<02:58, 363.13it/s]Preprocessing raw dataset...:  25%|█▌    | 21640/86398 [00:54<02:49, 381.28it/s]Preprocessing raw dataset...:  25%|█▌    | 21679/86398 [00:55<02:59, 360.53it/s]Preprocessing raw dataset...:  25%|█▌    | 21717/86398 [00:55<02:57, 364.80it/s]Preprocessing raw dataset...:  25%|█▌    | 21754/86398 [00:55<03:06, 347.52it/s]Preprocessing raw dataset...:  25%|█▌    | 21795/86398 [00:55<02:57, 363.82it/s]Preprocessing raw dataset...:  25%|█▌    | 21835/86398 [00:55<02:53, 372.06it/s]Preprocessing raw dataset...:  25%|█▌    | 21875/86398 [00:55<02:50, 378.94it/s]Preprocessing raw dataset...:  25%|█▌    | 21920/86398 [00:55<02:42, 397.06it/s]Preprocessing raw dataset...:  25%|█▌    | 21962/86398 [00:55<02:40, 402.35it/s]Preprocessing raw dataset...:  25%|█▌    | 22003/86398 [00:55<02:52, 372.42it/s]Preprocessing raw dataset...:  26%|█▌    | 22041/86398 [00:56<02:52, 372.76it/s]Preprocessing raw dataset...:  26%|█▌    | 22085/86398 [00:56<02:44, 391.58it/s]Preprocessing raw dataset...:  26%|█▌    | 22129/86398 [00:56<02:39, 404.07it/s]Preprocessing raw dataset...:  26%|█▌    | 22170/86398 [00:56<02:53, 369.35it/s]Preprocessing raw dataset...:  26%|█▌    | 22208/86398 [00:56<02:52, 372.14it/s]Preprocessing raw dataset...:  26%|█▌    | 22250/86398 [00:56<02:46, 384.51it/s]Preprocessing raw dataset...:  26%|█▌    | 22289/86398 [00:56<02:52, 372.32it/s]Preprocessing raw dataset...:  26%|█▌    | 22329/86398 [00:56<02:49, 378.85it/s]Preprocessing raw dataset...:  26%|█▌    | 22373/86398 [00:56<02:42, 394.78it/s]Preprocessing raw dataset...:  26%|█▌    | 22413/86398 [00:57<02:48, 380.36it/s]Preprocessing raw dataset...:  26%|█▌    | 22452/86398 [00:57<02:51, 372.33it/s]Preprocessing raw dataset...:  26%|█▌    | 22497/86398 [00:57<02:42, 392.86it/s]Preprocessing raw dataset...:  26%|█▌    | 22537/86398 [00:57<02:45, 384.77it/s]Preprocessing raw dataset...:  26%|█▌    | 22576/86398 [00:57<03:00, 353.94it/s]Preprocessing raw dataset...:  26%|█▌    | 22614/86398 [00:57<03:00, 353.41it/s]Preprocessing raw dataset...:  26%|█▌    | 22657/86398 [00:57<02:50, 374.10it/s]Preprocessing raw dataset...:  26%|█▌    | 22699/86398 [00:57<02:46, 383.41it/s]Preprocessing raw dataset...:  26%|█▌    | 22738/86398 [00:57<02:51, 371.32it/s]Preprocessing raw dataset...:  26%|█▌    | 22776/86398 [00:58<02:51, 371.10it/s]Preprocessing raw dataset...:  26%|█▌    | 22814/86398 [00:58<02:52, 369.43it/s]Preprocessing raw dataset...:  26%|█▌    | 22852/86398 [00:58<02:55, 361.50it/s]Preprocessing raw dataset...:  26%|█▌    | 22893/86398 [00:58<02:50, 371.93it/s]Preprocessing raw dataset...:  27%|█▌    | 22931/86398 [00:58<02:50, 371.39it/s]Preprocessing raw dataset...:  27%|█▌    | 22973/86398 [00:58<02:44, 384.98it/s]Preprocessing raw dataset...:  27%|█▌    | 23013/86398 [00:58<02:44, 385.16it/s]Preprocessing raw dataset...:  27%|█▌    | 23054/86398 [00:58<02:42, 389.97it/s]Preprocessing raw dataset...:  27%|█▌    | 23094/86398 [00:58<02:55, 360.97it/s]Preprocessing raw dataset...:  27%|█▌    | 23132/86398 [00:58<02:53, 364.64it/s]Preprocessing raw dataset...:  27%|█▌    | 23174/86398 [00:59<02:46, 379.86it/s]Preprocessing raw dataset...:  27%|█▌    | 23213/86398 [00:59<02:49, 373.25it/s]Preprocessing raw dataset...:  27%|█▌    | 23256/86398 [00:59<02:43, 386.28it/s]Preprocessing raw dataset...:  27%|█▌    | 23295/86398 [00:59<02:44, 382.61it/s]Preprocessing raw dataset...:  27%|█▌    | 23335/86398 [00:59<02:43, 386.15it/s]Preprocessing raw dataset...:  27%|█▌    | 23379/86398 [00:59<02:38, 398.78it/s]Preprocessing raw dataset...:  27%|█▋    | 23426/86398 [00:59<02:30, 417.51it/s]Preprocessing raw dataset...:  27%|█▋    | 23468/86398 [00:59<02:39, 394.62it/s]Preprocessing raw dataset...:  27%|█▋    | 23508/86398 [00:59<02:38, 395.99it/s]Preprocessing raw dataset...:  27%|█▋    | 23548/86398 [01:00<02:54, 359.55it/s]Preprocessing raw dataset...:  27%|█▋    | 23585/86398 [01:00<02:55, 357.92it/s]Preprocessing raw dataset...:  27%|█▋    | 23629/86398 [01:00<02:45, 378.54it/s]Preprocessing raw dataset...:  27%|█▋    | 23669/86398 [01:00<02:43, 383.97it/s]Preprocessing raw dataset...:  27%|█▋    | 23708/86398 [01:00<02:43, 384.48it/s]Preprocessing raw dataset...:  27%|█▋    | 23752/86398 [01:00<02:37, 397.69it/s]Preprocessing raw dataset...:  28%|█▋    | 23792/86398 [01:00<02:47, 374.01it/s]Preprocessing raw dataset...:  28%|█▋    | 23834/86398 [01:00<02:41, 386.88it/s]Preprocessing raw dataset...:  28%|█▋    | 23874/86398 [01:00<02:45, 377.09it/s]Preprocessing raw dataset...:  28%|█▋    | 23912/86398 [01:00<02:48, 371.03it/s]Preprocessing raw dataset...:  28%|█▋    | 23950/86398 [01:01<02:52, 362.73it/s]Preprocessing raw dataset...:  28%|█▋    | 23992/86398 [01:01<02:50, 366.92it/s]Preprocessing raw dataset...:  28%|█▋    | 24030/86398 [01:01<02:48, 369.99it/s]Preprocessing raw dataset...:  28%|█▋    | 24069/86398 [01:01<02:47, 372.97it/s]Preprocessing raw dataset...:  28%|█▋    | 24107/86398 [01:01<02:48, 369.97it/s]Preprocessing raw dataset...:  28%|█▋    | 24145/86398 [01:01<02:51, 363.89it/s]Preprocessing raw dataset...:  28%|█▋    | 24182/86398 [01:01<02:54, 355.90it/s]Preprocessing raw dataset...:  28%|█▋    | 24218/86398 [01:01<03:07, 331.23it/s]Preprocessing raw dataset...:  28%|█▋    | 24252/86398 [01:01<03:08, 329.14it/s]Preprocessing raw dataset...:  28%|█▋    | 24286/86398 [01:02<03:12, 322.04it/s]Preprocessing raw dataset...:  28%|█▋    | 24319/86398 [01:02<03:12, 322.51it/s]Preprocessing raw dataset...:  28%|█▋    | 24354/86398 [01:02<03:07, 330.26it/s]Preprocessing raw dataset...:  28%|█▋    | 24393/86398 [01:02<02:58, 346.63it/s]Preprocessing raw dataset...:  28%|█▋    | 24431/86398 [01:02<02:54, 355.45it/s]Preprocessing raw dataset...:  28%|█▋    | 24467/86398 [01:02<03:04, 335.96it/s]Preprocessing raw dataset...:  28%|█▋    | 24504/86398 [01:02<02:59, 344.79it/s]Preprocessing raw dataset...:  28%|█▋    | 24539/86398 [01:02<03:01, 340.70it/s]Preprocessing raw dataset...:  28%|█▋    | 24574/86398 [01:02<03:03, 337.65it/s]Preprocessing raw dataset...:  28%|█▋    | 24608/86398 [01:03<03:03, 336.24it/s]Preprocessing raw dataset...:  29%|█▋    | 24642/86398 [01:03<03:11, 322.23it/s]Preprocessing raw dataset...:  29%|█▋    | 24682/86398 [01:03<02:59, 343.34it/s]Preprocessing raw dataset...:  29%|█▋    | 24719/86398 [01:03<02:58, 346.00it/s]Preprocessing raw dataset...:  29%|█▋    | 24754/86398 [01:03<03:01, 340.54it/s]Preprocessing raw dataset...:  29%|█▋    | 24795/86398 [01:03<02:54, 352.33it/s]Preprocessing raw dataset...:  29%|█▋    | 24831/86398 [01:03<03:00, 341.68it/s]Preprocessing raw dataset...:  29%|█▋    | 24870/86398 [01:03<02:53, 354.21it/s]Preprocessing raw dataset...:  29%|█▋    | 24906/86398 [01:03<02:58, 344.75it/s]Preprocessing raw dataset...:  29%|█▋    | 24941/86398 [01:04<03:05, 331.45it/s]Preprocessing raw dataset...:  29%|█▋    | 24978/86398 [01:04<03:00, 340.65it/s]Preprocessing raw dataset...:  29%|█▋    | 25015/86398 [01:04<02:56, 348.40it/s]Preprocessing raw dataset...:  29%|█▋    | 25055/86398 [01:04<02:48, 363.12it/s]Preprocessing raw dataset...:  29%|█▋    | 25092/86398 [01:04<02:53, 354.19it/s]Preprocessing raw dataset...:  29%|█▋    | 25130/86398 [01:04<02:49, 360.58it/s]Preprocessing raw dataset...:  29%|█▋    | 25167/86398 [01:04<02:50, 358.44it/s]Preprocessing raw dataset...:  29%|█▊    | 25205/86398 [01:04<02:48, 362.31it/s]Preprocessing raw dataset...:  29%|█▊    | 25242/86398 [01:04<02:53, 351.65it/s]Preprocessing raw dataset...:  29%|█▊    | 25281/86398 [01:04<02:48, 362.44it/s]Preprocessing raw dataset...:  29%|█▊    | 25323/86398 [01:05<02:44, 372.29it/s]Preprocessing raw dataset...:  29%|█▊    | 25363/86398 [01:05<02:41, 378.82it/s]Preprocessing raw dataset...:  29%|█▊    | 25401/86398 [01:05<02:42, 374.34it/s]Preprocessing raw dataset...:  29%|█▊    | 25439/86398 [01:05<02:49, 360.10it/s]Preprocessing raw dataset...:  29%|█▊    | 25476/86398 [01:05<03:00, 336.71it/s]Preprocessing raw dataset...:  30%|█▊    | 25518/86398 [01:05<02:51, 355.63it/s]Preprocessing raw dataset...:  30%|█▊    | 25558/86398 [01:05<02:46, 365.98it/s]Preprocessing raw dataset...:  30%|█▊    | 25596/86398 [01:05<02:44, 369.50it/s]Preprocessing raw dataset...:  30%|█▊    | 25636/86398 [01:05<02:41, 376.31it/s]Preprocessing raw dataset...:  30%|█▊    | 25674/86398 [01:06<02:45, 366.07it/s]Preprocessing raw dataset...:  30%|█▊    | 25718/86398 [01:06<02:36, 387.13it/s]Preprocessing raw dataset...:  30%|█▊    | 25757/86398 [01:06<02:42, 372.87it/s]Preprocessing raw dataset...:  30%|█▊    | 25795/86398 [01:06<02:50, 355.22it/s]Preprocessing raw dataset...:  30%|█▊    | 25834/86398 [01:06<02:47, 362.06it/s]Preprocessing raw dataset...:  30%|█▊    | 25871/86398 [01:06<02:48, 359.72it/s]Preprocessing raw dataset...:  30%|█▊    | 25913/86398 [01:06<02:41, 374.32it/s]Preprocessing raw dataset...:  30%|█▊    | 25951/86398 [01:06<02:47, 361.23it/s]Preprocessing raw dataset...:  30%|█▊    | 25991/86398 [01:06<02:42, 372.03it/s]Preprocessing raw dataset...:  30%|█▊    | 26029/86398 [01:06<02:50, 355.00it/s]Preprocessing raw dataset...:  30%|█▊    | 26081/86398 [01:07<02:30, 400.78it/s]Preprocessing raw dataset...:  30%|█▊    | 26122/86398 [01:07<02:34, 389.65it/s]Preprocessing raw dataset...:  30%|█▊    | 26162/86398 [01:07<02:44, 366.89it/s]Preprocessing raw dataset...:  30%|█▊    | 26202/86398 [01:07<02:41, 371.70it/s]Preprocessing raw dataset...:  30%|█▊    | 26243/86398 [01:07<02:38, 380.72it/s]Preprocessing raw dataset...:  30%|█▊    | 26282/86398 [01:07<02:38, 380.41it/s]Preprocessing raw dataset...:  30%|█▊    | 26323/86398 [01:07<02:34, 387.63it/s]Preprocessing raw dataset...:  31%|█▊    | 26365/86398 [01:07<02:32, 393.96it/s]Preprocessing raw dataset...:  31%|█▊    | 26410/86398 [01:07<02:27, 405.44it/s]Preprocessing raw dataset...:  31%|█▊    | 26451/86398 [01:08<02:33, 389.72it/s]Preprocessing raw dataset...:  31%|█▊    | 26491/86398 [01:08<02:39, 374.70it/s]Preprocessing raw dataset...:  31%|█▊    | 26529/86398 [01:08<02:41, 369.85it/s]Preprocessing raw dataset...:  31%|█▊    | 26567/86398 [01:08<02:45, 361.84it/s]Preprocessing raw dataset...:  31%|█▊    | 26607/86398 [01:08<02:41, 370.78it/s]Preprocessing raw dataset...:  31%|█▊    | 26649/86398 [01:08<02:35, 384.13it/s]Preprocessing raw dataset...:  31%|█▊    | 26691/86398 [01:08<02:32, 392.13it/s]Preprocessing raw dataset...:  31%|█▊    | 26735/86398 [01:08<02:27, 404.69it/s]Preprocessing raw dataset...:  31%|█▊    | 26776/86398 [01:08<02:27, 405.49it/s]Preprocessing raw dataset...:  31%|█▊    | 26817/86398 [01:09<02:32, 391.91it/s]Preprocessing raw dataset...:  31%|█▊    | 26857/86398 [01:09<02:33, 388.96it/s]Preprocessing raw dataset...:  31%|█▊    | 26896/86398 [01:09<02:33, 386.56it/s]Preprocessing raw dataset...:  31%|█▊    | 26935/86398 [01:09<02:33, 386.96it/s]Preprocessing raw dataset...:  31%|█▊    | 26974/86398 [01:09<02:57, 335.64it/s]Preprocessing raw dataset...:  31%|█▉    | 27017/86398 [01:09<02:44, 360.32it/s]Preprocessing raw dataset...:  31%|█▉    | 27055/86398 [01:09<02:53, 342.72it/s]Preprocessing raw dataset...:  31%|█▉    | 27095/86398 [01:09<02:48, 351.88it/s]Preprocessing raw dataset...:  31%|█▉    | 27142/86398 [01:09<02:35, 381.09it/s]Preprocessing raw dataset...:  31%|█▉    | 27181/86398 [01:10<02:43, 361.27it/s]Preprocessing raw dataset...:  32%|█▉    | 27223/86398 [01:10<02:37, 376.14it/s]Preprocessing raw dataset...:  32%|█▉    | 27264/86398 [01:10<02:33, 384.84it/s]Preprocessing raw dataset...:  32%|█▉    | 27306/86398 [01:10<02:29, 393.96it/s]Preprocessing raw dataset...:  32%|█▉    | 27346/86398 [01:10<02:38, 372.02it/s]Preprocessing raw dataset...:  32%|█▉    | 27385/86398 [01:10<02:36, 376.28it/s]Preprocessing raw dataset...:  32%|█▉    | 27423/86398 [01:10<02:38, 370.94it/s]Preprocessing raw dataset...:  32%|█▉    | 27461/86398 [01:10<02:44, 358.55it/s]Preprocessing raw dataset...:  32%|█▉    | 27502/86398 [01:10<02:38, 371.95it/s]Preprocessing raw dataset...:  32%|█▉    | 27540/86398 [01:10<02:44, 356.76it/s]Preprocessing raw dataset...:  32%|█▉    | 27576/86398 [01:11<02:46, 353.01it/s]Preprocessing raw dataset...:  32%|█▉    | 27612/86398 [01:11<02:47, 351.60it/s]Preprocessing raw dataset...:  32%|█▉    | 27648/86398 [01:11<03:04, 318.99it/s]Preprocessing raw dataset...:  32%|█▉    | 27683/86398 [01:11<03:00, 325.79it/s]Preprocessing raw dataset...:  32%|█▉    | 27717/86398 [01:11<03:04, 318.57it/s]Preprocessing raw dataset...:  32%|█▉    | 27756/86398 [01:11<02:53, 337.12it/s]Preprocessing raw dataset...:  32%|█▉    | 27791/86398 [01:11<02:55, 334.00it/s]Preprocessing raw dataset...:  32%|█▉    | 27831/86398 [01:11<02:47, 350.21it/s]Preprocessing raw dataset...:  32%|█▉    | 27874/86398 [01:11<02:39, 367.39it/s]Preprocessing raw dataset...:  32%|█▉    | 27911/86398 [01:12<02:39, 366.23it/s]Preprocessing raw dataset...:  32%|█▉    | 27948/86398 [01:12<02:39, 366.09it/s]Preprocessing raw dataset...:  32%|█▉    | 27991/86398 [01:12<02:32, 382.94it/s]Preprocessing raw dataset...:  32%|█▉    | 28030/86398 [01:12<02:40, 363.50it/s]Preprocessing raw dataset...:  32%|█▉    | 28069/86398 [01:12<02:37, 369.92it/s]Preprocessing raw dataset...:  33%|█▉    | 28110/86398 [01:12<02:33, 380.78it/s]Preprocessing raw dataset...:  33%|█▉    | 28149/86398 [01:12<02:33, 378.71it/s]Preprocessing raw dataset...:  33%|█▉    | 28188/86398 [01:12<02:40, 362.63it/s]Preprocessing raw dataset...:  33%|█▉    | 28227/86398 [01:12<02:37, 369.99it/s]Preprocessing raw dataset...:  33%|█▉    | 28266/86398 [01:13<02:35, 373.08it/s]Preprocessing raw dataset...:  33%|█▉    | 28313/86398 [01:13<02:25, 398.93it/s]Preprocessing raw dataset...:  33%|█▉    | 28354/86398 [01:13<02:32, 381.84it/s]Preprocessing raw dataset...:  33%|█▉    | 28393/86398 [01:13<02:39, 363.73it/s]Preprocessing raw dataset...:  33%|█▉    | 28435/86398 [01:13<02:33, 378.66it/s]Preprocessing raw dataset...:  33%|█▉    | 28474/86398 [01:13<02:54, 331.65it/s]Preprocessing raw dataset...:  33%|█▉    | 28512/86398 [01:13<02:50, 340.50it/s]Preprocessing raw dataset...:  33%|█▉    | 28556/86398 [01:13<02:38, 365.74it/s]Preprocessing raw dataset...:  33%|█▉    | 28600/86398 [01:13<02:33, 376.94it/s]Preprocessing raw dataset...:  33%|█▉    | 28639/86398 [01:14<02:33, 376.65it/s]Preprocessing raw dataset...:  33%|█▉    | 28678/86398 [01:14<02:38, 364.82it/s]Preprocessing raw dataset...:  33%|█▉    | 28719/86398 [01:14<02:35, 372.08it/s]Preprocessing raw dataset...:  33%|█▉    | 28757/86398 [01:14<02:37, 366.70it/s]Preprocessing raw dataset...:  33%|█▉    | 28794/86398 [01:14<02:38, 363.77it/s]Preprocessing raw dataset...:  33%|██    | 28833/86398 [01:14<02:35, 369.03it/s]Preprocessing raw dataset...:  33%|██    | 28879/86398 [01:14<02:25, 394.93it/s]Preprocessing raw dataset...:  33%|██    | 28919/86398 [01:14<02:27, 389.75it/s]Preprocessing raw dataset...:  34%|██    | 28959/86398 [01:14<02:27, 388.54it/s]Preprocessing raw dataset...:  34%|██    | 28998/86398 [01:14<02:34, 371.49it/s]Preprocessing raw dataset...:  34%|██    | 29036/86398 [01:15<02:33, 373.41it/s]Preprocessing raw dataset...:  34%|██    | 29074/86398 [01:15<02:40, 357.98it/s]Preprocessing raw dataset...:  34%|██    | 29112/86398 [01:15<02:37, 363.71it/s]Preprocessing raw dataset...:  34%|██    | 29149/86398 [01:15<02:38, 361.40it/s]Preprocessing raw dataset...:  34%|██    | 29186/86398 [01:15<02:44, 347.70it/s]Preprocessing raw dataset...:  34%|██    | 29221/86398 [01:15<02:52, 330.61it/s]Preprocessing raw dataset...:  34%|██    | 29261/86398 [01:15<02:44, 348.20it/s]Preprocessing raw dataset...:  34%|██    | 29299/86398 [01:15<02:40, 356.12it/s]Preprocessing raw dataset...:  34%|██    | 29339/86398 [01:15<02:34, 368.70it/s]Preprocessing raw dataset...:  34%|██    | 29377/86398 [01:16<02:38, 359.00it/s]Preprocessing raw dataset...:  34%|██    | 29417/86398 [01:16<02:34, 369.95it/s]Preprocessing raw dataset...:  34%|██    | 29458/86398 [01:16<02:29, 381.23it/s]Preprocessing raw dataset...:  34%|██    | 29497/86398 [01:16<02:31, 376.30it/s]Preprocessing raw dataset...:  34%|██    | 29535/86398 [01:16<02:33, 370.87it/s]Preprocessing raw dataset...:  34%|██    | 29574/86398 [01:16<02:31, 375.42it/s]Preprocessing raw dataset...:  34%|██    | 29612/86398 [01:16<02:32, 371.98it/s]Preprocessing raw dataset...:  34%|██    | 29653/86398 [01:16<02:29, 380.46it/s]Preprocessing raw dataset...:  34%|██    | 29698/86398 [01:16<02:21, 400.23it/s]Preprocessing raw dataset...:  34%|██    | 29739/86398 [01:17<02:26, 386.05it/s]Preprocessing raw dataset...:  34%|██    | 29778/86398 [01:17<02:31, 373.31it/s]Preprocessing raw dataset...:  35%|██    | 29816/86398 [01:17<02:46, 340.12it/s]Preprocessing raw dataset...:  35%|██    | 29858/86398 [01:17<02:36, 361.47it/s]Preprocessing raw dataset...:  35%|██    | 29904/86398 [01:17<02:25, 388.11it/s]Preprocessing raw dataset...:  35%|██    | 29944/86398 [01:17<02:32, 369.34it/s]Preprocessing raw dataset...:  35%|██    | 29984/86398 [01:17<02:29, 377.65it/s]Preprocessing raw dataset...:  35%|██    | 30024/86398 [01:17<02:26, 383.71it/s]Preprocessing raw dataset...:  35%|██    | 30063/86398 [01:17<02:30, 375.44it/s]Preprocessing raw dataset...:  35%|██    | 30101/86398 [01:17<02:34, 364.81it/s]Preprocessing raw dataset...:  35%|██    | 30138/86398 [01:18<02:40, 350.72it/s]Preprocessing raw dataset...:  35%|██    | 30174/86398 [01:18<02:47, 335.84it/s]Preprocessing raw dataset...:  35%|██    | 30211/86398 [01:18<02:43, 343.18it/s]Preprocessing raw dataset...:  35%|██    | 30246/86398 [01:18<02:49, 331.96it/s]Preprocessing raw dataset...:  35%|██    | 30281/86398 [01:18<02:46, 336.69it/s]Preprocessing raw dataset...:  35%|██    | 30315/86398 [01:18<02:54, 321.49it/s]Preprocessing raw dataset...:  35%|██    | 30349/86398 [01:18<02:52, 324.94it/s]Preprocessing raw dataset...:  35%|██    | 30389/86398 [01:18<02:43, 342.55it/s]Preprocessing raw dataset...:  35%|██    | 30424/86398 [01:18<02:42, 343.44it/s]Preprocessing raw dataset...:  35%|██    | 30459/86398 [01:19<02:43, 342.78it/s]Preprocessing raw dataset...:  35%|██    | 30496/86398 [01:19<02:39, 349.45it/s]Preprocessing raw dataset...:  35%|██    | 30538/86398 [01:19<02:34, 362.70it/s]Preprocessing raw dataset...:  35%|██    | 30575/86398 [01:19<02:36, 356.15it/s]Preprocessing raw dataset...:  35%|██▏   | 30611/86398 [01:19<02:40, 347.90it/s]Preprocessing raw dataset...:  35%|██▏   | 30651/86398 [01:19<02:35, 359.00it/s]Preprocessing raw dataset...:  36%|██▏   | 30689/86398 [01:19<02:38, 351.16it/s]Preprocessing raw dataset...:  36%|██▏   | 30725/86398 [01:19<02:42, 341.98it/s]Preprocessing raw dataset...:  36%|██▏   | 30760/86398 [01:19<02:45, 337.01it/s]Preprocessing raw dataset...:  36%|██▏   | 30798/86398 [01:20<02:40, 346.43it/s]Preprocessing raw dataset...:  36%|██▏   | 30833/86398 [01:20<02:45, 335.87it/s]Preprocessing raw dataset...:  36%|██▏   | 30871/86398 [01:20<02:42, 342.74it/s]Preprocessing raw dataset...:  36%|██▏   | 30906/86398 [01:20<02:44, 338.36it/s]Preprocessing raw dataset...:  36%|██▏   | 30942/86398 [01:20<02:41, 344.43it/s]Preprocessing raw dataset...:  36%|██▏   | 30977/86398 [01:20<02:40, 344.34it/s]Preprocessing raw dataset...:  36%|██▏   | 31014/86398 [01:20<02:40, 346.01it/s]Preprocessing raw dataset...:  36%|██▏   | 31052/86398 [01:20<02:35, 355.00it/s]Preprocessing raw dataset...:  36%|██▏   | 31088/86398 [01:20<02:37, 350.98it/s]Preprocessing raw dataset...:  36%|██▏   | 31124/86398 [01:20<02:40, 345.36it/s]Preprocessing raw dataset...:  36%|██▏   | 31159/86398 [01:21<02:40, 343.53it/s]Preprocessing raw dataset...:  36%|██▏   | 31194/86398 [01:21<02:45, 333.47it/s]Preprocessing raw dataset...:  36%|██▏   | 31238/86398 [01:21<02:32, 361.49it/s]Preprocessing raw dataset...:  36%|██▏   | 31283/86398 [01:21<02:23, 384.37it/s]Preprocessing raw dataset...:  36%|██▏   | 31323/86398 [01:21<02:22, 386.21it/s]Preprocessing raw dataset...:  36%|██▏   | 31367/86398 [01:21<02:19, 394.62it/s]Preprocessing raw dataset...:  36%|██▏   | 31407/86398 [01:21<02:19, 393.95it/s]Preprocessing raw dataset...:  36%|██▏   | 31447/86398 [01:21<02:27, 373.46it/s]Preprocessing raw dataset...:  36%|██▏   | 31485/86398 [01:21<02:34, 355.82it/s]Preprocessing raw dataset...:  36%|██▏   | 31521/86398 [01:22<02:35, 352.73it/s]Preprocessing raw dataset...:  37%|██▏   | 31557/86398 [01:22<02:43, 336.16it/s]Preprocessing raw dataset...:  37%|██▏   | 31595/86398 [01:22<02:37, 348.16it/s]Preprocessing raw dataset...:  37%|██▏   | 31636/86398 [01:22<02:30, 363.03it/s]Preprocessing raw dataset...:  37%|██▏   | 31677/86398 [01:22<02:27, 371.21it/s]Preprocessing raw dataset...:  37%|██▏   | 31715/86398 [01:22<02:28, 368.91it/s]Preprocessing raw dataset...:  37%|██▏   | 31753/86398 [01:22<02:34, 353.61it/s]Preprocessing raw dataset...:  37%|██▏   | 31790/86398 [01:22<02:34, 354.13it/s]Preprocessing raw dataset...:  37%|██▏   | 31826/86398 [01:22<02:34, 352.79it/s]Preprocessing raw dataset...:  37%|██▏   | 31863/86398 [01:23<02:33, 354.48it/s]Preprocessing raw dataset...:  37%|██▏   | 31900/86398 [01:23<02:32, 356.42it/s]Preprocessing raw dataset...:  37%|██▏   | 31945/86398 [01:23<02:22, 382.99it/s]Preprocessing raw dataset...:  37%|██▏   | 31984/86398 [01:23<02:26, 371.63it/s]Preprocessing raw dataset...:  37%|██▏   | 32022/86398 [01:23<02:31, 358.14it/s]Preprocessing raw dataset...:  37%|██▏   | 32058/86398 [01:23<02:32, 357.22it/s]Preprocessing raw dataset...:  37%|██▏   | 32094/86398 [01:23<02:37, 344.19it/s]Preprocessing raw dataset...:  37%|██▏   | 32129/86398 [01:23<02:40, 337.44it/s]Preprocessing raw dataset...:  37%|██▏   | 32163/86398 [01:23<02:40, 338.02it/s]Preprocessing raw dataset...:  37%|██▏   | 32204/86398 [01:23<02:31, 357.95it/s]Preprocessing raw dataset...:  37%|██▏   | 32242/86398 [01:24<02:30, 359.41it/s]Preprocessing raw dataset...:  37%|██▏   | 32279/86398 [01:24<02:30, 359.90it/s]Preprocessing raw dataset...:  37%|██▏   | 32316/86398 [01:24<02:31, 357.88it/s]Preprocessing raw dataset...:  37%|██▏   | 32358/86398 [01:24<02:23, 375.74it/s]Preprocessing raw dataset...:  37%|██▏   | 32396/86398 [01:24<02:28, 364.19it/s]Preprocessing raw dataset...:  38%|██▎   | 32438/86398 [01:24<02:22, 379.30it/s]Preprocessing raw dataset...:  38%|██▎   | 32477/86398 [01:24<02:26, 368.75it/s]Preprocessing raw dataset...:  38%|██▎   | 32515/86398 [01:24<02:31, 355.76it/s]Preprocessing raw dataset...:  38%|██▎   | 32551/86398 [01:24<02:37, 341.38it/s]Preprocessing raw dataset...:  38%|██▎   | 32586/86398 [01:25<02:37, 342.64it/s]Preprocessing raw dataset...:  38%|██▎   | 32631/86398 [01:25<02:24, 371.09it/s]Preprocessing raw dataset...:  38%|██▎   | 32669/86398 [01:25<02:25, 369.26it/s]Preprocessing raw dataset...:  38%|██▎   | 32707/86398 [01:25<02:30, 357.59it/s]Preprocessing raw dataset...:  38%|██▎   | 32748/86398 [01:25<02:24, 371.46it/s]Preprocessing raw dataset...:  38%|██▎   | 32786/86398 [01:25<02:30, 356.96it/s]Preprocessing raw dataset...:  38%|██▎   | 32828/86398 [01:25<02:23, 374.02it/s]Preprocessing raw dataset...:  38%|██▎   | 32874/86398 [01:25<02:14, 397.78it/s]Preprocessing raw dataset...:  38%|██▎   | 32915/86398 [01:25<02:17, 387.80it/s]Preprocessing raw dataset...:  38%|██▎   | 32955/86398 [01:25<02:16, 390.95it/s]Preprocessing raw dataset...:  38%|██▎   | 32995/86398 [01:26<02:17, 389.12it/s]Preprocessing raw dataset...:  38%|██▎   | 33035/86398 [01:26<02:25, 366.10it/s]Preprocessing raw dataset...:  38%|██▎   | 33074/86398 [01:26<02:23, 371.29it/s]Preprocessing raw dataset...:  38%|██▎   | 33112/86398 [01:26<02:24, 369.27it/s]Preprocessing raw dataset...:  38%|██▎   | 33150/86398 [01:26<02:29, 356.29it/s]Preprocessing raw dataset...:  38%|██▎   | 33194/86398 [01:26<02:20, 378.16it/s]Preprocessing raw dataset...:  38%|██▎   | 33233/86398 [01:26<02:24, 368.90it/s]Preprocessing raw dataset...:  39%|██▎   | 33271/86398 [01:26<02:31, 350.83it/s]Preprocessing raw dataset...:  39%|██▎   | 33315/86398 [01:26<02:21, 374.66it/s]Preprocessing raw dataset...:  39%|██▎   | 33353/86398 [01:27<02:27, 360.33it/s]Preprocessing raw dataset...:  39%|██▎   | 33390/86398 [01:27<02:27, 359.15it/s]Preprocessing raw dataset...:  39%|██▎   | 33427/86398 [01:27<02:29, 354.51it/s]Preprocessing raw dataset...:  39%|██▎   | 33463/86398 [01:27<02:29, 353.59it/s]Preprocessing raw dataset...:  39%|██▎   | 33507/86398 [01:27<02:20, 376.74it/s]Preprocessing raw dataset...:  39%|██▎   | 33545/86398 [01:27<02:23, 368.67it/s]Preprocessing raw dataset...:  39%|██▎   | 33585/86398 [01:27<02:22, 370.92it/s]Preprocessing raw dataset...:  39%|██▎   | 33624/86398 [01:27<02:20, 375.05it/s]Preprocessing raw dataset...:  39%|██▎   | 33662/86398 [01:27<02:20, 376.08it/s]Preprocessing raw dataset...:  39%|██▎   | 33702/86398 [01:28<02:18, 381.44it/s]Preprocessing raw dataset...:  39%|██▎   | 33741/86398 [01:28<02:17, 383.57it/s]Preprocessing raw dataset...:  39%|██▎   | 33780/86398 [01:28<02:21, 371.62it/s]Preprocessing raw dataset...:  39%|██▎   | 33818/86398 [01:28<02:28, 354.02it/s]Preprocessing raw dataset...:  39%|██▎   | 33862/86398 [01:28<02:22, 369.27it/s]Preprocessing raw dataset...:  39%|██▎   | 33900/86398 [01:28<02:24, 362.77it/s]Preprocessing raw dataset...:  39%|██▎   | 33937/86398 [01:28<02:28, 352.92it/s]Preprocessing raw dataset...:  39%|██▎   | 33977/86398 [01:28<02:23, 364.26it/s]Preprocessing raw dataset...:  39%|██▎   | 34017/86398 [01:28<02:20, 374.08it/s]Preprocessing raw dataset...:  39%|██▎   | 34055/86398 [01:29<02:34, 339.07it/s]Preprocessing raw dataset...:  39%|██▎   | 34092/86398 [01:29<02:31, 346.28it/s]Preprocessing raw dataset...:  40%|██▎   | 34129/86398 [01:29<02:28, 351.44it/s]Preprocessing raw dataset...:  40%|██▎   | 34166/86398 [01:29<02:28, 352.69it/s]Preprocessing raw dataset...:  40%|██▍   | 34202/86398 [01:29<02:32, 342.04it/s]Preprocessing raw dataset...:  40%|██▍   | 34237/86398 [01:29<02:32, 341.00it/s]Preprocessing raw dataset...:  40%|██▍   | 34272/86398 [01:29<02:34, 337.96it/s]Preprocessing raw dataset...:  40%|██▍   | 34313/86398 [01:29<02:29, 348.06it/s]Preprocessing raw dataset...:  40%|██▍   | 34351/86398 [01:29<02:27, 353.91it/s]Preprocessing raw dataset...:  40%|██▍   | 34389/86398 [01:29<02:24, 360.68it/s]Preprocessing raw dataset...:  40%|██▍   | 34426/86398 [01:30<02:34, 335.60it/s]Preprocessing raw dataset...:  40%|██▍   | 34463/86398 [01:30<02:30, 344.07it/s]Preprocessing raw dataset...:  40%|██▍   | 34498/86398 [01:30<02:33, 338.77it/s]Preprocessing raw dataset...:  40%|██▍   | 34540/86398 [01:30<02:23, 361.23it/s]Preprocessing raw dataset...:  40%|██▍   | 34578/86398 [01:30<02:21, 365.49it/s]Preprocessing raw dataset...:  40%|██▍   | 34615/86398 [01:30<02:23, 360.48it/s]Preprocessing raw dataset...:  40%|██▍   | 34653/86398 [01:30<02:21, 364.91it/s]Preprocessing raw dataset...:  40%|██▍   | 34690/86398 [01:30<02:40, 322.82it/s]Preprocessing raw dataset...:  40%|██▍   | 34727/86398 [01:30<02:34, 333.68it/s]Preprocessing raw dataset...:  40%|██▍   | 34767/86398 [01:31<02:27, 350.36it/s]Preprocessing raw dataset...:  40%|██▍   | 34803/86398 [01:31<02:29, 344.79it/s]Preprocessing raw dataset...:  40%|██▍   | 34842/86398 [01:31<02:24, 357.01it/s]Preprocessing raw dataset...:  40%|██▍   | 34889/86398 [01:31<02:13, 385.12it/s]Preprocessing raw dataset...:  40%|██▍   | 34928/86398 [01:31<02:14, 383.05it/s]Preprocessing raw dataset...:  40%|██▍   | 34967/86398 [01:31<02:19, 369.84it/s]Preprocessing raw dataset...:  41%|██▍   | 35005/86398 [01:31<02:19, 367.87it/s]Preprocessing raw dataset...:  41%|██▍   | 35043/86398 [01:31<02:18, 370.83it/s]Preprocessing raw dataset...:  41%|██▍   | 35081/86398 [01:31<02:25, 352.45it/s]Preprocessing raw dataset...:  41%|██▍   | 35117/86398 [01:32<02:25, 352.82it/s]Preprocessing raw dataset...:  41%|██▍   | 35153/86398 [01:32<02:26, 348.97it/s]Preprocessing raw dataset...:  41%|██▍   | 35189/86398 [01:32<02:27, 347.17it/s]Preprocessing raw dataset...:  41%|██▍   | 35226/86398 [01:32<02:24, 353.43it/s]Preprocessing raw dataset...:  41%|██▍   | 35262/86398 [01:32<02:25, 351.90it/s]Preprocessing raw dataset...:  41%|██▍   | 35302/86398 [01:32<02:21, 361.75it/s]Preprocessing raw dataset...:  41%|██▍   | 35346/86398 [01:32<02:13, 383.38it/s]Preprocessing raw dataset...:  41%|██▍   | 35389/86398 [01:32<02:09, 395.36it/s]Preprocessing raw dataset...:  41%|██▍   | 35431/86398 [01:32<02:07, 398.50it/s]Preprocessing raw dataset...:  41%|██▍   | 35471/86398 [01:32<02:15, 374.82it/s]Preprocessing raw dataset...:  41%|██▍   | 35509/86398 [01:33<02:16, 371.60it/s]Preprocessing raw dataset...:  41%|██▍   | 35557/86398 [01:33<02:08, 396.89it/s]Preprocessing raw dataset...:  41%|██▍   | 35598/86398 [01:33<02:07, 398.61it/s]Preprocessing raw dataset...:  41%|██▍   | 35638/86398 [01:33<02:11, 387.21it/s]Preprocessing raw dataset...:  41%|██▍   | 35677/86398 [01:33<02:21, 358.05it/s]Preprocessing raw dataset...:  41%|██▍   | 35714/86398 [01:33<02:26, 347.10it/s]Preprocessing raw dataset...:  41%|██▍   | 35754/86398 [01:33<02:20, 360.88it/s]Preprocessing raw dataset...:  41%|██▍   | 35795/86398 [01:33<02:15, 374.56it/s]Preprocessing raw dataset...:  41%|██▍   | 35836/86398 [01:33<02:11, 383.93it/s]Preprocessing raw dataset...:  42%|██▍   | 35876/86398 [01:34<02:10, 385.81it/s]Preprocessing raw dataset...:  42%|██▍   | 35915/86398 [01:34<02:14, 375.06it/s]Preprocessing raw dataset...:  42%|██▍   | 35953/86398 [01:34<02:17, 366.77it/s]Preprocessing raw dataset...:  42%|██▍   | 35990/86398 [01:34<02:17, 367.52it/s]Preprocessing raw dataset...:  42%|██▌   | 36027/86398 [01:34<02:23, 350.78it/s]Preprocessing raw dataset...:  42%|██▌   | 36063/86398 [01:34<02:23, 349.88it/s]Preprocessing raw dataset...:  42%|██▌   | 36104/86398 [01:34<02:18, 363.61it/s]Preprocessing raw dataset...:  42%|██▌   | 36141/86398 [01:34<02:17, 365.43it/s]Preprocessing raw dataset...:  42%|██▌   | 36178/86398 [01:34<02:17, 364.19it/s]Preprocessing raw dataset...:  42%|██▌   | 36215/86398 [01:35<02:23, 349.21it/s]Preprocessing raw dataset...:  42%|██▌   | 36251/86398 [01:35<02:25, 343.98it/s]Preprocessing raw dataset...:  42%|██▌   | 36289/86398 [01:35<02:21, 354.06it/s]Preprocessing raw dataset...:  42%|██▌   | 36329/86398 [01:35<02:16, 366.99it/s]Preprocessing raw dataset...:  42%|██▌   | 36368/86398 [01:35<02:14, 372.31it/s]Preprocessing raw dataset...:  42%|██▌   | 36406/86398 [01:35<02:28, 337.12it/s]Preprocessing raw dataset...:  42%|██▌   | 36441/86398 [01:35<02:30, 331.74it/s]Preprocessing raw dataset...:  42%|██▌   | 36481/86398 [01:35<02:22, 349.26it/s]Preprocessing raw dataset...:  42%|██▌   | 36517/86398 [01:35<02:21, 351.69it/s]Preprocessing raw dataset...:  42%|██▌   | 36553/86398 [01:35<02:23, 347.40it/s]Preprocessing raw dataset...:  42%|██▌   | 36595/86398 [01:36<02:15, 367.57it/s]Preprocessing raw dataset...:  42%|██▌   | 36636/86398 [01:36<02:11, 378.35it/s]Preprocessing raw dataset...:  42%|██▌   | 36676/86398 [01:36<02:09, 384.23it/s]Preprocessing raw dataset...:  42%|██▌   | 36715/86398 [01:36<02:15, 367.43it/s]Preprocessing raw dataset...:  43%|██▌   | 36753/86398 [01:36<02:15, 367.44it/s]Preprocessing raw dataset...:  43%|██▌   | 36794/86398 [01:36<02:10, 379.39it/s]Preprocessing raw dataset...:  43%|██▌   | 36833/86398 [01:36<02:14, 368.74it/s]Preprocessing raw dataset...:  43%|██▌   | 36871/86398 [01:36<02:28, 332.50it/s]Preprocessing raw dataset...:  43%|██▌   | 36905/86398 [01:36<02:38, 311.74it/s]Preprocessing raw dataset...:  43%|██▌   | 36942/86398 [01:37<02:32, 323.58it/s]Preprocessing raw dataset...:  43%|██▌   | 36983/86398 [01:37<02:23, 344.41it/s]Preprocessing raw dataset...:  43%|██▌   | 37019/86398 [01:37<02:26, 336.67it/s]Preprocessing raw dataset...:  43%|██▌   | 37056/86398 [01:37<02:22, 345.61it/s]Preprocessing raw dataset...:  43%|██▌   | 37091/86398 [01:37<02:27, 333.50it/s]Preprocessing raw dataset...:  43%|██▌   | 37129/86398 [01:37<02:23, 344.39it/s]Preprocessing raw dataset...:  43%|██▌   | 37169/86398 [01:37<02:17, 357.64it/s]Preprocessing raw dataset...:  43%|██▌   | 37205/86398 [01:37<02:27, 332.70it/s]Preprocessing raw dataset...:  43%|██▌   | 37243/86398 [01:37<02:22, 344.32it/s]Preprocessing raw dataset...:  43%|██▌   | 37281/86398 [01:38<02:18, 354.13it/s]Preprocessing raw dataset...:  43%|██▌   | 37320/86398 [01:38<02:15, 362.11it/s]Preprocessing raw dataset...:  43%|██▌   | 37359/86398 [01:38<02:13, 367.21it/s]Preprocessing raw dataset...:  43%|██▌   | 37396/86398 [01:38<02:15, 362.31it/s]Preprocessing raw dataset...:  43%|██▌   | 37433/86398 [01:38<02:19, 352.11it/s]Preprocessing raw dataset...:  43%|██▌   | 37469/86398 [01:38<02:20, 347.21it/s]Preprocessing raw dataset...:  43%|██▌   | 37506/86398 [01:38<02:20, 347.50it/s]Preprocessing raw dataset...:  43%|██▌   | 37541/86398 [01:38<02:22, 341.83it/s]Preprocessing raw dataset...:  43%|██▌   | 37576/86398 [01:38<02:26, 333.37it/s]Preprocessing raw dataset...:  44%|██▌   | 37613/86398 [01:39<02:22, 343.32it/s]Preprocessing raw dataset...:  44%|██▌   | 37648/86398 [01:39<02:27, 329.96it/s]Preprocessing raw dataset...:  44%|██▌   | 37695/86398 [01:39<02:11, 369.18it/s]Preprocessing raw dataset...:  44%|██▌   | 37734/86398 [01:39<02:10, 371.77it/s]Preprocessing raw dataset...:  44%|██▌   | 37772/86398 [01:39<02:18, 352.16it/s]Preprocessing raw dataset...:  44%|██▋   | 37809/86398 [01:39<02:16, 356.83it/s]Preprocessing raw dataset...:  44%|██▋   | 37845/86398 [01:39<02:15, 357.69it/s]Preprocessing raw dataset...:  44%|██▋   | 37881/86398 [01:39<02:18, 349.74it/s]Preprocessing raw dataset...:  44%|██▋   | 37917/86398 [01:39<02:22, 339.08it/s]Preprocessing raw dataset...:  44%|██▋   | 37956/86398 [01:39<02:20, 343.85it/s]Preprocessing raw dataset...:  44%|██▋   | 37991/86398 [01:40<02:27, 328.04it/s]Preprocessing raw dataset...:  44%|██▋   | 38024/86398 [01:40<02:27, 327.76it/s]Preprocessing raw dataset...:  44%|██▋   | 38062/86398 [01:40<02:21, 341.98it/s]Preprocessing raw dataset...:  44%|██▋   | 38099/86398 [01:40<02:18, 348.42it/s]Preprocessing raw dataset...:  44%|██▋   | 38134/86398 [01:40<02:19, 345.95it/s]Preprocessing raw dataset...:  44%|██▋   | 38177/86398 [01:40<02:10, 369.74it/s]Preprocessing raw dataset...:  44%|██▋   | 38215/86398 [01:40<02:22, 337.32it/s]Preprocessing raw dataset...:  44%|██▋   | 38255/86398 [01:40<02:17, 350.63it/s]Preprocessing raw dataset...:  44%|██▋   | 38291/86398 [01:40<02:26, 328.03it/s]Preprocessing raw dataset...:  44%|██▋   | 38332/86398 [01:41<02:18, 347.46it/s]Preprocessing raw dataset...:  44%|██▋   | 38371/86398 [01:41<02:15, 355.56it/s]Preprocessing raw dataset...:  44%|██▋   | 38407/86398 [01:41<02:21, 339.29it/s]Preprocessing raw dataset...:  44%|██▋   | 38442/86398 [01:41<02:24, 332.75it/s]Preprocessing raw dataset...:  45%|██▋   | 38479/86398 [01:41<02:19, 342.83it/s]Preprocessing raw dataset...:  45%|██▋   | 38514/86398 [01:41<02:22, 335.77it/s]Preprocessing raw dataset...:  45%|██▋   | 38549/86398 [01:41<02:21, 339.01it/s]Preprocessing raw dataset...:  45%|██▋   | 38597/86398 [01:41<02:06, 378.32it/s]Preprocessing raw dataset...:  45%|██▋   | 38636/86398 [01:41<02:08, 371.80it/s]Preprocessing raw dataset...:  45%|██▋   | 38674/86398 [01:42<02:13, 357.41it/s]Preprocessing raw dataset...:  45%|██▋   | 38715/86398 [01:42<02:08, 370.90it/s]Preprocessing raw dataset...:  45%|██▋   | 38753/86398 [01:42<02:11, 363.67it/s]Preprocessing raw dataset...:  45%|██▋   | 38790/86398 [01:42<02:13, 357.21it/s]Preprocessing raw dataset...:  45%|██▋   | 38826/86398 [01:42<02:20, 339.62it/s]Preprocessing raw dataset...:  45%|██▋   | 38871/86398 [01:42<02:08, 369.10it/s]Preprocessing raw dataset...:  45%|██▋   | 38909/86398 [01:42<02:11, 359.78it/s]Preprocessing raw dataset...:  45%|██▋   | 38950/86398 [01:42<02:08, 370.61it/s]Preprocessing raw dataset...:  45%|██▋   | 38988/86398 [01:42<02:18, 342.12it/s]Preprocessing raw dataset...:  45%|██▋   | 39032/86398 [01:43<02:08, 367.38it/s]Preprocessing raw dataset...:  45%|██▋   | 39073/86398 [01:43<02:05, 375.76it/s]Preprocessing raw dataset...:  45%|██▋   | 39113/86398 [01:43<02:03, 382.44it/s]Preprocessing raw dataset...:  45%|██▋   | 39152/86398 [01:43<02:13, 353.87it/s]Preprocessing raw dataset...:  45%|██▋   | 39195/86398 [01:43<02:06, 374.58it/s]Preprocessing raw dataset...:  45%|██▋   | 39234/86398 [01:43<02:05, 375.13it/s]Preprocessing raw dataset...:  45%|██▋   | 39272/86398 [01:43<02:12, 355.34it/s]Preprocessing raw dataset...:  46%|██▋   | 39314/86398 [01:43<02:06, 373.16it/s]Preprocessing raw dataset...:  46%|██▋   | 39352/86398 [01:43<02:07, 368.12it/s]Preprocessing raw dataset...:  46%|██▋   | 39390/86398 [01:44<02:14, 348.43it/s]Preprocessing raw dataset...:  46%|██▋   | 39428/86398 [01:44<02:11, 356.64it/s]Preprocessing raw dataset...:  46%|██▋   | 39465/86398 [01:44<02:12, 355.23it/s]Preprocessing raw dataset...:  46%|██▋   | 39501/86398 [01:44<02:13, 350.67it/s]Preprocessing raw dataset...:  46%|██▋   | 39545/86398 [01:44<02:06, 369.91it/s]Preprocessing raw dataset...:  46%|██▋   | 39591/86398 [01:44<01:59, 391.44it/s]Preprocessing raw dataset...:  46%|██▊   | 39631/86398 [01:44<02:04, 376.03it/s]Preprocessing raw dataset...:  46%|██▊   | 39672/86398 [01:44<02:02, 382.51it/s]Preprocessing raw dataset...:  46%|██▊   | 39711/86398 [01:44<02:08, 364.16it/s]Preprocessing raw dataset...:  46%|██▊   | 39748/86398 [01:44<02:08, 363.95it/s]Preprocessing raw dataset...:  46%|██▊   | 39786/86398 [01:45<02:08, 362.11it/s]Preprocessing raw dataset...:  46%|██▊   | 39824/86398 [01:45<02:06, 366.90it/s]Preprocessing raw dataset...:  46%|██▊   | 39861/86398 [01:45<02:11, 353.25it/s]Preprocessing raw dataset...:  46%|██▊   | 39901/86398 [01:45<02:07, 363.88it/s]Preprocessing raw dataset...:  46%|██▊   | 39940/86398 [01:45<02:05, 370.75it/s]Preprocessing raw dataset...:  46%|██▊   | 39978/86398 [01:45<02:06, 367.44it/s]Preprocessing raw dataset...:  46%|██▊   | 40022/86398 [01:45<01:59, 387.64it/s]Preprocessing raw dataset...:  46%|██▊   | 40061/86398 [01:45<02:04, 373.12it/s]Preprocessing raw dataset...:  46%|██▊   | 40099/86398 [01:45<02:09, 357.12it/s]Preprocessing raw dataset...:  46%|██▊   | 40135/86398 [01:46<02:17, 336.55it/s]Preprocessing raw dataset...:  46%|██▊   | 40169/86398 [01:46<02:22, 325.43it/s]Preprocessing raw dataset...:  47%|██▊   | 40207/86398 [01:46<02:16, 339.28it/s]Preprocessing raw dataset...:  47%|██▊   | 40244/86398 [01:46<02:14, 344.12it/s]Preprocessing raw dataset...:  47%|██▊   | 40283/86398 [01:46<02:09, 356.76it/s]Preprocessing raw dataset...:  47%|██▊   | 40321/86398 [01:46<02:07, 362.58it/s]Preprocessing raw dataset...:  47%|██▊   | 40358/86398 [01:46<02:06, 364.29it/s]Preprocessing raw dataset...:  47%|██▊   | 40395/86398 [01:46<02:10, 352.25it/s]Preprocessing raw dataset...:  47%|██▊   | 40431/86398 [01:46<02:09, 353.92it/s]Preprocessing raw dataset...:  47%|██▊   | 40467/86398 [01:47<02:11, 349.34it/s]Preprocessing raw dataset...:  47%|██▊   | 40504/86398 [01:47<02:09, 353.99it/s]Preprocessing raw dataset...:  47%|██▊   | 40541/86398 [01:47<02:08, 356.50it/s]Preprocessing raw dataset...:  47%|██▊   | 40580/86398 [01:47<02:05, 364.60it/s]Preprocessing raw dataset...:  47%|██▊   | 40617/86398 [01:47<02:12, 345.40it/s]Preprocessing raw dataset...:  47%|██▊   | 40652/86398 [01:47<02:16, 334.32it/s]Preprocessing raw dataset...:  47%|██▊   | 40686/86398 [01:47<02:24, 317.35it/s]Preprocessing raw dataset...:  47%|██▊   | 40722/86398 [01:47<02:19, 327.97it/s]Preprocessing raw dataset...:  47%|██▊   | 40758/86398 [01:47<02:15, 336.42it/s]Preprocessing raw dataset...:  47%|██▊   | 40793/86398 [01:47<02:14, 339.87it/s]Preprocessing raw dataset...:  47%|██▊   | 40833/86398 [01:48<02:08, 354.57it/s]Preprocessing raw dataset...:  47%|██▊   | 40876/86398 [01:48<02:01, 375.28it/s]Preprocessing raw dataset...:  47%|██▊   | 40915/86398 [01:48<02:00, 378.79it/s]Preprocessing raw dataset...:  47%|██▊   | 40953/86398 [01:48<02:09, 351.23it/s]Preprocessing raw dataset...:  47%|██▊   | 40992/86398 [01:48<02:05, 361.20it/s]Preprocessing raw dataset...:  47%|██▊   | 41029/86398 [01:48<02:08, 351.86it/s]Preprocessing raw dataset...:  48%|██▊   | 41069/86398 [01:48<02:05, 362.08it/s]Preprocessing raw dataset...:  48%|██▊   | 41106/86398 [01:48<02:10, 348.12it/s]Preprocessing raw dataset...:  48%|██▊   | 41147/86398 [01:48<02:03, 364.98it/s]Preprocessing raw dataset...:  48%|██▊   | 41184/86398 [01:49<02:13, 338.16it/s]Preprocessing raw dataset...:  48%|██▊   | 41219/86398 [01:49<02:13, 337.23it/s]Preprocessing raw dataset...:  48%|██▊   | 41254/86398 [01:49<02:22, 315.92it/s]Preprocessing raw dataset...:  48%|██▊   | 41287/86398 [01:49<02:24, 313.05it/s]Preprocessing raw dataset...:  48%|██▊   | 41320/86398 [01:49<02:22, 316.96it/s]Preprocessing raw dataset...:  48%|██▊   | 41352/86398 [01:49<02:23, 314.62it/s]Preprocessing raw dataset...:  48%|██▊   | 41386/86398 [01:49<02:20, 321.38it/s]Preprocessing raw dataset...:  48%|██▉   | 41421/86398 [01:49<02:16, 329.02it/s]Preprocessing raw dataset...:  48%|██▉   | 41467/86398 [01:49<02:02, 365.96it/s]Preprocessing raw dataset...:  48%|██▉   | 41505/86398 [01:50<02:02, 365.00it/s]Preprocessing raw dataset...:  48%|██▉   | 41542/86398 [01:50<02:06, 355.22it/s]Preprocessing raw dataset...:  48%|██▉   | 41582/86398 [01:50<02:02, 365.68it/s]Preprocessing raw dataset...:  48%|██▉   | 41619/86398 [01:50<02:05, 356.35it/s]Preprocessing raw dataset...:  48%|██▉   | 41661/86398 [01:50<02:00, 371.38it/s]Preprocessing raw dataset...:  48%|██▉   | 41699/86398 [01:50<02:10, 341.66it/s]Preprocessing raw dataset...:  48%|██▉   | 41742/86398 [01:50<02:02, 364.22it/s]Preprocessing raw dataset...:  48%|██▉   | 41779/86398 [01:50<02:07, 349.62it/s]Preprocessing raw dataset...:  48%|██▉   | 41820/86398 [01:50<02:02, 365.04it/s]Preprocessing raw dataset...:  48%|██▉   | 41857/86398 [01:50<02:03, 361.35it/s]Preprocessing raw dataset...:  48%|██▉   | 41894/86398 [01:51<02:05, 355.02it/s]Preprocessing raw dataset...:  49%|██▉   | 41933/86398 [01:51<02:02, 364.30it/s]Preprocessing raw dataset...:  49%|██▉   | 41971/86398 [01:51<02:00, 368.26it/s]Preprocessing raw dataset...:  49%|██▉   | 42008/86398 [01:51<02:02, 363.09it/s]Preprocessing raw dataset...:  49%|██▉   | 42045/86398 [01:51<02:05, 354.59it/s]Preprocessing raw dataset...:  49%|██▉   | 42081/86398 [01:51<02:05, 354.04it/s]Preprocessing raw dataset...:  49%|██▉   | 42119/86398 [01:51<02:03, 358.44it/s]Preprocessing raw dataset...:  49%|██▉   | 42156/86398 [01:51<02:02, 359.94it/s]Preprocessing raw dataset...:  49%|██▉   | 42196/86398 [01:51<01:59, 369.56it/s]Preprocessing raw dataset...:  49%|██▉   | 42233/86398 [01:52<02:05, 351.65it/s]Preprocessing raw dataset...:  49%|██▉   | 42269/86398 [01:52<02:08, 342.54it/s]Preprocessing raw dataset...:  49%|██▉   | 42307/86398 [01:52<02:05, 350.55it/s]Preprocessing raw dataset...:  49%|██▉   | 42345/86398 [01:52<02:02, 358.79it/s]Preprocessing raw dataset...:  49%|██▉   | 42382/86398 [01:52<02:02, 359.11it/s]Preprocessing raw dataset...:  49%|██▉   | 42419/86398 [01:52<02:06, 348.32it/s]Preprocessing raw dataset...:  49%|██▉   | 42455/86398 [01:52<02:04, 351.57it/s]Preprocessing raw dataset...:  49%|██▉   | 42493/86398 [01:52<02:02, 358.64it/s]Preprocessing raw dataset...:  49%|██▉   | 42531/86398 [01:52<02:01, 361.27it/s]Preprocessing raw dataset...:  49%|██▉   | 42568/86398 [01:53<02:13, 328.70it/s]Preprocessing raw dataset...:  49%|██▉   | 42608/86398 [01:53<02:06, 347.05it/s]Preprocessing raw dataset...:  49%|██▉   | 42644/86398 [01:53<02:11, 332.05it/s]Preprocessing raw dataset...:  49%|██▉   | 42678/86398 [01:53<02:18, 316.47it/s]Preprocessing raw dataset...:  49%|██▉   | 42711/86398 [01:53<02:20, 310.75it/s]Preprocessing raw dataset...:  49%|██▉   | 42751/86398 [01:53<02:11, 331.12it/s]Preprocessing raw dataset...:  50%|██▉   | 42785/86398 [01:53<02:12, 327.93it/s]Preprocessing raw dataset...:  50%|██▉   | 42819/86398 [01:53<02:15, 321.77it/s]Preprocessing raw dataset...:  50%|██▉   | 42852/86398 [01:53<02:25, 298.92it/s]Preprocessing raw dataset...:  50%|██▉   | 42885/86398 [01:54<02:22, 305.93it/s]Preprocessing raw dataset...:  50%|██▉   | 42916/86398 [01:54<02:29, 291.21it/s]Preprocessing raw dataset...:  50%|██▉   | 42946/86398 [01:54<02:32, 284.23it/s]Preprocessing raw dataset...:  50%|██▉   | 42980/86398 [01:54<02:25, 299.36it/s]Preprocessing raw dataset...:  50%|██▉   | 43011/86398 [01:54<02:29, 289.43it/s]Preprocessing raw dataset...:  50%|██▉   | 43048/86398 [01:54<02:20, 308.83it/s]Preprocessing raw dataset...:  50%|██▉   | 43080/86398 [01:54<02:19, 311.19it/s]Preprocessing raw dataset...:  50%|██▉   | 43112/86398 [01:54<02:18, 313.02it/s]Preprocessing raw dataset...:  50%|██▉   | 43150/86398 [01:54<02:10, 331.46it/s]Preprocessing raw dataset...:  50%|██▉   | 43184/86398 [01:55<02:19, 310.76it/s]Preprocessing raw dataset...:  50%|███   | 43218/86398 [01:55<02:16, 316.29it/s]Preprocessing raw dataset...:  50%|███   | 43258/86398 [01:55<02:06, 339.71it/s]Preprocessing raw dataset...:  50%|███   | 43293/86398 [01:55<02:12, 326.09it/s]Preprocessing raw dataset...:  50%|███   | 43326/86398 [01:55<02:15, 316.80it/s]Preprocessing raw dataset...:  50%|███   | 43358/86398 [01:55<02:18, 310.03it/s]Preprocessing raw dataset...:  50%|███   | 43392/86398 [01:55<02:17, 312.55it/s]Preprocessing raw dataset...:  50%|███   | 43424/86398 [01:55<02:30, 285.12it/s]Preprocessing raw dataset...:  50%|███   | 43458/86398 [01:55<02:24, 297.09it/s]Preprocessing raw dataset...:  50%|███   | 43489/86398 [01:56<02:24, 296.36it/s]Preprocessing raw dataset...:  50%|███   | 43519/86398 [01:56<02:27, 291.43it/s]Preprocessing raw dataset...:  50%|███   | 43551/86398 [01:56<02:24, 296.96it/s]Preprocessing raw dataset...:  50%|███   | 43581/86398 [01:56<02:24, 297.30it/s]Preprocessing raw dataset...:  50%|███   | 43611/86398 [01:56<02:23, 297.32it/s]Preprocessing raw dataset...:  51%|███   | 43641/86398 [01:56<02:32, 281.17it/s]Preprocessing raw dataset...:  51%|███   | 43675/86398 [01:56<02:24, 295.31it/s]Preprocessing raw dataset...:  51%|███   | 43705/86398 [01:56<02:26, 291.43it/s]Preprocessing raw dataset...:  51%|███   | 43742/86398 [01:56<02:16, 312.49it/s]Preprocessing raw dataset...:  51%|███   | 43774/86398 [01:56<02:17, 310.79it/s]Preprocessing raw dataset...:  51%|███   | 43806/86398 [01:57<02:16, 311.62it/s]Preprocessing raw dataset...:  51%|███   | 43838/86398 [01:57<02:18, 306.58it/s]Preprocessing raw dataset...:  51%|███   | 43869/86398 [01:57<02:25, 291.52it/s]Preprocessing raw dataset...:  51%|███   | 43902/86398 [01:57<02:20, 301.50it/s]Preprocessing raw dataset...:  51%|███   | 43941/86398 [01:57<02:10, 325.06it/s]Preprocessing raw dataset...:  51%|███   | 43974/86398 [01:57<02:14, 315.13it/s]Preprocessing raw dataset...:  51%|███   | 44006/86398 [01:57<02:14, 314.60it/s]Preprocessing raw dataset...:  51%|███   | 44038/86398 [01:57<02:15, 313.19it/s]Preprocessing raw dataset...:  51%|███   | 44073/86398 [01:57<02:11, 322.44it/s]Preprocessing raw dataset...:  51%|███   | 44106/86398 [01:58<02:14, 315.09it/s]Preprocessing raw dataset...:  51%|███   | 44138/86398 [01:58<02:20, 301.29it/s]Preprocessing raw dataset...:  51%|███   | 44169/86398 [01:58<02:19, 302.05it/s]Preprocessing raw dataset...:  51%|███   | 44200/86398 [01:58<02:19, 302.73it/s]Preprocessing raw dataset...:  51%|███   | 44231/86398 [01:58<02:19, 301.54it/s]Preprocessing raw dataset...:  51%|███   | 44271/86398 [01:58<02:07, 329.51it/s]Preprocessing raw dataset...:  51%|███   | 44305/86398 [01:58<02:12, 317.02it/s]Preprocessing raw dataset...:  51%|███   | 44337/86398 [01:58<02:14, 311.68it/s]Preprocessing raw dataset...:  51%|███   | 44369/86398 [01:58<02:19, 302.33it/s]Preprocessing raw dataset...:  51%|███   | 44400/86398 [01:58<02:19, 301.61it/s]Preprocessing raw dataset...:  51%|███   | 44431/86398 [01:59<02:22, 295.30it/s]Preprocessing raw dataset...:  51%|███   | 44462/86398 [01:59<02:20, 297.93it/s]Preprocessing raw dataset...:  52%|███   | 44495/86398 [01:59<02:18, 302.76it/s]Preprocessing raw dataset...:  52%|███   | 44526/86398 [01:59<02:18, 301.29it/s]Preprocessing raw dataset...:  52%|███   | 44557/86398 [01:59<02:17, 303.48it/s]Preprocessing raw dataset...:  52%|███   | 44588/86398 [01:59<02:17, 303.88it/s]Preprocessing raw dataset...:  52%|███   | 44621/86398 [01:59<02:15, 307.65it/s]Preprocessing raw dataset...:  52%|███   | 44653/86398 [01:59<02:16, 304.71it/s]Preprocessing raw dataset...:  52%|███   | 44687/86398 [01:59<02:13, 311.87it/s]Preprocessing raw dataset...:  52%|███   | 44719/86398 [02:00<02:13, 312.92it/s]Preprocessing raw dataset...:  52%|███   | 44752/86398 [02:00<02:11, 317.02it/s]Preprocessing raw dataset...:  52%|███   | 44787/86398 [02:00<02:07, 325.64it/s]Preprocessing raw dataset...:  52%|███   | 44820/86398 [02:00<02:07, 325.88it/s]Preprocessing raw dataset...:  52%|███   | 44853/86398 [02:00<02:07, 326.11it/s]Preprocessing raw dataset...:  52%|███   | 44886/86398 [02:00<02:11, 315.67it/s]Preprocessing raw dataset...:  52%|███   | 44925/86398 [02:00<02:04, 334.22it/s]Preprocessing raw dataset...:  52%|███   | 44959/86398 [02:00<02:10, 317.45it/s]Preprocessing raw dataset...:  52%|███   | 44995/86398 [02:00<02:09, 320.61it/s]Preprocessing raw dataset...:  52%|███▏  | 45028/86398 [02:00<02:09, 320.65it/s]Preprocessing raw dataset...:  52%|███▏  | 45061/86398 [02:01<02:10, 317.22it/s]Preprocessing raw dataset...:  52%|███▏  | 45095/86398 [02:01<02:07, 322.90it/s]Preprocessing raw dataset...:  52%|███▏  | 45128/86398 [02:01<02:11, 314.76it/s]Preprocessing raw dataset...:  52%|███▏  | 45160/86398 [02:01<02:12, 311.03it/s]Preprocessing raw dataset...:  52%|███▏  | 45192/86398 [02:01<02:15, 303.65it/s]Preprocessing raw dataset...:  52%|███▏  | 45226/86398 [02:01<02:12, 310.24it/s]Preprocessing raw dataset...:  52%|███▏  | 45258/86398 [02:01<02:14, 306.25it/s]Preprocessing raw dataset...:  52%|███▏  | 45289/86398 [02:01<02:18, 295.93it/s]Preprocessing raw dataset...:  52%|███▏  | 45319/86398 [02:01<02:20, 293.35it/s]Preprocessing raw dataset...:  52%|███▏  | 45349/86398 [02:02<02:23, 286.21it/s]Preprocessing raw dataset...:  53%|███▏  | 45380/86398 [02:02<02:21, 290.32it/s]Preprocessing raw dataset...:  53%|███▏  | 45413/86398 [02:02<02:16, 299.34it/s]Preprocessing raw dataset...:  53%|███▏  | 45443/86398 [02:02<02:21, 289.56it/s]Preprocessing raw dataset...:  53%|███▏  | 45474/86398 [02:02<02:19, 293.73it/s]Preprocessing raw dataset...:  53%|███▏  | 45504/86398 [02:02<02:19, 293.93it/s]Preprocessing raw dataset...:  53%|███▏  | 45538/86398 [02:02<02:13, 305.97it/s]Preprocessing raw dataset...:  53%|███▏  | 45572/86398 [02:02<02:09, 315.31it/s]Preprocessing raw dataset...:  53%|███▏  | 45605/86398 [02:02<02:08, 317.79it/s]Preprocessing raw dataset...:  53%|███▏  | 45637/86398 [02:02<02:16, 299.55it/s]Preprocessing raw dataset...:  53%|███▏  | 45668/86398 [02:03<02:17, 296.28it/s]Preprocessing raw dataset...:  53%|███▏  | 45701/86398 [02:03<02:13, 304.92it/s]Preprocessing raw dataset...:  53%|███▏  | 45736/86398 [02:03<02:08, 317.57it/s]Preprocessing raw dataset...:  53%|███▏  | 45768/86398 [02:03<02:08, 315.01it/s]Preprocessing raw dataset...:  53%|███▏  | 45812/86398 [02:03<01:55, 350.16it/s]Preprocessing raw dataset...:  53%|███▏  | 45848/86398 [02:03<02:09, 312.93it/s]Preprocessing raw dataset...:  53%|███▏  | 45881/86398 [02:03<02:12, 305.13it/s]Preprocessing raw dataset...:  53%|███▏  | 45917/86398 [02:03<02:07, 317.70it/s]Preprocessing raw dataset...:  53%|███▏  | 45950/86398 [02:03<02:09, 313.14it/s]Preprocessing raw dataset...:  53%|███▏  | 45985/86398 [02:04<02:05, 322.40it/s]Preprocessing raw dataset...:  53%|███▏  | 46018/86398 [02:04<02:07, 317.73it/s]Preprocessing raw dataset...:  53%|███▏  | 46050/86398 [02:04<02:11, 307.51it/s]Preprocessing raw dataset...:  53%|███▏  | 46081/86398 [02:04<02:12, 303.34it/s]Preprocessing raw dataset...:  53%|███▏  | 46113/86398 [02:04<02:10, 307.62it/s]Preprocessing raw dataset...:  53%|███▏  | 46144/86398 [02:04<02:13, 301.36it/s]Preprocessing raw dataset...:  53%|███▏  | 46180/86398 [02:04<02:06, 317.79it/s]Preprocessing raw dataset...:  53%|███▏  | 46212/86398 [02:04<02:07, 315.83it/s]Preprocessing raw dataset...:  54%|███▏  | 46244/86398 [02:04<02:11, 305.67it/s]Preprocessing raw dataset...:  54%|███▏  | 46275/86398 [02:05<02:18, 290.56it/s]Preprocessing raw dataset...:  54%|███▏  | 46305/86398 [02:05<02:19, 286.77it/s]Preprocessing raw dataset...:  54%|███▏  | 46336/86398 [02:05<02:17, 291.51it/s]Preprocessing raw dataset...:  54%|███▏  | 46366/86398 [02:05<02:22, 280.22it/s]Preprocessing raw dataset...:  54%|███▏  | 46397/86398 [02:05<02:18, 288.40it/s]Preprocessing raw dataset...:  54%|███▏  | 46428/86398 [02:05<02:15, 294.21it/s]Preprocessing raw dataset...:  54%|███▏  | 46461/86398 [02:05<02:12, 301.48it/s]Preprocessing raw dataset...:  54%|███▏  | 46492/86398 [02:05<02:16, 293.29it/s]Preprocessing raw dataset...:  54%|███▏  | 46525/86398 [02:05<02:11, 302.97it/s]Preprocessing raw dataset...:  54%|███▏  | 46559/86398 [02:05<02:07, 313.49it/s]Preprocessing raw dataset...:  54%|███▏  | 46591/86398 [02:06<02:09, 306.39it/s]Preprocessing raw dataset...:  54%|███▏  | 46622/86398 [02:06<02:18, 287.48it/s]Preprocessing raw dataset...:  54%|███▏  | 46652/86398 [02:06<02:18, 287.33it/s]Preprocessing raw dataset...:  54%|███▏  | 46681/86398 [02:06<02:20, 283.03it/s]Preprocessing raw dataset...:  54%|███▏  | 46712/86398 [02:06<02:16, 289.79it/s]Preprocessing raw dataset...:  54%|███▏  | 46746/86398 [02:06<02:12, 299.13it/s]Preprocessing raw dataset...:  54%|███▏  | 46781/86398 [02:06<02:07, 310.19it/s]Preprocessing raw dataset...:  54%|███▎  | 46813/86398 [02:06<02:10, 304.36it/s]Preprocessing raw dataset...:  54%|███▎  | 46844/86398 [02:07<05:06, 128.97it/s]Preprocessing raw dataset...:  54%|███▎  | 46875/86398 [02:07<04:14, 155.27it/s]Preprocessing raw dataset...:  54%|███▎  | 46903/86398 [02:07<03:47, 173.61it/s]Preprocessing raw dataset...:  54%|███▎  | 46934/86398 [02:07<03:17, 199.32it/s]Preprocessing raw dataset...:  54%|███▎  | 46968/86398 [02:07<02:51, 229.58it/s]Preprocessing raw dataset...:  54%|███▎  | 47002/86398 [02:07<02:34, 255.05it/s]Preprocessing raw dataset...:  54%|███▎  | 47033/86398 [02:08<02:29, 262.75it/s]Preprocessing raw dataset...:  54%|███▎  | 47067/86398 [02:08<02:19, 282.23it/s]Preprocessing raw dataset...:  55%|███▎  | 47098/86398 [02:08<02:20, 279.88it/s]Preprocessing raw dataset...:  55%|███▎  | 47130/86398 [02:08<02:16, 288.64it/s]Preprocessing raw dataset...:  55%|███▎  | 47164/86398 [02:08<02:09, 302.54it/s]Preprocessing raw dataset...:  55%|███▎  | 47196/86398 [02:08<02:09, 302.90it/s]Preprocessing raw dataset...:  55%|███▎  | 47228/86398 [02:08<02:12, 294.87it/s]Preprocessing raw dataset...:  55%|███▎  | 47259/86398 [02:08<02:12, 294.38it/s]Preprocessing raw dataset...:  55%|███▎  | 47294/86398 [02:08<02:08, 304.89it/s]Preprocessing raw dataset...:  55%|███▎  | 47329/86398 [02:09<02:03, 316.13it/s]Preprocessing raw dataset...:  55%|███▎  | 47361/86398 [02:09<02:06, 309.21it/s]Preprocessing raw dataset...:  55%|███▎  | 47393/86398 [02:09<02:06, 309.03it/s]Preprocessing raw dataset...:  55%|███▎  | 47425/86398 [02:09<02:09, 301.38it/s]Preprocessing raw dataset...:  55%|███▎  | 47458/86398 [02:09<02:06, 307.77it/s]Preprocessing raw dataset...:  55%|███▎  | 47489/86398 [02:09<02:12, 292.81it/s]Preprocessing raw dataset...:  55%|███▎  | 47519/86398 [02:09<02:15, 287.41it/s]Preprocessing raw dataset...:  55%|███▎  | 47551/86398 [02:09<02:11, 296.46it/s]Preprocessing raw dataset...:  55%|███▎  | 47582/86398 [02:09<02:09, 299.79it/s]Preprocessing raw dataset...:  55%|███▎  | 47613/86398 [02:09<02:16, 284.68it/s]Preprocessing raw dataset...:  55%|███▎  | 47650/86398 [02:10<02:06, 307.27it/s]Preprocessing raw dataset...:  55%|███▎  | 47684/86398 [02:10<02:02, 316.22it/s]Preprocessing raw dataset...:  55%|███▎  | 47716/86398 [02:10<02:11, 293.16it/s]Preprocessing raw dataset...:  55%|███▎  | 47749/86398 [02:10<02:07, 302.10it/s]Preprocessing raw dataset...:  55%|███▎  | 47784/86398 [02:10<02:03, 312.86it/s]Preprocessing raw dataset...:  55%|███▎  | 47823/86398 [02:10<01:55, 334.19it/s]Preprocessing raw dataset...:  55%|███▎  | 47857/86398 [02:10<02:00, 319.84it/s]Preprocessing raw dataset...:  55%|███▎  | 47890/86398 [02:10<02:03, 311.42it/s]Preprocessing raw dataset...:  55%|███▎  | 47922/86398 [02:10<02:03, 311.24it/s]Preprocessing raw dataset...:  56%|███▎  | 47954/86398 [02:11<02:07, 301.56it/s]Preprocessing raw dataset...:  56%|███▎  | 47993/86398 [02:11<01:57, 326.04it/s]Preprocessing raw dataset...:  56%|███▎  | 48026/86398 [02:11<02:00, 318.18it/s]Preprocessing raw dataset...:  56%|███▎  | 48059/86398 [02:11<02:03, 309.93it/s]Preprocessing raw dataset...:  56%|███▎  | 48091/86398 [02:11<02:03, 309.58it/s]Preprocessing raw dataset...:  56%|███▎  | 48123/86398 [02:11<02:11, 290.85it/s]Preprocessing raw dataset...:  56%|███▎  | 48156/86398 [02:11<02:07, 299.77it/s]Preprocessing raw dataset...:  56%|███▎  | 48198/86398 [02:11<01:54, 332.55it/s]Preprocessing raw dataset...:  56%|███▎  | 48234/86398 [02:11<01:52, 340.17it/s]Preprocessing raw dataset...:  56%|███▎  | 48269/86398 [02:12<02:01, 313.22it/s]Preprocessing raw dataset...:  56%|███▎  | 48301/86398 [02:12<02:06, 301.11it/s]Preprocessing raw dataset...:  56%|███▎  | 48333/86398 [02:12<02:04, 306.06it/s]Preprocessing raw dataset...:  56%|███▎  | 48369/86398 [02:12<01:59, 318.50it/s]Preprocessing raw dataset...:  56%|███▎  | 48403/86398 [02:12<01:58, 321.59it/s]Preprocessing raw dataset...:  56%|███▎  | 48436/86398 [02:12<02:04, 305.59it/s]Preprocessing raw dataset...:  56%|███▎  | 48467/86398 [02:12<02:05, 303.28it/s]Preprocessing raw dataset...:  56%|███▎  | 48500/86398 [02:12<02:02, 308.25it/s]Preprocessing raw dataset...:  56%|███▎  | 48531/86398 [02:12<02:03, 305.78it/s]Preprocessing raw dataset...:  56%|███▎  | 48562/86398 [02:13<02:10, 290.41it/s]Preprocessing raw dataset...:  56%|███▎  | 48593/86398 [02:13<02:08, 295.14it/s]Preprocessing raw dataset...:  56%|███▍  | 48624/86398 [02:13<02:06, 299.08it/s]Preprocessing raw dataset...:  56%|███▍  | 48655/86398 [02:13<02:09, 290.53it/s]Preprocessing raw dataset...:  56%|███▍  | 48689/86398 [02:13<02:06, 297.04it/s]Preprocessing raw dataset...:  56%|███▍  | 48724/86398 [02:13<02:00, 311.94it/s]Preprocessing raw dataset...:  56%|███▍  | 48756/86398 [02:13<02:03, 304.96it/s]Preprocessing raw dataset...:  56%|███▍  | 48791/86398 [02:13<01:58, 317.04it/s]Preprocessing raw dataset...:  57%|███▍  | 48823/86398 [02:13<02:14, 278.96it/s]Preprocessing raw dataset...:  57%|███▍  | 48858/86398 [02:14<02:06, 296.77it/s]Preprocessing raw dataset...:  57%|███▍  | 48893/86398 [02:14<02:01, 309.72it/s]Preprocessing raw dataset...:  57%|███▍  | 48925/86398 [02:14<02:02, 306.06it/s]Preprocessing raw dataset...:  57%|███▍  | 48957/86398 [02:14<02:00, 309.78it/s]Preprocessing raw dataset...:  57%|███▍  | 48989/86398 [02:14<02:12, 283.18it/s]Preprocessing raw dataset...:  57%|███▍  | 49019/86398 [02:14<02:10, 286.25it/s]Preprocessing raw dataset...:  57%|███▍  | 49050/86398 [02:14<02:07, 292.45it/s]Preprocessing raw dataset...:  57%|███▍  | 49083/86398 [02:14<02:04, 299.42it/s]Preprocessing raw dataset...:  57%|███▍  | 49114/86398 [02:14<02:03, 301.76it/s]Preprocessing raw dataset...:  57%|███▍  | 49145/86398 [02:14<02:03, 301.88it/s]Preprocessing raw dataset...:  57%|███▍  | 49177/86398 [02:15<02:02, 304.31it/s]Preprocessing raw dataset...:  57%|███▍  | 49209/86398 [02:15<02:00, 308.57it/s]Preprocessing raw dataset...:  57%|███▍  | 49242/86398 [02:15<01:58, 314.18it/s]Preprocessing raw dataset...:  57%|███▍  | 49274/86398 [02:15<02:00, 307.46it/s]Preprocessing raw dataset...:  57%|███▍  | 49305/86398 [02:15<02:08, 289.02it/s]Preprocessing raw dataset...:  57%|███▍  | 49335/86398 [02:15<02:12, 279.83it/s]Preprocessing raw dataset...:  57%|███▍  | 49364/86398 [02:15<02:16, 271.42it/s]Preprocessing raw dataset...:  57%|███▍  | 49399/86398 [02:15<02:08, 288.86it/s]Preprocessing raw dataset...:  57%|███▍  | 49429/86398 [02:15<02:06, 291.68it/s]Preprocessing raw dataset...:  57%|███▍  | 49459/86398 [02:16<02:07, 289.24it/s]Preprocessing raw dataset...:  57%|███▍  | 49496/86398 [02:16<01:58, 312.12it/s]Preprocessing raw dataset...:  57%|███▍  | 49530/86398 [02:16<01:57, 313.43it/s]Preprocessing raw dataset...:  57%|███▍  | 49563/86398 [02:16<01:55, 317.64it/s]Preprocessing raw dataset...:  57%|███▍  | 49597/86398 [02:16<01:55, 318.27it/s]Preprocessing raw dataset...:  57%|███▍  | 49629/86398 [02:16<01:58, 310.71it/s]Preprocessing raw dataset...:  57%|███▍  | 49661/86398 [02:16<02:03, 297.20it/s]Preprocessing raw dataset...:  58%|███▍  | 49693/86398 [02:16<02:01, 303.04it/s]Preprocessing raw dataset...:  58%|███▍  | 49729/86398 [02:16<01:57, 312.49it/s]Preprocessing raw dataset...:  58%|███▍  | 49761/86398 [02:17<02:03, 295.89it/s]Preprocessing raw dataset...:  58%|███▍  | 49792/86398 [02:17<02:03, 297.37it/s]Preprocessing raw dataset...:  58%|███▍  | 49822/86398 [02:17<02:03, 296.83it/s]Preprocessing raw dataset...:  58%|███▍  | 49852/86398 [02:17<02:05, 290.40it/s]Preprocessing raw dataset...:  58%|███▍  | 49895/86398 [02:17<01:50, 329.97it/s]Preprocessing raw dataset...:  58%|███▍  | 49929/86398 [02:17<01:49, 332.36it/s]Preprocessing raw dataset...:  58%|███▍  | 49963/86398 [02:17<01:57, 311.09it/s]Preprocessing raw dataset...:  58%|███▍  | 49999/86398 [02:17<01:52, 324.17it/s]Preprocessing raw dataset...:  58%|███▍  | 50032/86398 [02:17<01:59, 304.44it/s]Preprocessing raw dataset...:  58%|███▍  | 50063/86398 [02:18<02:02, 295.94it/s]Preprocessing raw dataset...:  58%|███▍  | 50102/86398 [02:18<01:53, 319.74it/s]Preprocessing raw dataset...:  58%|███▍  | 50135/86398 [02:18<01:55, 314.17it/s]Preprocessing raw dataset...:  58%|███▍  | 50167/86398 [02:18<01:56, 311.49it/s]Preprocessing raw dataset...:  58%|███▍  | 50199/86398 [02:18<01:58, 306.02it/s]Preprocessing raw dataset...:  58%|███▍  | 50232/86398 [02:18<01:57, 307.08it/s]Preprocessing raw dataset...:  58%|███▍  | 50263/86398 [02:18<01:58, 305.13it/s]Preprocessing raw dataset...:  58%|███▍  | 50294/86398 [02:18<02:03, 293.07it/s]Preprocessing raw dataset...:  58%|███▍  | 50326/86398 [02:18<02:00, 299.71it/s]Preprocessing raw dataset...:  58%|███▍  | 50359/86398 [02:18<01:58, 304.36it/s]Preprocessing raw dataset...:  58%|███▍  | 50393/86398 [02:19<01:54, 314.48it/s]Preprocessing raw dataset...:  58%|███▌  | 50425/86398 [02:19<02:00, 297.74it/s]Preprocessing raw dataset...:  58%|███▌  | 50456/86398 [02:19<01:59, 299.82it/s]Preprocessing raw dataset...:  58%|███▌  | 50493/86398 [02:19<01:52, 319.38it/s]Preprocessing raw dataset...:  58%|███▌  | 50526/86398 [02:19<01:59, 299.60it/s]Preprocessing raw dataset...:  59%|███▌  | 50558/86398 [02:19<01:57, 305.02it/s]Preprocessing raw dataset...:  59%|███▌  | 50590/86398 [02:19<01:58, 302.41it/s]Preprocessing raw dataset...:  59%|███▌  | 50621/86398 [02:19<01:59, 298.62it/s]Preprocessing raw dataset...:  59%|███▌  | 50652/86398 [02:19<01:58, 301.52it/s]Preprocessing raw dataset...:  59%|███▌  | 50687/86398 [02:20<01:55, 310.27it/s]Preprocessing raw dataset...:  59%|███▌  | 50721/86398 [02:20<01:52, 316.69it/s]Preprocessing raw dataset...:  59%|███▌  | 50753/86398 [02:20<02:03, 288.51it/s]Preprocessing raw dataset...:  59%|███▌  | 50783/86398 [02:20<02:04, 285.20it/s]Preprocessing raw dataset...:  59%|███▌  | 50812/86398 [02:20<02:14, 265.43it/s]Preprocessing raw dataset...:  59%|███▌  | 50841/86398 [02:20<02:11, 269.86it/s]Preprocessing raw dataset...:  59%|███▌  | 50880/86398 [02:20<01:57, 301.60it/s]Preprocessing raw dataset...:  59%|███▌  | 50912/86398 [02:20<01:56, 304.15it/s]Preprocessing raw dataset...:  59%|███▌  | 50949/86398 [02:20<01:50, 319.92it/s]Preprocessing raw dataset...:  59%|███▌  | 50982/86398 [02:21<01:58, 299.61it/s]Preprocessing raw dataset...:  59%|███▌  | 51013/86398 [02:21<01:58, 299.86it/s]Preprocessing raw dataset...:  59%|███▌  | 51044/86398 [02:21<01:58, 298.97it/s]Preprocessing raw dataset...:  59%|███▌  | 51075/86398 [02:21<02:01, 290.22it/s]Preprocessing raw dataset...:  59%|███▌  | 51105/86398 [02:21<02:02, 287.04it/s]Preprocessing raw dataset...:  59%|███▌  | 51134/86398 [02:21<02:05, 280.83it/s]Preprocessing raw dataset...:  59%|███▌  | 51169/86398 [02:21<01:58, 296.49it/s]Preprocessing raw dataset...:  59%|███▌  | 51204/86398 [02:21<01:53, 308.87it/s]Preprocessing raw dataset...:  59%|███▌  | 51235/86398 [02:21<01:55, 303.69it/s]Preprocessing raw dataset...:  59%|███▌  | 51267/86398 [02:22<01:55, 305.21it/s]Preprocessing raw dataset...:  59%|███▌  | 51298/86398 [02:22<01:54, 305.61it/s]Preprocessing raw dataset...:  59%|███▌  | 51335/86398 [02:22<01:48, 323.66it/s]Preprocessing raw dataset...:  59%|███▌  | 51368/86398 [02:22<01:48, 322.32it/s]Preprocessing raw dataset...:  59%|███▌  | 51405/86398 [02:22<01:44, 334.86it/s]Preprocessing raw dataset...:  60%|███▌  | 51439/86398 [02:22<01:56, 301.08it/s]Preprocessing raw dataset...:  60%|███▌  | 51470/86398 [02:22<01:55, 302.40it/s]Preprocessing raw dataset...:  60%|███▌  | 51501/86398 [02:22<01:57, 297.00it/s]Preprocessing raw dataset...:  60%|███▌  | 51532/86398 [02:22<01:56, 298.77it/s]Preprocessing raw dataset...:  60%|███▌  | 51564/86398 [02:22<01:56, 298.31it/s]Preprocessing raw dataset...:  60%|███▌  | 51595/86398 [02:23<01:55, 301.37it/s]Preprocessing raw dataset...:  60%|███▌  | 51626/86398 [02:23<01:58, 293.25it/s]Preprocessing raw dataset...:  60%|███▌  | 51656/86398 [02:23<01:59, 290.11it/s]Preprocessing raw dataset...:  60%|███▌  | 51686/86398 [02:23<01:58, 291.73it/s]Preprocessing raw dataset...:  60%|███▌  | 51716/86398 [02:23<02:00, 286.84it/s]Preprocessing raw dataset...:  60%|███▌  | 51746/86398 [02:23<01:59, 289.02it/s]Preprocessing raw dataset...:  60%|███▌  | 51779/86398 [02:23<01:56, 297.79it/s]Preprocessing raw dataset...:  60%|███▌  | 51813/86398 [02:23<01:54, 302.81it/s]Preprocessing raw dataset...:  60%|███▌  | 51847/86398 [02:23<01:51, 309.51it/s]Preprocessing raw dataset...:  60%|███▌  | 51880/86398 [02:24<01:51, 308.61it/s]Preprocessing raw dataset...:  60%|███▌  | 51911/86398 [02:24<01:53, 305.14it/s]Preprocessing raw dataset...:  60%|███▌  | 51942/86398 [02:24<01:53, 302.55it/s]Preprocessing raw dataset...:  60%|███▌  | 51979/86398 [02:24<01:47, 320.83it/s]Preprocessing raw dataset...:  60%|███▌  | 52014/86398 [02:24<01:45, 327.39it/s]Preprocessing raw dataset...:  60%|███▌  | 52047/86398 [02:24<01:46, 323.42it/s]Preprocessing raw dataset...:  60%|███▌  | 52080/86398 [02:24<01:47, 319.32it/s]Preprocessing raw dataset...:  60%|███▌  | 52119/86398 [02:24<01:41, 337.37it/s]Preprocessing raw dataset...:  60%|███▌  | 52153/86398 [02:24<01:42, 334.53it/s]Preprocessing raw dataset...:  60%|███▌  | 52189/86398 [02:24<01:40, 340.80it/s]Preprocessing raw dataset...:  60%|███▋  | 52224/86398 [02:25<01:49, 312.04it/s]Preprocessing raw dataset...:  60%|███▋  | 52259/86398 [02:25<01:46, 321.93it/s]Preprocessing raw dataset...:  61%|███▋  | 52292/86398 [02:25<01:51, 305.68it/s]Preprocessing raw dataset...:  61%|███▋  | 52323/86398 [02:25<01:54, 297.59it/s]Preprocessing raw dataset...:  61%|███▋  | 52354/86398 [02:25<01:54, 297.19it/s]Preprocessing raw dataset...:  61%|███▋  | 52393/86398 [02:25<01:48, 313.41it/s]Preprocessing raw dataset...:  61%|███▋  | 52425/86398 [02:25<01:52, 301.39it/s]Preprocessing raw dataset...:  61%|███▋  | 52456/86398 [02:25<01:51, 303.62it/s]Preprocessing raw dataset...:  61%|███▋  | 52487/86398 [02:25<01:52, 302.15it/s]Preprocessing raw dataset...:  61%|███▋  | 52522/86398 [02:26<01:48, 312.96it/s]Preprocessing raw dataset...:  61%|███▋  | 52554/86398 [02:26<01:52, 300.86it/s]Preprocessing raw dataset...:  61%|███▋  | 52585/86398 [02:26<01:55, 291.86it/s]Preprocessing raw dataset...:  61%|███▋  | 52620/86398 [02:26<01:50, 306.77it/s]Preprocessing raw dataset...:  61%|███▋  | 52651/86398 [02:26<01:54, 294.92it/s]Preprocessing raw dataset...:  61%|███▋  | 52692/86398 [02:26<01:43, 326.81it/s]Preprocessing raw dataset...:  61%|███▋  | 52726/86398 [02:26<01:48, 310.79it/s]Preprocessing raw dataset...:  61%|███▋  | 52758/86398 [02:26<01:57, 286.35it/s]Preprocessing raw dataset...:  61%|███▋  | 52792/86398 [02:26<01:53, 296.17it/s]Preprocessing raw dataset...:  61%|███▋  | 52832/86398 [02:27<01:43, 323.93it/s]Preprocessing raw dataset...:  61%|███▋  | 52865/86398 [02:27<01:49, 306.73it/s]Preprocessing raw dataset...:  61%|███▋  | 52897/86398 [02:27<01:52, 297.38it/s]Preprocessing raw dataset...:  61%|███▋  | 52933/86398 [02:27<01:47, 311.13it/s]Preprocessing raw dataset...:  61%|███▋  | 52965/86398 [02:27<01:47, 310.75it/s]Preprocessing raw dataset...:  61%|███▋  | 53000/86398 [02:27<01:44, 318.27it/s]Preprocessing raw dataset...:  61%|███▋  | 53033/86398 [02:27<01:53, 294.97it/s]Preprocessing raw dataset...:  61%|███▋  | 53065/86398 [02:27<01:50, 301.72it/s]Preprocessing raw dataset...:  61%|███▋  | 53098/86398 [02:27<01:48, 307.11it/s]Preprocessing raw dataset...:  61%|███▋  | 53130/86398 [02:28<01:47, 310.69it/s]Preprocessing raw dataset...:  62%|███▋  | 53163/86398 [02:28<01:45, 316.03it/s]Preprocessing raw dataset...:  62%|███▋  | 53199/86398 [02:28<01:41, 326.91it/s]Preprocessing raw dataset...:  62%|███▋  | 53232/86398 [02:28<01:44, 317.52it/s]Preprocessing raw dataset...:  62%|███▋  | 53264/86398 [02:28<01:44, 317.00it/s]Preprocessing raw dataset...:  62%|███▋  | 53297/86398 [02:28<01:43, 320.09it/s]Preprocessing raw dataset...:  62%|███▋  | 53333/86398 [02:28<01:39, 331.58it/s]Preprocessing raw dataset...:  62%|███▋  | 53367/86398 [02:28<01:40, 329.38it/s]Preprocessing raw dataset...:  62%|███▋  | 53406/86398 [02:28<01:35, 345.42it/s]Preprocessing raw dataset...:  62%|███▋  | 53443/86398 [02:28<01:35, 345.44it/s]Preprocessing raw dataset...:  62%|███▋  | 53478/86398 [02:29<01:39, 330.87it/s]Preprocessing raw dataset...:  62%|███▋  | 53512/86398 [02:29<01:40, 325.73it/s]Preprocessing raw dataset...:  62%|███▋  | 53550/86398 [02:29<01:37, 338.38it/s]Preprocessing raw dataset...:  62%|███▋  | 53584/86398 [02:29<01:39, 330.51it/s]Preprocessing raw dataset...:  62%|███▋  | 53618/86398 [02:29<01:43, 317.80it/s]Preprocessing raw dataset...:  62%|███▋  | 53653/86398 [02:29<01:41, 322.98it/s]Preprocessing raw dataset...:  62%|███▋  | 53687/86398 [02:29<01:40, 326.31it/s]Preprocessing raw dataset...:  62%|███▋  | 53720/86398 [02:29<01:43, 317.23it/s]Preprocessing raw dataset...:  62%|███▋  | 53752/86398 [02:29<01:48, 300.54it/s]Preprocessing raw dataset...:  62%|███▋  | 53783/86398 [02:30<01:49, 298.62it/s]Preprocessing raw dataset...:  62%|███▋  | 53815/86398 [02:30<01:47, 304.23it/s]Preprocessing raw dataset...:  62%|███▋  | 53846/86398 [02:30<01:50, 293.81it/s]Preprocessing raw dataset...:  62%|███▋  | 53877/86398 [02:30<01:49, 297.08it/s]Preprocessing raw dataset...:  62%|███▋  | 53907/86398 [02:30<01:49, 295.82it/s]Preprocessing raw dataset...:  62%|███▋  | 53938/86398 [02:30<01:48, 298.93it/s]Preprocessing raw dataset...:  62%|███▋  | 53974/86398 [02:30<01:42, 315.55it/s]Preprocessing raw dataset...:  63%|███▊  | 54006/86398 [02:30<01:53, 286.14it/s]Preprocessing raw dataset...:  63%|███▊  | 54036/86398 [02:30<01:52, 287.89it/s]Preprocessing raw dataset...:  63%|███▊  | 54074/86398 [02:31<01:44, 309.67it/s]Preprocessing raw dataset...:  63%|███▊  | 54109/86398 [02:31<01:41, 317.30it/s]Preprocessing raw dataset...:  63%|███▊  | 54146/86398 [02:31<01:38, 328.58it/s]Preprocessing raw dataset...:  63%|███▊  | 54180/86398 [02:31<01:40, 321.50it/s]Preprocessing raw dataset...:  63%|███▊  | 54215/86398 [02:31<01:38, 327.25it/s]Preprocessing raw dataset...:  63%|███▊  | 54249/86398 [02:31<01:37, 329.09it/s]Preprocessing raw dataset...:  63%|███▊  | 54283/86398 [02:31<01:41, 316.68it/s]Preprocessing raw dataset...:  63%|███▊  | 54317/86398 [02:31<01:39, 320.97it/s]Preprocessing raw dataset...:  63%|███▊  | 54351/86398 [02:31<01:38, 325.31it/s]Preprocessing raw dataset...:  63%|███▊  | 54384/86398 [02:32<01:38, 326.11it/s]Preprocessing raw dataset...:  63%|███▊  | 54417/86398 [02:32<01:41, 314.34it/s]Preprocessing raw dataset...:  63%|███▊  | 54449/86398 [02:32<01:45, 303.65it/s]Preprocessing raw dataset...:  63%|███▊  | 54480/86398 [02:32<01:48, 295.43it/s]Preprocessing raw dataset...:  63%|███▊  | 54512/86398 [02:32<01:46, 299.40it/s]Preprocessing raw dataset...:  63%|███▊  | 54548/86398 [02:32<01:40, 316.52it/s]Preprocessing raw dataset...:  63%|███▊  | 54580/86398 [02:32<01:44, 304.04it/s]Preprocessing raw dataset...:  63%|███▊  | 54618/86398 [02:32<01:38, 323.60it/s]Preprocessing raw dataset...:  63%|███▊  | 54651/86398 [02:32<01:40, 315.18it/s]Preprocessing raw dataset...:  63%|███▊  | 54686/86398 [02:32<01:38, 321.60it/s]Preprocessing raw dataset...:  63%|███▊  | 54719/86398 [02:33<01:44, 304.59it/s]Preprocessing raw dataset...:  63%|███▊  | 54754/86398 [02:33<01:40, 316.24it/s]Preprocessing raw dataset...:  63%|███▊  | 54786/86398 [02:33<01:42, 307.28it/s]Preprocessing raw dataset...:  63%|███▊  | 54820/86398 [02:33<01:41, 310.13it/s]Preprocessing raw dataset...:  63%|███▊  | 54854/86398 [02:33<01:39, 318.54it/s]Preprocessing raw dataset...:  64%|███▊  | 54887/86398 [02:33<01:37, 321.75it/s]Preprocessing raw dataset...:  64%|███▊  | 54920/86398 [02:33<01:38, 320.36it/s]Preprocessing raw dataset...:  64%|███▊  | 54959/86398 [02:33<01:33, 336.34it/s]Preprocessing raw dataset...:  64%|███▊  | 54993/86398 [02:33<01:36, 324.33it/s]Preprocessing raw dataset...:  64%|███▊  | 55034/86398 [02:34<01:31, 341.03it/s]Preprocessing raw dataset...:  64%|███▊  | 55069/86398 [02:34<01:34, 332.50it/s]Preprocessing raw dataset...:  64%|███▊  | 55103/86398 [02:34<01:38, 316.49it/s]Preprocessing raw dataset...:  64%|███▊  | 55135/86398 [02:34<01:38, 316.26it/s]Preprocessing raw dataset...:  64%|███▊  | 55167/86398 [02:34<01:41, 306.21it/s]Preprocessing raw dataset...:  64%|███▊  | 55199/86398 [02:34<01:40, 308.94it/s]Preprocessing raw dataset...:  64%|███▊  | 55233/86398 [02:34<01:38, 316.86it/s]Preprocessing raw dataset...:  64%|███▊  | 55267/86398 [02:34<01:36, 322.56it/s]Preprocessing raw dataset...:  64%|███▊  | 55301/86398 [02:34<01:35, 325.63it/s]Preprocessing raw dataset...:  64%|███▊  | 55334/86398 [02:35<01:40, 309.18it/s]Preprocessing raw dataset...:  64%|███▊  | 55366/86398 [02:35<01:42, 302.39it/s]Preprocessing raw dataset...:  64%|███▊  | 55397/86398 [02:35<01:47, 288.36it/s]Preprocessing raw dataset...:  64%|███▊  | 55431/86398 [02:35<01:43, 298.86it/s]Preprocessing raw dataset...:  64%|███▊  | 55462/86398 [02:35<01:42, 300.82it/s]Preprocessing raw dataset...:  64%|███▊  | 55493/86398 [02:35<01:42, 302.63it/s]Preprocessing raw dataset...:  64%|███▊  | 55524/86398 [02:35<01:42, 302.44it/s]Preprocessing raw dataset...:  64%|███▊  | 55556/86398 [02:35<01:40, 305.77it/s]Preprocessing raw dataset...:  64%|███▊  | 55587/86398 [02:35<01:42, 301.49it/s]Preprocessing raw dataset...:  64%|███▊  | 55618/86398 [02:35<01:45, 292.70it/s]Preprocessing raw dataset...:  64%|███▊  | 55649/86398 [02:36<01:44, 292.93it/s]Preprocessing raw dataset...:  64%|███▊  | 55681/86398 [02:36<01:42, 299.04it/s]Preprocessing raw dataset...:  64%|███▊  | 55716/86398 [02:36<01:38, 312.41it/s]Preprocessing raw dataset...:  65%|███▊  | 55748/86398 [02:36<01:39, 308.16it/s]Preprocessing raw dataset...:  65%|███▊  | 55780/86398 [02:36<01:38, 309.49it/s]Preprocessing raw dataset...:  65%|███▉  | 55811/86398 [02:36<01:43, 294.21it/s]Preprocessing raw dataset...:  65%|███▉  | 55844/86398 [02:36<01:40, 303.55it/s]Preprocessing raw dataset...:  65%|███▉  | 55875/86398 [02:36<01:41, 301.61it/s]Preprocessing raw dataset...:  65%|███▉  | 55913/86398 [02:36<01:34, 323.11it/s]Preprocessing raw dataset...:  65%|███▉  | 55946/86398 [02:37<01:34, 321.18it/s]Preprocessing raw dataset...:  65%|███▉  | 55979/86398 [02:37<01:43, 293.74it/s]Preprocessing raw dataset...:  65%|███▉  | 56009/86398 [02:37<01:43, 293.27it/s]Preprocessing raw dataset...:  65%|███▉  | 56044/86398 [02:37<01:39, 306.43it/s]Preprocessing raw dataset...:  65%|███▉  | 56081/86398 [02:37<01:33, 323.47it/s]Preprocessing raw dataset...:  65%|███▉  | 56115/86398 [02:37<01:32, 326.07it/s]Preprocessing raw dataset...:  65%|███▉  | 56148/86398 [02:37<01:36, 314.83it/s]Preprocessing raw dataset...:  65%|███▉  | 56181/86398 [02:37<01:35, 317.74it/s]Preprocessing raw dataset...:  65%|███▉  | 56213/86398 [02:37<01:39, 304.02it/s]Preprocessing raw dataset...:  65%|███▉  | 56244/86398 [02:38<01:41, 296.24it/s]Preprocessing raw dataset...:  65%|███▉  | 56274/86398 [02:38<01:42, 294.11it/s]Preprocessing raw dataset...:  65%|███▉  | 56306/86398 [02:38<01:39, 300.95it/s]Preprocessing raw dataset...:  65%|███▉  | 56337/86398 [02:38<01:40, 300.13it/s]Preprocessing raw dataset...:  65%|███▉  | 56370/86398 [02:38<01:37, 307.71it/s]Preprocessing raw dataset...:  65%|███▉  | 56403/86398 [02:38<01:36, 312.42it/s]Preprocessing raw dataset...:  65%|███▉  | 56435/86398 [02:38<01:39, 302.44it/s]Preprocessing raw dataset...:  65%|███▉  | 56466/86398 [02:38<01:46, 280.60it/s]Preprocessing raw dataset...:  65%|███▉  | 56503/86398 [02:38<01:38, 304.35it/s]Preprocessing raw dataset...:  65%|███▉  | 56534/86398 [02:38<01:39, 299.33it/s]Preprocessing raw dataset...:  65%|███▉  | 56565/86398 [02:39<01:40, 296.34it/s]Preprocessing raw dataset...:  66%|███▉  | 56595/86398 [02:39<01:47, 276.30it/s]Preprocessing raw dataset...:  66%|███▉  | 56623/86398 [02:39<01:49, 272.48it/s]Preprocessing raw dataset...:  66%|███▉  | 56655/86398 [02:39<01:44, 283.41it/s]Preprocessing raw dataset...:  66%|███▉  | 56693/86398 [02:39<01:36, 308.82it/s]Preprocessing raw dataset...:  66%|███▉  | 56725/86398 [02:39<01:35, 309.69it/s]Preprocessing raw dataset...:  66%|███▉  | 56758/86398 [02:39<01:34, 315.27it/s]Preprocessing raw dataset...:  66%|███▉  | 56790/86398 [02:39<01:34, 311.88it/s]Preprocessing raw dataset...:  66%|███▉  | 56823/86398 [02:39<01:36, 306.18it/s]Preprocessing raw dataset...:  66%|███▉  | 56856/86398 [02:40<01:34, 311.07it/s]Preprocessing raw dataset...:  66%|███▉  | 56888/86398 [02:40<01:36, 304.72it/s]Preprocessing raw dataset...:  66%|███▉  | 56919/86398 [02:40<01:40, 294.56it/s]Preprocessing raw dataset...:  66%|███▉  | 56950/86398 [02:40<01:39, 296.21it/s]Preprocessing raw dataset...:  66%|███▉  | 56980/86398 [02:40<01:40, 291.58it/s]Preprocessing raw dataset...:  66%|███▉  | 57016/86398 [02:40<01:34, 309.97it/s]Preprocessing raw dataset...:  66%|███▉  | 57048/86398 [02:40<01:39, 293.90it/s]Preprocessing raw dataset...:  66%|███▉  | 57078/86398 [02:40<01:39, 294.07it/s]Preprocessing raw dataset...:  66%|███▉  | 57116/86398 [02:40<01:33, 312.93it/s]Preprocessing raw dataset...:  66%|███▉  | 57150/86398 [02:41<01:31, 320.35it/s]Preprocessing raw dataset...:  66%|███▉  | 57183/86398 [02:41<01:36, 302.57it/s]Preprocessing raw dataset...:  66%|███▉  | 57221/86398 [02:41<01:30, 323.61it/s]Preprocessing raw dataset...:  66%|███▉  | 57259/86398 [02:41<01:26, 338.31it/s]Preprocessing raw dataset...:  66%|███▉  | 57294/86398 [02:41<01:34, 308.68it/s]Preprocessing raw dataset...:  66%|███▉  | 57328/86398 [02:41<01:32, 314.40it/s]Preprocessing raw dataset...:  66%|███▉  | 57360/86398 [02:41<01:33, 310.36it/s]Preprocessing raw dataset...:  66%|███▉  | 57396/86398 [02:41<01:29, 324.22it/s]Preprocessing raw dataset...:  66%|███▉  | 57429/86398 [02:41<01:34, 308.13it/s]Preprocessing raw dataset...:  67%|███▉  | 57464/86398 [02:42<01:31, 317.40it/s]Preprocessing raw dataset...:  67%|███▉  | 57505/86398 [02:42<01:24, 340.15it/s]Preprocessing raw dataset...:  67%|███▉  | 57540/86398 [02:42<01:32, 310.40it/s]Preprocessing raw dataset...:  67%|███▉  | 57572/86398 [02:42<01:33, 308.99it/s]Preprocessing raw dataset...:  67%|████  | 57612/86398 [02:42<01:26, 334.04it/s]Preprocessing raw dataset...:  67%|████  | 57646/86398 [02:42<01:34, 304.28it/s]Preprocessing raw dataset...:  67%|████  | 57685/86398 [02:42<01:28, 322.78it/s]Preprocessing raw dataset...:  67%|████  | 57718/86398 [02:42<01:29, 318.74it/s]Preprocessing raw dataset...:  67%|████  | 57752/86398 [02:42<01:28, 324.57it/s]Preprocessing raw dataset...:  67%|████  | 57785/86398 [02:43<01:32, 310.58it/s]Preprocessing raw dataset...:  67%|████  | 57817/86398 [02:43<01:31, 311.73it/s]Preprocessing raw dataset...:  67%|████  | 57849/86398 [02:43<01:32, 307.65it/s]Preprocessing raw dataset...:  67%|████  | 57886/86398 [02:43<01:28, 320.93it/s]Preprocessing raw dataset...:  67%|████  | 57919/86398 [02:43<01:29, 317.70it/s]Preprocessing raw dataset...:  67%|████  | 57951/86398 [02:43<01:29, 316.99it/s]Preprocessing raw dataset...:  67%|████  | 57983/86398 [02:43<01:31, 310.08it/s]Preprocessing raw dataset...:  67%|████  | 58018/86398 [02:43<01:30, 314.46it/s]Preprocessing raw dataset...:  67%|████  | 58054/86398 [02:43<01:26, 326.31it/s]Preprocessing raw dataset...:  67%|████  | 58087/86398 [02:43<01:30, 313.53it/s]Preprocessing raw dataset...:  67%|████  | 58119/86398 [02:44<01:29, 314.50it/s]Preprocessing raw dataset...:  67%|████  | 58151/86398 [02:44<01:31, 309.20it/s]Preprocessing raw dataset...:  67%|████  | 58182/86398 [02:44<01:34, 298.98it/s]Preprocessing raw dataset...:  67%|████  | 58212/86398 [02:44<01:35, 295.81it/s]Preprocessing raw dataset...:  67%|████  | 58244/86398 [02:44<01:33, 300.81it/s]Preprocessing raw dataset...:  67%|████  | 58275/86398 [02:44<01:35, 294.28it/s]Preprocessing raw dataset...:  67%|████  | 58305/86398 [02:44<01:37, 288.92it/s]Preprocessing raw dataset...:  68%|████  | 58336/86398 [02:44<01:35, 294.82it/s]Preprocessing raw dataset...:  68%|████  | 58370/86398 [02:44<01:31, 305.65it/s]Preprocessing raw dataset...:  68%|████  | 58401/86398 [02:45<01:36, 289.96it/s]Preprocessing raw dataset...:  68%|████  | 58435/86398 [02:45<01:32, 302.92it/s]Preprocessing raw dataset...:  68%|████  | 58470/86398 [02:45<01:28, 315.48it/s]Preprocessing raw dataset...:  68%|████  | 58505/86398 [02:45<01:26, 323.86it/s]Preprocessing raw dataset...:  68%|████  | 58539/86398 [02:45<01:25, 324.70it/s]Preprocessing raw dataset...:  68%|████  | 58574/86398 [02:45<01:25, 326.72it/s]Preprocessing raw dataset...:  68%|████  | 58609/86398 [02:45<01:24, 330.28it/s]Preprocessing raw dataset...:  68%|████  | 58643/86398 [02:45<01:27, 317.74it/s]Preprocessing raw dataset...:  68%|████  | 58675/86398 [02:45<01:29, 311.25it/s]Preprocessing raw dataset...:  68%|████  | 58708/86398 [02:45<01:29, 310.28it/s]Preprocessing raw dataset...:  68%|████  | 58740/86398 [02:46<01:32, 298.07it/s]Preprocessing raw dataset...:  68%|████  | 58770/86398 [02:46<01:32, 298.22it/s]Preprocessing raw dataset...:  68%|████  | 58803/86398 [02:46<01:29, 306.98it/s]Preprocessing raw dataset...:  68%|████  | 58835/86398 [02:46<01:29, 306.82it/s]Preprocessing raw dataset...:  68%|████  | 58866/86398 [02:46<01:30, 302.81it/s]Preprocessing raw dataset...:  68%|████  | 58898/86398 [02:46<01:30, 303.70it/s]Preprocessing raw dataset...:  68%|████  | 58930/86398 [02:46<01:29, 307.68it/s]Preprocessing raw dataset...:  68%|████  | 58963/86398 [02:46<01:27, 314.06it/s]Preprocessing raw dataset...:  68%|████  | 58995/86398 [02:46<01:28, 309.63it/s]Preprocessing raw dataset...:  68%|████  | 59027/86398 [02:47<01:31, 299.32it/s]Preprocessing raw dataset...:  68%|████  | 59062/86398 [02:47<01:27, 312.81it/s]Preprocessing raw dataset...:  68%|████  | 59095/86398 [02:47<01:26, 315.78it/s]Preprocessing raw dataset...:  68%|████  | 59139/86398 [02:47<01:18, 349.31it/s]Preprocessing raw dataset...:  68%|████  | 59175/86398 [02:47<01:23, 326.32it/s]Preprocessing raw dataset...:  69%|████  | 59209/86398 [02:47<01:24, 320.99it/s]Preprocessing raw dataset...:  69%|████  | 59243/86398 [02:47<01:23, 325.33it/s]Preprocessing raw dataset...:  69%|████  | 59276/86398 [02:47<01:24, 319.68it/s]Preprocessing raw dataset...:  69%|████  | 59309/86398 [02:47<01:31, 294.81it/s]Preprocessing raw dataset...:  69%|████  | 59340/86398 [02:48<01:31, 295.15it/s]Preprocessing raw dataset...:  69%|████  | 59370/86398 [02:48<01:36, 281.52it/s]Preprocessing raw dataset...:  69%|████▏ | 59401/86398 [02:48<01:34, 287.20it/s]Preprocessing raw dataset...:  69%|████▏ | 59430/86398 [02:48<01:34, 286.10it/s]Preprocessing raw dataset...:  69%|████▏ | 59461/86398 [02:48<01:32, 292.60it/s]Preprocessing raw dataset...:  69%|████▏ | 59497/86398 [02:48<01:26, 311.14it/s]Preprocessing raw dataset...:  69%|████▏ | 59529/86398 [02:48<01:29, 301.81it/s]Preprocessing raw dataset...:  69%|████▏ | 59567/86398 [02:48<01:23, 321.15it/s]Preprocessing raw dataset...:  69%|████▏ | 59600/86398 [02:48<01:26, 309.53it/s]Preprocessing raw dataset...:  69%|████▏ | 59632/86398 [02:49<01:33, 286.69it/s]Preprocessing raw dataset...:  69%|████▏ | 59664/86398 [02:49<01:31, 292.90it/s]Preprocessing raw dataset...:  69%|████▏ | 59695/86398 [02:49<01:30, 295.01it/s]Preprocessing raw dataset...:  69%|████▏ | 59726/86398 [02:49<01:29, 298.72it/s]Preprocessing raw dataset...:  69%|████▏ | 59758/86398 [02:49<01:28, 302.72it/s]Preprocessing raw dataset...:  69%|████▏ | 59791/86398 [02:49<01:26, 307.15it/s]Preprocessing raw dataset...:  69%|████▏ | 59822/86398 [02:49<01:29, 295.47it/s]Preprocessing raw dataset...:  69%|████▏ | 59855/86398 [02:49<01:27, 304.46it/s]Preprocessing raw dataset...:  69%|████▏ | 59892/86398 [02:49<01:22, 320.75it/s]Preprocessing raw dataset...:  69%|████▏ | 59925/86398 [02:49<01:27, 304.25it/s]Preprocessing raw dataset...:  69%|████▏ | 59956/86398 [02:50<01:29, 293.83it/s]Preprocessing raw dataset...:  69%|████▏ | 59986/86398 [02:50<01:32, 284.65it/s]Preprocessing raw dataset...:  69%|████▏ | 60021/86398 [02:50<01:27, 302.21it/s]Preprocessing raw dataset...:  70%|████▏ | 60052/86398 [02:50<01:28, 298.86it/s]Preprocessing raw dataset...:  70%|████▏ | 60083/86398 [02:50<01:27, 300.92it/s]Preprocessing raw dataset...:  70%|████▏ | 60114/86398 [02:50<01:30, 290.07it/s]Preprocessing raw dataset...:  70%|████▏ | 60145/86398 [02:50<01:29, 294.03it/s]Preprocessing raw dataset...:  70%|████▏ | 60178/86398 [02:50<01:28, 296.13it/s]Preprocessing raw dataset...:  70%|████▏ | 60208/86398 [02:50<01:31, 285.42it/s]Preprocessing raw dataset...:  70%|████▏ | 60244/86398 [02:51<01:25, 304.13it/s]Preprocessing raw dataset...:  70%|████▏ | 60275/86398 [02:51<01:26, 303.17it/s]Preprocessing raw dataset...:  70%|████▏ | 60308/86398 [02:51<01:24, 308.64it/s]Preprocessing raw dataset...:  70%|████▏ | 60339/86398 [02:51<01:28, 295.46it/s]Preprocessing raw dataset...:  70%|████▏ | 60370/86398 [02:51<01:28, 294.69it/s]Preprocessing raw dataset...:  70%|████▏ | 60402/86398 [02:51<01:26, 299.05it/s]Preprocessing raw dataset...:  70%|████▏ | 60433/86398 [02:51<01:26, 300.32it/s]Preprocessing raw dataset...:  70%|████▏ | 60464/86398 [02:51<01:26, 299.15it/s]Preprocessing raw dataset...:  70%|████▏ | 60497/86398 [02:51<01:24, 308.00it/s]Preprocessing raw dataset...:  70%|████▏ | 60533/86398 [02:52<01:20, 322.83it/s]Preprocessing raw dataset...:  70%|████▏ | 60566/86398 [02:52<01:20, 321.36it/s]Preprocessing raw dataset...:  70%|████▏ | 60599/86398 [02:52<01:23, 310.46it/s]Preprocessing raw dataset...:  70%|████▏ | 60633/86398 [02:52<01:20, 318.69it/s]Preprocessing raw dataset...:  70%|████▏ | 60665/86398 [02:52<01:24, 304.66it/s]Preprocessing raw dataset...:  70%|████▏ | 60696/86398 [02:52<01:25, 300.21it/s]Preprocessing raw dataset...:  70%|████▏ | 60727/86398 [02:52<01:34, 270.60it/s]Preprocessing raw dataset...:  70%|████▏ | 60758/86398 [02:52<01:31, 281.03it/s]Preprocessing raw dataset...:  70%|████▏ | 60790/86398 [02:52<01:28, 290.20it/s]Preprocessing raw dataset...:  70%|████▏ | 60820/86398 [02:53<01:32, 277.07it/s]Preprocessing raw dataset...:  70%|████▏ | 60852/86398 [02:53<01:30, 280.97it/s]Preprocessing raw dataset...:  70%|████▏ | 60882/86398 [02:53<01:29, 283.63it/s]Preprocessing raw dataset...:  71%|████▏ | 60919/86398 [02:53<01:23, 305.03it/s]Preprocessing raw dataset...:  71%|████▏ | 60950/86398 [02:53<01:25, 296.50it/s]Preprocessing raw dataset...:  71%|████▏ | 60980/86398 [02:53<01:27, 291.89it/s]Preprocessing raw dataset...:  71%|████▏ | 61010/86398 [02:53<01:27, 291.59it/s]Preprocessing raw dataset...:  71%|████▏ | 61044/86398 [02:53<01:23, 305.09it/s]Preprocessing raw dataset...:  71%|████▏ | 61075/86398 [02:53<01:27, 288.66it/s]Preprocessing raw dataset...:  71%|████▏ | 61105/86398 [02:53<01:32, 273.33it/s]Preprocessing raw dataset...:  71%|████▏ | 61133/86398 [02:54<01:34, 268.69it/s]Preprocessing raw dataset...:  71%|████▏ | 61169/86398 [02:54<01:26, 293.30it/s]Preprocessing raw dataset...:  71%|████▎ | 61206/86398 [02:54<01:20, 313.05it/s]Preprocessing raw dataset...:  71%|████▎ | 61238/86398 [02:54<01:22, 306.83it/s]Preprocessing raw dataset...:  71%|████▎ | 61269/86398 [02:54<01:25, 294.59it/s]Preprocessing raw dataset...:  71%|████▎ | 61301/86398 [02:54<01:23, 299.22it/s]Preprocessing raw dataset...:  71%|████▎ | 61335/86398 [02:54<01:21, 306.15it/s]Preprocessing raw dataset...:  71%|████▎ | 61367/86398 [02:54<01:20, 309.08it/s]Preprocessing raw dataset...:  71%|████▎ | 61401/86398 [02:54<01:18, 317.92it/s]Preprocessing raw dataset...:  71%|████▎ | 61433/86398 [02:55<01:19, 312.27it/s]Preprocessing raw dataset...:  71%|████▎ | 61465/86398 [02:55<01:22, 304.03it/s]Preprocessing raw dataset...:  71%|████▎ | 61496/86398 [02:55<01:24, 295.01it/s]Preprocessing raw dataset...:  71%|████▎ | 61530/86398 [02:55<01:20, 307.09it/s]Preprocessing raw dataset...:  71%|████▎ | 61563/86398 [02:55<01:19, 311.51it/s]Preprocessing raw dataset...:  71%|████▎ | 61595/86398 [02:55<01:19, 312.43it/s]Preprocessing raw dataset...:  71%|████▎ | 61627/86398 [02:55<01:20, 307.40it/s]Preprocessing raw dataset...:  71%|████▎ | 61658/86398 [02:55<01:21, 302.78it/s]Preprocessing raw dataset...:  71%|████▎ | 61691/86398 [02:55<01:20, 308.45it/s]Preprocessing raw dataset...:  71%|████▎ | 61726/86398 [02:56<01:17, 317.50it/s]Preprocessing raw dataset...:  71%|████▎ | 61758/86398 [02:56<01:17, 317.87it/s]Preprocessing raw dataset...:  72%|████▎ | 61791/86398 [02:56<01:17, 316.57it/s]Preprocessing raw dataset...:  72%|████▎ | 61828/86398 [02:56<01:14, 329.73it/s]Preprocessing raw dataset...:  72%|████▎ | 61862/86398 [02:56<01:14, 329.63it/s]Preprocessing raw dataset...:  72%|████▎ | 61895/86398 [02:56<01:15, 325.54it/s]Preprocessing raw dataset...:  72%|████▎ | 61928/86398 [02:56<01:19, 306.09it/s]Preprocessing raw dataset...:  72%|████▎ | 61968/86398 [02:56<01:13, 331.66it/s]Preprocessing raw dataset...:  72%|████▎ | 62002/86398 [02:56<01:17, 315.21it/s]Preprocessing raw dataset...:  72%|████▎ | 62038/86398 [02:56<01:14, 325.59it/s]Preprocessing raw dataset...:  72%|████▎ | 62071/86398 [02:57<01:16, 317.09it/s]Preprocessing raw dataset...:  72%|████▎ | 62110/86398 [02:57<01:12, 336.11it/s]Preprocessing raw dataset...:  72%|████▎ | 62147/86398 [02:57<01:10, 342.89it/s]Preprocessing raw dataset...:  72%|████▎ | 62182/86398 [02:57<01:18, 309.75it/s]Preprocessing raw dataset...:  72%|████▎ | 62221/86398 [02:57<01:13, 328.47it/s]Preprocessing raw dataset...:  72%|████▎ | 62256/86398 [02:57<01:12, 332.83it/s]Preprocessing raw dataset...:  72%|████▎ | 62290/86398 [02:57<01:17, 312.26it/s]Preprocessing raw dataset...:  72%|████▎ | 62322/86398 [02:57<01:18, 307.66it/s]Preprocessing raw dataset...:  72%|████▎ | 62355/86398 [02:57<01:17, 311.42it/s]Preprocessing raw dataset...:  72%|████▎ | 62387/86398 [02:58<01:17, 309.45it/s]Preprocessing raw dataset...:  72%|████▎ | 62419/86398 [02:58<01:20, 297.22it/s]Preprocessing raw dataset...:  72%|████▎ | 62460/86398 [02:58<01:13, 326.63it/s]Preprocessing raw dataset...:  72%|████▎ | 62496/86398 [02:58<01:11, 335.84it/s]Preprocessing raw dataset...:  72%|████▎ | 62530/86398 [02:58<01:13, 323.68it/s]Preprocessing raw dataset...:  72%|████▎ | 62563/86398 [02:58<01:13, 324.79it/s]Preprocessing raw dataset...:  72%|████▎ | 62596/86398 [02:58<01:14, 317.50it/s]Preprocessing raw dataset...:  72%|████▎ | 62628/86398 [02:58<01:18, 302.76it/s]Preprocessing raw dataset...:  73%|████▎ | 62659/86398 [02:58<01:22, 287.60it/s]Preprocessing raw dataset...:  73%|████▎ | 62688/86398 [02:59<01:22, 287.04it/s]Preprocessing raw dataset...:  73%|████▎ | 62725/86398 [02:59<01:16, 309.70it/s]Preprocessing raw dataset...:  73%|████▎ | 62760/86398 [02:59<01:14, 316.82it/s]Preprocessing raw dataset...:  73%|████▎ | 62794/86398 [02:59<01:13, 322.73it/s]Preprocessing raw dataset...:  73%|████▎ | 62827/86398 [02:59<01:13, 320.42it/s]Preprocessing raw dataset...:  73%|████▎ | 62865/86398 [02:59<01:09, 337.45it/s]Preprocessing raw dataset...:  73%|████▎ | 62899/86398 [02:59<01:13, 319.05it/s]Preprocessing raw dataset...:  73%|████▎ | 62932/86398 [02:59<01:13, 319.94it/s]Preprocessing raw dataset...:  73%|████▎ | 62965/86398 [02:59<01:14, 313.04it/s]Preprocessing raw dataset...:  73%|████▎ | 62997/86398 [03:00<01:17, 300.73it/s]Preprocessing raw dataset...:  73%|████▍ | 63028/86398 [03:00<01:17, 301.77it/s]Preprocessing raw dataset...:  73%|████▍ | 63064/86398 [03:00<01:13, 316.32it/s]Preprocessing raw dataset...:  73%|████▍ | 63096/86398 [03:00<01:18, 297.70it/s]Preprocessing raw dataset...:  73%|████▍ | 63127/86398 [03:00<01:17, 299.16it/s]Preprocessing raw dataset...:  73%|████▍ | 63159/86398 [03:00<01:16, 304.35it/s]Preprocessing raw dataset...:  73%|████▍ | 63190/86398 [03:00<01:18, 296.59it/s]Preprocessing raw dataset...:  73%|████▍ | 63221/86398 [03:00<01:17, 300.17it/s]Preprocessing raw dataset...:  73%|████▍ | 63253/86398 [03:00<01:16, 300.61it/s]Preprocessing raw dataset...:  73%|████▍ | 63286/86398 [03:00<01:14, 308.44it/s]Preprocessing raw dataset...:  73%|████▍ | 63320/86398 [03:01<01:13, 315.02it/s]Preprocessing raw dataset...:  73%|████▍ | 63352/86398 [03:01<01:14, 308.21it/s]Preprocessing raw dataset...:  73%|████▍ | 63385/86398 [03:01<01:13, 313.78it/s]Preprocessing raw dataset...:  73%|████▍ | 63418/86398 [03:01<01:12, 317.39it/s]Preprocessing raw dataset...:  73%|████▍ | 63450/86398 [03:01<01:12, 317.10it/s]Preprocessing raw dataset...:  73%|████▍ | 63482/86398 [03:01<01:17, 296.08it/s]Preprocessing raw dataset...:  74%|████▍ | 63512/86398 [03:01<01:22, 277.68it/s]Preprocessing raw dataset...:  74%|████▍ | 63544/86398 [03:01<01:19, 287.14it/s]Preprocessing raw dataset...:  74%|████▍ | 63579/86398 [03:01<01:15, 303.98it/s]Preprocessing raw dataset...:  74%|████▍ | 63610/86398 [03:02<01:19, 286.80it/s]Preprocessing raw dataset...:  74%|████▍ | 63651/86398 [03:02<01:11, 320.17it/s]Preprocessing raw dataset...:  74%|████▍ | 63685/86398 [03:02<01:10, 323.33it/s]Preprocessing raw dataset...:  74%|████▍ | 63718/86398 [03:02<01:14, 306.12it/s]Preprocessing raw dataset...:  74%|████▍ | 63750/86398 [03:02<01:18, 286.72it/s]Preprocessing raw dataset...:  74%|████▍ | 63782/86398 [03:02<01:16, 294.47it/s]Preprocessing raw dataset...:  74%|████▍ | 63812/86398 [03:02<01:18, 288.97it/s]Preprocessing raw dataset...:  74%|████▍ | 63842/86398 [03:02<01:18, 286.19it/s]Preprocessing raw dataset...:  74%|████▍ | 63877/86398 [03:02<01:14, 302.97it/s]Preprocessing raw dataset...:  74%|████▍ | 63908/86398 [03:03<01:15, 298.56it/s]Preprocessing raw dataset...:  74%|████▍ | 63939/86398 [03:03<01:16, 292.51it/s]Preprocessing raw dataset...:  74%|████▍ | 63969/86398 [03:03<01:18, 284.17it/s]Preprocessing raw dataset...:  74%|████▍ | 64003/86398 [03:03<01:15, 297.89it/s]Preprocessing raw dataset...:  74%|████▍ | 64034/86398 [03:03<01:14, 300.29it/s]Preprocessing raw dataset...:  74%|████▍ | 64065/86398 [03:03<01:16, 292.85it/s]Preprocessing raw dataset...:  74%|████▍ | 64099/86398 [03:03<01:12, 306.06it/s]Preprocessing raw dataset...:  74%|████▍ | 64130/86398 [03:03<01:13, 301.90it/s]Preprocessing raw dataset...:  74%|████▍ | 64161/86398 [03:03<01:14, 297.14it/s]Preprocessing raw dataset...:  74%|████▍ | 64194/86398 [03:03<01:13, 302.61it/s]Preprocessing raw dataset...:  74%|████▍ | 64228/86398 [03:04<01:10, 312.76it/s]Preprocessing raw dataset...:  74%|████▍ | 64260/86398 [03:04<01:11, 308.77it/s]Preprocessing raw dataset...:  74%|████▍ | 64297/86398 [03:04<01:08, 323.80it/s]Preprocessing raw dataset...:  74%|████▍ | 64330/86398 [03:04<01:11, 309.63it/s]Preprocessing raw dataset...:  74%|████▍ | 64363/86398 [03:04<01:10, 312.73it/s]Preprocessing raw dataset...:  75%|████▍ | 64395/86398 [03:04<01:10, 313.24it/s]Preprocessing raw dataset...:  75%|████▍ | 64427/86398 [03:04<01:13, 297.60it/s]Preprocessing raw dataset...:  75%|████▍ | 64464/86398 [03:04<01:09, 314.69it/s]Preprocessing raw dataset...:  75%|████▍ | 64498/86398 [03:04<01:08, 317.56it/s]Preprocessing raw dataset...:  75%|████▍ | 64533/86398 [03:05<01:07, 324.79it/s]Preprocessing raw dataset...:  75%|████▍ | 64567/86398 [03:05<01:06, 328.35it/s]Preprocessing raw dataset...:  75%|████▍ | 64605/86398 [03:05<01:03, 341.21it/s]Preprocessing raw dataset...:  75%|████▍ | 64640/86398 [03:05<01:04, 339.76it/s]Preprocessing raw dataset...:  75%|████▍ | 64675/86398 [03:05<01:07, 320.89it/s]Preprocessing raw dataset...:  75%|████▍ | 64709/86398 [03:05<01:06, 325.00it/s]Preprocessing raw dataset...:  75%|████▍ | 64746/86398 [03:05<01:04, 337.12it/s]Preprocessing raw dataset...:  75%|████▍ | 64782/86398 [03:05<01:03, 342.23it/s]Preprocessing raw dataset...:  75%|████▌ | 64817/86398 [03:05<01:03, 341.83it/s]Preprocessing raw dataset...:  75%|████▌ | 64852/86398 [03:06<01:08, 314.70it/s]Preprocessing raw dataset...:  75%|████▌ | 64884/86398 [03:06<01:13, 294.67it/s]Preprocessing raw dataset...:  75%|████▌ | 64914/86398 [03:06<01:13, 293.28it/s]Preprocessing raw dataset...:  75%|████▌ | 64944/86398 [03:06<01:14, 286.77it/s]Preprocessing raw dataset...:  75%|████▌ | 64979/86398 [03:06<01:11, 301.65it/s]Preprocessing raw dataset...:  75%|████▌ | 65013/86398 [03:06<01:08, 311.27it/s]Preprocessing raw dataset...:  75%|████▌ | 65045/86398 [03:06<01:14, 285.33it/s]Preprocessing raw dataset...:  75%|████▌ | 65075/86398 [03:06<01:14, 287.94it/s]Preprocessing raw dataset...:  75%|████▌ | 65105/86398 [03:06<01:18, 272.81it/s]Preprocessing raw dataset...:  75%|████▌ | 65134/86398 [03:07<01:16, 276.81it/s]Preprocessing raw dataset...:  75%|████▌ | 65168/86398 [03:07<01:13, 290.08it/s]Preprocessing raw dataset...:  75%|████▌ | 65198/86398 [03:07<01:12, 292.54it/s]Preprocessing raw dataset...:  76%|████▌ | 65237/86398 [03:07<01:06, 315.95it/s]Preprocessing raw dataset...:  76%|████▌ | 65270/86398 [03:07<01:06, 317.70it/s]Preprocessing raw dataset...:  76%|████▌ | 65302/86398 [03:07<01:06, 318.11it/s]Preprocessing raw dataset...:  76%|████▌ | 65334/86398 [03:07<01:07, 312.17it/s]Preprocessing raw dataset...:  76%|████▌ | 65368/86398 [03:07<01:05, 320.17it/s]Preprocessing raw dataset...:  76%|████▌ | 65405/86398 [03:07<01:03, 332.76it/s]Preprocessing raw dataset...:  76%|████▌ | 65439/86398 [03:07<01:05, 321.98it/s]Preprocessing raw dataset...:  76%|████▌ | 65472/86398 [03:08<01:06, 315.50it/s]Preprocessing raw dataset...:  76%|████▌ | 65504/86398 [03:08<01:08, 303.87it/s]Preprocessing raw dataset...:  76%|████▌ | 65535/86398 [03:08<01:08, 304.21it/s]Preprocessing raw dataset...:  76%|████▌ | 65570/86398 [03:08<01:06, 314.28it/s]Preprocessing raw dataset...:  76%|████▌ | 65602/86398 [03:08<01:07, 306.37it/s]Preprocessing raw dataset...:  76%|████▌ | 65642/86398 [03:08<01:03, 326.42it/s]Preprocessing raw dataset...:  76%|████▌ | 65679/86398 [03:08<01:01, 338.13it/s]Preprocessing raw dataset...:  76%|████▌ | 65713/86398 [03:08<01:01, 333.67it/s]Preprocessing raw dataset...:  76%|████▌ | 65747/86398 [03:08<01:04, 319.95it/s]Preprocessing raw dataset...:  76%|████▌ | 65780/86398 [03:09<01:04, 318.05it/s]Preprocessing raw dataset...:  76%|████▌ | 65814/86398 [03:09<01:03, 323.91it/s]Preprocessing raw dataset...:  76%|████▌ | 65849/86398 [03:09<01:02, 328.34it/s]Preprocessing raw dataset...:  76%|████▌ | 65882/86398 [03:09<01:03, 325.22it/s]Preprocessing raw dataset...:  76%|████▌ | 65915/86398 [03:09<01:05, 311.30it/s]Preprocessing raw dataset...:  76%|████▌ | 65948/86398 [03:09<01:05, 311.91it/s]Preprocessing raw dataset...:  76%|████▌ | 65980/86398 [03:09<01:05, 312.87it/s]Preprocessing raw dataset...:  76%|████▌ | 66014/86398 [03:09<01:03, 320.44it/s]Preprocessing raw dataset...:  76%|████▌ | 66047/86398 [03:09<01:08, 296.84it/s]Preprocessing raw dataset...:  76%|████▌ | 66079/86398 [03:10<01:07, 300.45it/s]Preprocessing raw dataset...:  77%|████▌ | 66113/86398 [03:10<01:05, 309.67it/s]Preprocessing raw dataset...:  77%|████▌ | 66151/86398 [03:10<01:01, 328.37it/s]Preprocessing raw dataset...:  77%|████▌ | 66189/86398 [03:10<00:59, 341.54it/s]Preprocessing raw dataset...:  77%|████▌ | 66224/86398 [03:10<00:59, 336.37it/s]Preprocessing raw dataset...:  77%|████▌ | 66258/86398 [03:10<01:00, 333.73it/s]Preprocessing raw dataset...:  77%|████▌ | 66292/86398 [03:10<01:00, 333.89it/s]Preprocessing raw dataset...:  77%|████▌ | 66328/86398 [03:10<00:58, 341.02it/s]Preprocessing raw dataset...:  77%|████▌ | 66365/86398 [03:10<00:57, 348.93it/s]Preprocessing raw dataset...:  77%|████▌ | 66400/86398 [03:10<00:58, 339.38it/s]Preprocessing raw dataset...:  77%|████▌ | 66435/86398 [03:11<01:04, 309.32it/s]Preprocessing raw dataset...:  77%|████▌ | 66467/86398 [03:11<01:04, 309.00it/s]Preprocessing raw dataset...:  77%|████▌ | 66499/86398 [03:11<01:05, 302.57it/s]Preprocessing raw dataset...:  77%|████▌ | 66534/86398 [03:11<01:02, 315.54it/s]Preprocessing raw dataset...:  77%|████▌ | 66568/86398 [03:11<01:01, 320.32it/s]Preprocessing raw dataset...:  77%|████▋ | 66605/86398 [03:11<00:59, 334.30it/s]Preprocessing raw dataset...:  77%|████▋ | 66639/86398 [03:11<01:03, 311.01it/s]Preprocessing raw dataset...:  77%|████▋ | 66677/86398 [03:11<01:00, 326.79it/s]Preprocessing raw dataset...:  77%|████▋ | 66711/86398 [03:11<01:04, 303.86it/s]Preprocessing raw dataset...:  77%|████▋ | 66742/86398 [03:12<01:10, 277.44it/s]Preprocessing raw dataset...:  77%|████▋ | 66772/86398 [03:12<01:09, 281.70it/s]Preprocessing raw dataset...:  77%|████▋ | 66804/86398 [03:12<01:07, 291.70it/s]Preprocessing raw dataset...:  77%|████▋ | 66837/86398 [03:12<01:05, 296.83it/s]Preprocessing raw dataset...:  77%|████▋ | 66868/86398 [03:12<01:05, 297.22it/s]Preprocessing raw dataset...:  77%|████▋ | 66898/86398 [03:12<01:07, 287.72it/s]Preprocessing raw dataset...:  77%|████▋ | 66930/86398 [03:12<01:06, 292.80it/s]Preprocessing raw dataset...:  78%|████▋ | 66963/86398 [03:12<01:04, 303.14it/s]Preprocessing raw dataset...:  78%|████▋ | 66994/86398 [03:12<01:06, 292.02it/s]Preprocessing raw dataset...:  78%|████▋ | 67024/86398 [03:13<01:08, 281.91it/s]Preprocessing raw dataset...:  78%|████▋ | 67058/86398 [03:13<01:05, 296.76it/s]Preprocessing raw dataset...:  78%|████▋ | 67098/86398 [03:13<00:59, 324.86it/s]Preprocessing raw dataset...:  78%|████▋ | 67131/86398 [03:13<01:03, 304.23it/s]Preprocessing raw dataset...:  78%|████▋ | 67163/86398 [03:13<01:02, 305.36it/s]Preprocessing raw dataset...:  78%|████▋ | 67200/86398 [03:13<00:59, 322.36it/s]Preprocessing raw dataset...:  78%|████▋ | 67233/86398 [03:13<01:01, 312.47it/s]Preprocessing raw dataset...:  78%|████▋ | 67267/86398 [03:13<01:00, 317.26it/s]Preprocessing raw dataset...:  78%|████▋ | 67299/86398 [03:13<01:03, 301.12it/s]Preprocessing raw dataset...:  78%|████▋ | 67337/86398 [03:14<00:59, 321.14it/s]Preprocessing raw dataset...:  78%|████▋ | 67370/86398 [03:14<00:59, 322.22it/s]Preprocessing raw dataset...:  78%|████▋ | 67407/86398 [03:14<00:56, 334.35it/s]Preprocessing raw dataset...:  78%|████▋ | 67441/86398 [03:14<00:57, 329.98it/s]Preprocessing raw dataset...:  78%|████▋ | 67475/86398 [03:14<00:59, 320.47it/s]Preprocessing raw dataset...:  78%|████▋ | 67508/86398 [03:14<01:00, 310.50it/s]Preprocessing raw dataset...:  78%|████▋ | 67541/86398 [03:14<00:59, 314.91it/s]Preprocessing raw dataset...:  78%|████▋ | 67573/86398 [03:14<01:01, 306.67it/s]Preprocessing raw dataset...:  78%|████▋ | 67604/86398 [03:14<01:01, 304.47it/s]Preprocessing raw dataset...:  78%|████▋ | 67639/86398 [03:14<01:00, 312.57it/s]Preprocessing raw dataset...:  78%|████▋ | 67675/86398 [03:15<00:57, 325.81it/s]Preprocessing raw dataset...:  78%|████▋ | 67708/86398 [03:15<01:02, 300.86it/s]Preprocessing raw dataset...:  78%|████▋ | 67739/86398 [03:15<01:03, 293.82it/s]Preprocessing raw dataset...:  78%|████▋ | 67775/86398 [03:15<01:00, 309.68it/s]Preprocessing raw dataset...:  78%|████▋ | 67808/86398 [03:15<00:59, 313.58it/s]Preprocessing raw dataset...:  79%|████▋ | 67840/86398 [03:15<01:02, 297.53it/s]Preprocessing raw dataset...:  79%|████▋ | 67873/86398 [03:15<01:00, 306.39it/s]Preprocessing raw dataset...:  79%|████▋ | 67906/86398 [03:15<00:59, 312.41it/s]Preprocessing raw dataset...:  79%|████▋ | 67939/86398 [03:15<00:58, 317.29it/s]Preprocessing raw dataset...:  79%|████▋ | 67974/86398 [03:16<00:56, 326.06it/s]Preprocessing raw dataset...:  79%|████▋ | 68007/86398 [03:16<00:59, 311.62it/s]Preprocessing raw dataset...:  79%|████▋ | 68044/86398 [03:16<00:56, 327.25it/s]Preprocessing raw dataset...:  79%|████▋ | 68077/86398 [03:16<00:58, 310.77it/s]Preprocessing raw dataset...:  79%|████▋ | 68109/86398 [03:16<01:02, 292.64it/s]Preprocessing raw dataset...:  79%|████▋ | 68145/86398 [03:16<00:59, 308.25it/s]Preprocessing raw dataset...:  79%|████▋ | 68177/86398 [03:16<00:59, 303.77it/s]Preprocessing raw dataset...:  79%|████▋ | 68211/86398 [03:16<00:57, 313.71it/s]Preprocessing raw dataset...:  79%|████▋ | 68250/86398 [03:16<00:54, 334.85it/s]Preprocessing raw dataset...:  79%|████▋ | 68284/86398 [03:17<00:55, 324.81it/s]Preprocessing raw dataset...:  79%|████▋ | 68318/86398 [03:17<00:55, 326.13it/s]Preprocessing raw dataset...:  79%|████▋ | 68351/86398 [03:17<00:57, 312.19it/s]Preprocessing raw dataset...:  79%|████▋ | 68383/86398 [03:17<01:00, 299.03it/s]Preprocessing raw dataset...:  79%|████▊ | 68418/86398 [03:17<00:57, 310.83it/s]Preprocessing raw dataset...:  79%|████▊ | 68450/86398 [03:17<00:58, 304.47it/s]Preprocessing raw dataset...:  79%|████▊ | 68481/86398 [03:17<01:00, 298.53it/s]Preprocessing raw dataset...:  79%|████▊ | 68514/86398 [03:17<00:58, 306.29it/s]Preprocessing raw dataset...:  79%|████▊ | 68547/86398 [03:17<00:58, 305.96it/s]Preprocessing raw dataset...:  79%|████▊ | 68584/86398 [03:18<00:55, 321.30it/s]Preprocessing raw dataset...:  79%|████▊ | 68617/86398 [03:18<00:59, 299.21it/s]Preprocessing raw dataset...:  79%|████▊ | 68650/86398 [03:18<00:58, 303.82it/s]Preprocessing raw dataset...:  79%|████▊ | 68686/86398 [03:18<00:56, 316.04it/s]Preprocessing raw dataset...:  80%|████▊ | 68719/86398 [03:18<00:55, 317.59it/s]Preprocessing raw dataset...:  80%|████▊ | 68751/86398 [03:18<00:58, 300.15it/s]Preprocessing raw dataset...:  80%|████▊ | 68782/86398 [03:18<00:58, 301.35it/s]Preprocessing raw dataset...:  80%|████▊ | 68817/86398 [03:18<00:55, 314.25it/s]Preprocessing raw dataset...:  80%|████▊ | 68849/86398 [03:18<00:57, 306.08it/s]Preprocessing raw dataset...:  80%|████▊ | 68881/86398 [03:18<00:56, 308.61it/s]Preprocessing raw dataset...:  80%|████▊ | 68912/86398 [03:19<00:57, 305.20it/s]Preprocessing raw dataset...:  80%|████▊ | 68946/86398 [03:19<00:55, 314.71it/s]Preprocessing raw dataset...:  80%|████▊ | 68978/86398 [03:19<00:59, 290.54it/s]Preprocessing raw dataset...:  80%|████▊ | 69008/86398 [03:19<01:00, 286.04it/s]Preprocessing raw dataset...:  80%|████▊ | 69044/86398 [03:19<00:56, 305.59it/s]Preprocessing raw dataset...:  80%|████▊ | 69077/86398 [03:19<00:55, 310.78it/s]Preprocessing raw dataset...:  80%|████▊ | 69109/86398 [03:19<00:57, 303.14it/s]Preprocessing raw dataset...:  80%|████▊ | 69140/86398 [03:19<00:59, 292.19it/s]Preprocessing raw dataset...:  80%|████▊ | 69170/86398 [03:19<01:00, 286.61it/s]Preprocessing raw dataset...:  80%|████▊ | 69202/86398 [03:20<00:58, 294.90it/s]Preprocessing raw dataset...:  80%|████▊ | 69238/86398 [03:20<00:54, 313.30it/s]Preprocessing raw dataset...:  80%|████▊ | 69270/86398 [03:20<00:54, 314.98it/s]Preprocessing raw dataset...:  80%|████▊ | 69302/86398 [03:20<00:54, 310.87it/s]Preprocessing raw dataset...:  80%|████▊ | 69338/86398 [03:20<00:52, 324.83it/s]Preprocessing raw dataset...:  80%|████▊ | 69371/86398 [03:20<00:54, 312.93it/s]Preprocessing raw dataset...:  80%|████▊ | 69403/86398 [03:20<00:56, 302.77it/s]Preprocessing raw dataset...:  80%|████▊ | 69435/86398 [03:20<00:55, 305.44it/s]Preprocessing raw dataset...:  80%|████▊ | 69467/86398 [03:20<00:54, 308.37it/s]Preprocessing raw dataset...:  80%|████▊ | 69499/86398 [03:21<00:54, 309.85it/s]Preprocessing raw dataset...:  80%|████▊ | 69531/86398 [03:21<01:00, 279.32it/s]Preprocessing raw dataset...:  81%|████▊ | 69560/86398 [03:21<01:01, 274.44it/s]Preprocessing raw dataset...:  81%|████▊ | 69594/86398 [03:21<00:58, 288.86it/s]Preprocessing raw dataset...:  81%|████▊ | 69629/86398 [03:21<00:54, 305.55it/s]Preprocessing raw dataset...:  81%|████▊ | 69664/86398 [03:21<00:52, 317.89it/s]Preprocessing raw dataset...:  81%|████▊ | 69697/86398 [03:21<00:53, 314.36it/s]Preprocessing raw dataset...:  81%|████▊ | 69730/86398 [03:21<00:52, 316.96it/s]Preprocessing raw dataset...:  81%|████▊ | 69762/86398 [03:21<00:54, 307.13it/s]Preprocessing raw dataset...:  81%|████▊ | 69793/86398 [03:22<00:55, 301.61it/s]Preprocessing raw dataset...:  81%|████▊ | 69824/86398 [03:22<00:55, 301.12it/s]Preprocessing raw dataset...:  81%|████▊ | 69855/86398 [03:22<00:55, 296.34it/s]Preprocessing raw dataset...:  81%|████▊ | 69885/86398 [03:22<00:56, 292.61it/s]Preprocessing raw dataset...:  81%|████▊ | 69917/86398 [03:22<00:54, 299.96it/s]Preprocessing raw dataset...:  81%|████▊ | 69948/86398 [03:22<00:58, 282.51it/s]Preprocessing raw dataset...:  81%|████▊ | 69981/86398 [03:22<00:55, 293.89it/s]Preprocessing raw dataset...:  81%|████▊ | 70011/86398 [03:22<00:58, 281.05it/s]Preprocessing raw dataset...:  81%|████▊ | 70046/86398 [03:22<00:54, 298.85it/s]Preprocessing raw dataset...:  81%|████▊ | 70080/86398 [03:22<00:52, 309.66it/s]Preprocessing raw dataset...:  81%|████▊ | 70119/86398 [03:23<00:49, 330.90it/s]Preprocessing raw dataset...:  81%|████▊ | 70155/86398 [03:23<00:48, 337.79it/s]Preprocessing raw dataset...:  81%|████▊ | 70189/86398 [03:23<00:50, 321.88it/s]Preprocessing raw dataset...:  81%|████▉ | 70222/86398 [03:23<00:54, 297.01it/s]Preprocessing raw dataset...:  81%|████▉ | 70256/86398 [03:23<00:52, 307.28it/s]Preprocessing raw dataset...:  81%|████▉ | 70291/86398 [03:23<00:52, 309.38it/s]Preprocessing raw dataset...:  81%|████▉ | 70323/86398 [03:23<00:54, 292.40it/s]Preprocessing raw dataset...:  81%|████▉ | 70353/86398 [03:23<00:56, 281.89it/s]Preprocessing raw dataset...:  81%|████▉ | 70382/86398 [03:23<00:57, 280.79it/s]Preprocessing raw dataset...:  82%|████▉ | 70415/86398 [03:24<00:54, 292.96it/s]Preprocessing raw dataset...:  82%|████▉ | 70445/86398 [03:24<00:55, 289.82it/s]Preprocessing raw dataset...:  82%|████▉ | 70475/86398 [03:24<00:57, 276.67it/s]Preprocessing raw dataset...:  82%|████▉ | 70508/86398 [03:24<00:54, 288.95it/s]Preprocessing raw dataset...:  82%|████▉ | 70542/86398 [03:24<00:52, 301.87it/s]Preprocessing raw dataset...:  82%|████▉ | 70573/86398 [03:24<00:52, 299.62it/s]Preprocessing raw dataset...:  82%|████▉ | 70609/86398 [03:24<00:50, 310.90it/s]Preprocessing raw dataset...:  82%|████▉ | 70641/86398 [03:24<00:50, 312.04it/s]Preprocessing raw dataset...:  82%|████▉ | 70673/86398 [03:24<00:50, 309.91it/s]Preprocessing raw dataset...:  82%|████▉ | 70706/86398 [03:25<00:49, 314.59it/s]Preprocessing raw dataset...:  82%|████▉ | 70738/86398 [03:25<00:52, 299.07it/s]Preprocessing raw dataset...:  82%|████▉ | 70769/86398 [03:25<00:53, 291.97it/s]Preprocessing raw dataset...:  82%|████▉ | 70800/86398 [03:25<00:53, 289.44it/s]Preprocessing raw dataset...:  82%|████▉ | 70830/86398 [03:25<00:55, 282.56it/s]Preprocessing raw dataset...:  82%|████▉ | 70862/86398 [03:25<00:53, 290.33it/s]Preprocessing raw dataset...:  82%|████▉ | 70894/86398 [03:25<00:52, 296.53it/s]Preprocessing raw dataset...:  82%|████▉ | 70924/86398 [03:25<00:52, 292.19it/s]Preprocessing raw dataset...:  82%|████▉ | 70955/86398 [03:25<00:51, 297.26it/s]Preprocessing raw dataset...:  82%|████▉ | 70989/86398 [03:26<00:50, 307.39it/s]Preprocessing raw dataset...:  82%|████▉ | 71024/86398 [03:26<00:48, 319.40it/s]Preprocessing raw dataset...:  82%|████▉ | 71057/86398 [03:26<00:49, 307.46it/s]Preprocessing raw dataset...:  82%|████▉ | 71092/86398 [03:26<00:48, 318.66it/s]Preprocessing raw dataset...:  82%|████▉ | 71126/86398 [03:26<00:47, 323.25it/s]Preprocessing raw dataset...:  82%|████▉ | 71159/86398 [03:26<00:47, 317.95it/s]Preprocessing raw dataset...:  82%|████▉ | 71192/86398 [03:26<00:48, 315.51it/s]Preprocessing raw dataset...:  82%|████▉ | 71226/86398 [03:26<00:47, 319.58it/s]Preprocessing raw dataset...:  82%|████▉ | 71265/86398 [03:26<00:44, 338.19it/s]Preprocessing raw dataset...:  83%|████▉ | 71299/86398 [03:26<00:47, 317.10it/s]Preprocessing raw dataset...:  83%|████▉ | 71331/86398 [03:27<00:47, 314.42it/s]Preprocessing raw dataset...:  83%|████▉ | 71369/86398 [03:27<00:45, 328.47it/s]Preprocessing raw dataset...:  83%|████▉ | 71403/86398 [03:27<00:46, 322.45it/s]Preprocessing raw dataset...:  83%|████▉ | 71436/86398 [03:27<00:46, 318.49it/s]Preprocessing raw dataset...:  83%|████▉ | 71477/86398 [03:27<00:43, 343.91it/s]Preprocessing raw dataset...:  83%|████▉ | 71512/86398 [03:27<00:43, 343.37it/s]Preprocessing raw dataset...:  83%|████▉ | 71549/86398 [03:27<00:42, 348.12it/s]Preprocessing raw dataset...:  83%|████▉ | 71584/86398 [03:27<00:43, 342.52it/s]Preprocessing raw dataset...:  83%|████▉ | 71619/86398 [03:27<00:44, 330.71it/s]Preprocessing raw dataset...:  83%|████▉ | 71653/86398 [03:28<00:44, 333.06it/s]Preprocessing raw dataset...:  83%|████▉ | 71687/86398 [03:28<00:48, 306.41it/s]Preprocessing raw dataset...:  83%|████▉ | 71726/86398 [03:28<00:44, 328.05it/s]Preprocessing raw dataset...:  83%|████▉ | 71760/86398 [03:28<00:49, 294.09it/s]Preprocessing raw dataset...:  83%|████▉ | 71792/86398 [03:28<00:48, 299.24it/s]Preprocessing raw dataset...:  83%|████▉ | 71825/86398 [03:28<00:47, 304.48it/s]Preprocessing raw dataset...:  83%|████▉ | 71864/86398 [03:28<00:45, 322.15it/s]Preprocessing raw dataset...:  83%|████▉ | 71902/86398 [03:28<00:42, 337.70it/s]Preprocessing raw dataset...:  83%|████▉ | 71937/86398 [03:28<00:42, 337.55it/s]Preprocessing raw dataset...:  83%|████▉ | 71975/86398 [03:29<00:41, 348.57it/s]Preprocessing raw dataset...:  83%|█████ | 72012/86398 [03:29<00:40, 353.37it/s]Preprocessing raw dataset...:  83%|█████ | 72048/86398 [03:29<00:45, 316.30it/s]Preprocessing raw dataset...:  83%|█████ | 72081/86398 [03:29<00:44, 319.09it/s]Preprocessing raw dataset...:  83%|█████ | 72120/86398 [03:29<00:42, 337.20it/s]Preprocessing raw dataset...:  84%|█████ | 72156/86398 [03:29<00:42, 334.95it/s]Preprocessing raw dataset...:  84%|█████ | 72190/86398 [03:29<00:43, 325.40it/s]Preprocessing raw dataset...:  84%|█████ | 72223/86398 [03:29<00:43, 326.47it/s]Preprocessing raw dataset...:  84%|█████ | 72256/86398 [03:29<00:43, 323.83it/s]Preprocessing raw dataset...:  84%|█████ | 72289/86398 [03:30<00:45, 310.57it/s]Preprocessing raw dataset...:  84%|█████ | 72327/86398 [03:30<00:42, 327.25it/s]Preprocessing raw dataset...:  84%|█████ | 72360/86398 [03:30<00:45, 311.20it/s]Preprocessing raw dataset...:  84%|█████ | 72392/86398 [03:30<00:44, 311.42it/s]Preprocessing raw dataset...:  84%|█████ | 72429/86398 [03:30<00:42, 326.42it/s]Preprocessing raw dataset...:  84%|█████ | 72462/86398 [03:30<00:47, 296.00it/s]Preprocessing raw dataset...:  84%|█████ | 72494/86398 [03:30<00:46, 301.36it/s]Preprocessing raw dataset...:  84%|█████ | 72525/86398 [03:30<00:45, 303.56it/s]Preprocessing raw dataset...:  84%|█████ | 72556/86398 [03:30<00:45, 303.01it/s]Preprocessing raw dataset...:  84%|█████ | 72587/86398 [03:30<00:46, 298.39it/s]Preprocessing raw dataset...:  84%|█████ | 72619/86398 [03:31<00:46, 299.35it/s]Preprocessing raw dataset...:  84%|█████ | 72652/86398 [03:31<00:44, 307.93it/s]Preprocessing raw dataset...:  84%|█████ | 72683/86398 [03:31<00:44, 305.97it/s]Preprocessing raw dataset...:  84%|█████ | 72717/86398 [03:31<00:43, 315.34it/s]Preprocessing raw dataset...:  84%|█████ | 72750/86398 [03:31<00:42, 318.41it/s]Preprocessing raw dataset...:  84%|█████ | 72782/86398 [03:31<00:44, 305.31it/s]Preprocessing raw dataset...:  84%|█████ | 72814/86398 [03:31<00:44, 308.44it/s]Preprocessing raw dataset...:  84%|█████ | 72845/86398 [03:31<00:44, 304.45it/s]Preprocessing raw dataset...:  84%|█████ | 72882/86398 [03:31<00:42, 315.91it/s]Preprocessing raw dataset...:  84%|█████ | 72921/86398 [03:32<00:40, 333.50it/s]Preprocessing raw dataset...:  84%|█████ | 72956/86398 [03:32<00:40, 335.52it/s]Preprocessing raw dataset...:  84%|█████ | 72990/86398 [03:32<00:45, 297.84it/s]Preprocessing raw dataset...:  85%|█████ | 73021/86398 [03:32<00:45, 296.31it/s]Preprocessing raw dataset...:  85%|█████ | 73056/86398 [03:32<00:43, 309.33it/s]Preprocessing raw dataset...:  85%|█████ | 73093/86398 [03:32<00:40, 325.29it/s]Preprocessing raw dataset...:  85%|█████ | 73130/86398 [03:32<00:39, 335.90it/s]Preprocessing raw dataset...:  85%|█████ | 73164/86398 [03:32<00:41, 317.70it/s]Preprocessing raw dataset...:  85%|█████ | 73197/86398 [03:32<00:42, 312.08it/s]Preprocessing raw dataset...:  85%|█████ | 73232/86398 [03:33<00:41, 319.29it/s]Preprocessing raw dataset...:  85%|█████ | 73268/86398 [03:33<00:39, 328.51it/s]Preprocessing raw dataset...:  85%|█████ | 73302/86398 [03:33<00:40, 321.89it/s]Preprocessing raw dataset...:  85%|█████ | 73335/86398 [03:33<00:41, 317.90it/s]Preprocessing raw dataset...:  85%|█████ | 73369/86398 [03:33<00:40, 318.18it/s]Preprocessing raw dataset...:  85%|█████ | 73401/86398 [03:33<00:41, 316.15it/s]Preprocessing raw dataset...:  85%|█████ | 73433/86398 [03:33<00:41, 312.80it/s]Preprocessing raw dataset...:  85%|█████ | 73472/86398 [03:33<00:38, 332.56it/s]Preprocessing raw dataset...:  85%|█████ | 73506/86398 [03:33<00:39, 323.59it/s]Preprocessing raw dataset...:  85%|█████ | 73539/86398 [03:33<00:39, 324.89it/s]Preprocessing raw dataset...:  85%|█████ | 73572/86398 [03:34<00:40, 315.37it/s]Preprocessing raw dataset...:  85%|█████ | 73604/86398 [03:34<00:40, 316.37it/s]Preprocessing raw dataset...:  85%|█████ | 73636/86398 [03:34<00:41, 304.69it/s]Preprocessing raw dataset...:  85%|█████ | 73668/86398 [03:34<00:41, 307.65it/s]Preprocessing raw dataset...:  85%|█████ | 73699/86398 [03:34<00:41, 302.83it/s]Preprocessing raw dataset...:  85%|█████ | 73730/86398 [03:34<00:42, 301.60it/s]Preprocessing raw dataset...:  85%|█████ | 73767/86398 [03:34<00:39, 319.52it/s]Preprocessing raw dataset...:  85%|█████▏| 73803/86398 [03:34<00:38, 331.20it/s]Preprocessing raw dataset...:  85%|█████▏| 73837/86398 [03:34<00:38, 327.73it/s]Preprocessing raw dataset...:  85%|█████▏| 73870/86398 [03:35<00:38, 322.45it/s]Preprocessing raw dataset...:  86%|█████▏| 73903/86398 [03:35<00:40, 307.19it/s]Preprocessing raw dataset...:  86%|█████▏| 73934/86398 [03:35<00:42, 293.62it/s]Preprocessing raw dataset...:  86%|█████▏| 73970/86398 [03:35<00:39, 311.35it/s]Preprocessing raw dataset...:  86%|█████▏| 74002/86398 [03:35<00:41, 297.34it/s]Preprocessing raw dataset...:  86%|█████▏| 74040/86398 [03:35<00:38, 318.25it/s]Preprocessing raw dataset...:  86%|█████▏| 74073/86398 [03:35<00:40, 306.49it/s]Preprocessing raw dataset...:  86%|█████▏| 74104/86398 [03:35<00:40, 305.07it/s]Preprocessing raw dataset...:  86%|█████▏| 74135/86398 [03:35<00:40, 305.09it/s]Preprocessing raw dataset...:  86%|█████▏| 74166/86398 [03:36<00:40, 304.69it/s]Preprocessing raw dataset...:  86%|█████▏| 74197/86398 [03:36<00:40, 300.79it/s]Preprocessing raw dataset...:  86%|█████▏| 74228/86398 [03:36<00:41, 292.13it/s]Preprocessing raw dataset...:  86%|█████▏| 74261/86398 [03:36<00:40, 301.45it/s]Preprocessing raw dataset...:  86%|█████▏| 74292/86398 [03:36<00:40, 297.79it/s]Preprocessing raw dataset...:  86%|█████▏| 74330/86398 [03:36<00:37, 318.94it/s]Preprocessing raw dataset...:  86%|█████▏| 74362/86398 [03:36<00:39, 307.39it/s]Preprocessing raw dataset...:  86%|█████▏| 74394/86398 [03:36<00:38, 310.22it/s]Preprocessing raw dataset...:  86%|█████▏| 74429/86398 [03:36<00:37, 317.09it/s]Preprocessing raw dataset...:  86%|█████▏| 74465/86398 [03:36<00:36, 327.50it/s]Preprocessing raw dataset...:  86%|█████▏| 74499/86398 [03:37<00:36, 326.57it/s]Preprocessing raw dataset...:  86%|█████▏| 74532/86398 [03:37<00:37, 317.55it/s]Preprocessing raw dataset...:  86%|█████▏| 74565/86398 [03:37<00:36, 320.85it/s]Preprocessing raw dataset...:  86%|█████▏| 74598/86398 [03:37<00:36, 320.32it/s]Preprocessing raw dataset...:  86%|█████▏| 74631/86398 [03:37<00:36, 320.92it/s]Preprocessing raw dataset...:  86%|█████▏| 74664/86398 [03:37<00:37, 312.11it/s]Preprocessing raw dataset...:  86%|█████▏| 74698/86398 [03:37<00:36, 319.61it/s]Preprocessing raw dataset...:  86%|█████▏| 74732/86398 [03:37<00:35, 324.60it/s]Preprocessing raw dataset...:  87%|█████▏| 74770/86398 [03:37<00:34, 339.72it/s]Preprocessing raw dataset...:  87%|█████▏| 74805/86398 [03:38<00:35, 328.69it/s]Preprocessing raw dataset...:  87%|█████▏| 74838/86398 [03:38<00:35, 325.62it/s]Preprocessing raw dataset...:  87%|█████▏| 74873/86398 [03:38<00:34, 331.84it/s]Preprocessing raw dataset...:  87%|█████▏| 74910/86398 [03:38<00:33, 341.01it/s]Preprocessing raw dataset...:  87%|█████▏| 74945/86398 [03:38<00:33, 339.45it/s]Preprocessing raw dataset...:  87%|█████▏| 74983/86398 [03:38<00:33, 345.60it/s]Preprocessing raw dataset...:  87%|█████▏| 75018/86398 [03:38<00:33, 340.84it/s]Preprocessing raw dataset...:  87%|█████▏| 75053/86398 [03:38<00:33, 338.55it/s]Preprocessing raw dataset...:  87%|█████▏| 75087/86398 [03:38<00:35, 321.96it/s]Preprocessing raw dataset...:  87%|█████▏| 75120/86398 [03:38<00:36, 309.33it/s]Preprocessing raw dataset...:  87%|█████▏| 75152/86398 [03:39<00:37, 300.46it/s]Preprocessing raw dataset...:  87%|█████▏| 75183/86398 [03:39<00:37, 300.54it/s]Preprocessing raw dataset...:  87%|█████▏| 75215/86398 [03:39<00:36, 303.72it/s]Preprocessing raw dataset...:  87%|█████▏| 75246/86398 [03:39<00:37, 300.03it/s]Preprocessing raw dataset...:  87%|█████▏| 75277/86398 [03:39<00:38, 290.86it/s]Preprocessing raw dataset...:  87%|█████▏| 75313/86398 [03:39<00:35, 308.33it/s]Preprocessing raw dataset...:  87%|█████▏| 75348/86398 [03:39<00:34, 317.65it/s]Preprocessing raw dataset...:  87%|█████▏| 75380/86398 [03:39<00:35, 314.66it/s]Preprocessing raw dataset...:  87%|█████▏| 75412/86398 [03:39<00:35, 311.90it/s]Preprocessing raw dataset...:  87%|█████▏| 75444/86398 [03:40<00:37, 293.77it/s]Preprocessing raw dataset...:  87%|█████▏| 75476/86398 [03:40<00:36, 300.40it/s]Preprocessing raw dataset...:  87%|█████▏| 75508/86398 [03:40<00:35, 305.48it/s]Preprocessing raw dataset...:  87%|█████▏| 75539/86398 [03:40<00:35, 302.74it/s]Preprocessing raw dataset...:  87%|█████▏| 75570/86398 [03:40<00:35, 300.93it/s]Preprocessing raw dataset...:  88%|█████▎| 75601/86398 [03:40<00:36, 298.19it/s]Preprocessing raw dataset...:  88%|█████▎| 75636/86398 [03:40<00:34, 309.61it/s]Preprocessing raw dataset...:  88%|█████▎| 75668/86398 [03:40<00:34, 307.32it/s]Preprocessing raw dataset...:  88%|█████▎| 75702/86398 [03:40<00:33, 315.74it/s]Preprocessing raw dataset...:  88%|█████▎| 75738/86398 [03:40<00:32, 327.94it/s]Preprocessing raw dataset...:  88%|█████▎| 75771/86398 [03:41<00:32, 325.57it/s]Preprocessing raw dataset...:  88%|█████▎| 75804/86398 [03:41<00:32, 325.36it/s]Preprocessing raw dataset...:  88%|█████▎| 75837/86398 [03:41<00:34, 307.70it/s]Preprocessing raw dataset...:  88%|█████▎| 75868/86398 [03:41<00:35, 292.91it/s]Preprocessing raw dataset...:  88%|█████▎| 75898/86398 [03:41<00:39, 263.13it/s]Preprocessing raw dataset...:  88%|█████▎| 75933/86398 [03:41<00:36, 284.89it/s]Preprocessing raw dataset...:  88%|█████▎| 75963/86398 [03:41<00:36, 284.84it/s]Preprocessing raw dataset...:  88%|█████▎| 75994/86398 [03:41<00:36, 288.41it/s]Preprocessing raw dataset...:  88%|█████▎| 76026/86398 [03:41<00:35, 295.47it/s]Preprocessing raw dataset...:  88%|█████▎| 76057/86398 [03:42<00:34, 298.78it/s]Preprocessing raw dataset...:  88%|█████▎| 76088/86398 [03:42<00:35, 288.95it/s]Preprocessing raw dataset...:  88%|█████▎| 76118/86398 [03:42<00:35, 291.90it/s]Preprocessing raw dataset...:  88%|█████▎| 76151/86398 [03:42<00:33, 302.52it/s]Preprocessing raw dataset...:  88%|█████▎| 76184/86398 [03:42<00:33, 308.21it/s]Preprocessing raw dataset...:  88%|█████▎| 76215/86398 [03:42<00:34, 291.29it/s]Preprocessing raw dataset...:  88%|█████▎| 76245/86398 [03:42<00:36, 278.26it/s]Preprocessing raw dataset...:  88%|█████▎| 76275/86398 [03:42<00:35, 281.27it/s]Preprocessing raw dataset...:  88%|█████▎| 76309/86398 [03:42<00:34, 295.24it/s]Preprocessing raw dataset...:  88%|█████▎| 76344/86398 [03:43<00:32, 306.49it/s]Preprocessing raw dataset...:  88%|█████▎| 76375/86398 [03:43<00:33, 301.09it/s]Preprocessing raw dataset...:  88%|█████▎| 76409/86398 [03:43<00:32, 311.45it/s]Preprocessing raw dataset...:  88%|█████▎| 76444/86398 [03:43<00:31, 312.05it/s]Preprocessing raw dataset...:  89%|█████▎| 76477/86398 [03:43<00:31, 315.21it/s]Preprocessing raw dataset...:  89%|█████▎| 76509/86398 [03:43<00:32, 307.72it/s]Preprocessing raw dataset...:  89%|█████▎| 76542/86398 [03:43<00:31, 309.36it/s]Preprocessing raw dataset...:  89%|█████▎| 76573/86398 [03:43<00:32, 298.03it/s]Preprocessing raw dataset...:  89%|█████▎| 76605/86398 [03:43<00:32, 300.80it/s]Preprocessing raw dataset...:  89%|█████▎| 76641/86398 [03:44<00:30, 317.32it/s]Preprocessing raw dataset...:  89%|█████▎| 76673/86398 [03:44<00:31, 310.75it/s]Preprocessing raw dataset...:  89%|█████▎| 76705/86398 [03:44<00:31, 304.06it/s]Preprocessing raw dataset...:  89%|█████▎| 76736/86398 [03:44<00:32, 300.16it/s]Preprocessing raw dataset...:  89%|█████▎| 76770/86398 [03:44<00:31, 308.03it/s]Preprocessing raw dataset...:  89%|█████▎| 76805/86398 [03:44<00:30, 319.64it/s]Preprocessing raw dataset...:  89%|█████▎| 76841/86398 [03:44<00:29, 329.17it/s]Preprocessing raw dataset...:  89%|█████▎| 76874/86398 [03:44<00:29, 319.05it/s]Preprocessing raw dataset...:  89%|█████▎| 76907/86398 [03:44<00:30, 306.37it/s]Preprocessing raw dataset...:  89%|█████▎| 76942/86398 [03:44<00:29, 316.92it/s]Preprocessing raw dataset...:  89%|█████▎| 76974/86398 [03:45<00:31, 299.24it/s]Preprocessing raw dataset...:  89%|█████▎| 77009/86398 [03:45<00:30, 312.18it/s]Preprocessing raw dataset...:  89%|█████▎| 77049/86398 [03:45<00:28, 331.20it/s]Preprocessing raw dataset...:  89%|█████▎| 77083/86398 [03:45<00:29, 314.80it/s]Preprocessing raw dataset...:  89%|█████▎| 77117/86398 [03:45<00:29, 318.65it/s]Preprocessing raw dataset...:  89%|█████▎| 77150/86398 [03:45<00:29, 313.17it/s]Preprocessing raw dataset...:  89%|█████▎| 77183/86398 [03:45<00:29, 315.65it/s]Preprocessing raw dataset...:  89%|█████▎| 77215/86398 [03:45<00:30, 305.01it/s]Preprocessing raw dataset...:  89%|█████▎| 77249/86398 [03:45<00:29, 313.80it/s]Preprocessing raw dataset...:  89%|█████▎| 77281/86398 [03:46<00:31, 292.56it/s]Preprocessing raw dataset...:  89%|█████▎| 77316/86398 [03:46<00:29, 307.06it/s]Preprocessing raw dataset...:  90%|█████▎| 77356/86398 [03:46<00:27, 331.38it/s]Preprocessing raw dataset...:  90%|█████▎| 77390/86398 [03:46<00:27, 322.50it/s]Preprocessing raw dataset...:  90%|█████▍| 77425/86398 [03:46<00:27, 329.41it/s]Preprocessing raw dataset...:  90%|█████▍| 77459/86398 [03:46<00:27, 322.61it/s]Preprocessing raw dataset...:  90%|█████▍| 77494/86398 [03:46<00:27, 329.51it/s]Preprocessing raw dataset...:  90%|█████▍| 77528/86398 [03:46<00:27, 324.49it/s]Preprocessing raw dataset...:  90%|█████▍| 77561/86398 [03:46<00:29, 299.47it/s]Preprocessing raw dataset...:  90%|█████▍| 77592/86398 [03:47<00:29, 295.23it/s]Preprocessing raw dataset...:  90%|█████▍| 77624/86398 [03:47<00:29, 299.81it/s]Preprocessing raw dataset...:  90%|█████▍| 77658/86398 [03:47<00:28, 307.38it/s]Preprocessing raw dataset...:  90%|█████▍| 77689/86398 [03:47<00:29, 299.65it/s]Preprocessing raw dataset...:  90%|█████▍| 77720/86398 [03:47<00:30, 284.31it/s]Preprocessing raw dataset...:  90%|█████▍| 77751/86398 [03:47<00:29, 291.32it/s]Preprocessing raw dataset...:  90%|█████▍| 77790/86398 [03:47<00:27, 309.11it/s]Preprocessing raw dataset...:  90%|█████▍| 77823/86398 [03:47<00:27, 311.19it/s]Preprocessing raw dataset...:  90%|█████▍| 77855/86398 [03:47<00:29, 290.46it/s]Preprocessing raw dataset...:  90%|█████▍| 77885/86398 [03:48<00:29, 291.70it/s]Preprocessing raw dataset...:  90%|█████▍| 77916/86398 [03:48<00:28, 296.33it/s]Preprocessing raw dataset...:  90%|█████▍| 77954/86398 [03:48<00:26, 319.64it/s]Preprocessing raw dataset...:  90%|█████▍| 77987/86398 [03:48<00:28, 290.82it/s]Preprocessing raw dataset...:  90%|█████▍| 78017/86398 [03:48<00:29, 282.16it/s]Preprocessing raw dataset...:  90%|█████▍| 78048/86398 [03:48<00:29, 287.60it/s]Preprocessing raw dataset...:  90%|█████▍| 78079/86398 [03:48<00:28, 290.78it/s]Preprocessing raw dataset...:  90%|█████▍| 78109/86398 [03:48<00:28, 289.02it/s]Preprocessing raw dataset...:  90%|█████▍| 78139/86398 [03:48<00:28, 286.61it/s]Preprocessing raw dataset...:  90%|█████▍| 78169/86398 [03:49<00:28, 287.78it/s]Preprocessing raw dataset...:  91%|█████▍| 78209/86398 [03:49<00:25, 319.07it/s]Preprocessing raw dataset...:  91%|█████▍| 78242/86398 [03:49<00:25, 319.89it/s]Preprocessing raw dataset...:  91%|█████▍| 78275/86398 [03:49<00:26, 302.67it/s]Preprocessing raw dataset...:  91%|█████▍| 78306/86398 [03:49<00:28, 288.30it/s]Preprocessing raw dataset...:  91%|█████▍| 78336/86398 [03:49<00:27, 289.47it/s]Preprocessing raw dataset...:  91%|█████▍| 78366/86398 [03:49<00:28, 285.09it/s]Preprocessing raw dataset...:  91%|█████▍| 78401/86398 [03:49<00:26, 297.99it/s]Preprocessing raw dataset...:  91%|█████▍| 78433/86398 [03:49<00:26, 303.20it/s]Preprocessing raw dataset...:  91%|█████▍| 78464/86398 [03:49<00:26, 302.87it/s]Preprocessing raw dataset...:  91%|█████▍| 78495/86398 [03:50<00:26, 299.84it/s]Preprocessing raw dataset...:  91%|█████▍| 78528/86398 [03:50<00:25, 308.07it/s]Preprocessing raw dataset...:  91%|█████▍| 78561/86398 [03:50<00:25, 312.99it/s]Preprocessing raw dataset...:  91%|█████▍| 78593/86398 [03:50<00:25, 304.77it/s]Preprocessing raw dataset...:  91%|█████▍| 78624/86398 [03:50<00:26, 294.64it/s]Preprocessing raw dataset...:  91%|█████▍| 78654/86398 [03:50<00:26, 292.80it/s]Preprocessing raw dataset...:  91%|█████▍| 78686/86398 [03:50<00:25, 298.85it/s]Preprocessing raw dataset...:  91%|█████▍| 78720/86398 [03:50<00:24, 310.17it/s]Preprocessing raw dataset...:  91%|█████▍| 78752/86398 [03:50<00:24, 311.34it/s]Preprocessing raw dataset...:  91%|█████▍| 78789/86398 [03:51<00:23, 325.10it/s]Preprocessing raw dataset...:  91%|█████▍| 78822/86398 [03:51<00:24, 310.60it/s]Preprocessing raw dataset...:  91%|█████▍| 78855/86398 [03:51<00:24, 313.16it/s]Preprocessing raw dataset...:  91%|█████▍| 78889/86398 [03:51<00:23, 317.62it/s]Preprocessing raw dataset...:  91%|█████▍| 78925/86398 [03:51<00:22, 325.99it/s]Preprocessing raw dataset...:  91%|█████▍| 78958/86398 [03:51<00:23, 316.90it/s]Preprocessing raw dataset...:  91%|█████▍| 78995/86398 [03:51<00:22, 328.05it/s]Preprocessing raw dataset...:  91%|█████▍| 79028/86398 [03:51<00:24, 300.94it/s]Preprocessing raw dataset...:  92%|█████▍| 79059/86398 [03:51<00:24, 302.44it/s]Preprocessing raw dataset...:  92%|█████▍| 79090/86398 [03:52<00:25, 289.25it/s]Preprocessing raw dataset...:  92%|█████▍| 79125/86398 [03:52<00:23, 305.78it/s]Preprocessing raw dataset...:  92%|█████▍| 79156/86398 [03:52<00:24, 294.09it/s]Preprocessing raw dataset...:  92%|█████▍| 79192/86398 [03:52<00:23, 311.65it/s]Preprocessing raw dataset...:  92%|█████▌| 79224/86398 [03:52<00:23, 304.62it/s]Preprocessing raw dataset...:  92%|█████▌| 79255/86398 [03:52<00:23, 303.94it/s]Preprocessing raw dataset...:  92%|█████▌| 79289/86398 [03:52<00:22, 313.38it/s]Preprocessing raw dataset...:  92%|█████▌| 79325/86398 [03:52<00:21, 324.95it/s]Preprocessing raw dataset...:  92%|█████▌| 79358/86398 [03:52<00:22, 317.65it/s]Preprocessing raw dataset...:  92%|█████▌| 79390/86398 [03:52<00:22, 309.14it/s]Preprocessing raw dataset...:  92%|█████▌| 79422/86398 [03:53<00:22, 304.18it/s]Preprocessing raw dataset...:  92%|█████▌| 79456/86398 [03:53<00:22, 313.12it/s]Preprocessing raw dataset...:  92%|█████▌| 79488/86398 [03:53<00:21, 314.21it/s]Preprocessing raw dataset...:  92%|█████▌| 79522/86398 [03:53<00:21, 317.48it/s]Preprocessing raw dataset...:  92%|█████▌| 79554/86398 [03:53<00:21, 315.28it/s]Preprocessing raw dataset...:  92%|█████▌| 79587/86398 [03:53<00:21, 318.82it/s]Preprocessing raw dataset...:  92%|█████▌| 79619/86398 [03:53<00:22, 299.61it/s]Preprocessing raw dataset...:  92%|█████▌| 79651/86398 [03:53<00:22, 304.90it/s]Preprocessing raw dataset...:  92%|█████▌| 79684/86398 [03:53<00:21, 310.70it/s]Preprocessing raw dataset...:  92%|█████▌| 79716/86398 [03:54<00:22, 297.74it/s]Preprocessing raw dataset...:  92%|█████▌| 79749/86398 [03:54<00:21, 306.21it/s]Preprocessing raw dataset...:  92%|█████▌| 79784/86398 [03:54<00:20, 317.86it/s]Preprocessing raw dataset...:  92%|█████▌| 79826/86398 [03:54<00:19, 343.31it/s]Preprocessing raw dataset...:  92%|█████▌| 79861/86398 [03:54<00:19, 343.77it/s]Preprocessing raw dataset...:  92%|█████▌| 79896/86398 [03:54<00:18, 344.45it/s]Preprocessing raw dataset...:  93%|█████▌| 79931/86398 [03:54<00:19, 332.26it/s]Preprocessing raw dataset...:  93%|█████▌| 79965/86398 [03:54<00:21, 300.32it/s]Preprocessing raw dataset...:  93%|█████▌| 79996/86398 [03:54<00:21, 295.66it/s]Preprocessing raw dataset...:  93%|█████▌| 80031/86398 [03:55<00:20, 303.70it/s]Preprocessing raw dataset...:  93%|█████▌| 80063/86398 [03:55<00:20, 306.64it/s]Preprocessing raw dataset...:  93%|█████▌| 80096/86398 [03:55<00:20, 311.78it/s]Preprocessing raw dataset...:  93%|█████▌| 80129/86398 [03:55<00:19, 315.85it/s]Preprocessing raw dataset...:  93%|█████▌| 80161/86398 [03:55<00:20, 303.08it/s]Preprocessing raw dataset...:  93%|█████▌| 80193/86398 [03:55<00:20, 307.45it/s]Preprocessing raw dataset...:  93%|█████▌| 80224/86398 [03:55<00:20, 308.05it/s]Preprocessing raw dataset...:  93%|█████▌| 80259/86398 [03:55<00:19, 320.16it/s]Preprocessing raw dataset...:  93%|█████▌| 80292/86398 [03:55<00:19, 315.55it/s]Preprocessing raw dataset...:  93%|█████▌| 80327/86398 [03:55<00:18, 324.01it/s]Preprocessing raw dataset...:  93%|█████▌| 80361/86398 [03:56<00:18, 325.60it/s]Preprocessing raw dataset...:  93%|█████▌| 80394/86398 [03:56<00:20, 299.61it/s]Preprocessing raw dataset...:  93%|█████▌| 80428/86398 [03:56<00:19, 308.95it/s]Preprocessing raw dataset...:  93%|█████▌| 80460/86398 [03:56<00:20, 295.84it/s]Preprocessing raw dataset...:  93%|█████▌| 80490/86398 [03:56<00:20, 290.64it/s]Preprocessing raw dataset...:  93%|█████▌| 80525/86398 [03:56<00:19, 306.10it/s]Preprocessing raw dataset...:  93%|█████▌| 80557/86398 [03:56<00:18, 308.79it/s]Preprocessing raw dataset...:  93%|█████▌| 80589/86398 [03:56<00:19, 303.84it/s]Preprocessing raw dataset...:  93%|█████▌| 80620/86398 [03:56<00:19, 289.79it/s]Preprocessing raw dataset...:  93%|█████▌| 80650/86398 [03:57<00:20, 286.69it/s]Preprocessing raw dataset...:  93%|█████▌| 80680/86398 [03:57<00:19, 289.76it/s]Preprocessing raw dataset...:  93%|█████▌| 80711/86398 [03:57<00:19, 292.60it/s]Preprocessing raw dataset...:  93%|█████▌| 80741/86398 [03:57<00:19, 293.55it/s]Preprocessing raw dataset...:  93%|█████▌| 80780/86398 [03:57<00:17, 315.50it/s]Preprocessing raw dataset...:  94%|█████▌| 80815/86398 [03:57<00:17, 321.32it/s]Preprocessing raw dataset...:  94%|█████▌| 80848/86398 [03:57<00:18, 306.58it/s]Preprocessing raw dataset...:  94%|█████▌| 80880/86398 [03:57<00:17, 308.62it/s]Preprocessing raw dataset...:  94%|█████▌| 80911/86398 [03:57<00:18, 296.64it/s]Preprocessing raw dataset...:  94%|█████▌| 80941/86398 [03:58<00:18, 290.86it/s]Preprocessing raw dataset...:  94%|█████▌| 80971/86398 [03:58<00:19, 285.51it/s]Preprocessing raw dataset...:  94%|█████▋| 81003/86398 [03:58<00:18, 294.82it/s]Preprocessing raw dataset...:  94%|█████▋| 81043/86398 [03:58<00:16, 318.80it/s]Preprocessing raw dataset...:  94%|█████▋| 81076/86398 [03:58<00:16, 320.80it/s]Preprocessing raw dataset...:  94%|█████▋| 81109/86398 [03:58<00:17, 305.37it/s]Preprocessing raw dataset...:  94%|█████▋| 81140/86398 [03:58<00:17, 305.57it/s]Preprocessing raw dataset...:  94%|█████▋| 81171/86398 [03:58<00:17, 291.01it/s]Preprocessing raw dataset...:  94%|█████▋| 81204/86398 [03:58<00:17, 301.72it/s]Preprocessing raw dataset...:  94%|█████▋| 81242/86398 [03:58<00:16, 320.99it/s]Preprocessing raw dataset...:  94%|█████▋| 81279/86398 [03:59<00:15, 329.68it/s]Preprocessing raw dataset...:  94%|█████▋| 81313/86398 [03:59<00:16, 313.10it/s]Preprocessing raw dataset...:  94%|█████▋| 81349/86398 [03:59<00:15, 323.93it/s]Preprocessing raw dataset...:  94%|█████▋| 81386/86398 [03:59<00:14, 335.63it/s]Preprocessing raw dataset...:  94%|█████▋| 81420/86398 [03:59<00:15, 328.81it/s]Preprocessing raw dataset...:  94%|█████▋| 81454/86398 [03:59<00:14, 330.75it/s]Preprocessing raw dataset...:  94%|█████▋| 81488/86398 [03:59<00:15, 321.63it/s]Preprocessing raw dataset...:  94%|█████▋| 81523/86398 [03:59<00:14, 329.64it/s]Preprocessing raw dataset...:  94%|█████▋| 81557/86398 [03:59<00:15, 304.07it/s]Preprocessing raw dataset...:  94%|█████▋| 81601/86398 [04:00<00:14, 339.86it/s]Preprocessing raw dataset...:  94%|█████▋| 81636/86398 [04:00<00:14, 339.66it/s]Preprocessing raw dataset...:  95%|█████▋| 81671/86398 [04:00<00:15, 311.30it/s]Preprocessing raw dataset...:  95%|█████▋| 81706/86398 [04:00<00:14, 320.96it/s]Preprocessing raw dataset...:  95%|█████▋| 81739/86398 [04:00<00:14, 314.97it/s]Preprocessing raw dataset...:  95%|█████▋| 81771/86398 [04:00<00:14, 310.47it/s]Preprocessing raw dataset...:  95%|█████▋| 81803/86398 [04:00<00:14, 309.88it/s]Preprocessing raw dataset...:  95%|█████▋| 81836/86398 [04:00<00:14, 309.86it/s]Preprocessing raw dataset...:  95%|█████▋| 81872/86398 [04:00<00:13, 323.75it/s]Preprocessing raw dataset...:  95%|█████▋| 81911/86398 [04:01<00:13, 340.32it/s]Preprocessing raw dataset...:  95%|█████▋| 81946/86398 [04:01<00:13, 321.73it/s]Preprocessing raw dataset...:  95%|█████▋| 81979/86398 [04:01<00:14, 305.53it/s]Preprocessing raw dataset...:  95%|█████▋| 82010/86398 [04:01<00:14, 301.26it/s]Preprocessing raw dataset...:  95%|█████▋| 82042/86398 [04:01<00:14, 302.72it/s]Preprocessing raw dataset...:  95%|█████▋| 82073/86398 [04:01<00:14, 303.44it/s]Preprocessing raw dataset...:  95%|█████▋| 82107/86398 [04:01<00:13, 310.40it/s]Preprocessing raw dataset...:  95%|█████▋| 82139/86398 [04:01<00:14, 299.35it/s]Preprocessing raw dataset...:  95%|█████▋| 82170/86398 [04:01<00:14, 301.59it/s]Preprocessing raw dataset...:  95%|█████▋| 82201/86398 [04:02<00:13, 302.16it/s]Preprocessing raw dataset...:  95%|█████▋| 82239/86398 [04:02<00:12, 323.10it/s]Preprocessing raw dataset...:  95%|█████▋| 82272/86398 [04:02<00:12, 318.20it/s]Preprocessing raw dataset...:  95%|█████▋| 82304/86398 [04:02<00:13, 296.46it/s]Preprocessing raw dataset...:  95%|█████▋| 82334/86398 [04:02<00:13, 291.70it/s]Preprocessing raw dataset...:  95%|█████▋| 82364/86398 [04:02<00:14, 282.78it/s]Preprocessing raw dataset...:  95%|█████▋| 82397/86398 [04:02<00:13, 294.91it/s]Preprocessing raw dataset...:  95%|█████▋| 82430/86398 [04:02<00:13, 302.62it/s]Preprocessing raw dataset...:  95%|█████▋| 82461/86398 [04:02<00:12, 304.63it/s]Preprocessing raw dataset...:  95%|█████▋| 82492/86398 [04:02<00:12, 305.66it/s]Preprocessing raw dataset...:  96%|█████▋| 82523/86398 [04:03<00:12, 299.61it/s]Preprocessing raw dataset...:  96%|█████▋| 82554/86398 [04:03<00:13, 293.29it/s]Preprocessing raw dataset...:  96%|█████▋| 82591/86398 [04:03<00:12, 312.96it/s]Preprocessing raw dataset...:  96%|█████▋| 82625/86398 [04:03<00:11, 319.91it/s]Preprocessing raw dataset...:  96%|█████▋| 82658/86398 [04:03<00:12, 300.45it/s]Preprocessing raw dataset...:  96%|█████▋| 82689/86398 [04:03<00:12, 303.09it/s]Preprocessing raw dataset...:  96%|█████▋| 82720/86398 [04:03<00:12, 298.77it/s]Preprocessing raw dataset...:  96%|█████▋| 82754/86398 [04:03<00:11, 309.99it/s]Preprocessing raw dataset...:  96%|█████▋| 82786/86398 [04:03<00:12, 296.44it/s]Preprocessing raw dataset...:  96%|█████▊| 82816/86398 [04:04<00:12, 296.27it/s]Preprocessing raw dataset...:  96%|█████▊| 82848/86398 [04:04<00:11, 301.57it/s]Preprocessing raw dataset...:  96%|█████▊| 82881/86398 [04:04<00:11, 306.55it/s]Preprocessing raw dataset...:  96%|█████▊| 82916/86398 [04:04<00:10, 317.39it/s]Preprocessing raw dataset...:  96%|█████▊| 82948/86398 [04:04<00:10, 318.13it/s]Preprocessing raw dataset...:  96%|█████▊| 82981/86398 [04:04<00:10, 320.40it/s]Preprocessing raw dataset...:  96%|█████▊| 83014/86398 [04:04<00:11, 305.31it/s]Preprocessing raw dataset...:  96%|█████▊| 83045/86398 [04:04<00:11, 304.32it/s]Preprocessing raw dataset...:  96%|█████▊| 83076/86398 [04:04<00:11, 299.37it/s]Preprocessing raw dataset...:  96%|█████▊| 83108/86398 [04:04<00:10, 305.13it/s]Preprocessing raw dataset...:  96%|█████▊| 83139/86398 [04:05<00:10, 297.45it/s]Preprocessing raw dataset...:  96%|█████▊| 83169/86398 [04:05<00:11, 290.16it/s]Preprocessing raw dataset...:  96%|█████▊| 83204/86398 [04:05<00:10, 304.21it/s]Preprocessing raw dataset...:  96%|█████▊| 83242/86398 [04:05<00:09, 324.11it/s]Preprocessing raw dataset...:  96%|█████▊| 83277/86398 [04:05<00:09, 329.24it/s]Preprocessing raw dataset...:  96%|█████▊| 83311/86398 [04:05<00:09, 312.59it/s]Preprocessing raw dataset...:  96%|█████▊| 83353/86398 [04:05<00:08, 340.41it/s]Preprocessing raw dataset...:  97%|█████▊| 83388/86398 [04:05<00:09, 334.40it/s]Preprocessing raw dataset...:  97%|█████▊| 83422/86398 [04:05<00:09, 328.72it/s]Preprocessing raw dataset...:  97%|█████▊| 83457/86398 [04:06<00:08, 329.27it/s]Preprocessing raw dataset...:  97%|█████▊| 83494/86398 [04:06<00:08, 336.89it/s]Preprocessing raw dataset...:  97%|█████▊| 83528/86398 [04:06<00:08, 335.72it/s]Preprocessing raw dataset...:  97%|█████▊| 83562/86398 [04:06<00:08, 316.99it/s]Preprocessing raw dataset...:  97%|█████▊| 83595/86398 [04:06<00:08, 317.67it/s]Preprocessing raw dataset...:  97%|█████▊| 83627/86398 [04:06<00:09, 302.49it/s]Preprocessing raw dataset...:  97%|█████▊| 83658/86398 [04:06<00:09, 290.44it/s]Preprocessing raw dataset...:  97%|█████▊| 83697/86398 [04:06<00:08, 317.41it/s]Preprocessing raw dataset...:  97%|█████▊| 83731/86398 [04:06<00:08, 320.45it/s]Preprocessing raw dataset...:  97%|█████▊| 83764/86398 [04:07<00:08, 321.14it/s]Preprocessing raw dataset...:  97%|█████▊| 83797/86398 [04:07<00:08, 307.18it/s]Preprocessing raw dataset...:  97%|█████▊| 83828/86398 [04:07<00:08, 301.39it/s]Preprocessing raw dataset...:  97%|█████▊| 83862/86398 [04:07<00:08, 308.92it/s]Preprocessing raw dataset...:  97%|█████▊| 83897/86398 [04:07<00:07, 318.87it/s]Preprocessing raw dataset...:  97%|█████▊| 83932/86398 [04:07<00:07, 326.03it/s]Preprocessing raw dataset...:  97%|█████▊| 83965/86398 [04:07<00:07, 314.21it/s]Preprocessing raw dataset...:  97%|█████▊| 83997/86398 [04:07<00:07, 314.47it/s]Preprocessing raw dataset...:  97%|█████▊| 84029/86398 [04:07<00:07, 307.66it/s]Preprocessing raw dataset...:  97%|█████▊| 84062/86398 [04:08<00:07, 313.34it/s]Preprocessing raw dataset...:  97%|█████▊| 84102/86398 [04:08<00:06, 338.06it/s]Preprocessing raw dataset...:  97%|█████▊| 84141/86398 [04:08<00:06, 352.54it/s]Preprocessing raw dataset...:  97%|█████▊| 84177/86398 [04:08<00:06, 345.45it/s]Preprocessing raw dataset...:  97%|█████▊| 84212/86398 [04:08<00:06, 343.19it/s]Preprocessing raw dataset...:  98%|█████▊| 84247/86398 [04:08<00:06, 342.24it/s]Preprocessing raw dataset...:  98%|█████▊| 84282/86398 [04:08<00:06, 332.14it/s]Preprocessing raw dataset...:  98%|█████▊| 84316/86398 [04:08<00:06, 317.34it/s]Preprocessing raw dataset...:  98%|█████▊| 84348/86398 [04:08<00:06, 303.03it/s]Preprocessing raw dataset...:  98%|█████▊| 84379/86398 [04:08<00:06, 297.10it/s]Preprocessing raw dataset...:  98%|█████▊| 84411/86398 [04:09<00:06, 303.36it/s]Preprocessing raw dataset...:  98%|█████▊| 84443/86398 [04:09<00:06, 307.23it/s]Preprocessing raw dataset...:  98%|█████▊| 84474/86398 [04:09<00:06, 286.55it/s]Preprocessing raw dataset...:  98%|█████▊| 84504/86398 [04:09<00:06, 290.11it/s]Preprocessing raw dataset...:  98%|█████▊| 84541/86398 [04:09<00:05, 309.83it/s]Preprocessing raw dataset...:  98%|█████▊| 84573/86398 [04:09<00:06, 295.06it/s]Preprocessing raw dataset...:  98%|█████▉| 84603/86398 [04:09<00:06, 290.16it/s]Preprocessing raw dataset...:  98%|█████▉| 84635/86398 [04:09<00:05, 295.42it/s]Preprocessing raw dataset...:  98%|█████▉| 84667/86398 [04:09<00:05, 301.97it/s]Preprocessing raw dataset...:  98%|█████▉| 84700/86398 [04:10<00:05, 309.38it/s]Preprocessing raw dataset...:  98%|█████▉| 84732/86398 [04:10<00:05, 311.16it/s]Preprocessing raw dataset...:  98%|█████▉| 84765/86398 [04:10<00:05, 315.52it/s]Preprocessing raw dataset...:  98%|█████▉| 84797/86398 [04:10<00:05, 307.31it/s]Preprocessing raw dataset...:  98%|█████▉| 84830/86398 [04:10<00:04, 313.62it/s]Preprocessing raw dataset...:  98%|█████▉| 84862/86398 [04:10<00:05, 304.06it/s]Preprocessing raw dataset...:  98%|█████▉| 84893/86398 [04:10<00:05, 292.48it/s]Preprocessing raw dataset...:  98%|█████▉| 84925/86398 [04:10<00:04, 299.51it/s]Preprocessing raw dataset...:  98%|█████▉| 84963/86398 [04:10<00:04, 321.31it/s]Preprocessing raw dataset...:  98%|█████▉| 84996/86398 [04:10<00:04, 321.14it/s]Preprocessing raw dataset...:  98%|█████▉| 85030/86398 [04:11<00:04, 325.26it/s]Preprocessing raw dataset...:  98%|█████▉| 85063/86398 [04:11<00:04, 313.02it/s]Preprocessing raw dataset...:  98%|█████▉| 85098/86398 [04:11<00:04, 321.51it/s]Preprocessing raw dataset...:  99%|█████▉| 85131/86398 [04:11<00:04, 306.13it/s]Preprocessing raw dataset...:  99%|█████▉| 85162/86398 [04:11<00:04, 292.52it/s]Preprocessing raw dataset...:  99%|█████▉| 85194/86398 [04:11<00:04, 299.45it/s]Preprocessing raw dataset...:  99%|█████▉| 85225/86398 [04:11<00:03, 299.93it/s]Preprocessing raw dataset...:  99%|█████▉| 85262/86398 [04:11<00:03, 318.06it/s]Preprocessing raw dataset...:  99%|█████▉| 85298/86398 [04:11<00:03, 328.29it/s]Preprocessing raw dataset...:  99%|█████▉| 85331/86398 [04:12<00:03, 305.82it/s]Preprocessing raw dataset...:  99%|█████▉| 85365/86398 [04:12<00:03, 313.38it/s]Preprocessing raw dataset...:  99%|█████▉| 85398/86398 [04:12<00:03, 317.07it/s]Preprocessing raw dataset...:  99%|█████▉| 85430/86398 [04:12<00:03, 305.94it/s]Preprocessing raw dataset...:  99%|█████▉| 85467/86398 [04:12<00:02, 317.69it/s]Preprocessing raw dataset...:  99%|█████▉| 85504/86398 [04:12<00:02, 326.55it/s]Preprocessing raw dataset...:  99%|█████▉| 85537/86398 [04:12<00:02, 324.54it/s]Preprocessing raw dataset...:  99%|█████▉| 85570/86398 [04:12<00:02, 319.35it/s]Preprocessing raw dataset...:  99%|█████▉| 85602/86398 [04:12<00:02, 318.18it/s]Preprocessing raw dataset...:  99%|█████▉| 85634/86398 [04:13<00:02, 312.51it/s]Preprocessing raw dataset...:  99%|█████▉| 85669/86398 [04:13<00:02, 322.22it/s]Preprocessing raw dataset...:  99%|█████▉| 85705/86398 [04:13<00:02, 329.44it/s]Preprocessing raw dataset...:  99%|█████▉| 85738/86398 [04:13<00:02, 319.80it/s]Preprocessing raw dataset...:  99%|█████▉| 85773/86398 [04:13<00:01, 327.02it/s]Preprocessing raw dataset...:  99%|█████▉| 85807/86398 [04:13<00:01, 327.82it/s]Preprocessing raw dataset...:  99%|█████▉| 85842/86398 [04:13<00:01, 329.29it/s]Preprocessing raw dataset...:  99%|█████▉| 85875/86398 [04:13<00:01, 317.39it/s]Preprocessing raw dataset...:  99%|█████▉| 85907/86398 [04:13<00:01, 317.77it/s]Preprocessing raw dataset...:  99%|█████▉| 85940/86398 [04:13<00:01, 320.45it/s]Preprocessing raw dataset...: 100%|█████▉| 85973/86398 [04:14<00:01, 295.13it/s]Preprocessing raw dataset...: 100%|█████▉| 86003/86398 [04:14<00:01, 293.83it/s]Preprocessing raw dataset...: 100%|█████▉| 86040/86398 [04:14<00:01, 314.79it/s]Preprocessing raw dataset...: 100%|█████▉| 86072/86398 [04:14<00:01, 307.68it/s]Preprocessing raw dataset...: 100%|█████▉| 86105/86398 [04:14<00:00, 311.35it/s]Preprocessing raw dataset...: 100%|█████▉| 86137/86398 [04:14<00:00, 301.63it/s]Preprocessing raw dataset...: 100%|█████▉| 86168/86398 [04:14<00:00, 287.85it/s]Preprocessing raw dataset...: 100%|█████▉| 86197/86398 [04:14<00:00, 279.55it/s]Preprocessing raw dataset...: 100%|█████▉| 86229/86398 [04:14<00:00, 284.69it/s]Preprocessing raw dataset...: 100%|█████▉| 86258/86398 [04:15<00:00, 285.74it/s]Preprocessing raw dataset...: 100%|█████▉| 86291/86398 [04:15<00:00, 292.22it/s]Preprocessing raw dataset...: 100%|█████▉| 86321/86398 [04:15<00:00, 278.40it/s]Preprocessing raw dataset...: 100%|█████▉| 86351/86398 [04:15<00:00, 282.21it/s]Preprocessing raw dataset...: 100%|█████▉| 86381/86398 [04:15<00:00, 286.15it/s]Preprocessing raw dataset...: 100%|██████| 86398/86398 [04:15<00:00, 338.06it/s]
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Detected CUDA files, patching ldflags
Emitting ninja build file /root/.cache/torch_extensions/py310_cu117/fused_adam/build.ninja...
Building extension module fused_adam...
Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)
Loading extension module fused_adam...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Detected CUDA files, patching ldflags
Emitting ninja build file /root/.cache/torch_extensions/py310_cu117/fused_adam/build.ninja...
Building extension module fused_adam...
Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Detected CUDA files, patching ldflags
Emitting ninja build file /root/.cache/torch_extensions/py310_cu117/fused_adam/build.ninja...
Building extension module fused_adam...
Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Training 1/2 epoch:   0%|                              | 0/4114 [00:00<?, ?it/s]Training 1/2 epoch (loss 0.9102):   0%|                | 0/4114 [00:05<?, ?it/s]Training 1/2 epoch (loss 0.9102):   0%|      | 1/4114 [00:05<6:00:54,  5.26s/it]Training 1/2 epoch (loss 1.0234):   0%|      | 1/4114 [00:08<6:00:54,  5.26s/it]Training 1/2 epoch (loss 1.0234):   0%|      | 2/4114 [00:08<4:46:53,  4.19s/it]Training 1/2 epoch (loss 0.7656):   0%|      | 2/4114 [00:13<4:46:53,  4.19s/it]Training 1/2 epoch (loss 0.7656):   0%|      | 3/4114 [00:13<5:01:32,  4.40s/it]Training 1/2 epoch (loss 0.8047):   0%|      | 3/4114 [00:17<5:01:32,  4.40s/it]Training 1/2 epoch (loss 0.8047):   0%|      | 4/4114 [00:17<4:50:07,  4.24s/it]Training 1/2 epoch (loss 0.8320):   0%|      | 4/4114 [00:21<4:50:07,  4.24s/it]Training 1/2 epoch (loss 0.8320):   0%|      | 5/4114 [00:21<4:43:04,  4.13s/it]Training 1/2 epoch (loss 0.8594):   0%|      | 5/4114 [00:25<4:43:04,  4.13s/it]Training 1/2 epoch (loss 0.8594):   0%|      | 6/4114 [00:25<4:46:33,  4.19s/it]Training 1/2 epoch (loss 0.8867):   0%|      | 6/4114 [00:29<4:46:33,  4.19s/it]Training 1/2 epoch (loss 0.8867):   0%|      | 7/4114 [00:29<4:41:40,  4.12s/it]Training 1/2 epoch (loss 0.7656):   0%|      | 7/4114 [00:33<4:41:40,  4.12s/it]Training 1/2 epoch (loss 0.7656):   0%|      | 8/4114 [00:33<4:37:51,  4.06s/it]Training 1/2 epoch (loss 0.7070):   0%|      | 8/4114 [00:37<4:37:51,  4.06s/it]Training 1/2 epoch (loss 0.7070):   0%|      | 9/4114 [00:37<4:27:00,  3.90s/it]Training 1/2 epoch (loss 0.7227):   0%|      | 9/4114 [00:40<4:27:00,  3.90s/it]Training 1/2 epoch (loss 0.7227):   0%|     | 10/4114 [00:40<4:25:54,  3.89s/it]Training 1/2 epoch (loss 0.8594):   0%|     | 10/4114 [00:44<4:25:54,  3.89s/it]Training 1/2 epoch (loss 0.8594):   0%|     | 11/4114 [00:44<4:26:43,  3.90s/it]Training 1/2 epoch (loss 0.8242):   0%|     | 11/4114 [00:48<4:26:43,  3.90s/it]Training 1/2 epoch (loss 0.8242):   0%|     | 12/4114 [00:48<4:31:05,  3.97s/it]Training 1/2 epoch (loss 0.5234):   0%|     | 12/4114 [00:52<4:31:05,  3.97s/it]Training 1/2 epoch (loss 0.5234):   0%|     | 13/4114 [00:52<4:26:57,  3.91s/it]Training 1/2 epoch (loss 0.5977):   0%|     | 13/4114 [00:56<4:26:57,  3.91s/it]Training 1/2 epoch (loss 0.5977):   0%|     | 14/4114 [00:56<4:28:36,  3.93s/it]Training 1/2 epoch (loss 0.7422):   0%|     | 14/4114 [01:00<4:28:36,  3.93s/it]Training 1/2 epoch (loss 0.7422):   0%|     | 15/4114 [01:00<4:33:36,  4.00s/it]Training 1/2 epoch (loss 0.7148):   0%|     | 15/4114 [01:04<4:33:36,  4.00s/it]Training 1/2 epoch (loss 0.7148):   0%|     | 16/4114 [01:04<4:34:06,  4.01s/it]Training 1/2 epoch (loss 0.8242):   0%|     | 16/4114 [01:08<4:34:06,  4.01s/it]Training 1/2 epoch (loss 0.8242):   0%|     | 17/4114 [01:08<4:30:05,  3.96s/it]Training 1/2 epoch (loss 0.7266):   0%|     | 17/4114 [01:12<4:30:05,  3.96s/it]Training 1/2 epoch (loss 0.7266):   0%|     | 18/4114 [01:12<4:36:30,  4.05s/it]Training 1/2 epoch (loss 0.7148):   0%|     | 18/4114 [01:16<4:36:30,  4.05s/it]Training 1/2 epoch (loss 0.7148):   0%|     | 19/4114 [01:16<4:31:21,  3.98s/it]Training 1/2 epoch (loss 0.9883):   0%|     | 19/4114 [01:20<4:31:21,  3.98s/it]Training 1/2 epoch (loss 0.9883):   0%|     | 20/4114 [01:20<4:32:10,  3.99s/it]Training 1/2 epoch (loss 0.6719):   0%|     | 20/4114 [01:24<4:32:10,  3.99s/it]Training 1/2 epoch (loss 0.6719):   1%|     | 21/4114 [01:24<4:33:30,  4.01s/it]Training 1/2 epoch (loss 0.7227):   1%|     | 21/4114 [01:28<4:33:30,  4.01s/it]Training 1/2 epoch (loss 0.7227):   1%|     | 22/4114 [01:28<4:32:57,  4.00s/it]Training 1/2 epoch (loss 0.7188):   1%|     | 22/4114 [01:32<4:32:57,  4.00s/it]Training 1/2 epoch (loss 0.7188):   1%|     | 23/4114 [01:32<4:28:58,  3.94s/it]Training 1/2 epoch (loss 0.5352):   1%|     | 23/4114 [01:36<4:28:58,  3.94s/it]Training 1/2 epoch (loss 0.5352):   1%|     | 24/4114 [01:36<4:36:17,  4.05s/it]Training 1/2 epoch (loss 0.7031):   1%|     | 24/4114 [01:40<4:36:17,  4.05s/it]Training 1/2 epoch (loss 0.7031):   1%|     | 25/4114 [01:40<4:32:09,  3.99s/it]Training 1/2 epoch (loss 0.6055):   1%|     | 25/4114 [01:44<4:32:09,  3.99s/it]Training 1/2 epoch (loss 0.6055):   1%|     | 26/4114 [01:44<4:25:34,  3.90s/it]Training 1/2 epoch (loss 0.4766):   1%|     | 26/4114 [01:48<4:25:34,  3.90s/it]Training 1/2 epoch (loss 0.4766):   1%|     | 27/4114 [01:48<4:31:52,  3.99s/it]Training 1/2 epoch (loss 0.8086):   1%|     | 27/4114 [01:52<4:31:52,  3.99s/it]Training 1/2 epoch (loss 0.8086):   1%|     | 28/4114 [01:52<4:31:02,  3.98s/it]Training 1/2 epoch (loss 0.6484):   1%|     | 28/4114 [01:56<4:31:02,  3.98s/it]Training 1/2 epoch (loss 0.6484):   1%|     | 29/4114 [01:56<4:30:16,  3.97s/it]Training 1/2 epoch (loss 0.6406):   1%|     | 29/4114 [02:00<4:30:16,  3.97s/it]Training 1/2 epoch (loss 0.6406):   1%|     | 30/4114 [02:00<4:33:07,  4.01s/it]Training 1/2 epoch (loss 0.7148):   1%|     | 30/4114 [02:04<4:33:07,  4.01s/it]Training 1/2 epoch (loss 0.7148):   1%|     | 31/4114 [02:04<4:29:16,  3.96s/it]Training 1/2 epoch (loss 0.6523):   1%|     | 31/4114 [02:08<4:29:16,  3.96s/it]Training 1/2 epoch (loss 0.6523):   1%|     | 32/4114 [02:08<4:31:18,  3.99s/it]Training 1/2 epoch (loss 0.6562):   1%|     | 32/4114 [02:12<4:31:18,  3.99s/it]Training 1/2 epoch (loss 0.6562):   1%|     | 33/4114 [02:12<4:31:43,  3.99s/it]Training 1/2 epoch (loss 0.6328):   1%|     | 33/4114 [02:16<4:31:43,  3.99s/it]Training 1/2 epoch (loss 0.6328):   1%|     | 34/4114 [02:16<4:21:12,  3.84s/it]Training 1/2 epoch (loss 0.7383):   1%|     | 34/4114 [02:20<4:21:12,  3.84s/it]Training 1/2 epoch (loss 0.7383):   1%|     | 35/4114 [02:20<4:23:50,  3.88s/it]Training 1/2 epoch (loss 0.6367):   1%|     | 35/4114 [02:24<4:23:50,  3.88s/it]Training 1/2 epoch (loss 0.6367):   1%|     | 36/4114 [02:24<4:27:10,  3.93s/it]Training 1/2 epoch (loss 0.6406):   1%|     | 36/4114 [02:28<4:27:10,  3.93s/it]Training 1/2 epoch (loss 0.6406):   1%|     | 37/4114 [02:28<4:28:16,  3.95s/it]Training 1/2 epoch (loss 0.6094):   1%|     | 37/4114 [02:31<4:28:16,  3.95s/it]Training 1/2 epoch (loss 0.6094):   1%|     | 38/4114 [02:31<4:22:51,  3.87s/it]Training 1/2 epoch (loss 0.5781):   1%|     | 38/4114 [02:36<4:22:51,  3.87s/it]Training 1/2 epoch (loss 0.5781):   1%|     | 39/4114 [02:36<4:29:46,  3.97s/it]Training 1/2 epoch (loss 0.5781):   1%|     | 39/4114 [02:39<4:29:46,  3.97s/it]Training 1/2 epoch (loss 0.5781):   1%|     | 40/4114 [02:39<4:29:04,  3.96s/it]Training 1/2 epoch (loss 0.6602):   1%|     | 40/4114 [02:43<4:29:04,  3.96s/it]Training 1/2 epoch (loss 0.6602):   1%|     | 41/4114 [02:43<4:16:29,  3.78s/it]Training 1/2 epoch (loss 0.5508):   1%|     | 41/4114 [02:47<4:16:29,  3.78s/it]Training 1/2 epoch (loss 0.5508):   1%|     | 42/4114 [02:47<4:23:29,  3.88s/it]Training 1/2 epoch (loss 0.5898):   1%|     | 42/4114 [02:50<4:23:29,  3.88s/it]Training 1/2 epoch (loss 0.5898):   1%|     | 43/4114 [02:50<4:14:23,  3.75s/it]Training 1/2 epoch (loss 0.5703):   1%|     | 43/4114 [02:54<4:14:23,  3.75s/it]Training 1/2 epoch (loss 0.5703):   1%|     | 44/4114 [02:54<4:18:57,  3.82s/it]Training 1/2 epoch (loss 0.5898):   1%|     | 44/4114 [02:59<4:18:57,  3.82s/it]Training 1/2 epoch (loss 0.5898):   1%|     | 45/4114 [02:59<4:26:18,  3.93s/it]Training 1/2 epoch (loss 0.5000):   1%|     | 45/4114 [03:03<4:26:18,  3.93s/it]Training 1/2 epoch (loss 0.5000):   1%|     | 46/4114 [03:03<4:28:29,  3.96s/it]Training 1/2 epoch (loss 0.6094):   1%|     | 46/4114 [03:07<4:28:29,  3.96s/it]Training 1/2 epoch (loss 0.6094):   1%|     | 47/4114 [03:07<4:28:37,  3.96s/it]Training 1/2 epoch (loss 0.5664):   1%|     | 47/4114 [03:11<4:28:37,  3.96s/it]Training 1/2 epoch (loss 0.5664):   1%|     | 48/4114 [03:11<4:33:03,  4.03s/it]Training 1/2 epoch (loss 0.5000):   1%|     | 48/4114 [03:15<4:33:03,  4.03s/it]Training 1/2 epoch (loss 0.5000):   1%|     | 49/4114 [03:15<4:32:26,  4.02s/it]Training 1/2 epoch (loss 0.5430):   1%|     | 49/4114 [03:18<4:32:26,  4.02s/it]Training 1/2 epoch (loss 0.5430):   1%|     | 50/4114 [03:18<4:27:19,  3.95s/it]Training 1/2 epoch (loss 0.5469):   1%|     | 50/4114 [03:23<4:27:19,  3.95s/it]Training 1/2 epoch (loss 0.5469):   1%|     | 51/4114 [03:23<4:30:23,  3.99s/it]Training 1/2 epoch (loss 0.5195):   1%|     | 51/4114 [03:26<4:30:23,  3.99s/it]Training 1/2 epoch (loss 0.5195):   1%|     | 52/4114 [03:26<4:27:28,  3.95s/it]Training 1/2 epoch (loss 0.4844):   1%|     | 52/4114 [03:30<4:27:28,  3.95s/it]Training 1/2 epoch (loss 0.4844):   1%|     | 53/4114 [03:30<4:27:21,  3.95s/it]Training 1/2 epoch (loss 0.5195):   1%|     | 53/4114 [03:34<4:27:21,  3.95s/it]Training 1/2 epoch (loss 0.5195):   1%|     | 54/4114 [03:34<4:20:22,  3.85s/it]Training 1/2 epoch (loss 0.5469):   1%|     | 54/4114 [03:38<4:20:22,  3.85s/it]Training 1/2 epoch (loss 0.5469):   1%|     | 55/4114 [03:38<4:20:11,  3.85s/it]Training 1/2 epoch (loss 0.5234):   1%|     | 55/4114 [03:42<4:20:11,  3.85s/it]Training 1/2 epoch (loss 0.5234):   1%|     | 56/4114 [03:42<4:21:52,  3.87s/it]Training 1/2 epoch (loss 0.5625):   1%|     | 56/4114 [03:46<4:21:52,  3.87s/it]Training 1/2 epoch (loss 0.5625):   1%|     | 57/4114 [03:46<4:25:29,  3.93s/it]Training 1/2 epoch (loss 0.6133):   1%|     | 57/4114 [03:50<4:25:29,  3.93s/it]Training 1/2 epoch (loss 0.6133):   1%|     | 58/4114 [03:50<4:23:25,  3.90s/it]Training 1/2 epoch (loss 0.5039):   1%|     | 58/4114 [03:53<4:23:25,  3.90s/it]Training 1/2 epoch (loss 0.5039):   1%|     | 59/4114 [03:53<4:21:19,  3.87s/it]Training 1/2 epoch (loss 0.5664):   1%|     | 59/4114 [03:58<4:21:19,  3.87s/it]Training 1/2 epoch (loss 0.5664):   1%|     | 60/4114 [03:58<4:24:48,  3.92s/it]Training 1/2 epoch (loss 0.4199):   1%|     | 60/4114 [04:01<4:24:48,  3.92s/it]Training 1/2 epoch (loss 0.4199):   1%|     | 61/4114 [04:01<4:24:39,  3.92s/it]Training 1/2 epoch (loss 0.5312):   1%|     | 61/4114 [04:05<4:24:39,  3.92s/it]Training 1/2 epoch (loss 0.5312):   2%|     | 62/4114 [04:05<4:25:36,  3.93s/it]Training 1/2 epoch (loss 0.4824):   2%|     | 62/4114 [04:09<4:25:36,  3.93s/it]Training 1/2 epoch (loss 0.4824):   2%|     | 63/4114 [04:09<4:27:13,  3.96s/it]Training 1/2 epoch (loss 0.6055):   2%|     | 63/4114 [04:13<4:27:13,  3.96s/it]Training 1/2 epoch (loss 0.6055):   2%|     | 64/4114 [04:13<4:16:42,  3.80s/it]Training 1/2 epoch (loss 0.5742):   2%|     | 64/4114 [04:16<4:16:42,  3.80s/it]Training 1/2 epoch (loss 0.5742):   2%|     | 65/4114 [04:16<4:06:37,  3.65s/it]Training 1/2 epoch (loss 0.3789):   2%|     | 65/4114 [04:20<4:06:37,  3.65s/it]Training 1/2 epoch (loss 0.3789):   2%|     | 66/4114 [04:20<4:18:01,  3.82s/it]Training 1/2 epoch (loss 0.3809):   2%|     | 66/4114 [04:24<4:18:01,  3.82s/it]Training 1/2 epoch (loss 0.3809):   2%|     | 67/4114 [04:24<4:23:12,  3.90s/it]Training 1/2 epoch (loss 0.4844):   2%|     | 67/4114 [04:28<4:23:12,  3.90s/it]Training 1/2 epoch (loss 0.4844):   2%|     | 68/4114 [04:28<4:12:13,  3.74s/it]Training 1/2 epoch (loss 0.5781):   2%|     | 68/4114 [04:32<4:12:13,  3.74s/it]Training 1/2 epoch (loss 0.5781):   2%|     | 69/4114 [04:32<4:20:17,  3.86s/it]Training 1/2 epoch (loss 0.5703):   2%|     | 69/4114 [04:36<4:20:17,  3.86s/it]Training 1/2 epoch (loss 0.5703):   2%|     | 70/4114 [04:36<4:20:30,  3.87s/it]Training 1/2 epoch (loss 0.7266):   2%|     | 70/4114 [04:40<4:20:30,  3.87s/it]Training 1/2 epoch (loss 0.7266):   2%|     | 71/4114 [04:40<4:20:26,  3.87s/it]Training 1/2 epoch (loss 0.6016):   2%|     | 71/4114 [04:43<4:20:26,  3.87s/it]Training 1/2 epoch (loss 0.6016):   2%|     | 72/4114 [04:43<4:15:15,  3.79s/it]Training 1/2 epoch (loss 0.6094):   2%|     | 72/4114 [04:47<4:15:15,  3.79s/it]Training 1/2 epoch (loss 0.6094):   2%|     | 73/4114 [04:47<4:19:22,  3.85s/it]Training 1/2 epoch (loss 0.6328):   2%|     | 73/4114 [04:51<4:19:22,  3.85s/it]Training 1/2 epoch (loss 0.6328):   2%|     | 74/4114 [04:51<4:21:21,  3.88s/it]Training 1/2 epoch (loss 0.5391):   2%|     | 74/4114 [04:55<4:21:21,  3.88s/it]Training 1/2 epoch (loss 0.5391):   2%|     | 75/4114 [04:55<4:24:41,  3.93s/it]Training 1/2 epoch (loss 0.4648):   2%|     | 75/4114 [04:59<4:24:41,  3.93s/it]Training 1/2 epoch (loss 0.4648):   2%|     | 76/4114 [04:59<4:14:15,  3.78s/it]Training 1/2 epoch (loss 0.6055):   2%|     | 76/4114 [05:03<4:14:15,  3.78s/it]Training 1/2 epoch (loss 0.6055):   2%|     | 77/4114 [05:03<4:17:59,  3.83s/it]Training 1/2 epoch (loss 0.3477):   2%|     | 77/4114 [05:07<4:17:59,  3.83s/it]Training 1/2 epoch (loss 0.3477):   2%|     | 78/4114 [05:07<4:25:00,  3.94s/it]Training 1/2 epoch (loss 0.3906):   2%|     | 78/4114 [05:11<4:25:00,  3.94s/it]Training 1/2 epoch (loss 0.3906):   2%|     | 79/4114 [05:11<4:26:09,  3.96s/it]Training 1/2 epoch (loss 0.3105):   2%|     | 79/4114 [05:15<4:26:09,  3.96s/it]Training 1/2 epoch (loss 0.3105):   2%|     | 80/4114 [05:15<4:26:52,  3.97s/it]Training 1/2 epoch (loss 0.3828):   2%|     | 80/4114 [05:19<4:26:52,  3.97s/it]Training 1/2 epoch (loss 0.3828):   2%|     | 81/4114 [05:19<4:32:46,  4.06s/it]Training 1/2 epoch (loss 0.4961):   2%|     | 81/4114 [05:23<4:32:46,  4.06s/it]Training 1/2 epoch (loss 0.4961):   2%|     | 82/4114 [05:23<4:27:45,  3.98s/it]Training 1/2 epoch (loss 0.3047):   2%|     | 82/4114 [05:27<4:27:45,  3.98s/it]Training 1/2 epoch (loss 0.3047):   2%|     | 83/4114 [05:27<4:26:18,  3.96s/it]Training 1/2 epoch (loss 0.4688):   2%|     | 83/4114 [05:31<4:26:18,  3.96s/it]Training 1/2 epoch (loss 0.4688):   2%|     | 84/4114 [05:31<4:29:17,  4.01s/it]Training 1/2 epoch (loss 0.2949):   2%|     | 84/4114 [05:35<4:29:17,  4.01s/it]Training 1/2 epoch (loss 0.2949):   2%|     | 85/4114 [05:35<4:24:48,  3.94s/it]Training 1/2 epoch (loss 0.3848):   2%|     | 85/4114 [05:38<4:24:48,  3.94s/it]Training 1/2 epoch (loss 0.3848):   2%|     | 86/4114 [05:38<4:15:26,  3.81s/it]Training 1/2 epoch (loss 0.5703):   2%|     | 86/4114 [05:42<4:15:26,  3.81s/it]Training 1/2 epoch (loss 0.5703):   2%|     | 87/4114 [05:42<4:22:50,  3.92s/it]Training 1/2 epoch (loss 0.5156):   2%|     | 87/4114 [05:46<4:22:50,  3.92s/it]Training 1/2 epoch (loss 0.5156):   2%|     | 88/4114 [05:46<4:24:55,  3.95s/it]Training 1/2 epoch (loss 0.5508):   2%|     | 88/4114 [05:50<4:24:55,  3.95s/it]Training 1/2 epoch (loss 0.5508):   2%|     | 89/4114 [05:50<4:25:40,  3.96s/it]Training 1/2 epoch (loss 0.6289):   2%|     | 89/4114 [05:54<4:25:40,  3.96s/it]Training 1/2 epoch (loss 0.6289):   2%|     | 90/4114 [05:54<4:20:25,  3.88s/it]Training 1/2 epoch (loss 0.5078):   2%|     | 90/4114 [05:58<4:20:25,  3.88s/it]Training 1/2 epoch (loss 0.5078):   2%|     | 91/4114 [05:58<4:22:44,  3.92s/it]Training 1/2 epoch (loss 0.3340):   2%|     | 91/4114 [06:02<4:22:44,  3.92s/it]Training 1/2 epoch (loss 0.3340):   2%|     | 92/4114 [06:02<4:25:05,  3.95s/it]Training 1/2 epoch (loss 0.4355):   2%|     | 92/4114 [06:07<4:25:05,  3.95s/it]Training 1/2 epoch (loss 0.4355):   2%|     | 93/4114 [06:07<4:32:28,  4.07s/it]Training 1/2 epoch (loss 0.6328):   2%|     | 93/4114 [06:10<4:32:28,  4.07s/it]Training 1/2 epoch (loss 0.6328):   2%|     | 94/4114 [06:10<4:29:42,  4.03s/it]Training 1/2 epoch (loss 0.6484):   2%|     | 94/4114 [06:14<4:29:42,  4.03s/it]Training 1/2 epoch (loss 0.6484):   2%|     | 95/4114 [06:14<4:17:08,  3.84s/it]Training 1/2 epoch (loss 0.6367):   2%|     | 95/4114 [06:17<4:17:08,  3.84s/it]Training 1/2 epoch (loss 0.6367):   2%|     | 96/4114 [06:17<4:12:34,  3.77s/it]Training 1/2 epoch (loss 0.4297):   2%|     | 96/4114 [06:21<4:12:34,  3.77s/it]Training 1/2 epoch (loss 0.4297):   2%|     | 97/4114 [06:21<4:16:00,  3.82s/it]Training 1/2 epoch (loss 0.4766):   2%|     | 97/4114 [06:25<4:16:00,  3.82s/it]Training 1/2 epoch (loss 0.4766):   2%|     | 98/4114 [06:25<4:15:14,  3.81s/it]Training 1/2 epoch (loss 0.6016):   2%|     | 98/4114 [06:29<4:15:14,  3.81s/it]Training 1/2 epoch (loss 0.6016):   2%|     | 99/4114 [06:29<4:24:42,  3.96s/it]Training 1/2 epoch (loss 0.3672):   2%|     | 99/4114 [06:33<4:24:42,  3.96s/it]Training 1/2 epoch (loss 0.3672):   2%|    | 100/4114 [06:33<4:21:49,  3.91s/it]Training 1/2 epoch (loss 0.3398):   2%|    | 100/4114 [06:37<4:21:49,  3.91s/it]Training 1/2 epoch (loss 0.3398):   2%|    | 101/4114 [06:37<4:22:53,  3.93s/it]Training 1/2 epoch (loss 0.5117):   2%|    | 101/4114 [06:41<4:22:53,  3.93s/it]Training 1/2 epoch (loss 0.5117):   2%|    | 102/4114 [06:41<4:26:24,  3.98s/it]Training 1/2 epoch (loss 0.4980):   2%|    | 102/4114 [06:45<4:26:24,  3.98s/it]Training 1/2 epoch (loss 0.4980):   3%|    | 103/4114 [06:45<4:26:30,  3.99s/it]Training 1/2 epoch (loss 0.3555):   3%|    | 103/4114 [06:49<4:26:30,  3.99s/it]Training 1/2 epoch (loss 0.3555):   3%|    | 104/4114 [06:49<4:26:00,  3.98s/it]Training 1/2 epoch (loss 0.4062):   3%|    | 104/4114 [06:53<4:26:00,  3.98s/it]Training 1/2 epoch (loss 0.4062):   3%|    | 105/4114 [06:53<4:29:08,  4.03s/it]Training 1/2 epoch (loss 0.5039):   3%|    | 105/4114 [06:57<4:29:08,  4.03s/it]Training 1/2 epoch (loss 0.5039):   3%|    | 106/4114 [06:57<4:28:06,  4.01s/it]Training 1/2 epoch (loss 0.3125):   3%|    | 106/4114 [07:01<4:28:06,  4.01s/it]Training 1/2 epoch (loss 0.3125):   3%|    | 107/4114 [07:01<4:27:24,  4.00s/it]Training 1/2 epoch (loss 0.4355):   3%|    | 107/4114 [07:06<4:27:24,  4.00s/it]Training 1/2 epoch (loss 0.4355):   3%|    | 108/4114 [07:06<4:30:05,  4.05s/it]Training 1/2 epoch (loss 0.3672):   3%|    | 108/4114 [07:10<4:30:05,  4.05s/it]Training 1/2 epoch (loss 0.3672):   3%|    | 109/4114 [07:10<4:28:54,  4.03s/it]Training 1/2 epoch (loss 0.4746):   3%|    | 109/4114 [07:13<4:28:54,  4.03s/it]Training 1/2 epoch (loss 0.4746):   3%|    | 110/4114 [07:13<4:24:03,  3.96s/it]Training 1/2 epoch (loss 0.4941):   3%|    | 110/4114 [07:18<4:24:03,  3.96s/it]Training 1/2 epoch (loss 0.4941):   3%|    | 111/4114 [07:18<4:28:47,  4.03s/it]Training 1/2 epoch (loss 0.4160):   3%|    | 111/4114 [07:21<4:28:47,  4.03s/it]Training 1/2 epoch (loss 0.4160):   3%|    | 112/4114 [07:21<4:18:18,  3.87s/it]Training 1/2 epoch (loss 0.4531):   3%|    | 112/4114 [07:25<4:18:18,  3.87s/it]Training 1/2 epoch (loss 0.4531):   3%|    | 113/4114 [07:25<4:22:40,  3.94s/it]Training 1/2 epoch (loss 0.4180):   3%|    | 113/4114 [07:29<4:22:40,  3.94s/it]Training 1/2 epoch (loss 0.4180):   3%|    | 114/4114 [07:29<4:17:09,  3.86s/it]Training 1/2 epoch (loss 0.5820):   3%|    | 114/4114 [07:33<4:17:09,  3.86s/it]Training 1/2 epoch (loss 0.5820):   3%|    | 115/4114 [07:33<4:15:23,  3.83s/it]Training 1/2 epoch (loss 0.4082):   3%|    | 115/4114 [07:37<4:15:23,  3.83s/it]Training 1/2 epoch (loss 0.4082):   3%|    | 116/4114 [07:37<4:17:19,  3.86s/it]Training 1/2 epoch (loss 0.5312):   3%|    | 116/4114 [07:41<4:17:19,  3.86s/it]Training 1/2 epoch (loss 0.5312):   3%|    | 117/4114 [07:41<4:24:49,  3.98s/it]Training 1/2 epoch (loss 0.5117):   3%|    | 117/4114 [07:45<4:24:49,  3.98s/it]Training 1/2 epoch (loss 0.5117):   3%|    | 118/4114 [07:45<4:23:37,  3.96s/it]Training 1/2 epoch (loss 0.4531):   3%|    | 118/4114 [07:48<4:23:37,  3.96s/it]Training 1/2 epoch (loss 0.4531):   3%|    | 119/4114 [07:48<4:19:40,  3.90s/it]Training 1/2 epoch (loss 0.3730):   3%|    | 119/4114 [07:53<4:19:40,  3.90s/it]Training 1/2 epoch (loss 0.3730):   3%|    | 120/4114 [07:53<4:24:35,  3.97s/it]Training 1/2 epoch (loss 0.4844):   3%|    | 120/4114 [07:56<4:24:35,  3.97s/it]Training 1/2 epoch (loss 0.4844):   3%|    | 121/4114 [07:56<4:09:20,  3.75s/it]Training 1/2 epoch (loss 0.5195):   3%|    | 121/4114 [08:00<4:09:20,  3.75s/it]Training 1/2 epoch (loss 0.5195):   3%|    | 122/4114 [08:00<4:08:31,  3.74s/it]Training 1/2 epoch (loss 0.4492):   3%|    | 122/4114 [08:04<4:08:31,  3.74s/it]Training 1/2 epoch (loss 0.4492):   3%|    | 123/4114 [08:04<4:18:15,  3.88s/it]Training 1/2 epoch (loss 0.3281):   3%|    | 123/4114 [08:08<4:18:15,  3.88s/it]Training 1/2 epoch (loss 0.3281):   3%|    | 124/4114 [08:08<4:16:15,  3.85s/it]Training 1/2 epoch (loss 0.5117):   3%|    | 124/4114 [08:11<4:16:15,  3.85s/it]Training 1/2 epoch (loss 0.5117):   3%|    | 125/4114 [08:11<4:16:31,  3.86s/it]Training 1/2 epoch (loss 0.3633):   3%|    | 125/4114 [08:15<4:16:31,  3.86s/it]Training 1/2 epoch (loss 0.3633):   3%|    | 126/4114 [08:15<4:19:21,  3.90s/it]Training 1/2 epoch (loss 0.4141):   3%|    | 126/4114 [08:19<4:19:21,  3.90s/it]Training 1/2 epoch (loss 0.4141):   3%|    | 127/4114 [08:19<4:21:34,  3.94s/it]Training 1/2 epoch (loss 0.4062):   3%|    | 127/4114 [08:23<4:21:34,  3.94s/it]Training 1/2 epoch (loss 0.4062):   3%|    | 128/4114 [08:23<4:22:31,  3.95s/it]Training 1/2 epoch (loss 0.3086):   3%|    | 128/4114 [08:28<4:22:31,  3.95s/it]Training 1/2 epoch (loss 0.3086):   3%|▏   | 129/4114 [08:28<4:27:20,  4.03s/it]Training 1/2 epoch (loss 0.5078):   3%|▏   | 129/4114 [08:32<4:27:20,  4.03s/it]Training 1/2 epoch (loss 0.5078):   3%|▏   | 130/4114 [08:32<4:28:01,  4.04s/it]Training 1/2 epoch (loss 0.5469):   3%|▏   | 130/4114 [08:35<4:28:01,  4.04s/it]Training 1/2 epoch (loss 0.5469):   3%|▏   | 131/4114 [08:35<4:15:21,  3.85s/it]Training 1/2 epoch (loss 0.3750):   3%|▏   | 131/4114 [08:39<4:15:21,  3.85s/it]Training 1/2 epoch (loss 0.3750):   3%|▏   | 132/4114 [08:39<4:11:23,  3.79s/it]Training 1/2 epoch (loss 0.5039):   3%|▏   | 132/4114 [08:42<4:11:23,  3.79s/it]Training 1/2 epoch (loss 0.5039):   3%|▏   | 133/4114 [08:42<4:05:15,  3.70s/it]Training 1/2 epoch (loss 0.4727):   3%|▏   | 133/4114 [08:46<4:05:15,  3.70s/it]Training 1/2 epoch (loss 0.4727):   3%|▏   | 134/4114 [08:46<4:07:33,  3.73s/it]Training 1/2 epoch (loss 0.5469):   3%|▏   | 134/4114 [08:50<4:07:33,  3.73s/it]Training 1/2 epoch (loss 0.5469):   3%|▏   | 135/4114 [08:50<4:06:59,  3.72s/it]Training 1/2 epoch (loss 0.5820):   3%|▏   | 135/4114 [08:54<4:06:59,  3.72s/it]Training 1/2 epoch (loss 0.5820):   3%|▏   | 136/4114 [08:54<4:10:12,  3.77s/it]Training 1/2 epoch (loss 0.4648):   3%|▏   | 136/4114 [08:57<4:10:12,  3.77s/it]Training 1/2 epoch (loss 0.4648):   3%|▏   | 137/4114 [08:57<4:10:55,  3.79s/it]Training 1/2 epoch (loss 0.5352):   3%|▏   | 137/4114 [09:01<4:10:55,  3.79s/it]Training 1/2 epoch (loss 0.5352):   3%|▏   | 138/4114 [09:01<4:16:00,  3.86s/it]Training 1/2 epoch (loss 0.5000):   3%|▏   | 138/4114 [09:05<4:16:00,  3.86s/it]Training 1/2 epoch (loss 0.5000):   3%|▏   | 139/4114 [09:05<4:14:50,  3.85s/it]Training 1/2 epoch (loss 0.4629):   3%|▏   | 139/4114 [09:09<4:14:50,  3.85s/it]Training 1/2 epoch (loss 0.4629):   3%|▏   | 140/4114 [09:09<4:05:45,  3.71s/it]Training 1/2 epoch (loss 0.5078):   3%|▏   | 140/4114 [09:13<4:05:45,  3.71s/it]Training 1/2 epoch (loss 0.5078):   3%|▏   | 141/4114 [09:13<4:12:22,  3.81s/it]Training 1/2 epoch (loss 0.3223):   3%|▏   | 141/4114 [09:16<4:12:22,  3.81s/it]Training 1/2 epoch (loss 0.3223):   3%|▏   | 142/4114 [09:16<4:01:11,  3.64s/it]Training 1/2 epoch (loss 0.3086):   3%|▏   | 142/4114 [09:20<4:01:11,  3.64s/it]Training 1/2 epoch (loss 0.3086):   3%|▏   | 143/4114 [09:20<4:09:17,  3.77s/it]Training 1/2 epoch (loss 0.5195):   3%|▏   | 143/4114 [09:24<4:09:17,  3.77s/it]Training 1/2 epoch (loss 0.5195):   4%|▏   | 144/4114 [09:24<4:07:30,  3.74s/it]Training 1/2 epoch (loss 0.4766):   4%|▏   | 144/4114 [09:28<4:07:30,  3.74s/it]Training 1/2 epoch (loss 0.4766):   4%|▏   | 145/4114 [09:28<4:10:36,  3.79s/it]Training 1/2 epoch (loss 0.6016):   4%|▏   | 145/4114 [09:32<4:10:36,  3.79s/it]Training 1/2 epoch (loss 0.6016):   4%|▏   | 146/4114 [09:32<4:15:52,  3.87s/it]Training 1/2 epoch (loss 0.5117):   4%|▏   | 146/4114 [09:36<4:15:52,  3.87s/it]Training 1/2 epoch (loss 0.5117):   4%|▏   | 147/4114 [09:36<4:24:56,  4.01s/it]Training 1/2 epoch (loss 0.4316):   4%|▏   | 147/4114 [09:40<4:24:56,  4.01s/it]Training 1/2 epoch (loss 0.4316):   4%|▏   | 148/4114 [09:40<4:26:55,  4.04s/it]Training 1/2 epoch (loss 0.3574):   4%|▏   | 148/4114 [09:44<4:26:55,  4.04s/it]Training 1/2 epoch (loss 0.3574):   4%|▏   | 149/4114 [09:44<4:22:01,  3.97s/it]Training 1/2 epoch (loss 0.4688):   4%|▏   | 149/4114 [09:48<4:22:01,  3.97s/it]Training 1/2 epoch (loss 0.4688):   4%|▏   | 150/4114 [09:48<4:29:34,  4.08s/it]Training 1/2 epoch (loss 0.3691):   4%|▏   | 150/4114 [09:52<4:29:34,  4.08s/it]Training 1/2 epoch (loss 0.3691):   4%|▏   | 151/4114 [09:52<4:23:10,  3.98s/it]Training 1/2 epoch (loss 0.4883):   4%|▏   | 151/4114 [09:56<4:23:10,  3.98s/it]Training 1/2 epoch (loss 0.4883):   4%|▏   | 152/4114 [09:56<4:20:42,  3.95s/it]Training 1/2 epoch (loss 0.4824):   4%|▏   | 152/4114 [10:00<4:20:42,  3.95s/it]Training 1/2 epoch (loss 0.4824):   4%|▏   | 153/4114 [10:00<4:22:15,  3.97s/it]Training 1/2 epoch (loss 0.3418):   4%|▏   | 153/4114 [10:04<4:22:15,  3.97s/it]Training 1/2 epoch (loss 0.3418):   4%|▏   | 154/4114 [10:04<4:23:36,  3.99s/it]Training 1/2 epoch (loss 0.4590):   4%|▏   | 154/4114 [10:07<4:23:36,  3.99s/it]Training 1/2 epoch (loss 0.4590):   4%|▏   | 155/4114 [10:07<4:07:31,  3.75s/it]Training 1/2 epoch (loss 0.4395):   4%|▏   | 155/4114 [10:11<4:07:31,  3.75s/it]Training 1/2 epoch (loss 0.4395):   4%|▏   | 156/4114 [10:11<4:05:54,  3.73s/it]Training 1/2 epoch (loss 0.5000):   4%|▏   | 156/4114 [10:15<4:05:54,  3.73s/it]Training 1/2 epoch (loss 0.5000):   4%|▏   | 157/4114 [10:15<4:07:14,  3.75s/it]Training 1/2 epoch (loss 0.4570):   4%|▏   | 157/4114 [10:19<4:07:14,  3.75s/it]Training 1/2 epoch (loss 0.4570):   4%|▏   | 158/4114 [10:19<4:13:16,  3.84s/it]Training 1/2 epoch (loss 0.5625):   4%|▏   | 158/4114 [10:23<4:13:16,  3.84s/it]Training 1/2 epoch (loss 0.5625):   4%|▏   | 159/4114 [10:23<4:20:59,  3.96s/it]Training 1/2 epoch (loss 0.3906):   4%|▏   | 159/4114 [10:26<4:20:59,  3.96s/it]Training 1/2 epoch (loss 0.3906):   4%|▏   | 160/4114 [10:26<4:00:32,  3.65s/it]Training 1/2 epoch (loss 0.4316):   4%|▏   | 160/4114 [10:30<4:00:32,  3.65s/it]Training 1/2 epoch (loss 0.4316):   4%|▏   | 161/4114 [10:30<4:07:02,  3.75s/it]Training 1/2 epoch (loss 0.4707):   4%|▏   | 161/4114 [10:34<4:07:02,  3.75s/it]Training 1/2 epoch (loss 0.4707):   4%|▏   | 162/4114 [10:34<4:16:59,  3.90s/it]Training 1/2 epoch (loss 0.3984):   4%|▏   | 162/4114 [10:38<4:16:59,  3.90s/it]Training 1/2 epoch (loss 0.3984):   4%|▏   | 163/4114 [10:38<4:14:48,  3.87s/it]Training 1/2 epoch (loss 0.5625):   4%|▏   | 163/4114 [10:42<4:14:48,  3.87s/it]Training 1/2 epoch (loss 0.5625):   4%|▏   | 164/4114 [10:42<4:17:06,  3.91s/it]Training 1/2 epoch (loss 0.5586):   4%|▏   | 164/4114 [10:46<4:17:06,  3.91s/it]Training 1/2 epoch (loss 0.5586):   4%|▏   | 165/4114 [10:46<4:24:53,  4.02s/it]Training 1/2 epoch (loss 0.5273):   4%|▏   | 165/4114 [10:50<4:24:53,  4.02s/it]Training 1/2 epoch (loss 0.5273):   4%|▏   | 166/4114 [10:50<4:11:52,  3.83s/it]Training 1/2 epoch (loss 0.3867):   4%|▏   | 166/4114 [10:53<4:11:52,  3.83s/it]Training 1/2 epoch (loss 0.3867):   4%|▏   | 167/4114 [10:53<4:12:00,  3.83s/it]Training 1/2 epoch (loss 0.4023):   4%|▏   | 167/4114 [10:57<4:12:00,  3.83s/it]Training 1/2 epoch (loss 0.4023):   4%|▏   | 168/4114 [10:57<4:16:36,  3.90s/it]Training 1/2 epoch (loss 0.3594):   4%|▏   | 168/4114 [11:01<4:16:36,  3.90s/it]Training 1/2 epoch (loss 0.3594):   4%|▏   | 169/4114 [11:01<4:17:56,  3.92s/it]Training 1/2 epoch (loss 0.4395):   4%|▏   | 169/4114 [11:05<4:17:56,  3.92s/it]Training 1/2 epoch (loss 0.4395):   4%|▏   | 170/4114 [11:05<4:20:54,  3.97s/it]Training 1/2 epoch (loss 0.3926):   4%|▏   | 170/4114 [11:10<4:20:54,  3.97s/it]Training 1/2 epoch (loss 0.3926):   4%|▏   | 171/4114 [11:10<4:25:02,  4.03s/it]Training 1/2 epoch (loss 0.4727):   4%|▏   | 171/4114 [11:14<4:25:02,  4.03s/it]Training 1/2 epoch (loss 0.4727):   4%|▏   | 172/4114 [11:14<4:24:22,  4.02s/it]Training 1/2 epoch (loss 0.5039):   4%|▏   | 172/4114 [11:18<4:24:22,  4.02s/it]Training 1/2 epoch (loss 0.5039):   4%|▏   | 173/4114 [11:18<4:21:06,  3.98s/it]Training 1/2 epoch (loss 0.4316):   4%|▏   | 173/4114 [11:22<4:21:06,  3.98s/it]Training 1/2 epoch (loss 0.4316):   4%|▏   | 174/4114 [11:22<4:23:45,  4.02s/it]Training 1/2 epoch (loss 0.4688):   4%|▏   | 174/4114 [11:25<4:23:45,  4.02s/it]Training 1/2 epoch (loss 0.4688):   4%|▏   | 175/4114 [11:25<4:19:26,  3.95s/it]Training 1/2 epoch (loss 0.4766):   4%|▏   | 175/4114 [11:29<4:19:26,  3.95s/it]Training 1/2 epoch (loss 0.4766):   4%|▏   | 176/4114 [11:29<4:19:05,  3.95s/it]Training 1/2 epoch (loss 0.4199):   4%|▏   | 176/4114 [11:34<4:19:05,  3.95s/it]Training 1/2 epoch (loss 0.4199):   4%|▏   | 177/4114 [11:34<4:25:13,  4.04s/it]Training 1/2 epoch (loss 0.5625):   4%|▏   | 177/4114 [11:38<4:25:13,  4.04s/it]Training 1/2 epoch (loss 0.5625):   4%|▏   | 178/4114 [11:38<4:24:58,  4.04s/it]Training 1/2 epoch (loss 0.4766):   4%|▏   | 178/4114 [11:41<4:24:58,  4.04s/it]Training 1/2 epoch (loss 0.4766):   4%|▏   | 179/4114 [11:41<4:19:38,  3.96s/it]Training 1/2 epoch (loss 0.4941):   4%|▏   | 179/4114 [11:46<4:19:38,  3.96s/it]Training 1/2 epoch (loss 0.4941):   4%|▏   | 180/4114 [11:46<4:23:32,  4.02s/it]Training 1/2 epoch (loss 0.5508):   4%|▏   | 180/4114 [11:49<4:23:32,  4.02s/it]Training 1/2 epoch (loss 0.5508):   4%|▏   | 181/4114 [11:49<4:20:22,  3.97s/it]Training 1/2 epoch (loss 0.4961):   4%|▏   | 181/4114 [11:53<4:20:22,  3.97s/it]Training 1/2 epoch (loss 0.4961):   4%|▏   | 182/4114 [11:53<4:19:48,  3.96s/it]Training 1/2 epoch (loss 0.4629):   4%|▏   | 182/4114 [11:57<4:19:48,  3.96s/it]Training 1/2 epoch (loss 0.4629):   4%|▏   | 183/4114 [11:57<4:22:04,  4.00s/it]Training 1/2 epoch (loss 0.3887):   4%|▏   | 183/4114 [12:01<4:22:04,  4.00s/it]Training 1/2 epoch (loss 0.3887):   4%|▏   | 184/4114 [12:01<4:11:31,  3.84s/it]Training 1/2 epoch (loss 0.5508):   4%|▏   | 184/4114 [12:04<4:11:31,  3.84s/it]Training 1/2 epoch (loss 0.5508):   4%|▏   | 185/4114 [12:04<4:02:32,  3.70s/it]Training 1/2 epoch (loss 0.3906):   4%|▏   | 185/4114 [12:08<4:02:32,  3.70s/it]Training 1/2 epoch (loss 0.3906):   5%|▏   | 186/4114 [12:08<4:01:51,  3.69s/it]Training 1/2 epoch (loss 0.3555):   5%|▏   | 186/4114 [12:11<4:01:51,  3.69s/it]Training 1/2 epoch (loss 0.3555):   5%|▏   | 187/4114 [12:11<3:55:40,  3.60s/it]Training 1/2 epoch (loss 0.5039):   5%|▏   | 187/4114 [12:15<3:55:40,  3.60s/it]Training 1/2 epoch (loss 0.5039):   5%|▏   | 188/4114 [12:15<3:59:30,  3.66s/it]Training 1/2 epoch (loss 0.4199):   5%|▏   | 188/4114 [12:19<3:59:30,  3.66s/it]Training 1/2 epoch (loss 0.4199):   5%|▏   | 189/4114 [12:19<4:02:48,  3.71s/it]Training 1/2 epoch (loss 0.4160):   5%|▏   | 189/4114 [12:23<4:02:48,  3.71s/it]Training 1/2 epoch (loss 0.4160):   5%|▏   | 190/4114 [12:23<4:05:24,  3.75s/it]Training 1/2 epoch (loss 0.6172):   5%|▏   | 190/4114 [12:27<4:05:24,  3.75s/it]Training 1/2 epoch (loss 0.6172):   5%|▏   | 191/4114 [12:27<4:08:31,  3.80s/it]Training 1/2 epoch (loss 0.3555):   5%|▏   | 191/4114 [12:31<4:08:31,  3.80s/it]Training 1/2 epoch (loss 0.3555):   5%|▏   | 192/4114 [12:31<4:12:51,  3.87s/it]Training 1/2 epoch (loss 0.4180):   5%|▏   | 192/4114 [12:34<4:12:51,  3.87s/it]Training 1/2 epoch (loss 0.4180):   5%|▏   | 193/4114 [12:34<4:03:12,  3.72s/it]Training 1/2 epoch (loss 0.5938):   5%|▏   | 193/4114 [12:38<4:03:12,  3.72s/it]Training 1/2 epoch (loss 0.5938):   5%|▏   | 194/4114 [12:38<4:06:30,  3.77s/it]Training 1/2 epoch (loss 0.3789):   5%|▏   | 194/4114 [12:42<4:06:30,  3.77s/it]Training 1/2 epoch (loss 0.3789):   5%|▏   | 195/4114 [12:42<4:13:31,  3.88s/it]Training 1/2 epoch (loss 0.3926):   5%|▏   | 195/4114 [12:46<4:13:31,  3.88s/it]Training 1/2 epoch (loss 0.3926):   5%|▏   | 196/4114 [12:46<4:10:45,  3.84s/it]Training 1/2 epoch (loss 0.4492):   5%|▏   | 196/4114 [12:50<4:10:45,  3.84s/it]Training 1/2 epoch (loss 0.4492):   5%|▏   | 197/4114 [12:50<4:11:06,  3.85s/it]Training 1/2 epoch (loss 0.2969):   5%|▏   | 197/4114 [12:53<4:11:06,  3.85s/it]Training 1/2 epoch (loss 0.2969):   5%|▏   | 198/4114 [12:53<4:01:56,  3.71s/it]Training 1/2 epoch (loss 0.4375):   5%|▏   | 198/4114 [12:57<4:01:56,  3.71s/it]Training 1/2 epoch (loss 0.4375):   5%|▏   | 199/4114 [12:57<4:03:21,  3.73s/it]Training 1/2 epoch (loss 0.5469):   5%|▏   | 199/4114 [13:01<4:03:21,  3.73s/it]Training 1/2 epoch (loss 0.5469):   5%|▏   | 200/4114 [13:01<4:08:29,  3.81s/it]Training 1/2 epoch (loss 0.3613):   5%|▏   | 200/4114 [13:05<4:08:29,  3.81s/it]Training 1/2 epoch (loss 0.3613):   5%|▏   | 201/4114 [13:05<4:19:39,  3.98s/it]Training 1/2 epoch (loss 0.3691):   5%|▏   | 201/4114 [13:09<4:19:39,  3.98s/it]Training 1/2 epoch (loss 0.3691):   5%|▏   | 202/4114 [13:09<4:17:56,  3.96s/it]Training 1/2 epoch (loss 0.4805):   5%|▏   | 202/4114 [13:13<4:17:56,  3.96s/it]Training 1/2 epoch (loss 0.4805):   5%|▏   | 203/4114 [13:13<4:18:09,  3.96s/it]Training 1/2 epoch (loss 0.4336):   5%|▏   | 203/4114 [13:17<4:18:09,  3.96s/it]Training 1/2 epoch (loss 0.4336):   5%|▏   | 204/4114 [13:17<4:12:59,  3.88s/it]Training 1/2 epoch (loss 0.4609):   5%|▏   | 204/4114 [13:21<4:12:59,  3.88s/it]Training 1/2 epoch (loss 0.4609):   5%|▏   | 205/4114 [13:21<4:12:56,  3.88s/it]Training 1/2 epoch (loss 0.4746):   5%|▏   | 205/4114 [13:25<4:12:56,  3.88s/it]Training 1/2 epoch (loss 0.4746):   5%|▏   | 206/4114 [13:25<4:13:15,  3.89s/it]Training 1/2 epoch (loss 0.5586):   5%|▏   | 206/4114 [13:29<4:13:15,  3.89s/it]Training 1/2 epoch (loss 0.5586):   5%|▏   | 207/4114 [13:29<4:18:07,  3.96s/it]Training 1/2 epoch (loss 0.5234):   5%|▏   | 207/4114 [13:33<4:18:07,  3.96s/it]Training 1/2 epoch (loss 0.5234):   5%|▏   | 208/4114 [13:33<4:18:48,  3.98s/it]Training 1/2 epoch (loss 0.4316):   5%|▏   | 208/4114 [13:37<4:18:48,  3.98s/it]Training 1/2 epoch (loss 0.4316):   5%|▏   | 209/4114 [13:37<4:16:11,  3.94s/it]Training 1/2 epoch (loss 0.3789):   5%|▏   | 209/4114 [13:41<4:16:11,  3.94s/it]Training 1/2 epoch (loss 0.3789):   5%|▏   | 210/4114 [13:41<4:20:49,  4.01s/it]Training 1/2 epoch (loss 0.3359):   5%|▏   | 210/4114 [13:45<4:20:49,  4.01s/it]Training 1/2 epoch (loss 0.3359):   5%|▏   | 211/4114 [13:45<4:15:49,  3.93s/it]Training 1/2 epoch (loss 0.4824):   5%|▏   | 211/4114 [13:48<4:15:49,  3.93s/it]Training 1/2 epoch (loss 0.4824):   5%|▏   | 212/4114 [13:48<4:01:34,  3.71s/it]Training 1/2 epoch (loss 0.3242):   5%|▏   | 212/4114 [13:52<4:01:34,  3.71s/it]Training 1/2 epoch (loss 0.3242):   5%|▏   | 213/4114 [13:52<4:10:16,  3.85s/it]Training 1/2 epoch (loss 0.3789):   5%|▏   | 213/4114 [13:55<4:10:16,  3.85s/it]Training 1/2 epoch (loss 0.3789):   5%|▏   | 214/4114 [13:55<4:02:30,  3.73s/it]Training 1/2 epoch (loss 0.4238):   5%|▏   | 214/4114 [13:59<4:02:30,  3.73s/it]Training 1/2 epoch (loss 0.4238):   5%|▏   | 215/4114 [13:59<4:00:25,  3.70s/it]Training 1/2 epoch (loss 0.2070):   5%|▏   | 215/4114 [14:03<4:00:25,  3.70s/it]Training 1/2 epoch (loss 0.2070):   5%|▏   | 216/4114 [14:03<4:11:42,  3.87s/it]Training 1/2 epoch (loss 0.2637):   5%|▏   | 216/4114 [14:07<4:11:42,  3.87s/it]Training 1/2 epoch (loss 0.2637):   5%|▏   | 217/4114 [14:07<4:15:25,  3.93s/it]Training 1/2 epoch (loss 0.4453):   5%|▏   | 217/4114 [14:11<4:15:25,  3.93s/it]Training 1/2 epoch (loss 0.4453):   5%|▏   | 218/4114 [14:11<4:06:43,  3.80s/it]Training 1/2 epoch (loss 0.4570):   5%|▏   | 218/4114 [14:15<4:06:43,  3.80s/it]Training 1/2 epoch (loss 0.4570):   5%|▏   | 219/4114 [14:15<4:12:39,  3.89s/it]Training 1/2 epoch (loss 0.4785):   5%|▏   | 219/4114 [14:19<4:12:39,  3.89s/it]Training 1/2 epoch (loss 0.4785):   5%|▏   | 220/4114 [14:19<4:15:03,  3.93s/it]Training 1/2 epoch (loss 0.4141):   5%|▏   | 220/4114 [14:22<4:15:03,  3.93s/it]Training 1/2 epoch (loss 0.4141):   5%|▏   | 221/4114 [14:22<4:04:13,  3.76s/it]Training 1/2 epoch (loss 0.3574):   5%|▏   | 221/4114 [14:26<4:04:13,  3.76s/it]Training 1/2 epoch (loss 0.3574):   5%|▏   | 222/4114 [14:26<4:01:09,  3.72s/it]Training 1/2 epoch (loss 0.4902):   5%|▏   | 222/4114 [14:30<4:01:09,  3.72s/it]Training 1/2 epoch (loss 0.4902):   5%|▏   | 223/4114 [14:30<3:57:01,  3.65s/it]Training 1/2 epoch (loss 0.3750):   5%|▏   | 223/4114 [14:34<3:57:01,  3.65s/it]Training 1/2 epoch (loss 0.3750):   5%|▏   | 224/4114 [14:34<4:03:26,  3.75s/it]Training 1/2 epoch (loss 0.5273):   5%|▏   | 224/4114 [14:38<4:03:26,  3.75s/it]Training 1/2 epoch (loss 0.5273):   5%|▏   | 225/4114 [14:38<4:11:53,  3.89s/it]Training 1/2 epoch (loss 0.3223):   5%|▏   | 225/4114 [14:42<4:11:53,  3.89s/it]Training 1/2 epoch (loss 0.3223):   5%|▏   | 226/4114 [14:42<4:09:52,  3.86s/it]Training 1/2 epoch (loss 0.4648):   5%|▏   | 226/4114 [14:45<4:09:52,  3.86s/it]Training 1/2 epoch (loss 0.4648):   6%|▏   | 227/4114 [14:45<4:03:31,  3.76s/it]Training 1/2 epoch (loss 0.4785):   6%|▏   | 227/4114 [14:49<4:03:31,  3.76s/it]Training 1/2 epoch (loss 0.4785):   6%|▏   | 228/4114 [14:49<4:02:44,  3.75s/it]Training 1/2 epoch (loss 0.4805):   6%|▏   | 228/4114 [14:53<4:02:44,  3.75s/it]Training 1/2 epoch (loss 0.4805):   6%|▏   | 229/4114 [14:53<4:05:27,  3.79s/it]Training 1/2 epoch (loss 0.5586):   6%|▏   | 229/4114 [14:56<4:05:27,  3.79s/it]Training 1/2 epoch (loss 0.5586):   6%|▏   | 230/4114 [14:56<3:58:52,  3.69s/it]Training 1/2 epoch (loss 0.4004):   6%|▏   | 230/4114 [15:00<3:58:52,  3.69s/it]Training 1/2 epoch (loss 0.4004):   6%|▏   | 231/4114 [15:00<3:57:42,  3.67s/it]Training 1/2 epoch (loss 0.3164):   6%|▏   | 231/4114 [15:04<3:57:42,  3.67s/it]Training 1/2 epoch (loss 0.3164):   6%|▏   | 232/4114 [15:04<4:00:03,  3.71s/it]Training 1/2 epoch (loss 0.4141):   6%|▏   | 232/4114 [15:07<4:00:03,  3.71s/it]Training 1/2 epoch (loss 0.4141):   6%|▏   | 233/4114 [15:07<4:03:41,  3.77s/it]Training 1/2 epoch (loss 0.4922):   6%|▏   | 233/4114 [15:11<4:03:41,  3.77s/it]Training 1/2 epoch (loss 0.4922):   6%|▏   | 234/4114 [15:11<4:08:06,  3.84s/it]Training 1/2 epoch (loss 0.5117):   6%|▏   | 234/4114 [15:15<4:08:06,  3.84s/it]Training 1/2 epoch (loss 0.5117):   6%|▏   | 235/4114 [15:15<4:02:09,  3.75s/it]Training 1/2 epoch (loss 0.5273):   6%|▏   | 235/4114 [15:19<4:02:09,  3.75s/it]Training 1/2 epoch (loss 0.5273):   6%|▏   | 236/4114 [15:19<4:06:11,  3.81s/it]Training 1/2 epoch (loss 0.3789):   6%|▏   | 236/4114 [15:23<4:06:11,  3.81s/it]Training 1/2 epoch (loss 0.3789):   6%|▏   | 237/4114 [15:23<4:14:35,  3.94s/it]Training 1/2 epoch (loss 0.5547):   6%|▏   | 237/4114 [15:27<4:14:35,  3.94s/it]Training 1/2 epoch (loss 0.5547):   6%|▏   | 238/4114 [15:27<4:12:45,  3.91s/it]Training 1/2 epoch (loss 0.5273):   6%|▏   | 238/4114 [15:31<4:12:45,  3.91s/it]Training 1/2 epoch (loss 0.5273):   6%|▏   | 239/4114 [15:31<4:11:56,  3.90s/it]Training 1/2 epoch (loss 0.4512):   6%|▏   | 239/4114 [15:35<4:11:56,  3.90s/it]Training 1/2 epoch (loss 0.4512):   6%|▏   | 240/4114 [15:35<4:15:06,  3.95s/it]Training 1/2 epoch (loss 0.4609):   6%|▏   | 240/4114 [15:39<4:15:06,  3.95s/it]Training 1/2 epoch (loss 0.4609):   6%|▏   | 241/4114 [15:39<4:13:44,  3.93s/it]Training 1/2 epoch (loss 0.4395):   6%|▏   | 241/4114 [15:43<4:13:44,  3.93s/it]Training 1/2 epoch (loss 0.4395):   6%|▏   | 242/4114 [15:43<4:15:08,  3.95s/it]Training 1/2 epoch (loss 0.4590):   6%|▏   | 242/4114 [15:47<4:15:08,  3.95s/it]Training 1/2 epoch (loss 0.4590):   6%|▏   | 243/4114 [15:47<4:16:17,  3.97s/it]Training 1/2 epoch (loss 0.4941):   6%|▏   | 243/4114 [15:51<4:16:17,  3.97s/it]Training 1/2 epoch (loss 0.4941):   6%|▏   | 244/4114 [15:51<4:12:03,  3.91s/it]Training 1/2 epoch (loss 0.3379):   6%|▏   | 244/4114 [15:55<4:12:03,  3.91s/it]Training 1/2 epoch (loss 0.3379):   6%|▏   | 245/4114 [15:55<4:11:41,  3.90s/it]Training 1/2 epoch (loss 0.6406):   6%|▏   | 245/4114 [15:59<4:11:41,  3.90s/it]Training 1/2 epoch (loss 0.6406):   6%|▏   | 246/4114 [15:59<4:16:00,  3.97s/it]Training 1/2 epoch (loss 0.4922):   6%|▏   | 246/4114 [16:02<4:16:00,  3.97s/it]Training 1/2 epoch (loss 0.4922):   6%|▏   | 247/4114 [16:02<4:12:41,  3.92s/it]Training 1/2 epoch (loss 0.4121):   6%|▏   | 247/4114 [16:06<4:12:41,  3.92s/it]Training 1/2 epoch (loss 0.4121):   6%|▏   | 248/4114 [16:06<4:10:32,  3.89s/it]Training 1/2 epoch (loss 0.6094):   6%|▏   | 248/4114 [16:10<4:10:32,  3.89s/it]Training 1/2 epoch (loss 0.6094):   6%|▏   | 249/4114 [16:10<4:16:23,  3.98s/it]Training 1/2 epoch (loss 0.6992):   6%|▏   | 249/4114 [16:14<4:16:23,  3.98s/it]Training 1/2 epoch (loss 0.6992):   6%|▏   | 250/4114 [16:14<4:05:49,  3.82s/it]Training 1/2 epoch (loss 0.2891):   6%|▏   | 250/4114 [16:18<4:05:49,  3.82s/it]Training 1/2 epoch (loss 0.2891):   6%|▏   | 251/4114 [16:18<4:08:48,  3.86s/it]Training 1/2 epoch (loss 0.5469):   6%|▏   | 251/4114 [16:22<4:08:48,  3.86s/it]Training 1/2 epoch (loss 0.5469):   6%|▏   | 252/4114 [16:22<4:17:08,  3.99s/it]Training 1/2 epoch (loss 0.4434):   6%|▏   | 252/4114 [16:26<4:17:08,  3.99s/it]Training 1/2 epoch (loss 0.4434):   6%|▏   | 253/4114 [16:26<4:06:21,  3.83s/it]Training 1/2 epoch (loss 0.4043):   6%|▏   | 253/4114 [16:30<4:06:21,  3.83s/it]Training 1/2 epoch (loss 0.4043):   6%|▏   | 254/4114 [16:30<4:10:15,  3.89s/it]Training 1/2 epoch (loss 0.4668):   6%|▏   | 254/4114 [16:33<4:10:15,  3.89s/it]Training 1/2 epoch (loss 0.4668):   6%|▏   | 255/4114 [16:33<4:02:40,  3.77s/it]Training 1/2 epoch (loss 0.2949):   6%|▏   | 255/4114 [16:37<4:02:40,  3.77s/it]Training 1/2 epoch (loss 0.2949):   6%|▏   | 256/4114 [16:37<4:05:55,  3.82s/it]Training 1/2 epoch (loss 0.5742):   6%|▏   | 256/4114 [16:41<4:05:55,  3.82s/it]Training 1/2 epoch (loss 0.5742):   6%|▏   | 257/4114 [16:41<4:06:16,  3.83s/it]Training 1/2 epoch (loss 0.3574):   6%|▏   | 257/4114 [16:45<4:06:16,  3.83s/it]Training 1/2 epoch (loss 0.3574):   6%|▎   | 258/4114 [16:45<4:12:16,  3.93s/it]Training 1/2 epoch (loss 0.4668):   6%|▎   | 258/4114 [16:49<4:12:16,  3.93s/it]Training 1/2 epoch (loss 0.4668):   6%|▎   | 259/4114 [16:49<4:05:49,  3.83s/it]Training 1/2 epoch (loss 0.4980):   6%|▎   | 259/4114 [16:52<4:05:49,  3.83s/it]Training 1/2 epoch (loss 0.4980):   6%|▎   | 260/4114 [16:52<4:04:51,  3.81s/it]Training 1/2 epoch (loss 0.5000):   6%|▎   | 260/4114 [16:57<4:04:51,  3.81s/it]Training 1/2 epoch (loss 0.5000):   6%|▎   | 261/4114 [16:57<4:13:21,  3.95s/it]Training 1/2 epoch (loss 0.5742):   6%|▎   | 261/4114 [17:01<4:13:21,  3.95s/it]Training 1/2 epoch (loss 0.5742):   6%|▎   | 262/4114 [17:01<4:13:29,  3.95s/it]Training 1/2 epoch (loss 0.6016):   6%|▎   | 262/4114 [17:04<4:13:29,  3.95s/it]Training 1/2 epoch (loss 0.6016):   6%|▎   | 263/4114 [17:04<4:06:30,  3.84s/it]Training 1/2 epoch (loss 0.4258):   6%|▎   | 263/4114 [17:08<4:06:30,  3.84s/it]Training 1/2 epoch (loss 0.4258):   6%|▎   | 264/4114 [17:08<4:05:18,  3.82s/it]Training 1/2 epoch (loss 0.4668):   6%|▎   | 264/4114 [17:12<4:05:18,  3.82s/it]Training 1/2 epoch (loss 0.4668):   6%|▎   | 265/4114 [17:12<4:06:23,  3.84s/it]Training 1/2 epoch (loss 0.4375):   6%|▎   | 265/4114 [17:16<4:06:23,  3.84s/it]Training 1/2 epoch (loss 0.4375):   6%|▎   | 266/4114 [17:16<4:08:33,  3.88s/it]Training 1/2 epoch (loss 0.3477):   6%|▎   | 266/4114 [17:20<4:08:33,  3.88s/it]Training 1/2 epoch (loss 0.3477):   6%|▎   | 267/4114 [17:20<4:15:25,  3.98s/it]Training 1/2 epoch (loss 0.5078):   6%|▎   | 267/4114 [17:24<4:15:25,  3.98s/it]Training 1/2 epoch (loss 0.5078):   7%|▎   | 268/4114 [17:24<4:15:41,  3.99s/it]Training 1/2 epoch (loss 0.2988):   7%|▎   | 268/4114 [17:28<4:15:41,  3.99s/it]Training 1/2 epoch (loss 0.2988):   7%|▎   | 269/4114 [17:28<4:17:12,  4.01s/it]Training 1/2 epoch (loss 0.6211):   7%|▎   | 269/4114 [17:32<4:17:12,  4.01s/it]Training 1/2 epoch (loss 0.6211):   7%|▎   | 270/4114 [17:32<4:20:12,  4.06s/it]Training 1/2 epoch (loss 0.5273):   7%|▎   | 270/4114 [17:36<4:20:12,  4.06s/it]Training 1/2 epoch (loss 0.5273):   7%|▎   | 271/4114 [17:36<4:20:01,  4.06s/it]Training 1/2 epoch (loss 0.5234):   7%|▎   | 271/4114 [17:40<4:20:01,  4.06s/it]Training 1/2 epoch (loss 0.5234):   7%|▎   | 272/4114 [17:40<4:15:59,  4.00s/it]Training 1/2 epoch (loss 0.5156):   7%|▎   | 272/4114 [17:44<4:15:59,  4.00s/it]Training 1/2 epoch (loss 0.5156):   7%|▎   | 273/4114 [17:44<4:19:54,  4.06s/it]Training 1/2 epoch (loss 0.5508):   7%|▎   | 273/4114 [17:49<4:19:54,  4.06s/it]Training 1/2 epoch (loss 0.5508):   7%|▎   | 274/4114 [17:49<4:19:31,  4.06s/it]Training 1/2 epoch (loss 0.3359):   7%|▎   | 274/4114 [17:52<4:19:31,  4.06s/it]Training 1/2 epoch (loss 0.3359):   7%|▎   | 275/4114 [17:52<4:14:53,  3.98s/it]Training 1/2 epoch (loss 0.4727):   7%|▎   | 275/4114 [17:56<4:14:53,  3.98s/it]Training 1/2 epoch (loss 0.4727):   7%|▎   | 276/4114 [17:56<4:16:42,  4.01s/it]Training 1/2 epoch (loss 0.3965):   7%|▎   | 276/4114 [18:01<4:16:42,  4.01s/it]Training 1/2 epoch (loss 0.3965):   7%|▎   | 277/4114 [18:01<4:18:13,  4.04s/it]Training 1/2 epoch (loss 0.3418):   7%|▎   | 277/4114 [18:04<4:18:13,  4.04s/it]Training 1/2 epoch (loss 0.3418):   7%|▎   | 278/4114 [18:04<4:10:59,  3.93s/it]Training 1/2 epoch (loss 0.3848):   7%|▎   | 278/4114 [18:08<4:10:59,  3.93s/it]Training 1/2 epoch (loss 0.3848):   7%|▎   | 279/4114 [18:08<4:17:02,  4.02s/it]Training 1/2 epoch (loss 0.3984):   7%|▎   | 279/4114 [18:12<4:17:02,  4.02s/it]Training 1/2 epoch (loss 0.3984):   7%|▎   | 280/4114 [18:12<4:12:06,  3.95s/it]Training 1/2 epoch (loss 0.3184):   7%|▎   | 280/4114 [18:16<4:12:06,  3.95s/it]Training 1/2 epoch (loss 0.3184):   7%|▎   | 281/4114 [18:16<4:11:40,  3.94s/it]Training 1/2 epoch (loss 0.5000):   7%|▎   | 281/4114 [18:20<4:11:40,  3.94s/it]Training 1/2 epoch (loss 0.5000):   7%|▎   | 282/4114 [18:20<4:12:58,  3.96s/it]Training 1/2 epoch (loss 0.4199):   7%|▎   | 282/4114 [18:24<4:12:58,  3.96s/it]Training 1/2 epoch (loss 0.4199):   7%|▎   | 283/4114 [18:24<4:10:17,  3.92s/it]Training 1/2 epoch (loss 0.5625):   7%|▎   | 283/4114 [18:28<4:10:17,  3.92s/it]Training 1/2 epoch (loss 0.5625):   7%|▎   | 284/4114 [18:28<4:12:02,  3.95s/it]Training 1/2 epoch (loss 0.3652):   7%|▎   | 284/4114 [18:32<4:12:02,  3.95s/it]Training 1/2 epoch (loss 0.3652):   7%|▎   | 285/4114 [18:32<4:13:05,  3.97s/it]Training 1/2 epoch (loss 0.4980):   7%|▎   | 285/4114 [18:36<4:13:05,  3.97s/it]Training 1/2 epoch (loss 0.4980):   7%|▎   | 286/4114 [18:36<4:09:03,  3.90s/it]Training 1/2 epoch (loss 0.4883):   7%|▎   | 286/4114 [18:40<4:09:03,  3.90s/it]Training 1/2 epoch (loss 0.4883):   7%|▎   | 287/4114 [18:40<4:08:52,  3.90s/it]Training 1/2 epoch (loss 0.5039):   7%|▎   | 287/4114 [18:44<4:08:52,  3.90s/it]Training 1/2 epoch (loss 0.5039):   7%|▎   | 288/4114 [18:44<4:14:28,  3.99s/it]Training 1/2 epoch (loss 0.4375):   7%|▎   | 288/4114 [18:48<4:14:28,  3.99s/it]Training 1/2 epoch (loss 0.4375):   7%|▎   | 289/4114 [18:48<4:09:36,  3.92s/it]Training 1/2 epoch (loss 0.3516):   7%|▎   | 289/4114 [18:51<4:09:36,  3.92s/it]Training 1/2 epoch (loss 0.3516):   7%|▎   | 290/4114 [18:51<4:09:18,  3.91s/it]Training 1/2 epoch (loss 0.3906):   7%|▎   | 290/4114 [18:56<4:09:18,  3.91s/it]Training 1/2 epoch (loss 0.3906):   7%|▎   | 291/4114 [18:56<4:14:48,  4.00s/it]Training 1/2 epoch (loss 0.2734):   7%|▎   | 291/4114 [19:00<4:14:48,  4.00s/it]Training 1/2 epoch (loss 0.2734):   7%|▎   | 292/4114 [19:00<4:13:41,  3.98s/it]Training 1/2 epoch (loss 0.3477):   7%|▎   | 292/4114 [19:04<4:13:41,  3.98s/it]Training 1/2 epoch (loss 0.3477):   7%|▎   | 293/4114 [19:04<4:11:58,  3.96s/it]Training 1/2 epoch (loss 0.2539):   7%|▎   | 293/4114 [19:08<4:11:58,  3.96s/it]Training 1/2 epoch (loss 0.2539):   7%|▎   | 294/4114 [19:08<4:16:40,  4.03s/it]Training 1/2 epoch (loss 0.3555):   7%|▎   | 294/4114 [19:11<4:16:40,  4.03s/it]Training 1/2 epoch (loss 0.3555):   7%|▎   | 295/4114 [19:11<4:01:49,  3.80s/it]Training 1/2 epoch (loss 0.4902):   7%|▎   | 295/4114 [19:15<4:01:49,  3.80s/it]Training 1/2 epoch (loss 0.4902):   7%|▎   | 296/4114 [19:15<4:01:29,  3.80s/it]Training 1/2 epoch (loss 0.4668):   7%|▎   | 296/4114 [19:19<4:01:29,  3.80s/it]Training 1/2 epoch (loss 0.4668):   7%|▎   | 297/4114 [19:19<4:09:30,  3.92s/it]Training 1/2 epoch (loss 0.4141):   7%|▎   | 297/4114 [19:23<4:09:30,  3.92s/it]Training 1/2 epoch (loss 0.4141):   7%|▎   | 298/4114 [19:23<4:09:20,  3.92s/it]Training 1/2 epoch (loss 0.4805):   7%|▎   | 298/4114 [19:27<4:09:20,  3.92s/it]Training 1/2 epoch (loss 0.4805):   7%|▎   | 299/4114 [19:27<4:07:05,  3.89s/it]Training 1/2 epoch (loss 0.5859):   7%|▎   | 299/4114 [19:31<4:07:05,  3.89s/it]Training 1/2 epoch (loss 0.5859):   7%|▎   | 300/4114 [19:31<4:11:17,  3.95s/it]Training 1/2 epoch (loss 0.3594):   7%|▎   | 300/4114 [19:34<4:11:17,  3.95s/it]Training 1/2 epoch (loss 0.3594):   7%|▎   | 301/4114 [19:34<4:03:10,  3.83s/it]Training 1/2 epoch (loss 0.4629):   7%|▎   | 301/4114 [19:38<4:03:10,  3.83s/it]Training 1/2 epoch (loss 0.4629):   7%|▎   | 302/4114 [19:38<3:55:00,  3.70s/it]Training 1/2 epoch (loss 0.3750):   7%|▎   | 302/4114 [19:42<3:55:00,  3.70s/it]Training 1/2 epoch (loss 0.3750):   7%|▎   | 303/4114 [19:42<4:04:10,  3.84s/it]Training 1/2 epoch (loss 0.2988):   7%|▎   | 303/4114 [19:46<4:04:10,  3.84s/it]Training 1/2 epoch (loss 0.2988):   7%|▎   | 304/4114 [19:46<4:00:48,  3.79s/it]Training 1/2 epoch (loss 0.5820):   7%|▎   | 304/4114 [19:49<4:00:48,  3.79s/it]Training 1/2 epoch (loss 0.5820):   7%|▎   | 305/4114 [19:49<4:00:57,  3.80s/it]Training 1/2 epoch (loss 0.6094):   7%|▎   | 305/4114 [19:54<4:00:57,  3.80s/it]Training 1/2 epoch (loss 0.6094):   7%|▎   | 306/4114 [19:54<4:07:32,  3.90s/it]Training 1/2 epoch (loss 0.3789):   7%|▎   | 306/4114 [19:57<4:07:32,  3.90s/it]Training 1/2 epoch (loss 0.3789):   7%|▎   | 307/4114 [19:57<4:07:28,  3.90s/it]Training 1/2 epoch (loss 0.3828):   7%|▎   | 307/4114 [20:01<4:07:28,  3.90s/it]Training 1/2 epoch (loss 0.3828):   7%|▎   | 308/4114 [20:01<4:05:27,  3.87s/it]Training 1/2 epoch (loss 0.4941):   7%|▎   | 308/4114 [20:05<4:05:27,  3.87s/it]Training 1/2 epoch (loss 0.4941):   8%|▎   | 309/4114 [20:05<4:11:34,  3.97s/it]Training 1/2 epoch (loss 0.2852):   8%|▎   | 309/4114 [20:09<4:11:34,  3.97s/it]Training 1/2 epoch (loss 0.2852):   8%|▎   | 310/4114 [20:09<4:09:25,  3.93s/it]Training 1/2 epoch (loss 0.5508):   8%|▎   | 310/4114 [20:13<4:09:25,  3.93s/it]Training 1/2 epoch (loss 0.5508):   8%|▎   | 311/4114 [20:13<4:07:01,  3.90s/it]Training 1/2 epoch (loss 0.4453):   8%|▎   | 311/4114 [20:17<4:07:01,  3.90s/it]Training 1/2 epoch (loss 0.4453):   8%|▎   | 312/4114 [20:17<4:09:28,  3.94s/it]Training 1/2 epoch (loss 0.3164):   8%|▎   | 312/4114 [20:21<4:09:28,  3.94s/it]Training 1/2 epoch (loss 0.3164):   8%|▎   | 313/4114 [20:21<4:09:32,  3.94s/it]Training 1/2 epoch (loss 0.4336):   8%|▎   | 313/4114 [20:25<4:09:32,  3.94s/it]Training 1/2 epoch (loss 0.4336):   8%|▎   | 314/4114 [20:25<4:06:29,  3.89s/it]Training 1/2 epoch (loss 0.4492):   8%|▎   | 314/4114 [20:29<4:06:29,  3.89s/it]Training 1/2 epoch (loss 0.4492):   8%|▎   | 315/4114 [20:29<4:09:10,  3.94s/it]Training 1/2 epoch (loss 0.3281):   8%|▎   | 315/4114 [20:33<4:09:10,  3.94s/it]Training 1/2 epoch (loss 0.3281):   8%|▎   | 316/4114 [20:33<4:10:06,  3.95s/it]Training 1/2 epoch (loss 0.4727):   8%|▎   | 316/4114 [20:37<4:10:06,  3.95s/it]Training 1/2 epoch (loss 0.4727):   8%|▎   | 317/4114 [20:37<4:12:51,  4.00s/it]Training 1/2 epoch (loss 0.5391):   8%|▎   | 317/4114 [20:41<4:12:51,  4.00s/it]Training 1/2 epoch (loss 0.5391):   8%|▎   | 318/4114 [20:41<4:08:16,  3.92s/it]Training 1/2 epoch (loss 0.3320):   8%|▎   | 318/4114 [20:45<4:08:16,  3.92s/it]Training 1/2 epoch (loss 0.3320):   8%|▎   | 319/4114 [20:45<4:08:14,  3.92s/it]Training 1/2 epoch (loss 0.4395):   8%|▎   | 319/4114 [20:48<4:08:14,  3.92s/it]Training 1/2 epoch (loss 0.4395):   8%|▎   | 320/4114 [20:48<4:04:30,  3.87s/it]Training 1/2 epoch (loss 0.3789):   8%|▎   | 320/4114 [20:53<4:04:30,  3.87s/it]Training 1/2 epoch (loss 0.3789):   8%|▎   | 321/4114 [20:53<4:10:08,  3.96s/it]Training 1/2 epoch (loss 0.3125):   8%|▎   | 321/4114 [20:56<4:10:08,  3.96s/it]Training 1/2 epoch (loss 0.3125):   8%|▎   | 322/4114 [20:56<4:06:55,  3.91s/it]Training 1/2 epoch (loss 0.3262):   8%|▎   | 322/4114 [21:00<4:06:55,  3.91s/it]Training 1/2 epoch (loss 0.3262):   8%|▎   | 323/4114 [21:00<4:06:33,  3.90s/it]Training 1/2 epoch (loss 0.3555):   8%|▎   | 323/4114 [21:04<4:06:33,  3.90s/it]Training 1/2 epoch (loss 0.3555):   8%|▎   | 324/4114 [21:04<4:01:56,  3.83s/it]Training 1/2 epoch (loss 0.4883):   8%|▎   | 324/4114 [21:07<4:01:56,  3.83s/it]Training 1/2 epoch (loss 0.4883):   8%|▎   | 325/4114 [21:07<3:54:12,  3.71s/it]Training 1/2 epoch (loss 0.4395):   8%|▎   | 325/4114 [21:11<3:54:12,  3.71s/it]Training 1/2 epoch (loss 0.4395):   8%|▎   | 326/4114 [21:11<3:49:31,  3.64s/it]Training 1/2 epoch (loss 0.4980):   8%|▎   | 326/4114 [21:15<3:49:31,  3.64s/it]Training 1/2 epoch (loss 0.4980):   8%|▎   | 327/4114 [21:15<3:59:27,  3.79s/it]Training 1/2 epoch (loss 0.3730):   8%|▎   | 327/4114 [21:19<3:59:27,  3.79s/it]Training 1/2 epoch (loss 0.3730):   8%|▎   | 328/4114 [21:19<4:03:38,  3.86s/it]Training 1/2 epoch (loss 0.1592):   8%|▎   | 328/4114 [21:23<4:03:38,  3.86s/it]Training 1/2 epoch (loss 0.1592):   8%|▎   | 329/4114 [21:23<4:04:56,  3.88s/it]Training 1/2 epoch (loss 0.3770):   8%|▎   | 329/4114 [21:27<4:04:56,  3.88s/it]Training 1/2 epoch (loss 0.3770):   8%|▎   | 330/4114 [21:27<4:05:16,  3.89s/it]Training 1/2 epoch (loss 0.4082):   8%|▎   | 330/4114 [21:30<4:05:16,  3.89s/it]Training 1/2 epoch (loss 0.4082):   8%|▎   | 331/4114 [21:30<3:56:10,  3.75s/it]Training 1/2 epoch (loss 0.2871):   8%|▎   | 331/4114 [21:34<3:56:10,  3.75s/it]Training 1/2 epoch (loss 0.2871):   8%|▎   | 332/4114 [21:34<3:58:56,  3.79s/it]Training 1/2 epoch (loss 0.5195):   8%|▎   | 332/4114 [21:38<3:58:56,  3.79s/it]Training 1/2 epoch (loss 0.5195):   8%|▎   | 333/4114 [21:38<3:54:59,  3.73s/it]Training 1/2 epoch (loss 0.5820):   8%|▎   | 333/4114 [21:41<3:54:59,  3.73s/it]Training 1/2 epoch (loss 0.5820):   8%|▎   | 334/4114 [21:41<3:50:16,  3.66s/it]Training 1/2 epoch (loss 0.4141):   8%|▎   | 334/4114 [21:45<3:50:16,  3.66s/it]Training 1/2 epoch (loss 0.4141):   8%|▎   | 335/4114 [21:45<3:54:24,  3.72s/it]Training 1/2 epoch (loss 0.6172):   8%|▎   | 335/4114 [21:49<3:54:24,  3.72s/it]Training 1/2 epoch (loss 0.6172):   8%|▎   | 336/4114 [21:49<4:03:10,  3.86s/it]Training 1/2 epoch (loss 0.3535):   8%|▎   | 336/4114 [21:53<4:03:10,  3.86s/it]Training 1/2 epoch (loss 0.3535):   8%|▎   | 337/4114 [21:53<4:03:43,  3.87s/it]Training 1/2 epoch (loss 0.3418):   8%|▎   | 337/4114 [21:57<4:03:43,  3.87s/it]Training 1/2 epoch (loss 0.3418):   8%|▎   | 338/4114 [21:57<4:02:18,  3.85s/it]Training 1/2 epoch (loss 0.5195):   8%|▎   | 338/4114 [22:01<4:02:18,  3.85s/it]Training 1/2 epoch (loss 0.5195):   8%|▎   | 339/4114 [22:01<4:08:30,  3.95s/it]Training 1/2 epoch (loss 0.4082):   8%|▎   | 339/4114 [22:05<4:08:30,  3.95s/it]Training 1/2 epoch (loss 0.4082):   8%|▎   | 340/4114 [22:05<4:09:10,  3.96s/it]Training 1/2 epoch (loss 0.3535):   8%|▎   | 340/4114 [22:09<4:09:10,  3.96s/it]Training 1/2 epoch (loss 0.3535):   8%|▎   | 341/4114 [22:09<4:04:23,  3.89s/it]Training 1/2 epoch (loss 0.4414):   8%|▎   | 341/4114 [22:13<4:04:23,  3.89s/it]Training 1/2 epoch (loss 0.4414):   8%|▎   | 342/4114 [22:13<4:07:36,  3.94s/it]Training 1/2 epoch (loss 0.3379):   8%|▎   | 342/4114 [22:17<4:07:36,  3.94s/it]Training 1/2 epoch (loss 0.3379):   8%|▎   | 343/4114 [22:17<4:07:46,  3.94s/it]Training 1/2 epoch (loss 0.2275):   8%|▎   | 343/4114 [22:21<4:07:46,  3.94s/it]Training 1/2 epoch (loss 0.2275):   8%|▎   | 344/4114 [22:21<4:07:38,  3.94s/it]Training 1/2 epoch (loss 0.4160):   8%|▎   | 344/4114 [22:25<4:07:38,  3.94s/it]Training 1/2 epoch (loss 0.4160):   8%|▎   | 345/4114 [22:25<4:11:11,  4.00s/it]Training 1/2 epoch (loss 0.3516):   8%|▎   | 345/4114 [22:29<4:11:11,  4.00s/it]Training 1/2 epoch (loss 0.3516):   8%|▎   | 346/4114 [22:29<4:10:06,  3.98s/it]Training 1/2 epoch (loss 0.5039):   8%|▎   | 346/4114 [22:32<4:10:06,  3.98s/it]Training 1/2 epoch (loss 0.5039):   8%|▎   | 347/4114 [22:32<3:58:58,  3.81s/it]Training 1/2 epoch (loss 0.4141):   8%|▎   | 347/4114 [22:36<3:58:58,  3.81s/it]Training 1/2 epoch (loss 0.4141):   8%|▎   | 348/4114 [22:36<4:05:45,  3.92s/it]Training 1/2 epoch (loss 0.3750):   8%|▎   | 348/4114 [22:40<4:05:45,  3.92s/it]Training 1/2 epoch (loss 0.3750):   8%|▎   | 349/4114 [22:40<4:06:48,  3.93s/it]Training 1/2 epoch (loss 0.3809):   8%|▎   | 349/4114 [22:44<4:06:48,  3.93s/it]Training 1/2 epoch (loss 0.3809):   9%|▎   | 350/4114 [22:44<4:08:53,  3.97s/it]Training 1/2 epoch (loss 0.3398):   9%|▎   | 350/4114 [22:48<4:08:53,  3.97s/it]Training 1/2 epoch (loss 0.3398):   9%|▎   | 351/4114 [22:48<4:09:29,  3.98s/it]Training 1/2 epoch (loss 0.4453):   9%|▎   | 351/4114 [22:52<4:09:29,  3.98s/it]Training 1/2 epoch (loss 0.4453):   9%|▎   | 352/4114 [22:52<4:05:39,  3.92s/it]Training 1/2 epoch (loss 0.3555):   9%|▎   | 352/4114 [22:56<4:05:39,  3.92s/it]Training 1/2 epoch (loss 0.3555):   9%|▎   | 353/4114 [22:56<4:00:34,  3.84s/it]Training 1/2 epoch (loss 0.7188):   9%|▎   | 353/4114 [23:00<4:00:34,  3.84s/it]Training 1/2 epoch (loss 0.7188):   9%|▎   | 354/4114 [23:00<4:09:01,  3.97s/it]Training 1/2 epoch (loss 0.4941):   9%|▎   | 354/4114 [23:03<4:09:01,  3.97s/it]Training 1/2 epoch (loss 0.4941):   9%|▎   | 355/4114 [23:03<3:55:35,  3.76s/it]Training 1/2 epoch (loss 0.3418):   9%|▎   | 355/4114 [23:07<3:55:35,  3.76s/it]Training 1/2 epoch (loss 0.3418):   9%|▎   | 356/4114 [23:07<3:55:55,  3.77s/it]Training 1/2 epoch (loss 0.4355):   9%|▎   | 356/4114 [23:11<3:55:55,  3.77s/it]Training 1/2 epoch (loss 0.4355):   9%|▎   | 357/4114 [23:11<4:02:47,  3.88s/it]Training 1/2 epoch (loss 0.4062):   9%|▎   | 357/4114 [23:15<4:02:47,  3.88s/it]Training 1/2 epoch (loss 0.4062):   9%|▎   | 358/4114 [23:15<3:53:51,  3.74s/it]Training 1/2 epoch (loss 0.4648):   9%|▎   | 358/4114 [23:19<3:53:51,  3.74s/it]Training 1/2 epoch (loss 0.4648):   9%|▎   | 359/4114 [23:19<3:54:28,  3.75s/it]Training 1/2 epoch (loss 0.5742):   9%|▎   | 359/4114 [23:23<3:54:28,  3.75s/it]Training 1/2 epoch (loss 0.5742):   9%|▎   | 360/4114 [23:23<4:02:24,  3.87s/it]Training 1/2 epoch (loss 0.3223):   9%|▎   | 360/4114 [23:26<4:02:24,  3.87s/it]Training 1/2 epoch (loss 0.3223):   9%|▎   | 361/4114 [23:26<3:54:17,  3.75s/it]Training 1/2 epoch (loss 0.3320):   9%|▎   | 361/4114 [23:30<3:54:17,  3.75s/it]Training 1/2 epoch (loss 0.3320):   9%|▎   | 362/4114 [23:30<3:57:11,  3.79s/it]Training 1/2 epoch (loss 0.3457):   9%|▎   | 362/4114 [23:34<3:57:11,  3.79s/it]Training 1/2 epoch (loss 0.3457):   9%|▎   | 363/4114 [23:34<4:04:01,  3.90s/it]Training 1/2 epoch (loss 0.3984):   9%|▎   | 363/4114 [23:38<4:04:01,  3.90s/it]Training 1/2 epoch (loss 0.3984):   9%|▎   | 364/4114 [23:38<3:56:04,  3.78s/it]Training 1/2 epoch (loss 0.3281):   9%|▎   | 364/4114 [23:41<3:56:04,  3.78s/it]Training 1/2 epoch (loss 0.3281):   9%|▎   | 365/4114 [23:41<3:48:49,  3.66s/it]Training 1/2 epoch (loss 0.5039):   9%|▎   | 365/4114 [23:45<3:48:49,  3.66s/it]Training 1/2 epoch (loss 0.5039):   9%|▎   | 366/4114 [23:45<3:58:58,  3.83s/it]Training 1/2 epoch (loss 0.3105):   9%|▎   | 366/4114 [23:49<3:58:58,  3.83s/it]Training 1/2 epoch (loss 0.3105):   9%|▎   | 367/4114 [23:49<3:52:15,  3.72s/it]Training 1/2 epoch (loss 0.5195):   9%|▎   | 367/4114 [23:53<3:52:15,  3.72s/it]Training 1/2 epoch (loss 0.5195):   9%|▎   | 368/4114 [23:53<3:56:37,  3.79s/it]Training 1/2 epoch (loss 0.4062):   9%|▎   | 368/4114 [23:57<3:56:37,  3.79s/it]Training 1/2 epoch (loss 0.4062):   9%|▎   | 369/4114 [23:57<4:04:05,  3.91s/it]Training 1/2 epoch (loss 0.6016):   9%|▎   | 369/4114 [24:01<4:04:05,  3.91s/it]Training 1/2 epoch (loss 0.6016):   9%|▎   | 370/4114 [24:01<4:05:42,  3.94s/it]Training 1/2 epoch (loss 0.4648):   9%|▎   | 370/4114 [24:05<4:05:42,  3.94s/it]Training 1/2 epoch (loss 0.4648):   9%|▎   | 371/4114 [24:05<4:05:34,  3.94s/it]Training 1/2 epoch (loss 0.5156):   9%|▎   | 371/4114 [24:09<4:05:34,  3.94s/it]Training 1/2 epoch (loss 0.5156):   9%|▎   | 372/4114 [24:09<4:06:15,  3.95s/it]Training 1/2 epoch (loss 0.5859):   9%|▎   | 372/4114 [24:13<4:06:15,  3.95s/it]Training 1/2 epoch (loss 0.5859):   9%|▎   | 373/4114 [24:13<4:02:05,  3.88s/it]Training 1/2 epoch (loss 0.3770):   9%|▎   | 373/4114 [24:16<4:02:05,  3.88s/it]Training 1/2 epoch (loss 0.3770):   9%|▎   | 374/4114 [24:16<4:00:51,  3.86s/it]Training 1/2 epoch (loss 0.3164):   9%|▎   | 374/4114 [24:20<4:00:51,  3.86s/it]Training 1/2 epoch (loss 0.3164):   9%|▎   | 375/4114 [24:20<4:01:46,  3.88s/it]Training 1/2 epoch (loss 0.6094):   9%|▎   | 375/4114 [24:24<4:01:46,  3.88s/it]Training 1/2 epoch (loss 0.6094):   9%|▎   | 376/4114 [24:24<4:02:23,  3.89s/it]Training 1/2 epoch (loss 0.2363):   9%|▎   | 376/4114 [24:28<4:02:23,  3.89s/it]Training 1/2 epoch (loss 0.2363):   9%|▎   | 377/4114 [24:28<4:04:15,  3.92s/it]Training 1/2 epoch (loss 0.4160):   9%|▎   | 377/4114 [24:32<4:04:15,  3.92s/it]Training 1/2 epoch (loss 0.4160):   9%|▎   | 378/4114 [24:32<4:04:57,  3.93s/it]Training 1/2 epoch (loss 0.4746):   9%|▎   | 378/4114 [24:35<4:04:57,  3.93s/it]Training 1/2 epoch (loss 0.4746):   9%|▎   | 379/4114 [24:35<3:52:13,  3.73s/it]Training 1/2 epoch (loss 0.4727):   9%|▎   | 379/4114 [24:39<3:52:13,  3.73s/it]Training 1/2 epoch (loss 0.4727):   9%|▎   | 380/4114 [24:39<3:47:12,  3.65s/it]Training 1/2 epoch (loss 0.4863):   9%|▎   | 380/4114 [24:43<3:47:12,  3.65s/it]Training 1/2 epoch (loss 0.4863):   9%|▎   | 381/4114 [24:43<3:59:41,  3.85s/it]Training 1/2 epoch (loss 0.5234):   9%|▎   | 381/4114 [24:47<3:59:41,  3.85s/it]Training 1/2 epoch (loss 0.5234):   9%|▎   | 382/4114 [24:47<3:57:23,  3.82s/it]Training 1/2 epoch (loss 0.4023):   9%|▎   | 382/4114 [24:51<3:57:23,  3.82s/it]Training 1/2 epoch (loss 0.4023):   9%|▎   | 383/4114 [24:51<3:55:46,  3.79s/it]Training 1/2 epoch (loss 0.3145):   9%|▎   | 383/4114 [24:55<3:55:46,  3.79s/it]Training 1/2 epoch (loss 0.3145):   9%|▎   | 384/4114 [24:55<3:59:22,  3.85s/it]Training 1/2 epoch (loss 0.3047):   9%|▎   | 384/4114 [24:58<3:59:22,  3.85s/it]Training 1/2 epoch (loss 0.3047):   9%|▎   | 385/4114 [24:58<3:58:31,  3.84s/it]Training 1/2 epoch (loss 0.4590):   9%|▎   | 385/4114 [25:02<3:58:31,  3.84s/it]Training 1/2 epoch (loss 0.4590):   9%|▍   | 386/4114 [25:02<3:57:47,  3.83s/it]Training 1/2 epoch (loss 0.3555):   9%|▍   | 386/4114 [25:06<3:57:47,  3.83s/it]Training 1/2 epoch (loss 0.3555):   9%|▍   | 387/4114 [25:06<4:01:26,  3.89s/it]Training 1/2 epoch (loss 0.3340):   9%|▍   | 387/4114 [25:10<4:01:26,  3.89s/it]Training 1/2 epoch (loss 0.3340):   9%|▍   | 388/4114 [25:10<4:02:29,  3.90s/it]Training 1/2 epoch (loss 0.3438):   9%|▍   | 388/4114 [25:14<4:02:29,  3.90s/it]Training 1/2 epoch (loss 0.3438):   9%|▍   | 389/4114 [25:14<4:03:04,  3.92s/it]Training 1/2 epoch (loss 0.4434):   9%|▍   | 389/4114 [25:18<4:03:04,  3.92s/it]Training 1/2 epoch (loss 0.4434):   9%|▍   | 390/4114 [25:18<4:08:50,  4.01s/it]Training 1/2 epoch (loss 0.4727):   9%|▍   | 390/4114 [25:21<4:08:50,  4.01s/it]Training 1/2 epoch (loss 0.4727):  10%|▍   | 391/4114 [25:21<3:50:49,  3.72s/it]Training 1/2 epoch (loss 0.4102):  10%|▍   | 391/4114 [25:25<3:50:49,  3.72s/it]Training 1/2 epoch (loss 0.4102):  10%|▍   | 392/4114 [25:25<3:50:29,  3.72s/it]Training 1/2 epoch (loss 0.3945):  10%|▍   | 392/4114 [25:29<3:50:29,  3.72s/it]Training 1/2 epoch (loss 0.3945):  10%|▍   | 393/4114 [25:29<3:48:20,  3.68s/it]Training 1/2 epoch (loss 0.4863):  10%|▍   | 393/4114 [25:32<3:48:20,  3.68s/it]Training 1/2 epoch (loss 0.4863):  10%|▍   | 394/4114 [25:32<3:42:44,  3.59s/it]Training 1/2 epoch (loss 0.3945):  10%|▍   | 394/4114 [25:36<3:42:44,  3.59s/it]Training 1/2 epoch (loss 0.3945):  10%|▍   | 395/4114 [25:36<3:48:12,  3.68s/it]Training 1/2 epoch (loss 0.4375):  10%|▍   | 395/4114 [25:40<3:48:12,  3.68s/it]Training 1/2 epoch (loss 0.4375):  10%|▍   | 396/4114 [25:40<3:57:07,  3.83s/it]Training 1/2 epoch (loss 0.4102):  10%|▍   | 396/4114 [25:44<3:57:07,  3.83s/it]Training 1/2 epoch (loss 0.4102):  10%|▍   | 397/4114 [25:44<3:55:31,  3.80s/it]Training 1/2 epoch (loss 0.3770):  10%|▍   | 397/4114 [25:48<3:55:31,  3.80s/it]Training 1/2 epoch (loss 0.3770):  10%|▍   | 398/4114 [25:48<4:00:01,  3.88s/it]Training 1/2 epoch (loss 0.4023):  10%|▍   | 398/4114 [25:52<4:00:01,  3.88s/it]Training 1/2 epoch (loss 0.4023):  10%|▍   | 399/4114 [25:52<4:02:47,  3.92s/it]Training 1/2 epoch (loss 0.3750):  10%|▍   | 399/4114 [25:56<4:02:47,  3.92s/it]Training 1/2 epoch (loss 0.3750):  10%|▍   | 400/4114 [25:56<3:54:31,  3.79s/it]Training 1/2 epoch (loss 0.4453):  10%|▍   | 400/4114 [25:59<3:54:31,  3.79s/it]Training 1/2 epoch (loss 0.4453):  10%|▍   | 401/4114 [25:59<3:45:03,  3.64s/it]Training 1/2 epoch (loss 0.4570):  10%|▍   | 401/4114 [26:03<3:45:03,  3.64s/it]Training 1/2 epoch (loss 0.4570):  10%|▍   | 402/4114 [26:03<3:54:25,  3.79s/it]Training 1/2 epoch (loss 0.4492):  10%|▍   | 402/4114 [26:06<3:54:25,  3.79s/it]Training 1/2 epoch (loss 0.4492):  10%|▍   | 403/4114 [26:06<3:44:13,  3.63s/it]Training 1/2 epoch (loss 0.3750):  10%|▍   | 403/4114 [26:10<3:44:13,  3.63s/it]Training 1/2 epoch (loss 0.3750):  10%|▍   | 404/4114 [26:10<3:47:30,  3.68s/it]Training 1/2 epoch (loss 0.3926):  10%|▍   | 404/4114 [26:14<3:47:30,  3.68s/it]Training 1/2 epoch (loss 0.3926):  10%|▍   | 405/4114 [26:14<3:57:16,  3.84s/it]Training 1/2 epoch (loss 0.2793):  10%|▍   | 405/4114 [26:18<3:57:16,  3.84s/it]Training 1/2 epoch (loss 0.2793):  10%|▍   | 406/4114 [26:18<3:53:22,  3.78s/it]Training 1/2 epoch (loss 0.4922):  10%|▍   | 406/4114 [26:22<3:53:22,  3.78s/it]Training 1/2 epoch (loss 0.4922):  10%|▍   | 407/4114 [26:22<3:59:52,  3.88s/it]Training 1/2 epoch (loss 0.4785):  10%|▍   | 407/4114 [26:26<3:59:52,  3.88s/it]Training 1/2 epoch (loss 0.4785):  10%|▍   | 408/4114 [26:26<3:57:43,  3.85s/it]Training 1/2 epoch (loss 0.5078):  10%|▍   | 408/4114 [26:29<3:57:43,  3.85s/it]Training 1/2 epoch (loss 0.5078):  10%|▍   | 409/4114 [26:29<3:47:08,  3.68s/it]Training 1/2 epoch (loss 0.4199):  10%|▍   | 409/4114 [26:33<3:47:08,  3.68s/it]Training 1/2 epoch (loss 0.4199):  10%|▍   | 410/4114 [26:33<3:51:08,  3.74s/it]Training 1/2 epoch (loss 0.4512):  10%|▍   | 410/4114 [26:37<3:51:08,  3.74s/it]Training 1/2 epoch (loss 0.4512):  10%|▍   | 411/4114 [26:37<3:59:54,  3.89s/it]Training 1/2 epoch (loss 0.4375):  10%|▍   | 411/4114 [26:41<3:59:54,  3.89s/it]Training 1/2 epoch (loss 0.4375):  10%|▍   | 412/4114 [26:41<3:54:42,  3.80s/it]Training 1/2 epoch (loss 0.4766):  10%|▍   | 412/4114 [26:45<3:54:42,  3.80s/it]Training 1/2 epoch (loss 0.4766):  10%|▍   | 413/4114 [26:45<4:00:20,  3.90s/it]Training 1/2 epoch (loss 0.3105):  10%|▍   | 413/4114 [26:49<4:00:20,  3.90s/it]Training 1/2 epoch (loss 0.3105):  10%|▍   | 414/4114 [26:49<4:05:46,  3.99s/it]Training 1/2 epoch (loss 0.4082):  10%|▍   | 414/4114 [26:53<4:05:46,  3.99s/it]Training 1/2 epoch (loss 0.4082):  10%|▍   | 415/4114 [26:53<4:06:35,  4.00s/it]Training 1/2 epoch (loss 0.3926):  10%|▍   | 415/4114 [26:57<4:06:35,  4.00s/it]Training 1/2 epoch (loss 0.3926):  10%|▍   | 416/4114 [26:57<4:06:23,  4.00s/it]Training 1/2 epoch (loss 0.4531):  10%|▍   | 416/4114 [27:01<4:06:23,  4.00s/it]Training 1/2 epoch (loss 0.4531):  10%|▍   | 417/4114 [27:01<4:07:21,  4.01s/it]Training 1/2 epoch (loss 0.4082):  10%|▍   | 417/4114 [27:05<4:07:21,  4.01s/it]Training 1/2 epoch (loss 0.4082):  10%|▍   | 418/4114 [27:05<4:05:57,  3.99s/it]Training 1/2 epoch (loss 0.2598):  10%|▍   | 418/4114 [27:09<4:05:57,  3.99s/it]Training 1/2 epoch (loss 0.2598):  10%|▍   | 419/4114 [27:09<4:05:30,  3.99s/it]Training 1/2 epoch (loss 0.4492):  10%|▍   | 419/4114 [27:13<4:05:30,  3.99s/it]Training 1/2 epoch (loss 0.4492):  10%|▍   | 420/4114 [27:13<4:07:18,  4.02s/it]Training 1/2 epoch (loss 0.4609):  10%|▍   | 420/4114 [27:17<4:07:18,  4.02s/it]Training 1/2 epoch (loss 0.4609):  10%|▍   | 421/4114 [27:17<3:56:04,  3.84s/it]Training 1/2 epoch (loss 0.4961):  10%|▍   | 421/4114 [27:20<3:56:04,  3.84s/it]Training 1/2 epoch (loss 0.4961):  10%|▍   | 422/4114 [27:20<3:55:21,  3.82s/it]Training 1/2 epoch (loss 0.3457):  10%|▍   | 422/4114 [27:24<3:55:21,  3.82s/it]Training 1/2 epoch (loss 0.3457):  10%|▍   | 423/4114 [27:24<3:52:42,  3.78s/it]Training 1/2 epoch (loss 0.2412):  10%|▍   | 423/4114 [27:27<3:52:42,  3.78s/it]Training 1/2 epoch (loss 0.2412):  10%|▍   | 424/4114 [27:27<3:45:21,  3.66s/it]Training 1/2 epoch (loss 0.4062):  10%|▍   | 424/4114 [27:31<3:45:21,  3.66s/it]Training 1/2 epoch (loss 0.4062):  10%|▍   | 425/4114 [27:31<3:47:24,  3.70s/it]Training 1/2 epoch (loss 0.3691):  10%|▍   | 425/4114 [27:35<3:47:24,  3.70s/it]Training 1/2 epoch (loss 0.3691):  10%|▍   | 426/4114 [27:35<3:53:23,  3.80s/it]Training 1/2 epoch (loss 0.5469):  10%|▍   | 426/4114 [27:38<3:53:23,  3.80s/it]Training 1/2 epoch (loss 0.5469):  10%|▍   | 427/4114 [27:38<3:39:56,  3.58s/it]Training 1/2 epoch (loss 0.3652):  10%|▍   | 427/4114 [27:42<3:39:56,  3.58s/it]Training 1/2 epoch (loss 0.3652):  10%|▍   | 428/4114 [27:42<3:43:54,  3.64s/it]Training 1/2 epoch (loss 0.6680):  10%|▍   | 428/4114 [27:46<3:43:54,  3.64s/it]Training 1/2 epoch (loss 0.6680):  10%|▍   | 429/4114 [27:46<3:52:41,  3.79s/it]Training 1/2 epoch (loss 0.4590):  10%|▍   | 429/4114 [27:50<3:52:41,  3.79s/it]Training 1/2 epoch (loss 0.4590):  10%|▍   | 430/4114 [27:50<3:50:27,  3.75s/it]Training 1/2 epoch (loss 0.3867):  10%|▍   | 430/4114 [27:54<3:50:27,  3.75s/it]Training 1/2 epoch (loss 0.3867):  10%|▍   | 431/4114 [27:54<3:53:58,  3.81s/it]Training 1/2 epoch (loss 0.5352):  10%|▍   | 431/4114 [27:58<3:53:58,  3.81s/it]Training 1/2 epoch (loss 0.5352):  11%|▍   | 432/4114 [27:58<3:59:30,  3.90s/it]Training 1/2 epoch (loss 0.4492):  11%|▍   | 432/4114 [28:02<3:59:30,  3.90s/it]Training 1/2 epoch (loss 0.4492):  11%|▍   | 433/4114 [28:02<3:57:48,  3.88s/it]Training 1/2 epoch (loss 0.5938):  11%|▍   | 433/4114 [28:06<3:57:48,  3.88s/it]Training 1/2 epoch (loss 0.5938):  11%|▍   | 434/4114 [28:06<3:58:41,  3.89s/it]Training 1/2 epoch (loss 0.3750):  11%|▍   | 434/4114 [28:10<3:58:41,  3.89s/it]Training 1/2 epoch (loss 0.3750):  11%|▍   | 435/4114 [28:10<4:03:37,  3.97s/it]Training 1/2 epoch (loss 0.3418):  11%|▍   | 435/4114 [28:14<4:03:37,  3.97s/it]Training 1/2 epoch (loss 0.3418):  11%|▍   | 436/4114 [28:14<4:00:21,  3.92s/it]Training 1/2 epoch (loss 0.4199):  11%|▍   | 436/4114 [28:17<4:00:21,  3.92s/it]Training 1/2 epoch (loss 0.4199):  11%|▍   | 437/4114 [28:17<3:57:48,  3.88s/it]Training 1/2 epoch (loss 0.3438):  11%|▍   | 437/4114 [28:22<3:57:48,  3.88s/it]Training 1/2 epoch (loss 0.3438):  11%|▍   | 438/4114 [28:22<4:03:38,  3.98s/it]Training 1/2 epoch (loss 0.4102):  11%|▍   | 438/4114 [28:26<4:03:38,  3.98s/it]Training 1/2 epoch (loss 0.4102):  11%|▍   | 439/4114 [28:26<4:04:16,  3.99s/it]Training 1/2 epoch (loss 0.4844):  11%|▍   | 439/4114 [28:29<4:04:16,  3.99s/it]Training 1/2 epoch (loss 0.4844):  11%|▍   | 440/4114 [28:29<3:52:20,  3.79s/it]Training 1/2 epoch (loss 0.4414):  11%|▍   | 440/4114 [28:33<3:52:20,  3.79s/it]Training 1/2 epoch (loss 0.4414):  11%|▍   | 441/4114 [28:33<4:00:10,  3.92s/it]Training 1/2 epoch (loss 0.4453):  11%|▍   | 441/4114 [28:36<4:00:10,  3.92s/it]Training 1/2 epoch (loss 0.4453):  11%|▍   | 442/4114 [28:36<3:47:47,  3.72s/it]Training 1/2 epoch (loss 0.3203):  11%|▍   | 442/4114 [28:41<3:47:47,  3.72s/it]Training 1/2 epoch (loss 0.3203):  11%|▍   | 443/4114 [28:41<3:53:06,  3.81s/it]Training 1/2 epoch (loss 0.5391):  11%|▍   | 443/4114 [28:44<3:53:06,  3.81s/it]Training 1/2 epoch (loss 0.5391):  11%|▍   | 444/4114 [28:44<3:49:23,  3.75s/it]Training 1/2 epoch (loss 0.4941):  11%|▍   | 444/4114 [28:48<3:49:23,  3.75s/it]Training 1/2 epoch (loss 0.4941):  11%|▍   | 445/4114 [28:48<3:47:00,  3.71s/it]Training 1/2 epoch (loss 0.4766):  11%|▍   | 445/4114 [28:51<3:47:00,  3.71s/it]Training 1/2 epoch (loss 0.4766):  11%|▍   | 446/4114 [28:51<3:46:30,  3.71s/it]Training 1/2 epoch (loss 0.3164):  11%|▍   | 446/4114 [28:56<3:46:30,  3.71s/it]Training 1/2 epoch (loss 0.3164):  11%|▍   | 447/4114 [28:56<3:56:44,  3.87s/it]Training 1/2 epoch (loss 0.4531):  11%|▍   | 447/4114 [28:59<3:56:44,  3.87s/it]Training 1/2 epoch (loss 0.4531):  11%|▍   | 448/4114 [28:59<3:54:54,  3.84s/it]Training 1/2 epoch (loss 0.5234):  11%|▍   | 448/4114 [29:03<3:54:54,  3.84s/it]Training 1/2 epoch (loss 0.5234):  11%|▍   | 449/4114 [29:03<3:54:01,  3.83s/it]Training 1/2 epoch (loss 0.5078):  11%|▍   | 449/4114 [29:07<3:54:01,  3.83s/it]Training 1/2 epoch (loss 0.5078):  11%|▍   | 450/4114 [29:07<3:56:40,  3.88s/it]Training 1/2 epoch (loss 0.4023):  11%|▍   | 450/4114 [29:11<3:56:40,  3.88s/it]Training 1/2 epoch (loss 0.4023):  11%|▍   | 451/4114 [29:11<3:51:11,  3.79s/it]Training 1/2 epoch (loss 0.3359):  11%|▍   | 451/4114 [29:14<3:51:11,  3.79s/it]Training 1/2 epoch (loss 0.3359):  11%|▍   | 452/4114 [29:14<3:45:33,  3.70s/it]Training 1/2 epoch (loss 0.3848):  11%|▍   | 452/4114 [29:19<3:45:33,  3.70s/it]Training 1/2 epoch (loss 0.3848):  11%|▍   | 453/4114 [29:19<3:55:14,  3.86s/it]Training 1/2 epoch (loss 0.6250):  11%|▍   | 453/4114 [29:22<3:55:14,  3.86s/it]Training 1/2 epoch (loss 0.6250):  11%|▍   | 454/4114 [29:22<3:48:20,  3.74s/it]Training 1/2 epoch (loss 0.4238):  11%|▍   | 454/4114 [29:26<3:48:20,  3.74s/it]Training 1/2 epoch (loss 0.4238):  11%|▍   | 455/4114 [29:26<3:49:13,  3.76s/it]Training 1/2 epoch (loss 0.3203):  11%|▍   | 455/4114 [29:30<3:49:13,  3.76s/it]Training 1/2 epoch (loss 0.3203):  11%|▍   | 456/4114 [29:30<3:54:02,  3.84s/it]Training 1/2 epoch (loss 0.4023):  11%|▍   | 456/4114 [29:34<3:54:02,  3.84s/it]Training 1/2 epoch (loss 0.4023):  11%|▍   | 457/4114 [29:34<3:56:26,  3.88s/it]Training 1/2 epoch (loss 0.4707):  11%|▍   | 457/4114 [29:37<3:56:26,  3.88s/it]Training 1/2 epoch (loss 0.4707):  11%|▍   | 458/4114 [29:37<3:48:07,  3.74s/it]Training 1/2 epoch (loss 0.2871):  11%|▍   | 458/4114 [29:41<3:48:07,  3.74s/it]Training 1/2 epoch (loss 0.2871):  11%|▍   | 459/4114 [29:41<3:54:43,  3.85s/it]Training 1/2 epoch (loss 0.4609):  11%|▍   | 459/4114 [29:45<3:54:43,  3.85s/it]Training 1/2 epoch (loss 0.4609):  11%|▍   | 460/4114 [29:45<3:53:37,  3.84s/it]Training 1/2 epoch (loss 0.4414):  11%|▍   | 460/4114 [29:49<3:53:37,  3.84s/it]Training 1/2 epoch (loss 0.4414):  11%|▍   | 461/4114 [29:49<3:52:59,  3.83s/it]Training 1/2 epoch (loss 0.3223):  11%|▍   | 461/4114 [29:53<3:52:59,  3.83s/it]Training 1/2 epoch (loss 0.3223):  11%|▍   | 462/4114 [29:53<4:03:05,  3.99s/it]Training 1/2 epoch (loss 0.4453):  11%|▍   | 462/4114 [29:57<4:03:05,  3.99s/it]Training 1/2 epoch (loss 0.4453):  11%|▍   | 463/4114 [29:57<4:01:39,  3.97s/it]Training 1/2 epoch (loss 0.3262):  11%|▍   | 463/4114 [30:01<4:01:39,  3.97s/it]Training 1/2 epoch (loss 0.3262):  11%|▍   | 464/4114 [30:01<3:59:41,  3.94s/it]Training 1/2 epoch (loss 0.2402):  11%|▍   | 464/4114 [30:05<3:59:41,  3.94s/it]Training 1/2 epoch (loss 0.2402):  11%|▍   | 465/4114 [30:05<4:03:53,  4.01s/it]Training 1/2 epoch (loss 0.5156):  11%|▍   | 465/4114 [30:09<4:03:53,  4.01s/it]Training 1/2 epoch (loss 0.5156):  11%|▍   | 466/4114 [30:09<4:03:26,  4.00s/it]Training 1/2 epoch (loss 0.3418):  11%|▍   | 466/4114 [30:13<4:03:26,  4.00s/it]Training 1/2 epoch (loss 0.3418):  11%|▍   | 467/4114 [30:13<4:00:05,  3.95s/it]Training 1/2 epoch (loss 0.3066):  11%|▍   | 467/4114 [30:17<4:00:05,  3.95s/it]Training 1/2 epoch (loss 0.3066):  11%|▍   | 468/4114 [30:17<4:05:16,  4.04s/it]Training 1/2 epoch (loss 0.6719):  11%|▍   | 468/4114 [30:21<4:05:16,  4.04s/it]Training 1/2 epoch (loss 0.6719):  11%|▍   | 469/4114 [30:21<4:02:24,  3.99s/it]Training 1/2 epoch (loss 0.7109):  11%|▍   | 469/4114 [30:25<4:02:24,  3.99s/it]Training 1/2 epoch (loss 0.7109):  11%|▍   | 470/4114 [30:25<4:01:59,  3.98s/it]Training 1/2 epoch (loss 0.4531):  11%|▍   | 470/4114 [30:29<4:01:59,  3.98s/it]Training 1/2 epoch (loss 0.4531):  11%|▍   | 471/4114 [30:29<4:01:37,  3.98s/it]Training 1/2 epoch (loss 0.6367):  11%|▍   | 471/4114 [30:33<4:01:37,  3.98s/it]Training 1/2 epoch (loss 0.6367):  11%|▍   | 472/4114 [30:33<3:58:19,  3.93s/it]Training 1/2 epoch (loss 0.6172):  11%|▍   | 472/4114 [30:37<3:58:19,  3.93s/it]Training 1/2 epoch (loss 0.6172):  11%|▍   | 473/4114 [30:37<3:58:19,  3.93s/it]Training 1/2 epoch (loss 0.3477):  11%|▍   | 473/4114 [30:41<3:58:19,  3.93s/it]Training 1/2 epoch (loss 0.3477):  12%|▍   | 474/4114 [30:41<4:02:13,  3.99s/it]Training 1/2 epoch (loss 0.7148):  12%|▍   | 474/4114 [30:45<4:02:13,  3.99s/it]Training 1/2 epoch (loss 0.7148):  12%|▍   | 475/4114 [30:45<3:58:51,  3.94s/it]Training 1/2 epoch (loss 0.4160):  12%|▍   | 475/4114 [30:49<3:58:51,  3.94s/it]Training 1/2 epoch (loss 0.4160):  12%|▍   | 476/4114 [30:49<3:59:54,  3.96s/it]Training 1/2 epoch (loss 0.5742):  12%|▍   | 476/4114 [30:53<3:59:54,  3.96s/it]Training 1/2 epoch (loss 0.5742):  12%|▍   | 477/4114 [30:53<4:00:44,  3.97s/it]Training 1/2 epoch (loss 0.3887):  12%|▍   | 477/4114 [30:57<4:00:44,  3.97s/it]Training 1/2 epoch (loss 0.3887):  12%|▍   | 478/4114 [30:57<3:56:18,  3.90s/it]Training 1/2 epoch (loss 0.3984):  12%|▍   | 478/4114 [31:00<3:56:18,  3.90s/it]Training 1/2 epoch (loss 0.3984):  12%|▍   | 479/4114 [31:00<3:47:22,  3.75s/it]Training 1/2 epoch (loss 0.3613):  12%|▍   | 479/4114 [31:04<3:47:22,  3.75s/it]Training 1/2 epoch (loss 0.3613):  12%|▍   | 480/4114 [31:04<3:50:52,  3.81s/it]Training 1/2 epoch (loss 0.4141):  12%|▍   | 480/4114 [31:08<3:50:52,  3.81s/it]Training 1/2 epoch (loss 0.4141):  12%|▍   | 481/4114 [31:08<3:52:29,  3.84s/it]Training 1/2 epoch (loss 0.4707):  12%|▍   | 481/4114 [31:12<3:52:29,  3.84s/it]Training 1/2 epoch (loss 0.4707):  12%|▍   | 482/4114 [31:12<3:51:35,  3.83s/it]Training 1/2 epoch (loss 0.4180):  12%|▍   | 482/4114 [31:16<3:51:35,  3.83s/it]Training 1/2 epoch (loss 0.4180):  12%|▍   | 483/4114 [31:16<3:57:07,  3.92s/it]Training 1/2 epoch (loss 0.5195):  12%|▍   | 483/4114 [31:20<3:57:07,  3.92s/it]Training 1/2 epoch (loss 0.5195):  12%|▍   | 484/4114 [31:20<3:54:37,  3.88s/it]Training 1/2 epoch (loss 0.2969):  12%|▍   | 484/4114 [31:23<3:54:37,  3.88s/it]Training 1/2 epoch (loss 0.2969):  12%|▍   | 485/4114 [31:23<3:49:01,  3.79s/it]Training 1/2 epoch (loss 0.4727):  12%|▍   | 485/4114 [31:27<3:49:01,  3.79s/it]Training 1/2 epoch (loss 0.4727):  12%|▍   | 486/4114 [31:27<3:56:16,  3.91s/it]Training 1/2 epoch (loss 0.4512):  12%|▍   | 486/4114 [31:31<3:56:16,  3.91s/it]Training 1/2 epoch (loss 0.4512):  12%|▍   | 487/4114 [31:31<3:57:56,  3.94s/it]Training 1/2 epoch (loss 0.4102):  12%|▍   | 487/4114 [31:35<3:57:56,  3.94s/it]Training 1/2 epoch (loss 0.4102):  12%|▍   | 488/4114 [31:35<3:55:20,  3.89s/it]Training 1/2 epoch (loss 0.3750):  12%|▍   | 488/4114 [31:39<3:55:20,  3.89s/it]Training 1/2 epoch (loss 0.3750):  12%|▍   | 489/4114 [31:39<3:58:08,  3.94s/it]Training 1/2 epoch (loss 0.3770):  12%|▍   | 489/4114 [31:43<3:58:08,  3.94s/it]Training 1/2 epoch (loss 0.3770):  12%|▍   | 490/4114 [31:43<3:52:26,  3.85s/it]Training 1/2 epoch (loss 0.4219):  12%|▍   | 490/4114 [31:47<3:52:26,  3.85s/it]Training 1/2 epoch (loss 0.4219):  12%|▍   | 491/4114 [31:47<3:51:47,  3.84s/it]Training 1/2 epoch (loss 0.4004):  12%|▍   | 491/4114 [31:50<3:51:47,  3.84s/it]Training 1/2 epoch (loss 0.4004):  12%|▍   | 492/4114 [31:50<3:45:06,  3.73s/it]Training 1/2 epoch (loss 0.5234):  12%|▍   | 492/4114 [31:54<3:45:06,  3.73s/it]Training 1/2 epoch (loss 0.5234):  12%|▍   | 493/4114 [31:54<3:45:51,  3.74s/it]Training 1/2 epoch (loss 0.4590):  12%|▍   | 493/4114 [31:58<3:45:51,  3.74s/it]Training 1/2 epoch (loss 0.4590):  12%|▍   | 494/4114 [31:58<3:46:33,  3.76s/it]Training 1/2 epoch (loss 0.5664):  12%|▍   | 494/4114 [32:02<3:46:33,  3.76s/it]Training 1/2 epoch (loss 0.5664):  12%|▍   | 495/4114 [32:02<3:51:19,  3.84s/it]Training 1/2 epoch (loss 0.3301):  12%|▍   | 495/4114 [32:05<3:51:19,  3.84s/it]Training 1/2 epoch (loss 0.3301):  12%|▍   | 496/4114 [32:05<3:50:45,  3.83s/it]Training 1/2 epoch (loss 0.4297):  12%|▍   | 496/4114 [32:10<3:50:45,  3.83s/it]Training 1/2 epoch (loss 0.4297):  12%|▍   | 497/4114 [32:10<3:54:33,  3.89s/it]Training 1/2 epoch (loss 0.5469):  12%|▍   | 497/4114 [32:14<3:54:33,  3.89s/it]Training 1/2 epoch (loss 0.5469):  12%|▍   | 498/4114 [32:14<3:57:00,  3.93s/it]Training 1/2 epoch (loss 0.4219):  12%|▍   | 498/4114 [32:18<3:57:00,  3.93s/it]Training 1/2 epoch (loss 0.4219):  12%|▍   | 499/4114 [32:18<3:57:44,  3.95s/it]Training 1/2 epoch (loss 0.5430):  12%|▍   | 499/4114 [32:21<3:57:44,  3.95s/it]Training 1/2 epoch (loss 0.5430):  12%|▍   | 500/4114 [32:21<3:45:27,  3.74s/it]Training 1/2 epoch (loss 0.5664):  12%|▍   | 500/4114 [32:24<3:45:27,  3.74s/it]Training 1/2 epoch (loss 0.5664):  12%|▍   | 501/4114 [32:24<3:37:50,  3.62s/it]Training 1/2 epoch (loss 0.4941):  12%|▍   | 501/4114 [32:27<3:37:50,  3.62s/it]Training 1/2 epoch (loss 0.4941):  12%|▍   | 502/4114 [32:27<3:27:38,  3.45s/it]Training 1/2 epoch (loss 0.4121):  12%|▍   | 502/4114 [32:31<3:27:38,  3.45s/it]Training 1/2 epoch (loss 0.4121):  12%|▍   | 503/4114 [32:31<3:37:30,  3.61s/it]Training 1/2 epoch (loss 0.5430):  12%|▍   | 503/4114 [32:35<3:37:30,  3.61s/it]Training 1/2 epoch (loss 0.5430):  12%|▍   | 504/4114 [32:35<3:45:14,  3.74s/it]Training 1/2 epoch (loss 0.4043):  12%|▍   | 504/4114 [32:39<3:45:14,  3.74s/it]Training 1/2 epoch (loss 0.4043):  12%|▍   | 505/4114 [32:39<3:48:58,  3.81s/it]Training 1/2 epoch (loss 0.3672):  12%|▍   | 505/4114 [32:43<3:48:58,  3.81s/it]Training 1/2 epoch (loss 0.3672):  12%|▍   | 506/4114 [32:43<3:52:33,  3.87s/it]Training 1/2 epoch (loss 0.5430):  12%|▍   | 506/4114 [32:47<3:52:33,  3.87s/it]Training 1/2 epoch (loss 0.5430):  12%|▍   | 507/4114 [32:47<3:48:51,  3.81s/it]Training 1/2 epoch (loss 0.2695):  12%|▍   | 507/4114 [32:51<3:48:51,  3.81s/it]Training 1/2 epoch (loss 0.2695):  12%|▍   | 508/4114 [32:51<3:46:34,  3.77s/it]Training 1/2 epoch (loss 0.4160):  12%|▍   | 508/4114 [32:54<3:46:34,  3.77s/it]Training 1/2 epoch (loss 0.4160):  12%|▍   | 509/4114 [32:54<3:42:30,  3.70s/it]Training 1/2 epoch (loss 0.4375):  12%|▍   | 509/4114 [32:58<3:42:30,  3.70s/it]Training 1/2 epoch (loss 0.4375):  12%|▍   | 510/4114 [32:58<3:40:17,  3.67s/it]Training 1/2 epoch (loss 0.5625):  12%|▍   | 510/4114 [33:02<3:40:17,  3.67s/it]Training 1/2 epoch (loss 0.5625):  12%|▍   | 511/4114 [33:02<3:43:55,  3.73s/it]Training 1/2 epoch (loss 0.3906):  12%|▍   | 511/4114 [33:05<3:43:55,  3.73s/it]Training 1/2 epoch (loss 0.3906):  12%|▍   | 512/4114 [33:05<3:45:03,  3.75s/it]Training 1/2 epoch (loss 0.3477):  12%|▍   | 512/4114 [33:09<3:45:03,  3.75s/it]Training 1/2 epoch (loss 0.3477):  12%|▍   | 513/4114 [33:09<3:50:10,  3.84s/it]Training 1/2 epoch (loss 0.4277):  12%|▍   | 513/4114 [33:13<3:50:10,  3.84s/it]Training 1/2 epoch (loss 0.4277):  12%|▍   | 514/4114 [33:13<3:51:38,  3.86s/it]Training 1/2 epoch (loss 0.4648):  12%|▍   | 514/4114 [33:17<3:51:38,  3.86s/it]Training 1/2 epoch (loss 0.4648):  13%|▌   | 515/4114 [33:17<3:51:56,  3.87s/it]Training 1/2 epoch (loss 0.5000):  13%|▌   | 515/4114 [33:21<3:51:56,  3.87s/it]Training 1/2 epoch (loss 0.5000):  13%|▌   | 516/4114 [33:21<3:55:04,  3.92s/it]Training 1/2 epoch (loss 0.4297):  13%|▌   | 516/4114 [33:25<3:55:04,  3.92s/it]Training 1/2 epoch (loss 0.4297):  13%|▌   | 517/4114 [33:25<3:53:17,  3.89s/it]Training 1/2 epoch (loss 0.5586):  13%|▌   | 517/4114 [33:29<3:53:17,  3.89s/it]Training 1/2 epoch (loss 0.5586):  13%|▌   | 518/4114 [33:29<3:51:02,  3.85s/it]Training 1/2 epoch (loss 0.4258):  13%|▌   | 518/4114 [33:33<3:51:02,  3.85s/it]Training 1/2 epoch (loss 0.4258):  13%|▌   | 519/4114 [33:33<3:56:59,  3.96s/it]Training 1/2 epoch (loss 0.3730):  13%|▌   | 519/4114 [33:37<3:56:59,  3.96s/it]Training 1/2 epoch (loss 0.3730):  13%|▌   | 520/4114 [33:37<3:57:06,  3.96s/it]Training 1/2 epoch (loss 0.3496):  13%|▌   | 520/4114 [33:40<3:57:06,  3.96s/it]Training 1/2 epoch (loss 0.3496):  13%|▌   | 521/4114 [33:40<3:48:11,  3.81s/it]Training 1/2 epoch (loss 0.5312):  13%|▌   | 521/4114 [33:45<3:48:11,  3.81s/it]Training 1/2 epoch (loss 0.5312):  13%|▌   | 522/4114 [33:45<3:55:02,  3.93s/it]Training 1/2 epoch (loss 0.4199):  13%|▌   | 522/4114 [33:49<3:55:02,  3.93s/it]Training 1/2 epoch (loss 0.4199):  13%|▌   | 523/4114 [33:49<3:56:33,  3.95s/it]Training 1/2 epoch (loss 0.4688):  13%|▌   | 523/4114 [33:52<3:56:33,  3.95s/it]Training 1/2 epoch (loss 0.4688):  13%|▌   | 524/4114 [33:52<3:50:58,  3.86s/it]Training 1/2 epoch (loss 0.3926):  13%|▌   | 524/4114 [33:56<3:50:58,  3.86s/it]Training 1/2 epoch (loss 0.3926):  13%|▌   | 525/4114 [33:56<3:53:30,  3.90s/it]Training 1/2 epoch (loss 0.4375):  13%|▌   | 525/4114 [34:00<3:53:30,  3.90s/it]Training 1/2 epoch (loss 0.4375):  13%|▌   | 526/4114 [34:00<3:56:54,  3.96s/it]Training 1/2 epoch (loss 0.5312):  13%|▌   | 526/4114 [34:04<3:56:54,  3.96s/it]Training 1/2 epoch (loss 0.5312):  13%|▌   | 527/4114 [34:04<3:54:27,  3.92s/it]Training 1/2 epoch (loss 0.3828):  13%|▌   | 527/4114 [34:08<3:54:27,  3.92s/it]Training 1/2 epoch (loss 0.3828):  13%|▌   | 528/4114 [34:08<3:48:52,  3.83s/it]Training 1/2 epoch (loss 0.5586):  13%|▌   | 528/4114 [34:12<3:48:52,  3.83s/it]Training 1/2 epoch (loss 0.5586):  13%|▌   | 529/4114 [34:12<3:46:04,  3.78s/it]Training 1/2 epoch (loss 0.4980):  13%|▌   | 529/4114 [34:14<3:46:04,  3.78s/it]Training 1/2 epoch (loss 0.4980):  13%|▌   | 530/4114 [34:14<3:27:01,  3.47s/it]Training 1/2 epoch (loss 0.4043):  13%|▌   | 530/4114 [34:18<3:27:01,  3.47s/it]Training 1/2 epoch (loss 0.4043):  13%|▌   | 531/4114 [34:18<3:37:22,  3.64s/it]Training 1/2 epoch (loss 0.4629):  13%|▌   | 531/4114 [34:22<3:37:22,  3.64s/it]Training 1/2 epoch (loss 0.4629):  13%|▌   | 532/4114 [34:22<3:43:06,  3.74s/it]Training 1/2 epoch (loss 0.4902):  13%|▌   | 532/4114 [34:26<3:43:06,  3.74s/it]Training 1/2 epoch (loss 0.4902):  13%|▌   | 533/4114 [34:26<3:47:46,  3.82s/it]Training 1/2 epoch (loss 0.5078):  13%|▌   | 533/4114 [34:30<3:47:46,  3.82s/it]Training 1/2 epoch (loss 0.5078):  13%|▌   | 534/4114 [34:30<3:50:05,  3.86s/it]Training 1/2 epoch (loss 0.4844):  13%|▌   | 534/4114 [34:34<3:50:05,  3.86s/it]Training 1/2 epoch (loss 0.4844):  13%|▌   | 535/4114 [34:34<3:42:12,  3.73s/it]Training 1/2 epoch (loss 0.4707):  13%|▌   | 535/4114 [34:38<3:42:12,  3.73s/it]Training 1/2 epoch (loss 0.4707):  13%|▌   | 536/4114 [34:38<3:48:27,  3.83s/it]Training 1/2 epoch (loss 0.3555):  13%|▌   | 536/4114 [34:42<3:48:27,  3.83s/it]Training 1/2 epoch (loss 0.3555):  13%|▌   | 537/4114 [34:42<3:55:44,  3.95s/it]Training 1/2 epoch (loss 0.4102):  13%|▌   | 537/4114 [34:46<3:55:44,  3.95s/it]Training 1/2 epoch (loss 0.4102):  13%|▌   | 538/4114 [34:46<3:51:53,  3.89s/it]Training 1/2 epoch (loss 0.5078):  13%|▌   | 538/4114 [34:50<3:51:53,  3.89s/it]Training 1/2 epoch (loss 0.5078):  13%|▌   | 539/4114 [34:50<3:55:15,  3.95s/it]Training 1/2 epoch (loss 0.4883):  13%|▌   | 539/4114 [34:53<3:55:15,  3.95s/it]Training 1/2 epoch (loss 0.4883):  13%|▌   | 540/4114 [34:53<3:50:24,  3.87s/it]Training 1/2 epoch (loss 0.5859):  13%|▌   | 540/4114 [34:57<3:50:24,  3.87s/it]Training 1/2 epoch (loss 0.5859):  13%|▌   | 541/4114 [34:57<3:50:24,  3.87s/it]Training 1/2 epoch (loss 0.4355):  13%|▌   | 541/4114 [35:01<3:50:24,  3.87s/it]Training 1/2 epoch (loss 0.4355):  13%|▌   | 542/4114 [35:01<3:48:44,  3.84s/it]Training 1/2 epoch (loss 0.3457):  13%|▌   | 542/4114 [35:05<3:48:44,  3.84s/it]Training 1/2 epoch (loss 0.3457):  13%|▌   | 543/4114 [35:05<3:56:07,  3.97s/it]Training 1/2 epoch (loss 0.4160):  13%|▌   | 543/4114 [35:09<3:56:07,  3.97s/it]Training 1/2 epoch (loss 0.4160):  13%|▌   | 544/4114 [35:09<3:54:55,  3.95s/it]Training 1/2 epoch (loss 0.3555):  13%|▌   | 544/4114 [35:13<3:54:55,  3.95s/it]Training 1/2 epoch (loss 0.3555):  13%|▌   | 545/4114 [35:13<3:54:59,  3.95s/it]Training 1/2 epoch (loss 0.4160):  13%|▌   | 545/4114 [35:18<3:54:59,  3.95s/it]Training 1/2 epoch (loss 0.4160):  13%|▌   | 546/4114 [35:18<4:00:53,  4.05s/it]Training 1/2 epoch (loss 0.3633):  13%|▌   | 546/4114 [35:21<4:00:53,  4.05s/it]Training 1/2 epoch (loss 0.3633):  13%|▌   | 547/4114 [35:21<3:52:19,  3.91s/it]Training 1/2 epoch (loss 0.4453):  13%|▌   | 547/4114 [35:25<3:52:19,  3.91s/it]Training 1/2 epoch (loss 0.4453):  13%|▌   | 548/4114 [35:25<3:43:38,  3.76s/it]Training 1/2 epoch (loss 0.4277):  13%|▌   | 548/4114 [35:29<3:43:38,  3.76s/it]Training 1/2 epoch (loss 0.4277):  13%|▌   | 549/4114 [35:29<3:50:07,  3.87s/it]Training 1/2 epoch (loss 0.4941):  13%|▌   | 549/4114 [35:33<3:50:07,  3.87s/it]Training 1/2 epoch (loss 0.4941):  13%|▌   | 550/4114 [35:33<3:51:47,  3.90s/it]Training 1/2 epoch (loss 0.4863):  13%|▌   | 550/4114 [35:36<3:51:47,  3.90s/it]Training 1/2 epoch (loss 0.4863):  13%|▌   | 551/4114 [35:36<3:49:37,  3.87s/it]Training 1/2 epoch (loss 0.3984):  13%|▌   | 551/4114 [35:40<3:49:37,  3.87s/it]Training 1/2 epoch (loss 0.3984):  13%|▌   | 552/4114 [35:40<3:45:17,  3.79s/it]Training 1/2 epoch (loss 0.5156):  13%|▌   | 552/4114 [35:44<3:45:17,  3.79s/it]Training 1/2 epoch (loss 0.5156):  13%|▌   | 553/4114 [35:44<3:46:05,  3.81s/it]Training 1/2 epoch (loss 0.4258):  13%|▌   | 553/4114 [35:47<3:46:05,  3.81s/it]Training 1/2 epoch (loss 0.4258):  13%|▌   | 554/4114 [35:47<3:40:10,  3.71s/it]Training 1/2 epoch (loss 0.5469):  13%|▌   | 554/4114 [35:52<3:40:10,  3.71s/it]Training 1/2 epoch (loss 0.5469):  13%|▌   | 555/4114 [35:52<3:48:08,  3.85s/it]Training 1/2 epoch (loss 0.6211):  13%|▌   | 555/4114 [35:55<3:48:08,  3.85s/it]Training 1/2 epoch (loss 0.6211):  14%|▌   | 556/4114 [35:55<3:47:20,  3.83s/it]Training 1/2 epoch (loss 0.3008):  14%|▌   | 556/4114 [35:59<3:47:20,  3.83s/it]Training 1/2 epoch (loss 0.3008):  14%|▌   | 557/4114 [35:59<3:40:10,  3.71s/it]Training 1/2 epoch (loss 0.5273):  14%|▌   | 557/4114 [36:03<3:40:10,  3.71s/it]Training 1/2 epoch (loss 0.5273):  14%|▌   | 558/4114 [36:03<3:46:57,  3.83s/it]Training 1/2 epoch (loss 0.3457):  14%|▌   | 558/4114 [36:07<3:46:57,  3.83s/it]Training 1/2 epoch (loss 0.3457):  14%|▌   | 559/4114 [36:07<3:45:55,  3.81s/it]Training 1/2 epoch (loss 0.4336):  14%|▌   | 559/4114 [36:10<3:45:55,  3.81s/it]Training 1/2 epoch (loss 0.4336):  14%|▌   | 560/4114 [36:10<3:40:37,  3.72s/it]Training 1/2 epoch (loss 0.4473):  14%|▌   | 560/4114 [36:14<3:40:37,  3.72s/it]Training 1/2 epoch (loss 0.4473):  14%|▌   | 561/4114 [36:14<3:50:21,  3.89s/it]Training 1/2 epoch (loss 0.4961):  14%|▌   | 561/4114 [36:18<3:50:21,  3.89s/it]Training 1/2 epoch (loss 0.4961):  14%|▌   | 562/4114 [36:18<3:39:05,  3.70s/it]Training 1/2 epoch (loss 0.3516):  14%|▌   | 562/4114 [36:21<3:39:05,  3.70s/it]Training 1/2 epoch (loss 0.3516):  14%|▌   | 563/4114 [36:21<3:38:26,  3.69s/it]Training 1/2 epoch (loss 0.4395):  14%|▌   | 563/4114 [36:25<3:38:26,  3.69s/it]Training 1/2 epoch (loss 0.4395):  14%|▌   | 564/4114 [36:25<3:45:46,  3.82s/it]Training 1/2 epoch (loss 0.4570):  14%|▌   | 564/4114 [36:29<3:45:46,  3.82s/it]Training 1/2 epoch (loss 0.4570):  14%|▌   | 565/4114 [36:29<3:45:30,  3.81s/it]Training 1/2 epoch (loss 0.3203):  14%|▌   | 565/4114 [36:33<3:45:30,  3.81s/it]Training 1/2 epoch (loss 0.3203):  14%|▌   | 566/4114 [36:33<3:43:36,  3.78s/it]Training 1/2 epoch (loss 0.5039):  14%|▌   | 566/4114 [36:37<3:43:36,  3.78s/it]Training 1/2 epoch (loss 0.5039):  14%|▌   | 567/4114 [36:37<3:42:35,  3.77s/it]Training 1/2 epoch (loss 0.3711):  14%|▌   | 567/4114 [36:40<3:42:35,  3.77s/it]Training 1/2 epoch (loss 0.3711):  14%|▌   | 568/4114 [36:40<3:34:20,  3.63s/it]Training 1/2 epoch (loss 0.3535):  14%|▌   | 568/4114 [36:44<3:34:20,  3.63s/it]Training 1/2 epoch (loss 0.3535):  14%|▌   | 569/4114 [36:44<3:39:18,  3.71s/it]Training 1/2 epoch (loss 0.5000):  14%|▌   | 569/4114 [36:48<3:39:18,  3.71s/it]Training 1/2 epoch (loss 0.5000):  14%|▌   | 570/4114 [36:48<3:46:25,  3.83s/it]Training 1/2 epoch (loss 0.5625):  14%|▌   | 570/4114 [36:52<3:46:25,  3.83s/it]Training 1/2 epoch (loss 0.5625):  14%|▌   | 571/4114 [36:52<3:49:29,  3.89s/it]Training 1/2 epoch (loss 0.4375):  14%|▌   | 571/4114 [36:56<3:49:29,  3.89s/it]Training 1/2 epoch (loss 0.4375):  14%|▌   | 572/4114 [36:56<3:51:16,  3.92s/it]Training 1/2 epoch (loss 0.4375):  14%|▌   | 572/4114 [37:00<3:51:16,  3.92s/it]Training 1/2 epoch (loss 0.4375):  14%|▌   | 573/4114 [37:00<3:57:30,  4.02s/it]Training 1/2 epoch (loss 0.3984):  14%|▌   | 573/4114 [37:04<3:57:30,  4.02s/it]Training 1/2 epoch (loss 0.3984):  14%|▌   | 574/4114 [37:04<3:58:11,  4.04s/it]Training 1/2 epoch (loss 0.5938):  14%|▌   | 574/4114 [37:08<3:58:11,  4.04s/it]Training 1/2 epoch (loss 0.5938):  14%|▌   | 575/4114 [37:08<3:51:23,  3.92s/it]Training 1/2 epoch (loss 0.3359):  14%|▌   | 575/4114 [37:12<3:51:23,  3.92s/it]Training 1/2 epoch (loss 0.3359):  14%|▌   | 576/4114 [37:12<3:52:53,  3.95s/it]Training 1/2 epoch (loss 0.5039):  14%|▌   | 576/4114 [37:16<3:52:53,  3.95s/it]Training 1/2 epoch (loss 0.5039):  14%|▌   | 577/4114 [37:16<3:54:27,  3.98s/it]Training 1/2 epoch (loss 0.4062):  14%|▌   | 577/4114 [37:20<3:54:27,  3.98s/it]Training 1/2 epoch (loss 0.4062):  14%|▌   | 578/4114 [37:20<3:56:03,  4.01s/it]Training 1/2 epoch (loss 0.5078):  14%|▌   | 578/4114 [37:24<3:56:03,  4.01s/it]Training 1/2 epoch (loss 0.5078):  14%|▌   | 579/4114 [37:24<3:59:47,  4.07s/it]Training 1/2 epoch (loss 0.5547):  14%|▌   | 579/4114 [37:28<3:59:47,  4.07s/it]Training 1/2 epoch (loss 0.5547):  14%|▌   | 580/4114 [37:28<3:57:43,  4.04s/it]Training 1/2 epoch (loss 0.5586):  14%|▌   | 580/4114 [37:32<3:57:43,  4.04s/it]Training 1/2 epoch (loss 0.5586):  14%|▌   | 581/4114 [37:32<3:52:47,  3.95s/it]Training 1/2 epoch (loss 0.4004):  14%|▌   | 581/4114 [37:36<3:52:47,  3.95s/it]Training 1/2 epoch (loss 0.4004):  14%|▌   | 582/4114 [37:36<3:53:43,  3.97s/it]Training 1/2 epoch (loss 0.5547):  14%|▌   | 582/4114 [37:39<3:53:43,  3.97s/it]Training 1/2 epoch (loss 0.5547):  14%|▌   | 583/4114 [37:39<3:43:20,  3.79s/it]Training 1/2 epoch (loss 0.3438):  14%|▌   | 583/4114 [37:43<3:43:20,  3.79s/it]Training 1/2 epoch (loss 0.3438):  14%|▌   | 584/4114 [37:43<3:36:44,  3.68s/it]Training 1/2 epoch (loss 0.4688):  14%|▌   | 584/4114 [37:47<3:36:44,  3.68s/it]Training 1/2 epoch (loss 0.4688):  14%|▌   | 585/4114 [37:47<3:44:30,  3.82s/it]Training 1/2 epoch (loss 0.4922):  14%|▌   | 585/4114 [37:50<3:44:30,  3.82s/it]Training 1/2 epoch (loss 0.4922):  14%|▌   | 586/4114 [37:50<3:37:01,  3.69s/it]Training 1/2 epoch (loss 0.3223):  14%|▌   | 586/4114 [37:54<3:37:01,  3.69s/it]Training 1/2 epoch (loss 0.3223):  14%|▌   | 587/4114 [37:54<3:39:16,  3.73s/it]Training 1/2 epoch (loss 0.4766):  14%|▌   | 587/4114 [37:58<3:39:16,  3.73s/it]Training 1/2 epoch (loss 0.4766):  14%|▌   | 588/4114 [37:58<3:47:25,  3.87s/it]Training 1/2 epoch (loss 0.5977):  14%|▌   | 588/4114 [38:02<3:47:25,  3.87s/it]Training 1/2 epoch (loss 0.5977):  14%|▌   | 589/4114 [38:02<3:45:51,  3.84s/it]Training 1/2 epoch (loss 0.4922):  14%|▌   | 589/4114 [38:06<3:45:51,  3.84s/it]Training 1/2 epoch (loss 0.4922):  14%|▌   | 590/4114 [38:06<3:47:51,  3.88s/it]Training 1/2 epoch (loss 0.4531):  14%|▌   | 590/4114 [38:09<3:47:51,  3.88s/it]Training 1/2 epoch (loss 0.4531):  14%|▌   | 591/4114 [38:09<3:37:33,  3.71s/it]Training 1/2 epoch (loss 0.4570):  14%|▌   | 591/4114 [38:14<3:37:33,  3.71s/it]Training 1/2 epoch (loss 0.4570):  14%|▌   | 592/4114 [38:14<3:42:56,  3.80s/it]Training 1/2 epoch (loss 0.4551):  14%|▌   | 592/4114 [38:17<3:42:56,  3.80s/it]Training 1/2 epoch (loss 0.4551):  14%|▌   | 593/4114 [38:17<3:43:31,  3.81s/it]Training 1/2 epoch (loss 0.4004):  14%|▌   | 593/4114 [38:21<3:43:31,  3.81s/it]Training 1/2 epoch (loss 0.4004):  14%|▌   | 594/4114 [38:21<3:47:42,  3.88s/it]Training 1/2 epoch (loss 0.3301):  14%|▌   | 594/4114 [38:25<3:47:42,  3.88s/it]Training 1/2 epoch (loss 0.3301):  14%|▌   | 595/4114 [38:25<3:49:21,  3.91s/it]Training 1/2 epoch (loss 0.3926):  14%|▌   | 595/4114 [38:29<3:49:21,  3.91s/it]Training 1/2 epoch (loss 0.3926):  14%|▌   | 596/4114 [38:29<3:50:36,  3.93s/it]Training 1/2 epoch (loss 0.5625):  14%|▌   | 596/4114 [38:33<3:50:36,  3.93s/it]Training 1/2 epoch (loss 0.5625):  15%|▌   | 597/4114 [38:33<3:51:52,  3.96s/it]Training 1/2 epoch (loss 0.2930):  15%|▌   | 597/4114 [38:37<3:51:52,  3.96s/it]Training 1/2 epoch (loss 0.2930):  15%|▌   | 598/4114 [38:37<3:48:21,  3.90s/it]Training 1/2 epoch (loss 0.4961):  15%|▌   | 598/4114 [38:41<3:48:21,  3.90s/it]Training 1/2 epoch (loss 0.4961):  15%|▌   | 599/4114 [38:41<3:53:08,  3.98s/it]Training 1/2 epoch (loss 0.5508):  15%|▌   | 599/4114 [38:45<3:53:08,  3.98s/it]Training 1/2 epoch (loss 0.5508):  15%|▌   | 600/4114 [38:45<3:56:59,  4.05s/it]Training 1/2 epoch (loss 0.3906):  15%|▌   | 600/4114 [38:49<3:56:59,  4.05s/it]Training 1/2 epoch (loss 0.3906):  15%|▌   | 601/4114 [38:49<3:55:43,  4.03s/it]Training 1/2 epoch (loss 0.5156):  15%|▌   | 601/4114 [38:53<3:55:43,  4.03s/it]Training 1/2 epoch (loss 0.5156):  15%|▌   | 602/4114 [38:53<3:51:31,  3.96s/it]Training 1/2 epoch (loss 0.4473):  15%|▌   | 602/4114 [38:57<3:51:31,  3.96s/it]Training 1/2 epoch (loss 0.4473):  15%|▌   | 603/4114 [38:57<3:55:22,  4.02s/it]Training 1/2 epoch (loss 0.4414):  15%|▌   | 603/4114 [39:01<3:55:22,  4.02s/it]Training 1/2 epoch (loss 0.4414):  15%|▌   | 604/4114 [39:01<3:53:39,  3.99s/it]Training 1/2 epoch (loss 0.3867):  15%|▌   | 604/4114 [39:05<3:53:39,  3.99s/it]Training 1/2 epoch (loss 0.3867):  15%|▌   | 605/4114 [39:05<3:47:43,  3.89s/it]Training 1/2 epoch (loss 0.4746):  15%|▌   | 605/4114 [39:09<3:47:43,  3.89s/it]Training 1/2 epoch (loss 0.4746):  15%|▌   | 606/4114 [39:09<3:49:38,  3.93s/it]Training 1/2 epoch (loss 0.3340):  15%|▌   | 606/4114 [39:13<3:49:38,  3.93s/it]Training 1/2 epoch (loss 0.3340):  15%|▌   | 607/4114 [39:13<3:48:17,  3.91s/it]Training 1/2 epoch (loss 0.3398):  15%|▌   | 607/4114 [39:17<3:48:17,  3.91s/it]Training 1/2 epoch (loss 0.3398):  15%|▌   | 608/4114 [39:17<3:48:37,  3.91s/it]Training 1/2 epoch (loss 0.4199):  15%|▌   | 608/4114 [39:21<3:48:37,  3.91s/it]Training 1/2 epoch (loss 0.4199):  15%|▌   | 609/4114 [39:21<3:49:48,  3.93s/it]Training 1/2 epoch (loss 0.4199):  15%|▌   | 609/4114 [39:25<3:49:48,  3.93s/it]Training 1/2 epoch (loss 0.4199):  15%|▌   | 610/4114 [39:25<3:50:05,  3.94s/it]Training 1/2 epoch (loss 0.4453):  15%|▌   | 610/4114 [39:29<3:50:05,  3.94s/it]Training 1/2 epoch (loss 0.4453):  15%|▌   | 611/4114 [39:29<3:48:34,  3.91s/it]Training 1/2 epoch (loss 0.4375):  15%|▌   | 611/4114 [39:33<3:48:34,  3.91s/it]Training 1/2 epoch (loss 0.4375):  15%|▌   | 612/4114 [39:33<3:52:09,  3.98s/it]Training 1/2 epoch (loss 0.4277):  15%|▌   | 612/4114 [39:37<3:52:09,  3.98s/it]Training 1/2 epoch (loss 0.4277):  15%|▌   | 613/4114 [39:37<3:50:43,  3.95s/it]Training 1/2 epoch (loss 0.3359):  15%|▌   | 613/4114 [39:40<3:50:43,  3.95s/it]Training 1/2 epoch (loss 0.3359):  15%|▌   | 614/4114 [39:40<3:48:18,  3.91s/it]Training 1/2 epoch (loss 0.3770):  15%|▌   | 614/4114 [39:45<3:48:18,  3.91s/it]Training 1/2 epoch (loss 0.3770):  15%|▌   | 615/4114 [39:45<3:50:52,  3.96s/it]Training 1/2 epoch (loss 0.3984):  15%|▌   | 615/4114 [39:48<3:50:52,  3.96s/it]Training 1/2 epoch (loss 0.3984):  15%|▌   | 616/4114 [39:48<3:49:52,  3.94s/it]Training 1/2 epoch (loss 0.5469):  15%|▌   | 616/4114 [39:52<3:49:52,  3.94s/it]Training 1/2 epoch (loss 0.5469):  15%|▌   | 617/4114 [39:52<3:39:47,  3.77s/it]Training 1/2 epoch (loss 0.3438):  15%|▌   | 617/4114 [39:56<3:39:47,  3.77s/it]Training 1/2 epoch (loss 0.3438):  15%|▌   | 618/4114 [39:56<3:43:40,  3.84s/it]Training 1/2 epoch (loss 0.3613):  15%|▌   | 618/4114 [40:00<3:43:40,  3.84s/it]Training 1/2 epoch (loss 0.3613):  15%|▌   | 619/4114 [40:00<3:45:54,  3.88s/it]Training 1/2 epoch (loss 0.4414):  15%|▌   | 619/4114 [40:04<3:45:54,  3.88s/it]Training 1/2 epoch (loss 0.4414):  15%|▌   | 620/4114 [40:04<3:48:21,  3.92s/it]Training 1/2 epoch (loss 0.3047):  15%|▌   | 620/4114 [40:08<3:48:21,  3.92s/it]Training 1/2 epoch (loss 0.3047):  15%|▌   | 621/4114 [40:08<3:52:36,  4.00s/it]Training 1/2 epoch (loss 0.3320):  15%|▌   | 621/4114 [40:12<3:52:36,  4.00s/it]Training 1/2 epoch (loss 0.3320):  15%|▌   | 622/4114 [40:12<3:50:33,  3.96s/it]Training 1/2 epoch (loss 0.4121):  15%|▌   | 622/4114 [40:16<3:50:33,  3.96s/it]Training 1/2 epoch (loss 0.4121):  15%|▌   | 623/4114 [40:16<3:46:56,  3.90s/it]Training 1/2 epoch (loss 0.3496):  15%|▌   | 623/4114 [40:19<3:46:56,  3.90s/it]Training 1/2 epoch (loss 0.3496):  15%|▌   | 624/4114 [40:19<3:35:24,  3.70s/it]Training 1/2 epoch (loss 0.5117):  15%|▌   | 624/4114 [40:23<3:35:24,  3.70s/it]Training 1/2 epoch (loss 0.5117):  15%|▌   | 625/4114 [40:23<3:38:48,  3.76s/it]Training 1/2 epoch (loss 0.3594):  15%|▌   | 625/4114 [40:26<3:38:48,  3.76s/it]Training 1/2 epoch (loss 0.3594):  15%|▌   | 626/4114 [40:26<3:33:02,  3.66s/it]Training 1/2 epoch (loss 0.7500):  15%|▌   | 626/4114 [40:30<3:33:02,  3.66s/it]Training 1/2 epoch (loss 0.7500):  15%|▌   | 627/4114 [40:30<3:42:41,  3.83s/it]Training 1/2 epoch (loss 0.3145):  15%|▌   | 627/4114 [40:34<3:42:41,  3.83s/it]Training 1/2 epoch (loss 0.3145):  15%|▌   | 628/4114 [40:34<3:45:47,  3.89s/it]Training 1/2 epoch (loss 0.6328):  15%|▌   | 628/4114 [40:38<3:45:47,  3.89s/it]Training 1/2 epoch (loss 0.6328):  15%|▌   | 629/4114 [40:38<3:46:31,  3.90s/it]Training 1/2 epoch (loss 0.2422):  15%|▌   | 629/4114 [40:43<3:46:31,  3.90s/it]Training 1/2 epoch (loss 0.2422):  15%|▌   | 630/4114 [40:43<3:53:12,  4.02s/it]Training 1/2 epoch (loss 0.3398):  15%|▌   | 630/4114 [40:47<3:53:12,  4.02s/it]Training 1/2 epoch (loss 0.3398):  15%|▌   | 631/4114 [40:47<3:51:06,  3.98s/it]Training 1/2 epoch (loss 0.3359):  15%|▌   | 631/4114 [40:50<3:51:06,  3.98s/it]Training 1/2 epoch (loss 0.3359):  15%|▌   | 632/4114 [40:50<3:49:10,  3.95s/it]Training 1/2 epoch (loss 0.6016):  15%|▌   | 632/4114 [40:54<3:49:10,  3.95s/it]Training 1/2 epoch (loss 0.6016):  15%|▌   | 633/4114 [40:54<3:48:59,  3.95s/it]Training 1/2 epoch (loss 0.4023):  15%|▌   | 633/4114 [40:58<3:48:59,  3.95s/it]Training 1/2 epoch (loss 0.4023):  15%|▌   | 634/4114 [40:58<3:45:51,  3.89s/it]Training 1/2 epoch (loss 0.3242):  15%|▌   | 634/4114 [41:02<3:45:51,  3.89s/it]Training 1/2 epoch (loss 0.3242):  15%|▌   | 635/4114 [41:02<3:48:22,  3.94s/it]Training 1/2 epoch (loss 0.7383):  15%|▌   | 635/4114 [41:06<3:48:22,  3.94s/it]Training 1/2 epoch (loss 0.7383):  15%|▌   | 636/4114 [41:06<3:50:27,  3.98s/it]Training 1/2 epoch (loss 0.3770):  15%|▌   | 636/4114 [41:10<3:50:27,  3.98s/it]Training 1/2 epoch (loss 0.3770):  15%|▌   | 637/4114 [41:10<3:51:14,  3.99s/it]Training 1/2 epoch (loss 0.5312):  15%|▌   | 637/4114 [41:14<3:51:14,  3.99s/it]Training 1/2 epoch (loss 0.5312):  16%|▌   | 638/4114 [41:14<3:50:25,  3.98s/it]Training 1/2 epoch (loss 0.4570):  16%|▌   | 638/4114 [41:18<3:50:25,  3.98s/it]Training 1/2 epoch (loss 0.4570):  16%|▌   | 639/4114 [41:18<3:52:34,  4.02s/it]Training 1/2 epoch (loss 0.4160):  16%|▌   | 639/4114 [41:22<3:52:34,  4.02s/it]Training 1/2 epoch (loss 0.4160):  16%|▌   | 640/4114 [41:22<3:52:32,  4.02s/it]Training 1/2 epoch (loss 0.4492):  16%|▌   | 640/4114 [41:26<3:52:32,  4.02s/it]Training 1/2 epoch (loss 0.4492):  16%|▌   | 641/4114 [41:26<3:47:57,  3.94s/it]Training 1/2 epoch (loss 0.3594):  16%|▌   | 641/4114 [41:30<3:47:57,  3.94s/it]Training 1/2 epoch (loss 0.3594):  16%|▌   | 642/4114 [41:30<3:51:20,  4.00s/it]Training 1/2 epoch (loss 0.3379):  16%|▌   | 642/4114 [41:34<3:51:20,  4.00s/it]Training 1/2 epoch (loss 0.3379):  16%|▋   | 643/4114 [41:34<3:41:27,  3.83s/it]Training 1/2 epoch (loss 0.3438):  16%|▋   | 643/4114 [41:38<3:41:27,  3.83s/it]Training 1/2 epoch (loss 0.3438):  16%|▋   | 644/4114 [41:38<3:42:27,  3.85s/it]Training 1/2 epoch (loss 0.4043):  16%|▋   | 644/4114 [41:42<3:42:27,  3.85s/it]Training 1/2 epoch (loss 0.4043):  16%|▋   | 645/4114 [41:42<3:47:28,  3.93s/it]Training 1/2 epoch (loss 0.5508):  16%|▋   | 645/4114 [41:46<3:47:28,  3.93s/it]Training 1/2 epoch (loss 0.5508):  16%|▋   | 646/4114 [41:46<3:48:58,  3.96s/it]Training 1/2 epoch (loss 0.4395):  16%|▋   | 646/4114 [41:49<3:48:58,  3.96s/it]Training 1/2 epoch (loss 0.4395):  16%|▋   | 647/4114 [41:49<3:40:19,  3.81s/it]Training 1/2 epoch (loss 0.4844):  16%|▋   | 647/4114 [41:53<3:40:19,  3.81s/it]Training 1/2 epoch (loss 0.4844):  16%|▋   | 648/4114 [41:53<3:45:29,  3.90s/it]Training 1/2 epoch (loss 0.4023):  16%|▋   | 648/4114 [41:57<3:45:29,  3.90s/it]Training 1/2 epoch (loss 0.4023):  16%|▋   | 649/4114 [41:57<3:44:28,  3.89s/it]Training 1/2 epoch (loss 0.3672):  16%|▋   | 649/4114 [42:01<3:44:28,  3.89s/it]Training 1/2 epoch (loss 0.3672):  16%|▋   | 650/4114 [42:01<3:45:05,  3.90s/it]Training 1/2 epoch (loss 0.4453):  16%|▋   | 650/4114 [42:05<3:45:05,  3.90s/it]Training 1/2 epoch (loss 0.4453):  16%|▋   | 651/4114 [42:05<3:47:19,  3.94s/it]Training 1/2 epoch (loss 0.5312):  16%|▋   | 651/4114 [42:09<3:47:19,  3.94s/it]Training 1/2 epoch (loss 0.5312):  16%|▋   | 652/4114 [42:09<3:47:25,  3.94s/it]Training 1/2 epoch (loss 0.4629):  16%|▋   | 652/4114 [42:13<3:47:25,  3.94s/it]Training 1/2 epoch (loss 0.4629):  16%|▋   | 653/4114 [42:13<3:48:10,  3.96s/it]Training 1/2 epoch (loss 0.4375):  16%|▋   | 653/4114 [42:17<3:48:10,  3.96s/it]Training 1/2 epoch (loss 0.4375):  16%|▋   | 654/4114 [42:17<3:51:22,  4.01s/it]Training 1/2 epoch (loss 0.3789):  16%|▋   | 654/4114 [42:21<3:51:22,  4.01s/it]Training 1/2 epoch (loss 0.3789):  16%|▋   | 655/4114 [42:21<3:41:13,  3.84s/it]Training 1/2 epoch (loss 0.3262):  16%|▋   | 655/4114 [42:24<3:41:13,  3.84s/it]Training 1/2 epoch (loss 0.3262):  16%|▋   | 656/4114 [42:24<3:41:11,  3.84s/it]Training 1/2 epoch (loss 0.3750):  16%|▋   | 656/4114 [42:29<3:41:11,  3.84s/it]Training 1/2 epoch (loss 0.3750):  16%|▋   | 657/4114 [42:29<3:48:03,  3.96s/it]Training 1/2 epoch (loss 0.3613):  16%|▋   | 657/4114 [42:32<3:48:03,  3.96s/it]Training 1/2 epoch (loss 0.3613):  16%|▋   | 658/4114 [42:32<3:42:34,  3.86s/it]Training 1/2 epoch (loss 0.5156):  16%|▋   | 658/4114 [42:36<3:42:34,  3.86s/it]Training 1/2 epoch (loss 0.5156):  16%|▋   | 659/4114 [42:36<3:45:52,  3.92s/it]Training 1/2 epoch (loss 0.5234):  16%|▋   | 659/4114 [42:41<3:45:52,  3.92s/it]Training 1/2 epoch (loss 0.5234):  16%|▋   | 660/4114 [42:41<3:51:16,  4.02s/it]Training 1/2 epoch (loss 0.3359):  16%|▋   | 660/4114 [42:44<3:51:16,  4.02s/it]Training 1/2 epoch (loss 0.3359):  16%|▋   | 661/4114 [42:44<3:42:59,  3.87s/it]Training 1/2 epoch (loss 0.4629):  16%|▋   | 661/4114 [42:48<3:42:59,  3.87s/it]Training 1/2 epoch (loss 0.4629):  16%|▋   | 662/4114 [42:48<3:41:15,  3.85s/it]Training 1/2 epoch (loss 0.3125):  16%|▋   | 662/4114 [42:52<3:41:15,  3.85s/it]Training 1/2 epoch (loss 0.3125):  16%|▋   | 663/4114 [42:52<3:43:17,  3.88s/it]Training 1/2 epoch (loss 0.2871):  16%|▋   | 663/4114 [42:56<3:43:17,  3.88s/it]Training 1/2 epoch (loss 0.2871):  16%|▋   | 664/4114 [42:56<3:47:02,  3.95s/it]Training 1/2 epoch (loss 0.3516):  16%|▋   | 664/4114 [43:00<3:47:02,  3.95s/it]Training 1/2 epoch (loss 0.3516):  16%|▋   | 665/4114 [43:00<3:48:53,  3.98s/it]Training 1/2 epoch (loss 0.4961):  16%|▋   | 665/4114 [43:04<3:48:53,  3.98s/it]Training 1/2 epoch (loss 0.4961):  16%|▋   | 666/4114 [43:04<3:48:50,  3.98s/it]Training 1/2 epoch (loss 0.3574):  16%|▋   | 666/4114 [43:08<3:48:50,  3.98s/it]Training 1/2 epoch (loss 0.3574):  16%|▋   | 667/4114 [43:08<3:45:24,  3.92s/it]Training 1/2 epoch (loss 0.3477):  16%|▋   | 667/4114 [43:12<3:45:24,  3.92s/it]Training 1/2 epoch (loss 0.3477):  16%|▋   | 668/4114 [43:12<3:46:39,  3.95s/it]Training 1/2 epoch (loss 0.5820):  16%|▋   | 668/4114 [43:16<3:46:39,  3.95s/it]Training 1/2 epoch (loss 0.5820):  16%|▋   | 669/4114 [43:16<3:50:40,  4.02s/it]Training 1/2 epoch (loss 0.4199):  16%|▋   | 669/4114 [43:20<3:50:40,  4.02s/it]Training 1/2 epoch (loss 0.4199):  16%|▋   | 670/4114 [43:20<3:50:54,  4.02s/it]Training 1/2 epoch (loss 0.3984):  16%|▋   | 670/4114 [43:24<3:50:54,  4.02s/it]Training 1/2 epoch (loss 0.3984):  16%|▋   | 671/4114 [43:24<3:46:46,  3.95s/it]Training 1/2 epoch (loss 0.4023):  16%|▋   | 671/4114 [43:28<3:46:46,  3.95s/it]Training 1/2 epoch (loss 0.4023):  16%|▋   | 672/4114 [43:28<3:52:04,  4.05s/it]Training 1/2 epoch (loss 0.3848):  16%|▋   | 672/4114 [43:31<3:52:04,  4.05s/it]Training 1/2 epoch (loss 0.3848):  16%|▋   | 673/4114 [43:31<3:39:42,  3.83s/it]Training 1/2 epoch (loss 0.3984):  16%|▋   | 673/4114 [43:35<3:39:42,  3.83s/it]Training 1/2 epoch (loss 0.3984):  16%|▋   | 674/4114 [43:35<3:35:15,  3.75s/it]Training 1/2 epoch (loss 0.3242):  16%|▋   | 674/4114 [43:39<3:35:15,  3.75s/it]Training 1/2 epoch (loss 0.3242):  16%|▋   | 675/4114 [43:39<3:34:59,  3.75s/it]Training 1/2 epoch (loss 0.5234):  16%|▋   | 675/4114 [43:42<3:34:59,  3.75s/it]Training 1/2 epoch (loss 0.5234):  16%|▋   | 676/4114 [43:42<3:32:12,  3.70s/it]Training 1/2 epoch (loss 0.4727):  16%|▋   | 676/4114 [43:46<3:32:12,  3.70s/it]Training 1/2 epoch (loss 0.4727):  16%|▋   | 677/4114 [43:46<3:36:13,  3.77s/it]Training 1/2 epoch (loss 0.3359):  16%|▋   | 677/4114 [43:50<3:36:13,  3.77s/it]Training 1/2 epoch (loss 0.3359):  16%|▋   | 678/4114 [43:50<3:43:38,  3.91s/it]Training 1/2 epoch (loss 0.4531):  16%|▋   | 678/4114 [43:55<3:43:38,  3.91s/it]Training 1/2 epoch (loss 0.4531):  17%|▋   | 679/4114 [43:55<3:46:05,  3.95s/it]Training 1/2 epoch (loss 0.3555):  17%|▋   | 679/4114 [43:58<3:46:05,  3.95s/it]Training 1/2 epoch (loss 0.3555):  17%|▋   | 680/4114 [43:58<3:37:55,  3.81s/it]Training 1/2 epoch (loss 0.4688):  17%|▋   | 680/4114 [44:02<3:37:55,  3.81s/it]Training 1/2 epoch (loss 0.4688):  17%|▋   | 681/4114 [44:02<3:42:09,  3.88s/it]Training 1/2 epoch (loss 0.4688):  17%|▋   | 681/4114 [44:06<3:42:09,  3.88s/it]Training 1/2 epoch (loss 0.4688):  17%|▋   | 682/4114 [44:06<3:40:03,  3.85s/it]Training 1/2 epoch (loss 0.5938):  17%|▋   | 682/4114 [44:09<3:40:03,  3.85s/it]Training 1/2 epoch (loss 0.5938):  17%|▋   | 683/4114 [44:09<3:33:20,  3.73s/it]Training 1/2 epoch (loss 0.3125):  17%|▋   | 683/4114 [44:13<3:33:20,  3.73s/it]Training 1/2 epoch (loss 0.3125):  17%|▋   | 684/4114 [44:13<3:38:06,  3.82s/it]Training 1/2 epoch (loss 0.3496):  17%|▋   | 684/4114 [44:17<3:38:06,  3.82s/it]Training 1/2 epoch (loss 0.3496):  17%|▋   | 685/4114 [44:17<3:40:40,  3.86s/it]Training 1/2 epoch (loss 0.5234):  17%|▋   | 685/4114 [44:21<3:40:40,  3.86s/it]Training 1/2 epoch (loss 0.5234):  17%|▋   | 686/4114 [44:21<3:37:57,  3.81s/it]Training 1/2 epoch (loss 0.3691):  17%|▋   | 686/4114 [44:25<3:37:57,  3.81s/it]Training 1/2 epoch (loss 0.3691):  17%|▋   | 687/4114 [44:25<3:46:00,  3.96s/it]Training 1/2 epoch (loss 0.4434):  17%|▋   | 687/4114 [44:29<3:46:00,  3.96s/it]Training 1/2 epoch (loss 0.4434):  17%|▋   | 688/4114 [44:29<3:42:58,  3.91s/it]Training 1/2 epoch (loss 0.4297):  17%|▋   | 688/4114 [44:33<3:42:58,  3.91s/it]Training 1/2 epoch (loss 0.4297):  17%|▋   | 689/4114 [44:33<3:42:02,  3.89s/it]Training 1/2 epoch (loss 0.5156):  17%|▋   | 689/4114 [44:37<3:42:02,  3.89s/it]Training 1/2 epoch (loss 0.5156):  17%|▋   | 690/4114 [44:37<3:43:59,  3.93s/it]Training 1/2 epoch (loss 0.4141):  17%|▋   | 690/4114 [44:41<3:43:59,  3.93s/it]Training 1/2 epoch (loss 0.4141):  17%|▋   | 691/4114 [44:41<3:42:32,  3.90s/it]Training 1/2 epoch (loss 0.4316):  17%|▋   | 691/4114 [44:45<3:42:32,  3.90s/it]Training 1/2 epoch (loss 0.4316):  17%|▋   | 692/4114 [44:45<3:42:56,  3.91s/it]Training 1/2 epoch (loss 0.5352):  17%|▋   | 692/4114 [44:49<3:42:56,  3.91s/it]Training 1/2 epoch (loss 0.5352):  17%|▋   | 693/4114 [44:49<3:47:42,  3.99s/it]Training 1/2 epoch (loss 0.5820):  17%|▋   | 693/4114 [44:52<3:47:42,  3.99s/it]Training 1/2 epoch (loss 0.5820):  17%|▋   | 694/4114 [44:52<3:38:11,  3.83s/it]Training 1/2 epoch (loss 0.3008):  17%|▋   | 694/4114 [44:56<3:38:11,  3.83s/it]Training 1/2 epoch (loss 0.3008):  17%|▋   | 695/4114 [44:56<3:41:03,  3.88s/it]Training 1/2 epoch (loss 0.3262):  17%|▋   | 695/4114 [45:00<3:41:03,  3.88s/it]Training 1/2 epoch (loss 0.3262):  17%|▋   | 696/4114 [45:00<3:43:43,  3.93s/it]Training 1/2 epoch (loss 0.4980):  17%|▋   | 696/4114 [45:04<3:43:43,  3.93s/it]Training 1/2 epoch (loss 0.4980):  17%|▋   | 697/4114 [45:04<3:45:07,  3.95s/it]Training 1/2 epoch (loss 0.5469):  17%|▋   | 697/4114 [45:08<3:45:07,  3.95s/it]Training 1/2 epoch (loss 0.5469):  17%|▋   | 698/4114 [45:08<3:43:04,  3.92s/it]Training 1/2 epoch (loss 0.5156):  17%|▋   | 698/4114 [45:12<3:43:04,  3.92s/it]Training 1/2 epoch (loss 0.5156):  17%|▋   | 699/4114 [45:12<3:46:41,  3.98s/it]Training 1/2 epoch (loss 0.3594):  17%|▋   | 699/4114 [45:16<3:46:41,  3.98s/it]Training 1/2 epoch (loss 0.3594):  17%|▋   | 700/4114 [45:16<3:42:11,  3.91s/it]Training 1/2 epoch (loss 0.3203):  17%|▋   | 700/4114 [45:20<3:42:11,  3.91s/it]Training 1/2 epoch (loss 0.3203):  17%|▋   | 701/4114 [45:20<3:43:41,  3.93s/it]Training 1/2 epoch (loss 0.4141):  17%|▋   | 701/4114 [45:24<3:43:41,  3.93s/it]Training 1/2 epoch (loss 0.4141):  17%|▋   | 702/4114 [45:24<3:48:53,  4.03s/it]Training 1/2 epoch (loss 0.4844):  17%|▋   | 702/4114 [45:28<3:48:53,  4.03s/it]Training 1/2 epoch (loss 0.4844):  17%|▋   | 703/4114 [45:28<3:44:11,  3.94s/it]Training 1/2 epoch (loss 0.4395):  17%|▋   | 703/4114 [45:32<3:44:11,  3.94s/it]Training 1/2 epoch (loss 0.4395):  17%|▋   | 704/4114 [45:32<3:41:02,  3.89s/it]Training 1/2 epoch (loss 0.4316):  17%|▋   | 704/4114 [45:36<3:41:02,  3.89s/it]Training 1/2 epoch (loss 0.4316):  17%|▋   | 705/4114 [45:36<3:38:11,  3.84s/it]Training 1/2 epoch (loss 0.3809):  17%|▋   | 705/4114 [45:39<3:38:11,  3.84s/it]Training 1/2 epoch (loss 0.3809):  17%|▋   | 706/4114 [45:39<3:37:36,  3.83s/it]Training 1/2 epoch (loss 0.5312):  17%|▋   | 706/4114 [45:43<3:37:36,  3.83s/it]Training 1/2 epoch (loss 0.5312):  17%|▋   | 707/4114 [45:43<3:40:23,  3.88s/it]Training 1/2 epoch (loss 0.4785):  17%|▋   | 707/4114 [45:47<3:40:23,  3.88s/it]Training 1/2 epoch (loss 0.4785):  17%|▋   | 708/4114 [45:47<3:42:38,  3.92s/it]Training 1/2 epoch (loss 0.4707):  17%|▋   | 708/4114 [45:51<3:42:38,  3.92s/it]Training 1/2 epoch (loss 0.4707):  17%|▋   | 709/4114 [45:51<3:43:26,  3.94s/it]Training 1/2 epoch (loss 0.5117):  17%|▋   | 709/4114 [45:55<3:43:26,  3.94s/it]Training 1/2 epoch (loss 0.5117):  17%|▋   | 710/4114 [45:55<3:43:36,  3.94s/it]Training 1/2 epoch (loss 0.4336):  17%|▋   | 710/4114 [46:00<3:43:36,  3.94s/it]Training 1/2 epoch (loss 0.4336):  17%|▋   | 711/4114 [46:00<3:49:51,  4.05s/it]Training 1/2 epoch (loss 0.3105):  17%|▋   | 711/4114 [46:03<3:49:51,  4.05s/it]Training 1/2 epoch (loss 0.3105):  17%|▋   | 712/4114 [46:03<3:36:09,  3.81s/it]Training 1/2 epoch (loss 0.4258):  17%|▋   | 712/4114 [46:06<3:36:09,  3.81s/it]Training 1/2 epoch (loss 0.4258):  17%|▋   | 713/4114 [46:06<3:28:58,  3.69s/it]Training 1/2 epoch (loss 0.4453):  17%|▋   | 713/4114 [46:10<3:28:58,  3.69s/it]Training 1/2 epoch (loss 0.4453):  17%|▋   | 714/4114 [46:10<3:34:06,  3.78s/it]Training 1/2 epoch (loss 0.4844):  17%|▋   | 714/4114 [46:14<3:34:06,  3.78s/it]Training 1/2 epoch (loss 0.4844):  17%|▋   | 715/4114 [46:14<3:28:52,  3.69s/it]Training 1/2 epoch (loss 0.4414):  17%|▋   | 715/4114 [46:18<3:28:52,  3.69s/it]Training 1/2 epoch (loss 0.4414):  17%|▋   | 716/4114 [46:18<3:33:48,  3.78s/it]Training 1/2 epoch (loss 0.5312):  17%|▋   | 716/4114 [46:22<3:33:48,  3.78s/it]Training 1/2 epoch (loss 0.5312):  17%|▋   | 717/4114 [46:22<3:38:54,  3.87s/it]Training 1/2 epoch (loss 0.4297):  17%|▋   | 717/4114 [46:26<3:38:54,  3.87s/it]Training 1/2 epoch (loss 0.4297):  17%|▋   | 718/4114 [46:26<3:37:30,  3.84s/it]Training 1/2 epoch (loss 0.4668):  17%|▋   | 718/4114 [46:28<3:37:30,  3.84s/it]Training 1/2 epoch (loss 0.4668):  17%|▋   | 719/4114 [46:28<3:21:08,  3.55s/it]Training 1/2 epoch (loss 0.3926):  17%|▋   | 719/4114 [46:33<3:21:08,  3.55s/it]Training 1/2 epoch (loss 0.3926):  18%|▋   | 720/4114 [46:33<3:31:48,  3.74s/it]Training 1/2 epoch (loss 0.3887):  18%|▋   | 720/4114 [46:36<3:31:48,  3.74s/it]Training 1/2 epoch (loss 0.3887):  18%|▋   | 721/4114 [46:36<3:33:25,  3.77s/it]Training 1/2 epoch (loss 0.3945):  18%|▋   | 721/4114 [46:40<3:33:25,  3.77s/it]Training 1/2 epoch (loss 0.3945):  18%|▋   | 722/4114 [46:40<3:24:34,  3.62s/it]Training 1/2 epoch (loss 0.3730):  18%|▋   | 722/4114 [46:43<3:24:34,  3.62s/it]Training 1/2 epoch (loss 0.3730):  18%|▋   | 723/4114 [46:43<3:26:01,  3.65s/it]Training 1/2 epoch (loss 0.3340):  18%|▋   | 723/4114 [46:48<3:26:01,  3.65s/it]Training 1/2 epoch (loss 0.3340):  18%|▋   | 724/4114 [46:48<3:34:06,  3.79s/it]Training 1/2 epoch (loss 0.5469):  18%|▋   | 724/4114 [46:51<3:34:06,  3.79s/it]Training 1/2 epoch (loss 0.5469):  18%|▋   | 725/4114 [46:51<3:34:10,  3.79s/it]Training 1/2 epoch (loss 0.5195):  18%|▋   | 725/4114 [46:56<3:34:10,  3.79s/it]Training 1/2 epoch (loss 0.5195):  18%|▋   | 726/4114 [46:56<3:39:47,  3.89s/it]Training 1/2 epoch (loss 0.3809):  18%|▋   | 726/4114 [46:59<3:39:47,  3.89s/it]Training 1/2 epoch (loss 0.3809):  18%|▋   | 727/4114 [46:59<3:41:22,  3.92s/it]Training 1/2 epoch (loss 0.4629):  18%|▋   | 727/4114 [47:03<3:41:22,  3.92s/it]Training 1/2 epoch (loss 0.4629):  18%|▋   | 728/4114 [47:03<3:42:15,  3.94s/it]Training 1/2 epoch (loss 0.4941):  18%|▋   | 728/4114 [47:08<3:42:15,  3.94s/it]Training 1/2 epoch (loss 0.4941):  18%|▋   | 729/4114 [47:08<3:43:55,  3.97s/it]Training 1/2 epoch (loss 0.3984):  18%|▋   | 729/4114 [47:11<3:43:55,  3.97s/it]Training 1/2 epoch (loss 0.3984):  18%|▋   | 730/4114 [47:11<3:42:51,  3.95s/it]Training 1/2 epoch (loss 0.3828):  18%|▋   | 730/4114 [47:15<3:42:51,  3.95s/it]Training 1/2 epoch (loss 0.3828):  18%|▋   | 731/4114 [47:15<3:43:49,  3.97s/it]Training 1/2 epoch (loss 0.3477):  18%|▋   | 731/4114 [47:20<3:43:49,  3.97s/it]Training 1/2 epoch (loss 0.3477):  18%|▋   | 732/4114 [47:20<3:47:37,  4.04s/it]Training 1/2 epoch (loss 0.4922):  18%|▋   | 732/4114 [47:23<3:47:37,  4.04s/it]Training 1/2 epoch (loss 0.4922):  18%|▋   | 733/4114 [47:23<3:43:17,  3.96s/it]Training 1/2 epoch (loss 0.5664):  18%|▋   | 733/4114 [47:27<3:43:17,  3.96s/it]Training 1/2 epoch (loss 0.5664):  18%|▋   | 734/4114 [47:27<3:33:31,  3.79s/it]Training 1/2 epoch (loss 0.4102):  18%|▋   | 734/4114 [47:31<3:33:31,  3.79s/it]Training 1/2 epoch (loss 0.4102):  18%|▋   | 735/4114 [47:31<3:37:56,  3.87s/it]Training 1/2 epoch (loss 0.4727):  18%|▋   | 735/4114 [47:35<3:37:56,  3.87s/it]Training 1/2 epoch (loss 0.4727):  18%|▋   | 736/4114 [47:35<3:40:03,  3.91s/it]Training 1/2 epoch (loss 0.4004):  18%|▋   | 736/4114 [47:39<3:40:03,  3.91s/it]Training 1/2 epoch (loss 0.4004):  18%|▋   | 737/4114 [47:39<3:41:15,  3.93s/it]Training 1/2 epoch (loss 0.4844):  18%|▋   | 737/4114 [47:43<3:41:15,  3.93s/it]Training 1/2 epoch (loss 0.4844):  18%|▋   | 738/4114 [47:43<3:42:15,  3.95s/it]Training 1/2 epoch (loss 0.3301):  18%|▋   | 738/4114 [47:47<3:42:15,  3.95s/it]Training 1/2 epoch (loss 0.3301):  18%|▋   | 739/4114 [47:47<3:41:58,  3.95s/it]Training 1/2 epoch (loss 0.3164):  18%|▋   | 739/4114 [47:50<3:41:58,  3.95s/it]Training 1/2 epoch (loss 0.3164):  18%|▋   | 740/4114 [47:50<3:37:23,  3.87s/it]Training 1/2 epoch (loss 0.5508):  18%|▋   | 740/4114 [47:55<3:37:23,  3.87s/it]Training 1/2 epoch (loss 0.5508):  18%|▋   | 741/4114 [47:55<3:41:41,  3.94s/it]Training 1/2 epoch (loss 0.3027):  18%|▋   | 741/4114 [47:58<3:41:41,  3.94s/it]Training 1/2 epoch (loss 0.3027):  18%|▋   | 742/4114 [47:58<3:39:18,  3.90s/it]Training 1/2 epoch (loss 0.4355):  18%|▋   | 742/4114 [48:02<3:39:18,  3.90s/it]Training 1/2 epoch (loss 0.4355):  18%|▋   | 743/4114 [48:02<3:38:35,  3.89s/it]Training 1/2 epoch (loss 0.5078):  18%|▋   | 743/4114 [48:07<3:38:35,  3.89s/it]Training 1/2 epoch (loss 0.5078):  18%|▋   | 744/4114 [48:07<3:44:52,  4.00s/it]Training 1/2 epoch (loss 0.3633):  18%|▋   | 744/4114 [48:10<3:44:52,  4.00s/it]Training 1/2 epoch (loss 0.3633):  18%|▋   | 745/4114 [48:10<3:43:04,  3.97s/it]Training 1/2 epoch (loss 0.4414):  18%|▋   | 745/4114 [48:14<3:43:04,  3.97s/it]Training 1/2 epoch (loss 0.4414):  18%|▋   | 746/4114 [48:14<3:42:00,  3.95s/it]Training 1/2 epoch (loss 0.5703):  18%|▋   | 746/4114 [48:19<3:42:00,  3.95s/it]Training 1/2 epoch (loss 0.5703):  18%|▋   | 747/4114 [48:19<3:47:26,  4.05s/it]Training 1/2 epoch (loss 0.5078):  18%|▋   | 747/4114 [48:22<3:47:26,  4.05s/it]Training 1/2 epoch (loss 0.5078):  18%|▋   | 748/4114 [48:22<3:42:29,  3.97s/it]Training 1/2 epoch (loss 0.3633):  18%|▋   | 748/4114 [48:26<3:42:29,  3.97s/it]Training 1/2 epoch (loss 0.3633):  18%|▋   | 749/4114 [48:26<3:40:03,  3.92s/it]Training 1/2 epoch (loss 0.4961):  18%|▋   | 749/4114 [48:30<3:40:03,  3.92s/it]Training 1/2 epoch (loss 0.4961):  18%|▋   | 750/4114 [48:30<3:44:08,  4.00s/it]Training 1/2 epoch (loss 0.4062):  18%|▋   | 750/4114 [48:34<3:44:08,  4.00s/it]Training 1/2 epoch (loss 0.4062):  18%|▋   | 751/4114 [48:34<3:42:28,  3.97s/it]Training 1/2 epoch (loss 0.3906):  18%|▋   | 751/4114 [48:38<3:42:28,  3.97s/it]Training 1/2 epoch (loss 0.3906):  18%|▋   | 752/4114 [48:38<3:32:17,  3.79s/it]Training 1/2 epoch (loss 0.4551):  18%|▋   | 752/4114 [48:42<3:32:17,  3.79s/it]Training 1/2 epoch (loss 0.4551):  18%|▋   | 753/4114 [48:42<3:40:08,  3.93s/it]Training 1/2 epoch (loss 0.2910):  18%|▋   | 753/4114 [48:46<3:40:08,  3.93s/it]Training 1/2 epoch (loss 0.2910):  18%|▋   | 754/4114 [48:46<3:41:54,  3.96s/it]Training 1/2 epoch (loss 0.3398):  18%|▋   | 754/4114 [48:50<3:41:54,  3.96s/it]Training 1/2 epoch (loss 0.3398):  18%|▋   | 755/4114 [48:50<3:42:57,  3.98s/it]Training 1/2 epoch (loss 0.4023):  18%|▋   | 755/4114 [48:54<3:42:57,  3.98s/it]Training 1/2 epoch (loss 0.4023):  18%|▋   | 756/4114 [48:54<3:45:30,  4.03s/it]Training 1/2 epoch (loss 0.5508):  18%|▋   | 756/4114 [48:58<3:45:30,  4.03s/it]Training 1/2 epoch (loss 0.5508):  18%|▋   | 757/4114 [48:58<3:42:44,  3.98s/it]Training 1/2 epoch (loss 0.3398):  18%|▋   | 757/4114 [49:02<3:42:44,  3.98s/it]Training 1/2 epoch (loss 0.3398):  18%|▋   | 758/4114 [49:02<3:42:43,  3.98s/it]Training 1/2 epoch (loss 0.7227):  18%|▋   | 758/4114 [49:06<3:42:43,  3.98s/it]Training 1/2 epoch (loss 0.7227):  18%|▋   | 759/4114 [49:06<3:45:01,  4.02s/it]Training 1/2 epoch (loss 0.5469):  18%|▋   | 759/4114 [49:09<3:45:01,  4.02s/it]Training 1/2 epoch (loss 0.5469):  18%|▋   | 760/4114 [49:09<3:31:52,  3.79s/it]Training 1/2 epoch (loss 0.4688):  18%|▋   | 760/4114 [49:13<3:31:52,  3.79s/it]Training 1/2 epoch (loss 0.4688):  18%|▋   | 761/4114 [49:13<3:25:21,  3.67s/it]Training 1/2 epoch (loss 0.4648):  18%|▋   | 761/4114 [49:17<3:25:21,  3.67s/it]Training 1/2 epoch (loss 0.4648):  19%|▋   | 762/4114 [49:17<3:32:48,  3.81s/it]Training 1/2 epoch (loss 0.4004):  19%|▋   | 762/4114 [49:21<3:32:48,  3.81s/it]Training 1/2 epoch (loss 0.4004):  19%|▋   | 763/4114 [49:21<3:34:18,  3.84s/it]Training 1/2 epoch (loss 0.4883):  19%|▋   | 763/4114 [49:24<3:34:18,  3.84s/it]Training 1/2 epoch (loss 0.4883):  19%|▋   | 764/4114 [49:24<3:22:56,  3.63s/it]Training 1/2 epoch (loss 0.3984):  19%|▋   | 764/4114 [49:28<3:22:56,  3.63s/it]Training 1/2 epoch (loss 0.3984):  19%|▋   | 765/4114 [49:28<3:31:31,  3.79s/it]Training 1/2 epoch (loss 0.5664):  19%|▋   | 765/4114 [49:32<3:31:31,  3.79s/it]Training 1/2 epoch (loss 0.5664):  19%|▋   | 766/4114 [49:32<3:35:40,  3.87s/it]Training 1/2 epoch (loss 0.5508):  19%|▋   | 766/4114 [49:36<3:35:40,  3.87s/it]Training 1/2 epoch (loss 0.5508):  19%|▋   | 767/4114 [49:36<3:32:08,  3.80s/it]Training 1/2 epoch (loss 0.2598):  19%|▋   | 767/4114 [49:40<3:32:08,  3.80s/it]Training 1/2 epoch (loss 0.2598):  19%|▋   | 768/4114 [49:40<3:39:16,  3.93s/it]Training 1/2 epoch (loss 0.4238):  19%|▋   | 768/4114 [49:44<3:39:16,  3.93s/it]Training 1/2 epoch (loss 0.4238):  19%|▋   | 769/4114 [49:44<3:39:52,  3.94s/it]Training 1/2 epoch (loss 0.3984):  19%|▋   | 769/4114 [49:48<3:39:52,  3.94s/it]Training 1/2 epoch (loss 0.3984):  19%|▋   | 770/4114 [49:48<3:39:21,  3.94s/it]Training 1/2 epoch (loss 0.3164):  19%|▋   | 770/4114 [49:52<3:39:21,  3.94s/it]Training 1/2 epoch (loss 0.3164):  19%|▋   | 771/4114 [49:52<3:36:16,  3.88s/it]Training 1/2 epoch (loss 0.4277):  19%|▋   | 771/4114 [49:55<3:36:16,  3.88s/it]Training 1/2 epoch (loss 0.4277):  19%|▊   | 772/4114 [49:55<3:31:31,  3.80s/it]Training 1/2 epoch (loss 0.4512):  19%|▊   | 772/4114 [49:59<3:31:31,  3.80s/it]Training 1/2 epoch (loss 0.4512):  19%|▊   | 773/4114 [49:59<3:24:18,  3.67s/it]Training 1/2 epoch (loss 0.3594):  19%|▊   | 773/4114 [50:03<3:24:18,  3.67s/it]Training 1/2 epoch (loss 0.3594):  19%|▊   | 774/4114 [50:03<3:32:06,  3.81s/it]Training 1/2 epoch (loss 0.5781):  19%|▊   | 774/4114 [50:07<3:32:06,  3.81s/it]Training 1/2 epoch (loss 0.5781):  19%|▊   | 775/4114 [50:07<3:33:37,  3.84s/it]Training 1/2 epoch (loss 0.3730):  19%|▊   | 775/4114 [50:10<3:33:37,  3.84s/it]Training 1/2 epoch (loss 0.3730):  19%|▊   | 776/4114 [50:10<3:23:49,  3.66s/it]Training 1/2 epoch (loss 0.2695):  19%|▊   | 776/4114 [50:14<3:23:49,  3.66s/it]Training 1/2 epoch (loss 0.2695):  19%|▊   | 777/4114 [50:14<3:33:04,  3.83s/it]Training 1/2 epoch (loss 0.2852):  19%|▊   | 777/4114 [50:18<3:33:04,  3.83s/it]Training 1/2 epoch (loss 0.2852):  19%|▊   | 778/4114 [50:18<3:36:15,  3.89s/it]Training 1/2 epoch (loss 0.3984):  19%|▊   | 778/4114 [50:22<3:36:15,  3.89s/it]Training 1/2 epoch (loss 0.3984):  19%|▊   | 779/4114 [50:22<3:38:14,  3.93s/it]Training 1/2 epoch (loss 0.4395):  19%|▊   | 779/4114 [50:26<3:38:14,  3.93s/it]Training 1/2 epoch (loss 0.4395):  19%|▊   | 780/4114 [50:26<3:43:07,  4.02s/it]Training 1/2 epoch (loss 0.4570):  19%|▊   | 780/4114 [50:30<3:43:07,  4.02s/it]Training 1/2 epoch (loss 0.4570):  19%|▊   | 781/4114 [50:30<3:41:12,  3.98s/it]Training 1/2 epoch (loss 0.3125):  19%|▊   | 781/4114 [50:34<3:41:12,  3.98s/it]Training 1/2 epoch (loss 0.3125):  19%|▊   | 782/4114 [50:34<3:33:15,  3.84s/it]Training 1/2 epoch (loss 0.3086):  19%|▊   | 782/4114 [50:38<3:33:15,  3.84s/it]Training 1/2 epoch (loss 0.3086):  19%|▊   | 783/4114 [50:38<3:36:52,  3.91s/it]Training 1/2 epoch (loss 0.5117):  19%|▊   | 783/4114 [50:41<3:36:52,  3.91s/it]Training 1/2 epoch (loss 0.5117):  19%|▊   | 784/4114 [50:41<3:28:13,  3.75s/it]Training 1/2 epoch (loss 0.4102):  19%|▊   | 784/4114 [50:45<3:28:13,  3.75s/it]Training 1/2 epoch (loss 0.4102):  19%|▊   | 785/4114 [50:45<3:31:31,  3.81s/it]Training 1/2 epoch (loss 0.3945):  19%|▊   | 785/4114 [50:49<3:31:31,  3.81s/it]Training 1/2 epoch (loss 0.3945):  19%|▊   | 786/4114 [50:49<3:36:58,  3.91s/it]Training 1/2 epoch (loss 0.3066):  19%|▊   | 786/4114 [50:53<3:36:58,  3.91s/it]Training 1/2 epoch (loss 0.3066):  19%|▊   | 787/4114 [50:53<3:37:22,  3.92s/it]Training 1/2 epoch (loss 0.2812):  19%|▊   | 787/4114 [50:57<3:37:22,  3.92s/it]Training 1/2 epoch (loss 0.2812):  19%|▊   | 788/4114 [50:57<3:39:22,  3.96s/it]Training 1/2 epoch (loss 0.4824):  19%|▊   | 788/4114 [51:01<3:39:22,  3.96s/it]Training 1/2 epoch (loss 0.4824):  19%|▊   | 789/4114 [51:01<3:36:13,  3.90s/it]Training 1/2 epoch (loss 0.4551):  19%|▊   | 789/4114 [51:05<3:36:13,  3.90s/it]Training 1/2 epoch (loss 0.4551):  19%|▊   | 790/4114 [51:05<3:34:35,  3.87s/it]Training 1/2 epoch (loss 0.3711):  19%|▊   | 790/4114 [51:09<3:34:35,  3.87s/it]Training 1/2 epoch (loss 0.3711):  19%|▊   | 791/4114 [51:09<3:35:03,  3.88s/it]Training 1/2 epoch (loss 0.5430):  19%|▊   | 791/4114 [51:13<3:35:03,  3.88s/it]Training 1/2 epoch (loss 0.5430):  19%|▊   | 792/4114 [51:13<3:40:52,  3.99s/it]Training 1/2 epoch (loss 0.2539):  19%|▊   | 792/4114 [51:17<3:40:52,  3.99s/it]Training 1/2 epoch (loss 0.2539):  19%|▊   | 793/4114 [51:17<3:37:03,  3.92s/it]Training 1/2 epoch (loss 0.3750):  19%|▊   | 793/4114 [51:21<3:37:03,  3.92s/it]Training 1/2 epoch (loss 0.3750):  19%|▊   | 794/4114 [51:21<3:34:58,  3.89s/it]Training 1/2 epoch (loss 0.5312):  19%|▊   | 794/4114 [51:24<3:34:58,  3.89s/it]Training 1/2 epoch (loss 0.5312):  19%|▊   | 795/4114 [51:24<3:31:00,  3.81s/it]Training 1/2 epoch (loss 0.5664):  19%|▊   | 795/4114 [51:28<3:31:00,  3.81s/it]Training 1/2 epoch (loss 0.5664):  19%|▊   | 796/4114 [51:28<3:26:16,  3.73s/it]Training 1/2 epoch (loss 0.2520):  19%|▊   | 796/4114 [51:32<3:26:16,  3.73s/it]Training 1/2 epoch (loss 0.2520):  19%|▊   | 797/4114 [51:32<3:29:29,  3.79s/it]Training 1/2 epoch (loss 0.3945):  19%|▊   | 797/4114 [51:36<3:29:29,  3.79s/it]Training 1/2 epoch (loss 0.3945):  19%|▊   | 798/4114 [51:36<3:33:01,  3.85s/it]Training 1/2 epoch (loss 0.4883):  19%|▊   | 798/4114 [51:40<3:33:01,  3.85s/it]Training 1/2 epoch (loss 0.4883):  19%|▊   | 799/4114 [51:40<3:36:08,  3.91s/it]Training 1/2 epoch (loss 0.4141):  19%|▊   | 799/4114 [51:44<3:36:08,  3.91s/it]Training 1/2 epoch (loss 0.4141):  19%|▊   | 800/4114 [51:44<3:37:08,  3.93s/it]Training 1/2 epoch (loss 0.4102):  19%|▊   | 800/4114 [51:48<3:37:08,  3.93s/it]Training 1/2 epoch (loss 0.4102):  19%|▊   | 801/4114 [51:48<3:42:51,  4.04s/it]Training 1/2 epoch (loss 0.3438):  19%|▊   | 801/4114 [51:52<3:42:51,  4.04s/it]Training 1/2 epoch (loss 0.3438):  19%|▊   | 802/4114 [51:52<3:41:24,  4.01s/it]Training 1/2 epoch (loss 0.2832):  19%|▊   | 802/4114 [51:56<3:41:24,  4.01s/it]Training 1/2 epoch (loss 0.2832):  20%|▊   | 803/4114 [51:56<3:38:58,  3.97s/it]Training 1/2 epoch (loss 0.5000):  20%|▊   | 803/4114 [52:00<3:38:58,  3.97s/it]Training 1/2 epoch (loss 0.5000):  20%|▊   | 804/4114 [52:00<3:42:40,  4.04s/it]Training 1/2 epoch (loss 0.4062):  20%|▊   | 804/4114 [52:04<3:42:40,  4.04s/it]Training 1/2 epoch (loss 0.4062):  20%|▊   | 805/4114 [52:04<3:40:30,  4.00s/it]Training 1/2 epoch (loss 0.3789):  20%|▊   | 805/4114 [52:08<3:40:30,  4.00s/it]Training 1/2 epoch (loss 0.3789):  20%|▊   | 806/4114 [52:08<3:36:20,  3.92s/it]Training 1/2 epoch (loss 0.3477):  20%|▊   | 806/4114 [52:12<3:36:20,  3.92s/it]Training 1/2 epoch (loss 0.3477):  20%|▊   | 807/4114 [52:12<3:41:20,  4.02s/it]Training 1/2 epoch (loss 0.4785):  20%|▊   | 807/4114 [52:16<3:41:20,  4.02s/it]Training 1/2 epoch (loss 0.4785):  20%|▊   | 808/4114 [52:16<3:40:01,  3.99s/it]Training 1/2 epoch (loss 0.3301):  20%|▊   | 808/4114 [52:19<3:40:01,  3.99s/it]Training 1/2 epoch (loss 0.3301):  20%|▊   | 809/4114 [52:19<3:30:56,  3.83s/it]Training 1/2 epoch (loss 0.4082):  20%|▊   | 809/4114 [52:23<3:30:56,  3.83s/it]Training 1/2 epoch (loss 0.4082):  20%|▊   | 810/4114 [52:23<3:28:46,  3.79s/it]Training 1/2 epoch (loss 0.5000):  20%|▊   | 810/4114 [52:27<3:28:46,  3.79s/it]Training 1/2 epoch (loss 0.5000):  20%|▊   | 811/4114 [52:27<3:28:48,  3.79s/it]Training 1/2 epoch (loss 0.3672):  20%|▊   | 811/4114 [52:31<3:28:48,  3.79s/it]Training 1/2 epoch (loss 0.3672):  20%|▊   | 812/4114 [52:31<3:28:23,  3.79s/it]Training 1/2 epoch (loss 0.4219):  20%|▊   | 812/4114 [52:34<3:28:23,  3.79s/it]Training 1/2 epoch (loss 0.4219):  20%|▊   | 813/4114 [52:34<3:24:18,  3.71s/it]Training 1/2 epoch (loss 0.3125):  20%|▊   | 813/4114 [52:38<3:24:18,  3.71s/it]Training 1/2 epoch (loss 0.3125):  20%|▊   | 814/4114 [52:38<3:29:03,  3.80s/it]Training 1/2 epoch (loss 0.4980):  20%|▊   | 814/4114 [52:42<3:29:03,  3.80s/it]Training 1/2 epoch (loss 0.4980):  20%|▊   | 815/4114 [52:42<3:28:44,  3.80s/it]Training 1/2 epoch (loss 0.4336):  20%|▊   | 815/4114 [52:46<3:28:44,  3.80s/it]Training 1/2 epoch (loss 0.4336):  20%|▊   | 816/4114 [52:46<3:36:57,  3.95s/it]Training 1/2 epoch (loss 0.4434):  20%|▊   | 816/4114 [52:50<3:36:57,  3.95s/it]Training 1/2 epoch (loss 0.4434):  20%|▊   | 817/4114 [52:50<3:37:35,  3.96s/it]Training 1/2 epoch (loss 0.4512):  20%|▊   | 817/4114 [52:54<3:37:35,  3.96s/it]Training 1/2 epoch (loss 0.4512):  20%|▊   | 818/4114 [52:54<3:38:11,  3.97s/it]Training 1/2 epoch (loss 0.2988):  20%|▊   | 818/4114 [52:58<3:38:11,  3.97s/it]Training 1/2 epoch (loss 0.2988):  20%|▊   | 819/4114 [52:58<3:32:46,  3.87s/it]Training 1/2 epoch (loss 0.3223):  20%|▊   | 819/4114 [53:02<3:32:46,  3.87s/it]Training 1/2 epoch (loss 0.3223):  20%|▊   | 820/4114 [53:02<3:34:05,  3.90s/it]Training 1/2 epoch (loss 0.3867):  20%|▊   | 820/4114 [53:06<3:34:05,  3.90s/it]Training 1/2 epoch (loss 0.3867):  20%|▊   | 821/4114 [53:06<3:34:08,  3.90s/it]Training 1/2 epoch (loss 0.3320):  20%|▊   | 821/4114 [53:10<3:34:08,  3.90s/it]Training 1/2 epoch (loss 0.3320):  20%|▊   | 822/4114 [53:10<3:40:13,  4.01s/it]Training 1/2 epoch (loss 0.4199):  20%|▊   | 822/4114 [53:14<3:40:13,  4.01s/it]Training 1/2 epoch (loss 0.4199):  20%|▊   | 823/4114 [53:14<3:34:45,  3.92s/it]Training 1/2 epoch (loss 0.4648):  20%|▊   | 823/4114 [53:17<3:34:45,  3.92s/it]Training 1/2 epoch (loss 0.4648):  20%|▊   | 824/4114 [53:17<3:30:57,  3.85s/it]Training 1/2 epoch (loss 0.5859):  20%|▊   | 824/4114 [53:21<3:30:57,  3.85s/it]Training 1/2 epoch (loss 0.5859):  20%|▊   | 825/4114 [53:21<3:27:14,  3.78s/it]Training 1/2 epoch (loss 0.4551):  20%|▊   | 825/4114 [53:24<3:27:14,  3.78s/it]Training 1/2 epoch (loss 0.4551):  20%|▊   | 826/4114 [53:24<3:08:43,  3.44s/it]Training 1/2 epoch (loss 0.3164):  20%|▊   | 826/4114 [53:27<3:08:43,  3.44s/it]Training 1/2 epoch (loss 0.3164):  20%|▊   | 827/4114 [53:27<3:09:25,  3.46s/it]Training 1/2 epoch (loss 0.4238):  20%|▊   | 827/4114 [53:31<3:09:25,  3.46s/it]Training 1/2 epoch (loss 0.4238):  20%|▊   | 828/4114 [53:31<3:12:57,  3.52s/it]Training 1/2 epoch (loss 0.3379):  20%|▊   | 828/4114 [53:35<3:12:57,  3.52s/it]Training 1/2 epoch (loss 0.3379):  20%|▊   | 829/4114 [53:35<3:21:25,  3.68s/it]Training 1/2 epoch (loss 0.4121):  20%|▊   | 829/4114 [53:39<3:21:25,  3.68s/it]Training 1/2 epoch (loss 0.4121):  20%|▊   | 830/4114 [53:39<3:22:53,  3.71s/it]Training 1/2 epoch (loss 0.4688):  20%|▊   | 830/4114 [53:43<3:22:53,  3.71s/it]Training 1/2 epoch (loss 0.4688):  20%|▊   | 831/4114 [53:43<3:31:23,  3.86s/it]Training 1/2 epoch (loss 0.5391):  20%|▊   | 831/4114 [53:46<3:31:23,  3.86s/it]Training 1/2 epoch (loss 0.5391):  20%|▊   | 832/4114 [53:46<3:24:03,  3.73s/it]Training 1/2 epoch (loss 0.4355):  20%|▊   | 832/4114 [53:50<3:24:03,  3.73s/it]Training 1/2 epoch (loss 0.4355):  20%|▊   | 833/4114 [53:50<3:27:55,  3.80s/it]Training 1/2 epoch (loss 0.3008):  20%|▊   | 833/4114 [53:54<3:27:55,  3.80s/it]Training 1/2 epoch (loss 0.3008):  20%|▊   | 834/4114 [53:54<3:32:35,  3.89s/it]Training 1/2 epoch (loss 0.5000):  20%|▊   | 834/4114 [53:58<3:32:35,  3.89s/it]Training 1/2 epoch (loss 0.5000):  20%|▊   | 835/4114 [53:58<3:31:12,  3.86s/it]Training 1/2 epoch (loss 0.4297):  20%|▊   | 835/4114 [54:02<3:31:12,  3.86s/it]Training 1/2 epoch (loss 0.4297):  20%|▊   | 836/4114 [54:02<3:29:44,  3.84s/it]Training 1/2 epoch (loss 0.2969):  20%|▊   | 836/4114 [54:06<3:29:44,  3.84s/it]Training 1/2 epoch (loss 0.2969):  20%|▊   | 837/4114 [54:06<3:35:50,  3.95s/it]Training 1/2 epoch (loss 0.4238):  20%|▊   | 837/4114 [54:10<3:35:50,  3.95s/it]Training 1/2 epoch (loss 0.4238):  20%|▊   | 838/4114 [54:10<3:31:50,  3.88s/it]Training 1/2 epoch (loss 0.2617):  20%|▊   | 838/4114 [54:13<3:31:50,  3.88s/it]Training 1/2 epoch (loss 0.2617):  20%|▊   | 839/4114 [54:13<3:23:56,  3.74s/it]Training 1/2 epoch (loss 0.2617):  20%|▊   | 839/4114 [54:17<3:23:56,  3.74s/it]Training 1/2 epoch (loss 0.2617):  20%|▊   | 840/4114 [54:17<3:29:15,  3.83s/it]Training 1/2 epoch (loss 0.4082):  20%|▊   | 840/4114 [54:21<3:29:15,  3.83s/it]Training 1/2 epoch (loss 0.4082):  20%|▊   | 841/4114 [54:21<3:29:19,  3.84s/it]Training 1/2 epoch (loss 0.4941):  20%|▊   | 841/4114 [54:24<3:29:19,  3.84s/it]Training 1/2 epoch (loss 0.4941):  20%|▊   | 842/4114 [54:24<3:07:45,  3.44s/it]Training 1/2 epoch (loss 0.4863):  20%|▊   | 842/4114 [54:28<3:07:45,  3.44s/it]Training 1/2 epoch (loss 0.4863):  20%|▊   | 843/4114 [54:28<3:20:26,  3.68s/it]Training 1/2 epoch (loss 0.3027):  20%|▊   | 843/4114 [54:32<3:20:26,  3.68s/it]Training 1/2 epoch (loss 0.3027):  21%|▊   | 844/4114 [54:32<3:18:40,  3.65s/it]Training 1/2 epoch (loss 0.3477):  21%|▊   | 844/4114 [54:35<3:18:40,  3.65s/it]Training 1/2 epoch (loss 0.3477):  21%|▊   | 845/4114 [54:35<3:09:07,  3.47s/it]Training 1/2 epoch (loss 0.4492):  21%|▊   | 845/4114 [54:39<3:09:07,  3.47s/it]Training 1/2 epoch (loss 0.4492):  21%|▊   | 846/4114 [54:39<3:22:11,  3.71s/it]Training 1/2 epoch (loss 0.4531):  21%|▊   | 846/4114 [54:43<3:22:11,  3.71s/it]Training 1/2 epoch (loss 0.4531):  21%|▊   | 847/4114 [54:43<3:21:38,  3.70s/it]Training 1/2 epoch (loss 0.4961):  21%|▊   | 847/4114 [54:46<3:21:38,  3.70s/it]Training 1/2 epoch (loss 0.4961):  21%|▊   | 848/4114 [54:46<3:25:35,  3.78s/it]Training 1/2 epoch (loss 0.3301):  21%|▊   | 848/4114 [54:51<3:25:35,  3.78s/it]Training 1/2 epoch (loss 0.3301):  21%|▊   | 849/4114 [54:51<3:29:31,  3.85s/it]Training 1/2 epoch (loss 0.4219):  21%|▊   | 849/4114 [54:54<3:29:31,  3.85s/it]Training 1/2 epoch (loss 0.4219):  21%|▊   | 850/4114 [54:54<3:29:24,  3.85s/it]Training 1/2 epoch (loss 0.4062):  21%|▊   | 850/4114 [54:58<3:29:24,  3.85s/it]Training 1/2 epoch (loss 0.4062):  21%|▊   | 851/4114 [54:58<3:28:12,  3.83s/it]Training 1/2 epoch (loss 0.5312):  21%|▊   | 851/4114 [55:02<3:28:12,  3.83s/it]Training 1/2 epoch (loss 0.5312):  21%|▊   | 852/4114 [55:02<3:32:39,  3.91s/it]Training 1/2 epoch (loss 0.4824):  21%|▊   | 852/4114 [55:06<3:32:39,  3.91s/it]Training 1/2 epoch (loss 0.4824):  21%|▊   | 853/4114 [55:06<3:30:23,  3.87s/it]Training 1/2 epoch (loss 0.3457):  21%|▊   | 853/4114 [55:10<3:30:23,  3.87s/it]Training 1/2 epoch (loss 0.3457):  21%|▊   | 854/4114 [55:10<3:31:44,  3.90s/it]Training 1/2 epoch (loss 0.6094):  21%|▊   | 854/4114 [55:14<3:31:44,  3.90s/it]Training 1/2 epoch (loss 0.6094):  21%|▊   | 855/4114 [55:14<3:36:27,  3.99s/it]Training 1/2 epoch (loss 0.4102):  21%|▊   | 855/4114 [55:17<3:36:27,  3.99s/it]Training 1/2 epoch (loss 0.4102):  21%|▊   | 856/4114 [55:17<3:22:52,  3.74s/it]Training 1/2 epoch (loss 0.3848):  21%|▊   | 856/4114 [55:21<3:22:52,  3.74s/it]Training 1/2 epoch (loss 0.3848):  21%|▊   | 857/4114 [55:21<3:18:10,  3.65s/it]Training 1/2 epoch (loss 0.5195):  21%|▊   | 857/4114 [55:25<3:18:10,  3.65s/it]Training 1/2 epoch (loss 0.5195):  21%|▊   | 858/4114 [55:25<3:27:57,  3.83s/it]Training 1/2 epoch (loss 0.3945):  21%|▊   | 858/4114 [55:29<3:27:57,  3.83s/it]Training 1/2 epoch (loss 0.3945):  21%|▊   | 859/4114 [55:29<3:22:08,  3.73s/it]Training 1/2 epoch (loss 0.4160):  21%|▊   | 859/4114 [55:32<3:22:08,  3.73s/it]Training 1/2 epoch (loss 0.4160):  21%|▊   | 860/4114 [55:32<3:25:48,  3.79s/it]Training 1/2 epoch (loss 0.3906):  21%|▊   | 860/4114 [55:37<3:25:48,  3.79s/it]Training 1/2 epoch (loss 0.3906):  21%|▊   | 861/4114 [55:37<3:32:31,  3.92s/it]Training 1/2 epoch (loss 0.4141):  21%|▊   | 861/4114 [55:40<3:32:31,  3.92s/it]Training 1/2 epoch (loss 0.4141):  21%|▊   | 862/4114 [55:40<3:28:46,  3.85s/it]Training 1/2 epoch (loss 0.4023):  21%|▊   | 862/4114 [55:44<3:28:46,  3.85s/it]Training 1/2 epoch (loss 0.4023):  21%|▊   | 863/4114 [55:44<3:31:13,  3.90s/it]Training 1/2 epoch (loss 0.2871):  21%|▊   | 863/4114 [55:48<3:31:13,  3.90s/it]Training 1/2 epoch (loss 0.2871):  21%|▊   | 864/4114 [55:48<3:31:18,  3.90s/it]Training 1/2 epoch (loss 0.4492):  21%|▊   | 864/4114 [55:52<3:31:18,  3.90s/it]Training 1/2 epoch (loss 0.4492):  21%|▊   | 865/4114 [55:52<3:31:40,  3.91s/it]Training 1/2 epoch (loss 0.3535):  21%|▊   | 865/4114 [55:56<3:31:40,  3.91s/it]Training 1/2 epoch (loss 0.3535):  21%|▊   | 866/4114 [55:56<3:33:45,  3.95s/it]Training 1/2 epoch (loss 0.4023):  21%|▊   | 866/4114 [56:00<3:33:45,  3.95s/it]Training 1/2 epoch (loss 0.4023):  21%|▊   | 867/4114 [56:00<3:37:02,  4.01s/it]Training 1/2 epoch (loss 0.2754):  21%|▊   | 867/4114 [56:04<3:37:02,  4.01s/it]Training 1/2 epoch (loss 0.2754):  21%|▊   | 868/4114 [56:04<3:36:57,  4.01s/it]Training 1/2 epoch (loss 0.2617):  21%|▊   | 868/4114 [56:08<3:36:57,  4.01s/it]Training 1/2 epoch (loss 0.2617):  21%|▊   | 869/4114 [56:08<3:34:48,  3.97s/it]Training 1/2 epoch (loss 0.5000):  21%|▊   | 869/4114 [56:12<3:34:48,  3.97s/it]Training 1/2 epoch (loss 0.5000):  21%|▊   | 870/4114 [56:12<3:36:29,  4.00s/it]Training 1/2 epoch (loss 0.3223):  21%|▊   | 870/4114 [56:16<3:36:29,  4.00s/it]Training 1/2 epoch (loss 0.3223):  21%|▊   | 871/4114 [56:16<3:35:25,  3.99s/it]Training 1/2 epoch (loss 0.4297):  21%|▊   | 871/4114 [56:20<3:35:25,  3.99s/it]Training 1/2 epoch (loss 0.4297):  21%|▊   | 872/4114 [56:20<3:34:10,  3.96s/it]Training 1/2 epoch (loss 0.3730):  21%|▊   | 872/4114 [56:24<3:34:10,  3.96s/it]Training 1/2 epoch (loss 0.3730):  21%|▊   | 873/4114 [56:24<3:37:20,  4.02s/it]Training 1/2 epoch (loss 0.6445):  21%|▊   | 873/4114 [56:28<3:37:20,  4.02s/it]Training 1/2 epoch (loss 0.6445):  21%|▊   | 874/4114 [56:28<3:35:20,  3.99s/it]Training 1/2 epoch (loss 0.4121):  21%|▊   | 874/4114 [56:32<3:35:20,  3.99s/it]Training 1/2 epoch (loss 0.4121):  21%|▊   | 875/4114 [56:32<3:28:34,  3.86s/it]Training 1/2 epoch (loss 0.3320):  21%|▊   | 875/4114 [56:36<3:28:34,  3.86s/it]Training 1/2 epoch (loss 0.3320):  21%|▊   | 876/4114 [56:36<3:25:14,  3.80s/it]Training 1/2 epoch (loss 0.4648):  21%|▊   | 876/4114 [56:39<3:25:14,  3.80s/it]Training 1/2 epoch (loss 0.4648):  21%|▊   | 877/4114 [56:39<3:19:29,  3.70s/it]Training 1/2 epoch (loss 0.3672):  21%|▊   | 877/4114 [56:43<3:19:29,  3.70s/it]Training 1/2 epoch (loss 0.3672):  21%|▊   | 878/4114 [56:43<3:25:04,  3.80s/it]Training 1/2 epoch (loss 0.3828):  21%|▊   | 878/4114 [56:47<3:25:04,  3.80s/it]Training 1/2 epoch (loss 0.3828):  21%|▊   | 879/4114 [56:47<3:28:16,  3.86s/it]Training 1/2 epoch (loss 0.4277):  21%|▊   | 879/4114 [56:51<3:28:16,  3.86s/it]Training 1/2 epoch (loss 0.4277):  21%|▊   | 880/4114 [56:51<3:31:39,  3.93s/it]Training 1/2 epoch (loss 0.3359):  21%|▊   | 880/4114 [56:55<3:31:39,  3.93s/it]Training 1/2 epoch (loss 0.3359):  21%|▊   | 881/4114 [56:55<3:29:13,  3.88s/it]Training 1/2 epoch (loss 0.5039):  21%|▊   | 881/4114 [56:59<3:29:13,  3.88s/it]Training 1/2 epoch (loss 0.5039):  21%|▊   | 882/4114 [56:59<3:31:13,  3.92s/it]Training 1/2 epoch (loss 0.3828):  21%|▊   | 882/4114 [57:02<3:31:13,  3.92s/it]Training 1/2 epoch (loss 0.3828):  21%|▊   | 883/4114 [57:02<3:20:59,  3.73s/it]Training 1/2 epoch (loss 0.3555):  21%|▊   | 883/4114 [57:05<3:20:59,  3.73s/it]Training 1/2 epoch (loss 0.3555):  21%|▊   | 884/4114 [57:05<3:09:12,  3.51s/it]Training 1/2 epoch (loss 0.4492):  21%|▊   | 884/4114 [57:09<3:09:12,  3.51s/it]Training 1/2 epoch (loss 0.4492):  22%|▊   | 885/4114 [57:09<3:17:22,  3.67s/it]Training 1/2 epoch (loss 0.6055):  22%|▊   | 885/4114 [57:13<3:17:22,  3.67s/it]Training 1/2 epoch (loss 0.6055):  22%|▊   | 886/4114 [57:13<3:20:47,  3.73s/it]Training 1/2 epoch (loss 0.3672):  22%|▊   | 886/4114 [57:17<3:20:47,  3.73s/it]Training 1/2 epoch (loss 0.3672):  22%|▊   | 887/4114 [57:17<3:21:31,  3.75s/it]Training 1/2 epoch (loss 0.5000):  22%|▊   | 887/4114 [57:21<3:21:31,  3.75s/it]Training 1/2 epoch (loss 0.5000):  22%|▊   | 888/4114 [57:21<3:29:38,  3.90s/it]Training 1/2 epoch (loss 0.3594):  22%|▊   | 888/4114 [57:25<3:29:38,  3.90s/it]Training 1/2 epoch (loss 0.3594):  22%|▊   | 889/4114 [57:25<3:30:49,  3.92s/it]Training 1/2 epoch (loss 0.5039):  22%|▊   | 889/4114 [57:29<3:30:49,  3.92s/it]Training 1/2 epoch (loss 0.5039):  22%|▊   | 890/4114 [57:29<3:32:56,  3.96s/it]Training 1/2 epoch (loss 0.3555):  22%|▊   | 890/4114 [57:33<3:32:56,  3.96s/it]Training 1/2 epoch (loss 0.3555):  22%|▊   | 891/4114 [57:33<3:28:00,  3.87s/it]Training 1/2 epoch (loss 0.4688):  22%|▊   | 891/4114 [57:37<3:28:00,  3.87s/it]Training 1/2 epoch (loss 0.4688):  22%|▊   | 892/4114 [57:37<3:28:53,  3.89s/it]Training 1/2 epoch (loss 0.5078):  22%|▊   | 892/4114 [57:40<3:28:53,  3.89s/it]Training 1/2 epoch (loss 0.5078):  22%|▊   | 893/4114 [57:40<3:22:50,  3.78s/it]Training 1/2 epoch (loss 0.3457):  22%|▊   | 893/4114 [57:44<3:22:50,  3.78s/it]Training 1/2 epoch (loss 0.3457):  22%|▊   | 894/4114 [57:44<3:26:31,  3.85s/it]Training 1/2 epoch (loss 0.5898):  22%|▊   | 894/4114 [57:48<3:26:31,  3.85s/it]Training 1/2 epoch (loss 0.5898):  22%|▊   | 895/4114 [57:48<3:26:23,  3.85s/it]Training 1/2 epoch (loss 0.3438):  22%|▊   | 895/4114 [57:52<3:26:23,  3.85s/it]Training 1/2 epoch (loss 0.3438):  22%|▊   | 896/4114 [57:52<3:27:34,  3.87s/it]Training 1/2 epoch (loss 0.2871):  22%|▊   | 896/4114 [57:56<3:27:34,  3.87s/it]Training 1/2 epoch (loss 0.2871):  22%|▊   | 897/4114 [57:56<3:31:38,  3.95s/it]Training 1/2 epoch (loss 0.4434):  22%|▊   | 897/4114 [58:00<3:31:38,  3.95s/it]Training 1/2 epoch (loss 0.4434):  22%|▊   | 898/4114 [58:00<3:28:43,  3.89s/it]Training 1/2 epoch (loss 0.2637):  22%|▊   | 898/4114 [58:04<3:28:43,  3.89s/it]Training 1/2 epoch (loss 0.2637):  22%|▊   | 899/4114 [58:04<3:28:05,  3.88s/it]Training 1/2 epoch (loss 0.4590):  22%|▊   | 899/4114 [58:08<3:28:05,  3.88s/it]Training 1/2 epoch (loss 0.4590):  22%|▉   | 900/4114 [58:08<3:30:48,  3.94s/it]Training 1/2 epoch (loss 0.3750):  22%|▉   | 900/4114 [58:12<3:30:48,  3.94s/it]Training 1/2 epoch (loss 0.3750):  22%|▉   | 901/4114 [58:12<3:30:32,  3.93s/it]Training 1/2 epoch (loss 0.4277):  22%|▉   | 901/4114 [58:15<3:30:32,  3.93s/it]Training 1/2 epoch (loss 0.4277):  22%|▉   | 902/4114 [58:15<3:25:18,  3.84s/it]Training 1/2 epoch (loss 0.4766):  22%|▉   | 902/4114 [58:20<3:25:18,  3.84s/it]Training 1/2 epoch (loss 0.4766):  22%|▉   | 903/4114 [58:20<3:29:41,  3.92s/it]Training 1/2 epoch (loss 0.3926):  22%|▉   | 903/4114 [58:24<3:29:41,  3.92s/it]Training 1/2 epoch (loss 0.3926):  22%|▉   | 904/4114 [58:24<3:32:28,  3.97s/it]Training 1/2 epoch (loss 0.3672):  22%|▉   | 904/4114 [58:28<3:32:28,  3.97s/it]Training 1/2 epoch (loss 0.3672):  22%|▉   | 905/4114 [58:28<3:31:44,  3.96s/it]Training 1/2 epoch (loss 0.5156):  22%|▉   | 905/4114 [58:32<3:31:44,  3.96s/it]Training 1/2 epoch (loss 0.5156):  22%|▉   | 906/4114 [58:32<3:36:35,  4.05s/it]Training 1/2 epoch (loss 0.4141):  22%|▉   | 906/4114 [58:35<3:36:35,  4.05s/it]Training 1/2 epoch (loss 0.4141):  22%|▉   | 907/4114 [58:35<3:28:23,  3.90s/it]Training 1/2 epoch (loss 0.3926):  22%|▉   | 907/4114 [58:39<3:28:23,  3.90s/it]Training 1/2 epoch (loss 0.3926):  22%|▉   | 908/4114 [58:39<3:26:38,  3.87s/it]Training 1/2 epoch (loss 0.5117):  22%|▉   | 908/4114 [58:43<3:26:38,  3.87s/it]Training 1/2 epoch (loss 0.5117):  22%|▉   | 909/4114 [58:43<3:30:20,  3.94s/it]Training 1/2 epoch (loss 0.4102):  22%|▉   | 909/4114 [58:47<3:30:20,  3.94s/it]Training 1/2 epoch (loss 0.4102):  22%|▉   | 910/4114 [58:47<3:21:49,  3.78s/it]Training 1/2 epoch (loss 0.3184):  22%|▉   | 910/4114 [58:51<3:21:49,  3.78s/it]Training 1/2 epoch (loss 0.3184):  22%|▉   | 911/4114 [58:51<3:26:00,  3.86s/it]Training 1/2 epoch (loss 0.3809):  22%|▉   | 911/4114 [58:55<3:26:00,  3.86s/it]Training 1/2 epoch (loss 0.3809):  22%|▉   | 912/4114 [58:55<3:31:47,  3.97s/it]Training 1/2 epoch (loss 0.3691):  22%|▉   | 912/4114 [58:58<3:31:47,  3.97s/it]Training 1/2 epoch (loss 0.3691):  22%|▉   | 913/4114 [58:58<3:13:55,  3.63s/it]Training 1/2 epoch (loss 0.4922):  22%|▉   | 913/4114 [59:02<3:13:55,  3.63s/it]Training 1/2 epoch (loss 0.4922):  22%|▉   | 914/4114 [59:02<3:20:28,  3.76s/it]Training 1/2 epoch (loss 0.4941):  22%|▉   | 914/4114 [59:06<3:20:28,  3.76s/it]Training 1/2 epoch (loss 0.4941):  22%|▉   | 915/4114 [59:06<3:24:35,  3.84s/it]Training 1/2 epoch (loss 0.4570):  22%|▉   | 915/4114 [59:09<3:24:35,  3.84s/it]Training 1/2 epoch (loss 0.4570):  22%|▉   | 916/4114 [59:09<3:18:53,  3.73s/it]Training 1/2 epoch (loss 0.3789):  22%|▉   | 916/4114 [59:13<3:18:53,  3.73s/it]Training 1/2 epoch (loss 0.3789):  22%|▉   | 917/4114 [59:13<3:21:18,  3.78s/it]Training 1/2 epoch (loss 0.3711):  22%|▉   | 917/4114 [59:17<3:21:18,  3.78s/it]Training 1/2 epoch (loss 0.3711):  22%|▉   | 918/4114 [59:17<3:27:05,  3.89s/it]Training 1/2 epoch (loss 0.4863):  22%|▉   | 918/4114 [59:21<3:27:05,  3.89s/it]Training 1/2 epoch (loss 0.4863):  22%|▉   | 919/4114 [59:21<3:25:32,  3.86s/it]Training 1/2 epoch (loss 0.4414):  22%|▉   | 919/4114 [59:25<3:25:32,  3.86s/it]Training 1/2 epoch (loss 0.4414):  22%|▉   | 920/4114 [59:25<3:18:27,  3.73s/it]Training 1/2 epoch (loss 0.4668):  22%|▉   | 920/4114 [59:29<3:18:27,  3.73s/it]Training 1/2 epoch (loss 0.4668):  22%|▉   | 921/4114 [59:29<3:26:39,  3.88s/it]Training 1/2 epoch (loss 0.3789):  22%|▉   | 921/4114 [59:32<3:26:39,  3.88s/it]Training 1/2 epoch (loss 0.3789):  22%|▉   | 922/4114 [59:32<3:22:27,  3.81s/it]Training 1/2 epoch (loss 0.4707):  22%|▉   | 922/4114 [59:36<3:22:27,  3.81s/it]Training 1/2 epoch (loss 0.4707):  22%|▉   | 923/4114 [59:36<3:24:41,  3.85s/it]Training 1/2 epoch (loss 0.4766):  22%|▉   | 923/4114 [59:41<3:24:41,  3.85s/it]Training 1/2 epoch (loss 0.4766):  22%|▉   | 924/4114 [59:41<3:29:23,  3.94s/it]Training 1/2 epoch (loss 0.4121):  22%|▉   | 924/4114 [59:44<3:29:23,  3.94s/it]Training 1/2 epoch (loss 0.4121):  22%|▉   | 925/4114 [59:44<3:28:43,  3.93s/it]Training 1/2 epoch (loss 0.3516):  22%|▉   | 925/4114 [59:48<3:28:43,  3.93s/it]Training 1/2 epoch (loss 0.3516):  23%|▉   | 926/4114 [59:48<3:29:23,  3.94s/it]Training 1/2 epoch (loss 0.5000):  23%|▉   | 926/4114 [59:53<3:29:23,  3.94s/it]Training 1/2 epoch (loss 0.5000):  23%|▉   | 927/4114 [59:53<3:33:04,  4.01s/it]Training 1/2 epoch (loss 0.3457):  23%|▉   | 927/4114 [59:56<3:33:04,  4.01s/it]Training 1/2 epoch (loss 0.3457):  23%|▉   | 928/4114 [59:56<3:29:41,  3.95s/it]Training 1/2 epoch (loss 0.4414):  23%|▍ | 928/4114 [1:00:00<3:29:41,  3.95s/it]Training 1/2 epoch (loss 0.4414):  23%|▍ | 929/4114 [1:00:00<3:27:41,  3.91s/it]Training 1/2 epoch (loss 0.4766):  23%|▍ | 929/4114 [1:00:04<3:27:41,  3.91s/it]Training 1/2 epoch (loss 0.4766):  23%|▍ | 930/4114 [1:00:04<3:30:26,  3.97s/it]Training 1/2 epoch (loss 0.4199):  23%|▍ | 930/4114 [1:00:08<3:30:26,  3.97s/it]Training 1/2 epoch (loss 0.4199):  23%|▍ | 931/4114 [1:00:08<3:29:45,  3.95s/it]Training 1/2 epoch (loss 0.3867):  23%|▍ | 931/4114 [1:00:12<3:29:45,  3.95s/it]Training 1/2 epoch (loss 0.3867):  23%|▍ | 932/4114 [1:00:12<3:26:42,  3.90s/it]Training 1/2 epoch (loss 0.3965):  23%|▍ | 932/4114 [1:00:16<3:26:42,  3.90s/it]Training 1/2 epoch (loss 0.3965):  23%|▍ | 933/4114 [1:00:16<3:28:06,  3.93s/it]Training 1/2 epoch (loss 0.4414):  23%|▍ | 933/4114 [1:00:20<3:28:06,  3.93s/it]Training 1/2 epoch (loss 0.4414):  23%|▍ | 934/4114 [1:00:20<3:28:55,  3.94s/it]Training 1/2 epoch (loss 0.3613):  23%|▍ | 934/4114 [1:00:24<3:28:55,  3.94s/it]Training 1/2 epoch (loss 0.3613):  23%|▍ | 935/4114 [1:00:24<3:29:30,  3.95s/it]Training 1/2 epoch (loss 0.3750):  23%|▍ | 935/4114 [1:00:28<3:29:30,  3.95s/it]Training 1/2 epoch (loss 0.3750):  23%|▍ | 936/4114 [1:00:28<3:27:23,  3.92s/it]Training 1/2 epoch (loss 0.4160):  23%|▍ | 936/4114 [1:00:32<3:27:23,  3.92s/it]Training 1/2 epoch (loss 0.4160):  23%|▍ | 937/4114 [1:00:32<3:26:16,  3.90s/it]Training 1/2 epoch (loss 0.4180):  23%|▍ | 937/4114 [1:00:35<3:26:16,  3.90s/it]Training 1/2 epoch (loss 0.4180):  23%|▍ | 938/4114 [1:00:35<3:18:17,  3.75s/it]Training 1/2 epoch (loss 0.4355):  23%|▍ | 938/4114 [1:00:39<3:18:17,  3.75s/it]Training 1/2 epoch (loss 0.4355):  23%|▍ | 939/4114 [1:00:39<3:24:36,  3.87s/it]Training 1/2 epoch (loss 0.4395):  23%|▍ | 939/4114 [1:00:43<3:24:36,  3.87s/it]Training 1/2 epoch (loss 0.4395):  23%|▍ | 940/4114 [1:00:43<3:18:35,  3.75s/it]Training 1/2 epoch (loss 0.4395):  23%|▍ | 940/4114 [1:00:47<3:18:35,  3.75s/it]Training 1/2 epoch (loss 0.4395):  23%|▍ | 941/4114 [1:00:47<3:22:30,  3.83s/it]Training 1/2 epoch (loss 0.3262):  23%|▍ | 941/4114 [1:00:51<3:22:30,  3.83s/it]Training 1/2 epoch (loss 0.3262):  23%|▍ | 942/4114 [1:00:51<3:29:12,  3.96s/it]Training 1/2 epoch (loss 0.3066):  23%|▍ | 942/4114 [1:00:55<3:29:12,  3.96s/it]Training 1/2 epoch (loss 0.3066):  23%|▍ | 943/4114 [1:00:55<3:28:32,  3.95s/it]Training 1/2 epoch (loss 0.4199):  23%|▍ | 943/4114 [1:00:59<3:28:32,  3.95s/it]Training 1/2 epoch (loss 0.4199):  23%|▍ | 944/4114 [1:00:59<3:28:20,  3.94s/it]Training 1/2 epoch (loss 0.3145):  23%|▍ | 944/4114 [1:01:03<3:28:20,  3.94s/it]Training 1/2 epoch (loss 0.3145):  23%|▍ | 945/4114 [1:01:03<3:24:28,  3.87s/it]Training 1/2 epoch (loss 0.4082):  23%|▍ | 945/4114 [1:01:06<3:24:28,  3.87s/it]Training 1/2 epoch (loss 0.4082):  23%|▍ | 946/4114 [1:01:06<3:25:05,  3.88s/it]Training 1/2 epoch (loss 0.5234):  23%|▍ | 946/4114 [1:01:10<3:25:05,  3.88s/it]Training 1/2 epoch (loss 0.5234):  23%|▍ | 947/4114 [1:01:10<3:27:58,  3.94s/it]Training 1/2 epoch (loss 0.3711):  23%|▍ | 947/4114 [1:01:15<3:27:58,  3.94s/it]Training 1/2 epoch (loss 0.3711):  23%|▍ | 948/4114 [1:01:15<3:32:16,  4.02s/it]Training 1/2 epoch (loss 0.3809):  23%|▍ | 948/4114 [1:01:19<3:32:16,  4.02s/it]Training 1/2 epoch (loss 0.3809):  23%|▍ | 949/4114 [1:01:19<3:29:49,  3.98s/it]Training 1/2 epoch (loss 0.5312):  23%|▍ | 949/4114 [1:01:23<3:29:49,  3.98s/it]Training 1/2 epoch (loss 0.5312):  23%|▍ | 950/4114 [1:01:23<3:29:46,  3.98s/it]Training 1/2 epoch (loss 0.4199):  23%|▍ | 950/4114 [1:01:27<3:29:46,  3.98s/it]Training 1/2 epoch (loss 0.4199):  23%|▍ | 951/4114 [1:01:27<3:32:57,  4.04s/it]Training 1/2 epoch (loss 0.3125):  23%|▍ | 951/4114 [1:01:31<3:32:57,  4.04s/it]Training 1/2 epoch (loss 0.3125):  23%|▍ | 952/4114 [1:01:31<3:28:30,  3.96s/it]Training 1/2 epoch (loss 0.3477):  23%|▍ | 952/4114 [1:01:34<3:28:30,  3.96s/it]Training 1/2 epoch (loss 0.3477):  23%|▍ | 953/4114 [1:01:34<3:28:34,  3.96s/it]Training 1/2 epoch (loss 0.2988):  23%|▍ | 953/4114 [1:01:38<3:28:34,  3.96s/it]Training 1/2 epoch (loss 0.2988):  23%|▍ | 954/4114 [1:01:38<3:28:59,  3.97s/it]Training 1/2 epoch (loss 0.5234):  23%|▍ | 954/4114 [1:01:42<3:28:59,  3.97s/it]Training 1/2 epoch (loss 0.5234):  23%|▍ | 955/4114 [1:01:42<3:28:50,  3.97s/it]Training 1/2 epoch (loss 0.5039):  23%|▍ | 955/4114 [1:01:45<3:28:50,  3.97s/it]Training 1/2 epoch (loss 0.5039):  23%|▍ | 956/4114 [1:01:45<3:07:57,  3.57s/it]Training 1/2 epoch (loss 0.4453):  23%|▍ | 956/4114 [1:01:49<3:07:57,  3.57s/it]Training 1/2 epoch (loss 0.4453):  23%|▍ | 957/4114 [1:01:49<3:17:37,  3.76s/it]Training 1/2 epoch (loss 0.5703):  23%|▍ | 957/4114 [1:01:53<3:17:37,  3.76s/it]Training 1/2 epoch (loss 0.5703):  23%|▍ | 958/4114 [1:01:53<3:19:17,  3.79s/it]Training 1/2 epoch (loss 0.6367):  23%|▍ | 958/4114 [1:01:57<3:19:17,  3.79s/it]Training 1/2 epoch (loss 0.6367):  23%|▍ | 959/4114 [1:01:57<3:18:48,  3.78s/it]Training 1/2 epoch (loss 0.3828):  23%|▍ | 959/4114 [1:02:01<3:18:48,  3.78s/it]Training 1/2 epoch (loss 0.3828):  23%|▍ | 960/4114 [1:02:01<3:25:59,  3.92s/it]Training 1/2 epoch (loss 0.4473):  23%|▍ | 960/4114 [1:02:05<3:25:59,  3.92s/it]Training 1/2 epoch (loss 0.4473):  23%|▍ | 961/4114 [1:02:05<3:27:07,  3.94s/it]Training 1/2 epoch (loss 0.3203):  23%|▍ | 961/4114 [1:02:09<3:27:07,  3.94s/it]Training 1/2 epoch (loss 0.3203):  23%|▍ | 962/4114 [1:02:09<3:25:13,  3.91s/it]Training 1/2 epoch (loss 0.3711):  23%|▍ | 962/4114 [1:02:13<3:25:13,  3.91s/it]Training 1/2 epoch (loss 0.3711):  23%|▍ | 963/4114 [1:02:13<3:28:21,  3.97s/it]Training 1/2 epoch (loss 0.4492):  23%|▍ | 963/4114 [1:02:17<3:28:21,  3.97s/it]Training 1/2 epoch (loss 0.4492):  23%|▍ | 964/4114 [1:02:17<3:25:27,  3.91s/it]Training 1/2 epoch (loss 0.4023):  23%|▍ | 964/4114 [1:02:21<3:25:27,  3.91s/it]Training 1/2 epoch (loss 0.4023):  23%|▍ | 965/4114 [1:02:21<3:25:39,  3.92s/it]Training 1/2 epoch (loss 0.6016):  23%|▍ | 965/4114 [1:02:25<3:25:39,  3.92s/it]Training 1/2 epoch (loss 0.6016):  23%|▍ | 966/4114 [1:02:25<3:28:41,  3.98s/it]Training 1/2 epoch (loss 0.3535):  23%|▍ | 966/4114 [1:02:28<3:28:41,  3.98s/it]Training 1/2 epoch (loss 0.3535):  24%|▍ | 967/4114 [1:02:28<3:16:23,  3.74s/it]Training 1/2 epoch (loss 0.4980):  24%|▍ | 967/4114 [1:02:31<3:16:23,  3.74s/it]Training 1/2 epoch (loss 0.4980):  24%|▍ | 968/4114 [1:02:31<3:07:17,  3.57s/it]Training 1/2 epoch (loss 0.3867):  24%|▍ | 968/4114 [1:02:35<3:07:17,  3.57s/it]Training 1/2 epoch (loss 0.3867):  24%|▍ | 969/4114 [1:02:35<3:16:59,  3.76s/it]Training 1/2 epoch (loss 0.4062):  24%|▍ | 969/4114 [1:02:39<3:16:59,  3.76s/it]Training 1/2 epoch (loss 0.4062):  24%|▍ | 970/4114 [1:02:39<3:16:50,  3.76s/it]Training 1/2 epoch (loss 0.3555):  24%|▍ | 970/4114 [1:02:43<3:16:50,  3.76s/it]Training 1/2 epoch (loss 0.3555):  24%|▍ | 971/4114 [1:02:43<3:17:06,  3.76s/it]Training 1/2 epoch (loss 0.4141):  24%|▍ | 971/4114 [1:02:47<3:17:06,  3.76s/it]Training 1/2 epoch (loss 0.4141):  24%|▍ | 972/4114 [1:02:47<3:22:53,  3.87s/it]Training 1/2 epoch (loss 0.5391):  24%|▍ | 972/4114 [1:02:51<3:22:53,  3.87s/it]Training 1/2 epoch (loss 0.5391):  24%|▍ | 973/4114 [1:02:51<3:25:02,  3.92s/it]Training 1/2 epoch (loss 0.4258):  24%|▍ | 973/4114 [1:02:55<3:25:02,  3.92s/it]Training 1/2 epoch (loss 0.4258):  24%|▍ | 974/4114 [1:02:55<3:24:55,  3.92s/it]Training 1/2 epoch (loss 0.5430):  24%|▍ | 974/4114 [1:02:59<3:24:55,  3.92s/it]Training 1/2 epoch (loss 0.5430):  24%|▍ | 975/4114 [1:02:59<3:27:39,  3.97s/it]Training 1/2 epoch (loss 0.3457):  24%|▍ | 975/4114 [1:03:03<3:27:39,  3.97s/it]Training 1/2 epoch (loss 0.3457):  24%|▍ | 976/4114 [1:03:03<3:26:43,  3.95s/it]Training 1/2 epoch (loss 0.5000):  24%|▍ | 976/4114 [1:03:07<3:26:43,  3.95s/it]Training 1/2 epoch (loss 0.5000):  24%|▍ | 977/4114 [1:03:07<3:22:50,  3.88s/it]Training 1/2 epoch (loss 0.3516):  24%|▍ | 977/4114 [1:03:11<3:22:50,  3.88s/it]Training 1/2 epoch (loss 0.3516):  24%|▍ | 978/4114 [1:03:11<3:26:43,  3.96s/it]Training 1/2 epoch (loss 0.3477):  24%|▍ | 978/4114 [1:03:15<3:26:43,  3.96s/it]Training 1/2 epoch (loss 0.3477):  24%|▍ | 979/4114 [1:03:15<3:24:05,  3.91s/it]Training 1/2 epoch (loss 0.3926):  24%|▍ | 979/4114 [1:03:18<3:24:05,  3.91s/it]Training 1/2 epoch (loss 0.3926):  24%|▍ | 980/4114 [1:03:18<3:15:05,  3.74s/it]Training 1/2 epoch (loss 0.4180):  24%|▍ | 980/4114 [1:03:22<3:15:05,  3.74s/it]Training 1/2 epoch (loss 0.4180):  24%|▍ | 981/4114 [1:03:22<3:20:01,  3.83s/it]Training 1/2 epoch (loss 0.3516):  24%|▍ | 981/4114 [1:03:25<3:20:01,  3.83s/it]Training 1/2 epoch (loss 0.3516):  24%|▍ | 982/4114 [1:03:25<3:07:08,  3.59s/it]Training 1/2 epoch (loss 0.4023):  24%|▍ | 982/4114 [1:03:29<3:07:08,  3.59s/it]Training 1/2 epoch (loss 0.4023):  24%|▍ | 983/4114 [1:03:29<3:14:24,  3.73s/it]Training 1/2 epoch (loss 0.4590):  24%|▍ | 983/4114 [1:03:33<3:14:24,  3.73s/it]Training 1/2 epoch (loss 0.4590):  24%|▍ | 984/4114 [1:03:33<3:21:04,  3.85s/it]Training 1/2 epoch (loss 0.4141):  24%|▍ | 984/4114 [1:03:37<3:21:04,  3.85s/it]Training 1/2 epoch (loss 0.4141):  24%|▍ | 985/4114 [1:03:37<3:21:51,  3.87s/it]Training 1/2 epoch (loss 0.3984):  24%|▍ | 985/4114 [1:03:41<3:21:51,  3.87s/it]Training 1/2 epoch (loss 0.3984):  24%|▍ | 986/4114 [1:03:41<3:23:37,  3.91s/it]Training 1/2 epoch (loss 0.3770):  24%|▍ | 986/4114 [1:03:45<3:23:37,  3.91s/it]Training 1/2 epoch (loss 0.3770):  24%|▍ | 987/4114 [1:03:45<3:16:00,  3.76s/it]Training 1/2 epoch (loss 0.3809):  24%|▍ | 987/4114 [1:03:49<3:16:00,  3.76s/it]Training 1/2 epoch (loss 0.3809):  24%|▍ | 988/4114 [1:03:49<3:20:30,  3.85s/it]Training 1/2 epoch (loss 0.4082):  24%|▍ | 988/4114 [1:03:53<3:20:30,  3.85s/it]Training 1/2 epoch (loss 0.4082):  24%|▍ | 989/4114 [1:03:53<3:20:29,  3.85s/it]Training 1/2 epoch (loss 0.4297):  24%|▍ | 989/4114 [1:03:57<3:20:29,  3.85s/it]Training 1/2 epoch (loss 0.4297):  24%|▍ | 990/4114 [1:03:57<3:24:44,  3.93s/it]Training 1/2 epoch (loss 0.4316):  24%|▍ | 990/4114 [1:04:01<3:24:44,  3.93s/it]Training 1/2 epoch (loss 0.4316):  24%|▍ | 991/4114 [1:04:01<3:24:42,  3.93s/it]Training 1/2 epoch (loss 0.4023):  24%|▍ | 991/4114 [1:04:05<3:24:42,  3.93s/it]Training 1/2 epoch (loss 0.4023):  24%|▍ | 992/4114 [1:04:05<3:24:34,  3.93s/it]Training 1/2 epoch (loss 0.4609):  24%|▍ | 992/4114 [1:04:09<3:24:34,  3.93s/it]Training 1/2 epoch (loss 0.4609):  24%|▍ | 993/4114 [1:04:09<3:28:00,  4.00s/it]Training 1/2 epoch (loss 0.4121):  24%|▍ | 993/4114 [1:04:13<3:28:00,  4.00s/it]Training 1/2 epoch (loss 0.4121):  24%|▍ | 994/4114 [1:04:13<3:25:30,  3.95s/it]Training 1/2 epoch (loss 0.3496):  24%|▍ | 994/4114 [1:04:16<3:25:30,  3.95s/it]Training 1/2 epoch (loss 0.3496):  24%|▍ | 995/4114 [1:04:16<3:21:22,  3.87s/it]Training 1/2 epoch (loss 0.3672):  24%|▍ | 995/4114 [1:04:20<3:21:22,  3.87s/it]Training 1/2 epoch (loss 0.3672):  24%|▍ | 996/4114 [1:04:20<3:22:43,  3.90s/it]Training 1/2 epoch (loss 0.4785):  24%|▍ | 996/4114 [1:04:24<3:22:43,  3.90s/it]Training 1/2 epoch (loss 0.4785):  24%|▍ | 997/4114 [1:04:24<3:23:40,  3.92s/it]Training 1/2 epoch (loss 0.5117):  24%|▍ | 997/4114 [1:04:28<3:23:40,  3.92s/it]Training 1/2 epoch (loss 0.5117):  24%|▍ | 998/4114 [1:04:28<3:21:17,  3.88s/it]Training 1/2 epoch (loss 0.5078):  24%|▍ | 998/4114 [1:04:32<3:21:17,  3.88s/it]Training 1/2 epoch (loss 0.5078):  24%|▍ | 999/4114 [1:04:32<3:23:53,  3.93s/it]Training 1/2 epoch (loss 0.4590):  24%|▍ | 999/4114 [1:04:36<3:23:53,  3.93s/it]Training 1/2 epoch (loss 0.4590):  24%|▏| 1000/4114 [1:04:36<3:25:22,  3.96s/it]Training 1/2 epoch (loss 0.2734):  24%|▏| 1000/4114 [1:04:40<3:25:22,  3.96s/it]Training 1/2 epoch (loss 0.2734):  24%|▏| 1001/4114 [1:04:40<3:18:39,  3.83s/it]Training 1/2 epoch (loss 0.5273):  24%|▏| 1001/4114 [1:04:44<3:18:39,  3.83s/it]Training 1/2 epoch (loss 0.5273):  24%|▏| 1002/4114 [1:04:44<3:21:43,  3.89s/it]Training 1/2 epoch (loss 0.4316):  24%|▏| 1002/4114 [1:04:47<3:21:43,  3.89s/it]Training 1/2 epoch (loss 0.4316):  24%|▏| 1003/4114 [1:04:47<3:22:30,  3.91s/it]Training 1/2 epoch (loss 0.3555):  24%|▏| 1003/4114 [1:04:51<3:22:30,  3.91s/it]Training 1/2 epoch (loss 0.3555):  24%|▏| 1004/4114 [1:04:51<3:21:22,  3.88s/it]Training 1/2 epoch (loss 0.3574):  24%|▏| 1004/4114 [1:04:55<3:21:22,  3.88s/it]Training 1/2 epoch (loss 0.3574):  24%|▏| 1005/4114 [1:04:55<3:24:12,  3.94s/it]Training 1/2 epoch (loss 0.4297):  24%|▏| 1005/4114 [1:04:59<3:24:12,  3.94s/it]Training 1/2 epoch (loss 0.4297):  24%|▏| 1006/4114 [1:04:59<3:25:21,  3.96s/it]Training 1/2 epoch (loss 0.4023):  24%|▏| 1006/4114 [1:05:03<3:25:21,  3.96s/it]Training 1/2 epoch (loss 0.4023):  24%|▏| 1007/4114 [1:05:03<3:25:43,  3.97s/it]Training 1/2 epoch (loss 0.5156):  24%|▏| 1007/4114 [1:05:08<3:25:43,  3.97s/it]Training 1/2 epoch (loss 0.5156):  25%|▏| 1008/4114 [1:05:08<3:30:18,  4.06s/it]Training 1/2 epoch (loss 0.4219):  25%|▏| 1008/4114 [1:05:12<3:30:18,  4.06s/it]Training 1/2 epoch (loss 0.4219):  25%|▏| 1009/4114 [1:05:12<3:31:06,  4.08s/it]Training 1/2 epoch (loss 0.3379):  25%|▏| 1009/4114 [1:05:15<3:31:06,  4.08s/it]Training 1/2 epoch (loss 0.3379):  25%|▏| 1010/4114 [1:05:15<3:22:57,  3.92s/it]Training 1/2 epoch (loss 0.3477):  25%|▏| 1010/4114 [1:05:20<3:22:57,  3.92s/it]Training 1/2 epoch (loss 0.3477):  25%|▏| 1011/4114 [1:05:20<3:27:11,  4.01s/it]Training 1/2 epoch (loss 0.3711):  25%|▏| 1011/4114 [1:05:23<3:27:11,  4.01s/it]Training 1/2 epoch (loss 0.3711):  25%|▏| 1012/4114 [1:05:23<3:21:14,  3.89s/it]Training 1/2 epoch (loss 0.4668):  25%|▏| 1012/4114 [1:05:27<3:21:14,  3.89s/it]Training 1/2 epoch (loss 0.4668):  25%|▏| 1013/4114 [1:05:27<3:19:59,  3.87s/it]Training 1/2 epoch (loss 0.3555):  25%|▏| 1013/4114 [1:05:31<3:19:59,  3.87s/it]Training 1/2 epoch (loss 0.3555):  25%|▏| 1014/4114 [1:05:31<3:22:41,  3.92s/it]Training 1/2 epoch (loss 0.3594):  25%|▏| 1014/4114 [1:05:35<3:22:41,  3.92s/it]Training 1/2 epoch (loss 0.3594):  25%|▏| 1015/4114 [1:05:35<3:20:41,  3.89s/it]Training 1/2 epoch (loss 0.4180):  25%|▏| 1015/4114 [1:05:38<3:20:41,  3.89s/it]Training 1/2 epoch (loss 0.4180):  25%|▏| 1016/4114 [1:05:38<3:06:47,  3.62s/it]Training 1/2 epoch (loss 0.5391):  25%|▏| 1016/4114 [1:05:42<3:06:47,  3.62s/it]Training 1/2 epoch (loss 0.5391):  25%|▏| 1017/4114 [1:05:42<3:15:57,  3.80s/it]Training 1/2 epoch (loss 0.4609):  25%|▏| 1017/4114 [1:05:46<3:15:57,  3.80s/it]Training 1/2 epoch (loss 0.4609):  25%|▏| 1018/4114 [1:05:46<3:16:12,  3.80s/it]Training 1/2 epoch (loss 0.3984):  25%|▏| 1018/4114 [1:05:50<3:16:12,  3.80s/it]Training 1/2 epoch (loss 0.3984):  25%|▏| 1019/4114 [1:05:50<3:19:01,  3.86s/it]Training 1/2 epoch (loss 0.3867):  25%|▏| 1019/4114 [1:05:54<3:19:01,  3.86s/it]Training 1/2 epoch (loss 0.3867):  25%|▏| 1020/4114 [1:05:54<3:21:41,  3.91s/it]Training 1/2 epoch (loss 0.4160):  25%|▏| 1020/4114 [1:05:58<3:21:41,  3.91s/it]Training 1/2 epoch (loss 0.4160):  25%|▏| 1021/4114 [1:05:58<3:20:48,  3.90s/it]Training 1/2 epoch (loss 0.5234):  25%|▏| 1021/4114 [1:06:02<3:20:48,  3.90s/it]Training 1/2 epoch (loss 0.5234):  25%|▏| 1022/4114 [1:06:02<3:21:11,  3.90s/it]Training 1/2 epoch (loss 0.3477):  25%|▏| 1022/4114 [1:06:05<3:21:11,  3.90s/it]Training 1/2 epoch (loss 0.3477):  25%|▏| 1023/4114 [1:06:05<3:18:49,  3.86s/it]Training 1/2 epoch (loss 0.4199):  25%|▏| 1023/4114 [1:06:09<3:18:49,  3.86s/it]Training 1/2 epoch (loss 0.4199):  25%|▏| 1024/4114 [1:06:09<3:18:08,  3.85s/it]Training 1/2 epoch (loss 0.3828):  25%|▏| 1024/4114 [1:06:13<3:18:08,  3.85s/it]Training 1/2 epoch (loss 0.3828):  25%|▏| 1025/4114 [1:06:13<3:17:15,  3.83s/it]Training 1/2 epoch (loss 0.5586):  25%|▏| 1025/4114 [1:06:17<3:17:15,  3.83s/it]Training 1/2 epoch (loss 0.5586):  25%|▏| 1026/4114 [1:06:17<3:13:37,  3.76s/it]Training 1/2 epoch (loss 0.4805):  25%|▏| 1026/4114 [1:06:21<3:13:37,  3.76s/it]Training 1/2 epoch (loss 0.4805):  25%|▏| 1027/4114 [1:06:21<3:15:28,  3.80s/it]Training 1/2 epoch (loss 0.4629):  25%|▏| 1027/4114 [1:06:24<3:15:28,  3.80s/it]Training 1/2 epoch (loss 0.4629):  25%|▏| 1028/4114 [1:06:24<3:08:00,  3.66s/it]Training 1/2 epoch (loss 0.5039):  25%|▏| 1028/4114 [1:06:28<3:08:00,  3.66s/it]Training 1/2 epoch (loss 0.5039):  25%|▎| 1029/4114 [1:06:28<3:16:07,  3.81s/it]Training 1/2 epoch (loss 0.5469):  25%|▎| 1029/4114 [1:06:32<3:16:07,  3.81s/it]Training 1/2 epoch (loss 0.5469):  25%|▎| 1030/4114 [1:06:32<3:17:14,  3.84s/it]Training 1/2 epoch (loss 0.3438):  25%|▎| 1030/4114 [1:06:36<3:17:14,  3.84s/it]Training 1/2 epoch (loss 0.3438):  25%|▎| 1031/4114 [1:06:36<3:17:02,  3.83s/it]Training 1/2 epoch (loss 0.5312):  25%|▎| 1031/4114 [1:06:39<3:17:02,  3.83s/it]Training 1/2 epoch (loss 0.5312):  25%|▎| 1032/4114 [1:06:39<3:08:17,  3.67s/it]Training 1/2 epoch (loss 0.3340):  25%|▎| 1032/4114 [1:06:43<3:08:17,  3.67s/it]Training 1/2 epoch (loss 0.3340):  25%|▎| 1033/4114 [1:06:43<3:12:30,  3.75s/it]Training 1/2 epoch (loss 0.4082):  25%|▎| 1033/4114 [1:06:47<3:12:30,  3.75s/it]Training 1/2 epoch (loss 0.4082):  25%|▎| 1034/4114 [1:06:47<3:14:05,  3.78s/it]Training 1/2 epoch (loss 0.4629):  25%|▎| 1034/4114 [1:06:51<3:14:05,  3.78s/it]Training 1/2 epoch (loss 0.4629):  25%|▎| 1035/4114 [1:06:51<3:17:44,  3.85s/it]Training 1/2 epoch (loss 0.3418):  25%|▎| 1035/4114 [1:06:55<3:17:44,  3.85s/it]Training 1/2 epoch (loss 0.3418):  25%|▎| 1036/4114 [1:06:55<3:18:31,  3.87s/it]Training 1/2 epoch (loss 0.5078):  25%|▎| 1036/4114 [1:06:59<3:18:31,  3.87s/it]Training 1/2 epoch (loss 0.5078):  25%|▎| 1037/4114 [1:06:59<3:18:28,  3.87s/it]Training 1/2 epoch (loss 0.2871):  25%|▎| 1037/4114 [1:07:03<3:18:28,  3.87s/it]Training 1/2 epoch (loss 0.2871):  25%|▎| 1038/4114 [1:07:03<3:22:02,  3.94s/it]Training 1/2 epoch (loss 0.4395):  25%|▎| 1038/4114 [1:07:07<3:22:02,  3.94s/it]Training 1/2 epoch (loss 0.4395):  25%|▎| 1039/4114 [1:07:07<3:22:39,  3.95s/it]Training 1/2 epoch (loss 0.3789):  25%|▎| 1039/4114 [1:07:11<3:22:39,  3.95s/it]Training 1/2 epoch (loss 0.3789):  25%|▎| 1040/4114 [1:07:11<3:22:55,  3.96s/it]Training 1/2 epoch (loss 0.4043):  25%|▎| 1040/4114 [1:07:15<3:22:55,  3.96s/it]Training 1/2 epoch (loss 0.4043):  25%|▎| 1041/4114 [1:07:15<3:27:22,  4.05s/it]Training 1/2 epoch (loss 0.4219):  25%|▎| 1041/4114 [1:07:18<3:27:22,  4.05s/it]Training 1/2 epoch (loss 0.4219):  25%|▎| 1042/4114 [1:07:18<3:05:57,  3.63s/it]Training 1/2 epoch (loss 0.4121):  25%|▎| 1042/4114 [1:07:21<3:05:57,  3.63s/it]Training 1/2 epoch (loss 0.4121):  25%|▎| 1043/4114 [1:07:21<3:08:37,  3.69s/it]Training 1/2 epoch (loss 0.4609):  25%|▎| 1043/4114 [1:07:26<3:08:37,  3.69s/it]Training 1/2 epoch (loss 0.4609):  25%|▎| 1044/4114 [1:07:26<3:16:29,  3.84s/it]Training 1/2 epoch (loss 0.3652):  25%|▎| 1044/4114 [1:07:29<3:16:29,  3.84s/it]Training 1/2 epoch (loss 0.3652):  25%|▎| 1045/4114 [1:07:29<3:17:05,  3.85s/it]Training 1/2 epoch (loss 0.3984):  25%|▎| 1045/4114 [1:07:33<3:17:05,  3.85s/it]Training 1/2 epoch (loss 0.3984):  25%|▎| 1046/4114 [1:07:33<3:16:31,  3.84s/it]Training 1/2 epoch (loss 0.3594):  25%|▎| 1046/4114 [1:07:37<3:16:31,  3.84s/it]Training 1/2 epoch (loss 0.3594):  25%|▎| 1047/4114 [1:07:37<3:18:25,  3.88s/it]Training 1/2 epoch (loss 0.3242):  25%|▎| 1047/4114 [1:07:41<3:18:25,  3.88s/it]Training 1/2 epoch (loss 0.3242):  25%|▎| 1048/4114 [1:07:41<3:17:52,  3.87s/it]Training 1/2 epoch (loss 0.3652):  25%|▎| 1048/4114 [1:07:45<3:17:52,  3.87s/it]Training 1/2 epoch (loss 0.3652):  25%|▎| 1049/4114 [1:07:45<3:16:44,  3.85s/it]Training 1/2 epoch (loss 0.5625):  25%|▎| 1049/4114 [1:07:49<3:16:44,  3.85s/it]Training 1/2 epoch (loss 0.5625):  26%|▎| 1050/4114 [1:07:49<3:20:52,  3.93s/it]Training 1/2 epoch (loss 0.3203):  26%|▎| 1050/4114 [1:07:53<3:20:52,  3.93s/it]Training 1/2 epoch (loss 0.3203):  26%|▎| 1051/4114 [1:07:53<3:19:00,  3.90s/it]Training 1/2 epoch (loss 0.4297):  26%|▎| 1051/4114 [1:07:57<3:19:00,  3.90s/it]Training 1/2 epoch (loss 0.4297):  26%|▎| 1052/4114 [1:07:57<3:17:12,  3.86s/it]Training 1/2 epoch (loss 0.4102):  26%|▎| 1052/4114 [1:08:01<3:17:12,  3.86s/it]Training 1/2 epoch (loss 0.4102):  26%|▎| 1053/4114 [1:08:01<3:20:30,  3.93s/it]Training 1/2 epoch (loss 0.4297):  26%|▎| 1053/4114 [1:08:05<3:20:30,  3.93s/it]Training 1/2 epoch (loss 0.4297):  26%|▎| 1054/4114 [1:08:05<3:19:03,  3.90s/it]Training 1/2 epoch (loss 0.4043):  26%|▎| 1054/4114 [1:08:08<3:19:03,  3.90s/it]Training 1/2 epoch (loss 0.4043):  26%|▎| 1055/4114 [1:08:08<3:16:44,  3.86s/it]Training 1/2 epoch (loss 0.3516):  26%|▎| 1055/4114 [1:08:12<3:16:44,  3.86s/it]Training 1/2 epoch (loss 0.3516):  26%|▎| 1056/4114 [1:08:13<3:21:08,  3.95s/it]Training 1/2 epoch (loss 0.4727):  26%|▎| 1056/4114 [1:08:16<3:21:08,  3.95s/it]Training 1/2 epoch (loss 0.4727):  26%|▎| 1057/4114 [1:08:16<3:19:57,  3.92s/it]Training 1/2 epoch (loss 0.5391):  26%|▎| 1057/4114 [1:08:20<3:19:57,  3.92s/it]Training 1/2 epoch (loss 0.5391):  26%|▎| 1058/4114 [1:08:20<3:20:14,  3.93s/it]Training 1/2 epoch (loss 0.3086):  26%|▎| 1058/4114 [1:08:24<3:20:14,  3.93s/it]Training 1/2 epoch (loss 0.3086):  26%|▎| 1059/4114 [1:08:24<3:23:20,  3.99s/it]Training 1/2 epoch (loss 0.4746):  26%|▎| 1059/4114 [1:08:28<3:23:20,  3.99s/it]Training 1/2 epoch (loss 0.4746):  26%|▎| 1060/4114 [1:08:28<3:20:58,  3.95s/it]Training 1/2 epoch (loss 0.3887):  26%|▎| 1060/4114 [1:08:32<3:20:58,  3.95s/it]Training 1/2 epoch (loss 0.3887):  26%|▎| 1061/4114 [1:08:32<3:10:18,  3.74s/it]Training 1/2 epoch (loss 0.4609):  26%|▎| 1061/4114 [1:08:36<3:10:18,  3.74s/it]Training 1/2 epoch (loss 0.4609):  26%|▎| 1062/4114 [1:08:36<3:13:53,  3.81s/it]Training 1/2 epoch (loss 0.4453):  26%|▎| 1062/4114 [1:08:39<3:13:53,  3.81s/it]Training 1/2 epoch (loss 0.4453):  26%|▎| 1063/4114 [1:08:39<3:14:56,  3.83s/it]Training 1/2 epoch (loss 0.4062):  26%|▎| 1063/4114 [1:08:43<3:14:56,  3.83s/it]Training 1/2 epoch (loss 0.4062):  26%|▎| 1064/4114 [1:08:43<3:16:42,  3.87s/it]Training 1/2 epoch (loss 0.4023):  26%|▎| 1064/4114 [1:08:47<3:16:42,  3.87s/it]Training 1/2 epoch (loss 0.4023):  26%|▎| 1065/4114 [1:08:47<3:18:32,  3.91s/it]Training 1/2 epoch (loss 0.4141):  26%|▎| 1065/4114 [1:08:51<3:18:32,  3.91s/it]Training 1/2 epoch (loss 0.4141):  26%|▎| 1066/4114 [1:08:51<3:09:45,  3.74s/it]Training 1/2 epoch (loss 0.4375):  26%|▎| 1066/4114 [1:08:54<3:09:45,  3.74s/it]Training 1/2 epoch (loss 0.4375):  26%|▎| 1067/4114 [1:08:54<3:10:08,  3.74s/it]Training 1/2 epoch (loss 0.4824):  26%|▎| 1067/4114 [1:08:59<3:10:08,  3.74s/it]Training 1/2 epoch (loss 0.4824):  26%|▎| 1068/4114 [1:08:59<3:18:12,  3.90s/it]Training 1/2 epoch (loss 0.4844):  26%|▎| 1068/4114 [1:09:03<3:18:12,  3.90s/it]Training 1/2 epoch (loss 0.4844):  26%|▎| 1069/4114 [1:09:03<3:19:47,  3.94s/it]Training 1/2 epoch (loss 0.4180):  26%|▎| 1069/4114 [1:09:07<3:19:47,  3.94s/it]Training 1/2 epoch (loss 0.4180):  26%|▎| 1070/4114 [1:09:07<3:20:56,  3.96s/it]Training 1/2 epoch (loss 0.5234):  26%|▎| 1070/4114 [1:09:10<3:20:56,  3.96s/it]Training 1/2 epoch (loss 0.5234):  26%|▎| 1071/4114 [1:09:10<3:14:04,  3.83s/it]Training 1/2 epoch (loss 0.3066):  26%|▎| 1071/4114 [1:09:14<3:14:04,  3.83s/it]Training 1/2 epoch (loss 0.3066):  26%|▎| 1072/4114 [1:09:14<3:16:02,  3.87s/it]Training 1/2 epoch (loss 0.6836):  26%|▎| 1072/4114 [1:09:18<3:16:02,  3.87s/it]Training 1/2 epoch (loss 0.6836):  26%|▎| 1073/4114 [1:09:18<3:17:30,  3.90s/it]Training 1/2 epoch (loss 0.3262):  26%|▎| 1073/4114 [1:09:22<3:17:30,  3.90s/it]Training 1/2 epoch (loss 0.3262):  26%|▎| 1074/4114 [1:09:22<3:11:43,  3.78s/it]Training 1/2 epoch (loss 0.4492):  26%|▎| 1074/4114 [1:09:26<3:11:43,  3.78s/it]Training 1/2 epoch (loss 0.4492):  26%|▎| 1075/4114 [1:09:26<3:11:44,  3.79s/it]Training 1/2 epoch (loss 0.3262):  26%|▎| 1075/4114 [1:09:30<3:11:44,  3.79s/it]Training 1/2 epoch (loss 0.3262):  26%|▎| 1076/4114 [1:09:30<3:14:42,  3.85s/it]Training 1/2 epoch (loss 0.3750):  26%|▎| 1076/4114 [1:09:33<3:14:42,  3.85s/it]Training 1/2 epoch (loss 0.3750):  26%|▎| 1077/4114 [1:09:33<3:11:58,  3.79s/it]Training 1/2 epoch (loss 0.3867):  26%|▎| 1077/4114 [1:09:37<3:11:58,  3.79s/it]Training 1/2 epoch (loss 0.3867):  26%|▎| 1078/4114 [1:09:37<3:12:02,  3.80s/it]Training 1/2 epoch (loss 0.4609):  26%|▎| 1078/4114 [1:09:41<3:12:02,  3.80s/it]Training 1/2 epoch (loss 0.4609):  26%|▎| 1079/4114 [1:09:41<3:14:28,  3.84s/it]Training 1/2 epoch (loss 0.3164):  26%|▎| 1079/4114 [1:09:45<3:14:28,  3.84s/it]Training 1/2 epoch (loss 0.3164):  26%|▎| 1080/4114 [1:09:45<3:13:37,  3.83s/it]Training 1/2 epoch (loss 0.3359):  26%|▎| 1080/4114 [1:09:49<3:13:37,  3.83s/it]Training 1/2 epoch (loss 0.3359):  26%|▎| 1081/4114 [1:09:49<3:14:42,  3.85s/it]Training 1/2 epoch (loss 0.4395):  26%|▎| 1081/4114 [1:09:52<3:14:42,  3.85s/it]Training 1/2 epoch (loss 0.4395):  26%|▎| 1082/4114 [1:09:52<3:13:41,  3.83s/it]Training 1/2 epoch (loss 0.4141):  26%|▎| 1082/4114 [1:09:57<3:13:41,  3.83s/it]Training 1/2 epoch (loss 0.4141):  26%|▎| 1083/4114 [1:09:57<3:20:16,  3.96s/it]Training 1/2 epoch (loss 0.3945):  26%|▎| 1083/4114 [1:10:01<3:20:16,  3.96s/it]Training 1/2 epoch (loss 0.3945):  26%|▎| 1084/4114 [1:10:01<3:19:08,  3.94s/it]Training 1/2 epoch (loss 0.3691):  26%|▎| 1084/4114 [1:10:04<3:19:08,  3.94s/it]Training 1/2 epoch (loss 0.3691):  26%|▎| 1085/4114 [1:10:04<3:16:52,  3.90s/it]Training 1/2 epoch (loss 0.6055):  26%|▎| 1085/4114 [1:10:08<3:16:52,  3.90s/it]Training 1/2 epoch (loss 0.6055):  26%|▎| 1086/4114 [1:10:08<3:18:58,  3.94s/it]Training 1/2 epoch (loss 0.4629):  26%|▎| 1086/4114 [1:10:12<3:18:58,  3.94s/it]Training 1/2 epoch (loss 0.4629):  26%|▎| 1087/4114 [1:10:12<3:20:17,  3.97s/it]Training 1/2 epoch (loss 0.4727):  26%|▎| 1087/4114 [1:10:16<3:20:17,  3.97s/it]Training 1/2 epoch (loss 0.4727):  26%|▎| 1088/4114 [1:10:16<3:19:23,  3.95s/it]Training 1/2 epoch (loss 0.4180):  26%|▎| 1088/4114 [1:10:20<3:19:23,  3.95s/it]Training 1/2 epoch (loss 0.4180):  26%|▎| 1089/4114 [1:10:20<3:19:30,  3.96s/it]Training 1/2 epoch (loss 0.4023):  26%|▎| 1089/4114 [1:10:24<3:19:30,  3.96s/it]Training 1/2 epoch (loss 0.4023):  26%|▎| 1090/4114 [1:10:24<3:19:36,  3.96s/it]Training 1/2 epoch (loss 0.4258):  26%|▎| 1090/4114 [1:10:28<3:19:36,  3.96s/it]Training 1/2 epoch (loss 0.4258):  27%|▎| 1091/4114 [1:10:28<3:17:55,  3.93s/it]Training 1/2 epoch (loss 0.4336):  27%|▎| 1091/4114 [1:10:32<3:17:55,  3.93s/it]Training 1/2 epoch (loss 0.4336):  27%|▎| 1092/4114 [1:10:32<3:20:13,  3.98s/it]Training 1/2 epoch (loss 0.3867):  27%|▎| 1092/4114 [1:10:36<3:20:13,  3.98s/it]Training 1/2 epoch (loss 0.3867):  27%|▎| 1093/4114 [1:10:36<3:18:24,  3.94s/it]Training 1/2 epoch (loss 0.3516):  27%|▎| 1093/4114 [1:10:40<3:18:24,  3.94s/it]Training 1/2 epoch (loss 0.3516):  27%|▎| 1094/4114 [1:10:40<3:19:44,  3.97s/it]Training 1/2 epoch (loss 0.3926):  27%|▎| 1094/4114 [1:10:44<3:19:44,  3.97s/it]Training 1/2 epoch (loss 0.3926):  27%|▎| 1095/4114 [1:10:44<3:22:23,  4.02s/it]Training 1/2 epoch (loss 0.3730):  27%|▎| 1095/4114 [1:10:48<3:22:23,  4.02s/it]Training 1/2 epoch (loss 0.3730):  27%|▎| 1096/4114 [1:10:48<3:14:56,  3.88s/it]Training 1/2 epoch (loss 0.2754):  27%|▎| 1096/4114 [1:10:52<3:14:56,  3.88s/it]Training 1/2 epoch (loss 0.2754):  27%|▎| 1097/4114 [1:10:52<3:14:14,  3.86s/it]Training 1/2 epoch (loss 0.4746):  27%|▎| 1097/4114 [1:10:56<3:14:14,  3.86s/it]Training 1/2 epoch (loss 0.4746):  27%|▎| 1098/4114 [1:10:56<3:18:02,  3.94s/it]Training 1/2 epoch (loss 0.4258):  27%|▎| 1098/4114 [1:11:00<3:18:02,  3.94s/it]Training 1/2 epoch (loss 0.4258):  27%|▎| 1099/4114 [1:11:00<3:17:02,  3.92s/it]Training 1/2 epoch (loss 0.3945):  27%|▎| 1099/4114 [1:11:04<3:17:02,  3.92s/it]Training 1/2 epoch (loss 0.3945):  27%|▎| 1100/4114 [1:11:04<3:18:12,  3.95s/it]Training 1/2 epoch (loss 0.4023):  27%|▎| 1100/4114 [1:11:08<3:18:12,  3.95s/it]Training 1/2 epoch (loss 0.4023):  27%|▎| 1101/4114 [1:11:08<3:22:33,  4.03s/it]Training 1/2 epoch (loss 0.4473):  27%|▎| 1101/4114 [1:11:12<3:22:33,  4.03s/it]Training 1/2 epoch (loss 0.4473):  27%|▎| 1102/4114 [1:11:12<3:22:30,  4.03s/it]Training 1/2 epoch (loss 0.2637):  27%|▎| 1102/4114 [1:11:16<3:22:30,  4.03s/it]Training 1/2 epoch (loss 0.2637):  27%|▎| 1103/4114 [1:11:16<3:18:40,  3.96s/it]Training 1/2 epoch (loss 0.3652):  27%|▎| 1103/4114 [1:11:19<3:18:40,  3.96s/it]Training 1/2 epoch (loss 0.3652):  27%|▎| 1104/4114 [1:11:19<3:11:31,  3.82s/it]Training 1/2 epoch (loss 0.3887):  27%|▎| 1104/4114 [1:11:23<3:11:31,  3.82s/it]Training 1/2 epoch (loss 0.3887):  27%|▎| 1105/4114 [1:11:23<3:12:59,  3.85s/it]Training 1/2 epoch (loss 0.3438):  27%|▎| 1105/4114 [1:11:27<3:12:59,  3.85s/it]Training 1/2 epoch (loss 0.3438):  27%|▎| 1106/4114 [1:11:27<3:13:54,  3.87s/it]Training 1/2 epoch (loss 0.4414):  27%|▎| 1106/4114 [1:11:31<3:13:54,  3.87s/it]Training 1/2 epoch (loss 0.4414):  27%|▎| 1107/4114 [1:11:31<3:17:37,  3.94s/it]Training 1/2 epoch (loss 0.4551):  27%|▎| 1107/4114 [1:11:35<3:17:37,  3.94s/it]Training 1/2 epoch (loss 0.4551):  27%|▎| 1108/4114 [1:11:35<3:16:02,  3.91s/it]Training 1/2 epoch (loss 0.2471):  27%|▎| 1108/4114 [1:11:39<3:16:02,  3.91s/it]Training 1/2 epoch (loss 0.2471):  27%|▎| 1109/4114 [1:11:39<3:18:19,  3.96s/it]Training 1/2 epoch (loss 0.4395):  27%|▎| 1109/4114 [1:11:43<3:18:19,  3.96s/it]Training 1/2 epoch (loss 0.4395):  27%|▎| 1110/4114 [1:11:43<3:21:00,  4.01s/it]Training 1/2 epoch (loss 0.3672):  27%|▎| 1110/4114 [1:11:47<3:21:00,  4.01s/it]Training 1/2 epoch (loss 0.3672):  27%|▎| 1111/4114 [1:11:47<3:17:55,  3.95s/it]Training 1/2 epoch (loss 0.5547):  27%|▎| 1111/4114 [1:11:51<3:17:55,  3.95s/it]Training 1/2 epoch (loss 0.5547):  27%|▎| 1112/4114 [1:11:51<3:16:18,  3.92s/it]Training 1/2 epoch (loss 0.6094):  27%|▎| 1112/4114 [1:11:55<3:16:18,  3.92s/it]Training 1/2 epoch (loss 0.6094):  27%|▎| 1113/4114 [1:11:55<3:19:23,  3.99s/it]Training 1/2 epoch (loss 0.2891):  27%|▎| 1113/4114 [1:11:59<3:19:23,  3.99s/it]Training 1/2 epoch (loss 0.2891):  27%|▎| 1114/4114 [1:11:59<3:15:51,  3.92s/it]Training 1/2 epoch (loss 0.5156):  27%|▎| 1114/4114 [1:12:03<3:15:51,  3.92s/it]Training 1/2 epoch (loss 0.5156):  27%|▎| 1115/4114 [1:12:03<3:14:01,  3.88s/it]Training 1/2 epoch (loss 0.4570):  27%|▎| 1115/4114 [1:12:06<3:14:01,  3.88s/it]Training 1/2 epoch (loss 0.4570):  27%|▎| 1116/4114 [1:12:06<3:07:36,  3.75s/it]Training 1/2 epoch (loss 0.4453):  27%|▎| 1116/4114 [1:12:10<3:07:36,  3.75s/it]Training 1/2 epoch (loss 0.4453):  27%|▎| 1117/4114 [1:12:10<3:10:06,  3.81s/it]Training 1/2 epoch (loss 0.4531):  27%|▎| 1117/4114 [1:12:14<3:10:06,  3.81s/it]Training 1/2 epoch (loss 0.4531):  27%|▎| 1118/4114 [1:12:14<3:06:39,  3.74s/it]Training 1/2 epoch (loss 0.4570):  27%|▎| 1118/4114 [1:12:17<3:06:39,  3.74s/it]Training 1/2 epoch (loss 0.4570):  27%|▎| 1119/4114 [1:12:17<3:08:51,  3.78s/it]Training 1/2 epoch (loss 0.4668):  27%|▎| 1119/4114 [1:12:21<3:08:51,  3.78s/it]Training 1/2 epoch (loss 0.4668):  27%|▎| 1120/4114 [1:12:21<3:09:20,  3.79s/it]Training 1/2 epoch (loss 0.3379):  27%|▎| 1120/4114 [1:12:25<3:09:20,  3.79s/it]Training 1/2 epoch (loss 0.3379):  27%|▎| 1121/4114 [1:12:25<3:12:39,  3.86s/it]Training 1/2 epoch (loss 0.2930):  27%|▎| 1121/4114 [1:12:29<3:12:39,  3.86s/it]Training 1/2 epoch (loss 0.2930):  27%|▎| 1122/4114 [1:12:29<3:08:52,  3.79s/it]Training 1/2 epoch (loss 0.4766):  27%|▎| 1122/4114 [1:12:33<3:08:52,  3.79s/it]Training 1/2 epoch (loss 0.4766):  27%|▎| 1123/4114 [1:12:33<3:08:45,  3.79s/it]Training 1/2 epoch (loss 0.5156):  27%|▎| 1123/4114 [1:12:36<3:08:45,  3.79s/it]Training 1/2 epoch (loss 0.5156):  27%|▎| 1124/4114 [1:12:36<3:09:18,  3.80s/it]Training 1/2 epoch (loss 0.4414):  27%|▎| 1124/4114 [1:12:41<3:09:18,  3.80s/it]Training 1/2 epoch (loss 0.4414):  27%|▎| 1125/4114 [1:12:41<3:13:22,  3.88s/it]Training 1/2 epoch (loss 0.5156):  27%|▎| 1125/4114 [1:12:44<3:13:22,  3.88s/it]Training 1/2 epoch (loss 0.5156):  27%|▎| 1126/4114 [1:12:44<3:12:39,  3.87s/it]Training 1/2 epoch (loss 0.4082):  27%|▎| 1126/4114 [1:12:48<3:12:39,  3.87s/it]Training 1/2 epoch (loss 0.4082):  27%|▎| 1127/4114 [1:12:48<3:13:50,  3.89s/it]Training 1/2 epoch (loss 0.4570):  27%|▎| 1127/4114 [1:12:52<3:13:50,  3.89s/it]Training 1/2 epoch (loss 0.4570):  27%|▎| 1128/4114 [1:12:52<3:17:20,  3.97s/it]Training 1/2 epoch (loss 0.5742):  27%|▎| 1128/4114 [1:12:56<3:17:20,  3.97s/it]Training 1/2 epoch (loss 0.5742):  27%|▎| 1129/4114 [1:12:56<3:14:33,  3.91s/it]Training 1/2 epoch (loss 0.4414):  27%|▎| 1129/4114 [1:13:00<3:14:33,  3.91s/it]Training 1/2 epoch (loss 0.4414):  27%|▎| 1130/4114 [1:13:00<3:15:31,  3.93s/it]Training 1/2 epoch (loss 0.5977):  27%|▎| 1130/4114 [1:13:04<3:15:31,  3.93s/it]Training 1/2 epoch (loss 0.5977):  27%|▎| 1131/4114 [1:13:04<3:18:25,  3.99s/it]Training 1/2 epoch (loss 0.3379):  27%|▎| 1131/4114 [1:13:08<3:18:25,  3.99s/it]Training 1/2 epoch (loss 0.3379):  28%|▎| 1132/4114 [1:13:08<3:19:27,  4.01s/it]Training 1/2 epoch (loss 0.3145):  28%|▎| 1132/4114 [1:13:12<3:19:27,  4.01s/it]Training 1/2 epoch (loss 0.3145):  28%|▎| 1133/4114 [1:13:12<3:17:27,  3.97s/it]Training 1/2 epoch (loss 0.3555):  28%|▎| 1133/4114 [1:13:16<3:17:27,  3.97s/it]Training 1/2 epoch (loss 0.3555):  28%|▎| 1134/4114 [1:13:16<3:19:17,  4.01s/it]Training 1/2 epoch (loss 0.3105):  28%|▎| 1134/4114 [1:13:20<3:19:17,  4.01s/it]Training 1/2 epoch (loss 0.3105):  28%|▎| 1135/4114 [1:13:20<3:17:13,  3.97s/it]Training 1/2 epoch (loss 0.4141):  28%|▎| 1135/4114 [1:13:24<3:17:13,  3.97s/it]Training 1/2 epoch (loss 0.4141):  28%|▎| 1136/4114 [1:13:24<3:13:58,  3.91s/it]Training 1/2 epoch (loss 0.4766):  28%|▎| 1136/4114 [1:13:28<3:13:58,  3.91s/it]Training 1/2 epoch (loss 0.4766):  28%|▎| 1137/4114 [1:13:28<3:07:29,  3.78s/it]Training 1/2 epoch (loss 0.3770):  28%|▎| 1137/4114 [1:13:31<3:07:29,  3.78s/it]Training 1/2 epoch (loss 0.3770):  28%|▎| 1138/4114 [1:13:31<3:09:22,  3.82s/it]Training 1/2 epoch (loss 0.3379):  28%|▎| 1138/4114 [1:13:35<3:09:22,  3.82s/it]Training 1/2 epoch (loss 0.3379):  28%|▎| 1139/4114 [1:13:35<3:08:13,  3.80s/it]Training 1/2 epoch (loss 0.4297):  28%|▎| 1139/4114 [1:13:39<3:08:13,  3.80s/it]Training 1/2 epoch (loss 0.4297):  28%|▎| 1140/4114 [1:13:39<3:14:04,  3.92s/it]Training 1/2 epoch (loss 0.4414):  28%|▎| 1140/4114 [1:13:42<3:14:04,  3.92s/it]Training 1/2 epoch (loss 0.4414):  28%|▎| 1141/4114 [1:13:42<3:00:01,  3.63s/it]Training 1/2 epoch (loss 0.4453):  28%|▎| 1141/4114 [1:13:46<3:00:01,  3.63s/it]Training 1/2 epoch (loss 0.4453):  28%|▎| 1142/4114 [1:13:46<3:06:43,  3.77s/it]Training 1/2 epoch (loss 0.4102):  28%|▎| 1142/4114 [1:13:50<3:06:43,  3.77s/it]Training 1/2 epoch (loss 0.4102):  28%|▎| 1143/4114 [1:13:50<3:10:11,  3.84s/it]Training 1/2 epoch (loss 0.4062):  28%|▎| 1143/4114 [1:13:54<3:10:11,  3.84s/it]Training 1/2 epoch (loss 0.4062):  28%|▎| 1144/4114 [1:13:54<3:03:53,  3.72s/it]Training 1/2 epoch (loss 0.4766):  28%|▎| 1144/4114 [1:13:58<3:03:53,  3.72s/it]Training 1/2 epoch (loss 0.4766):  28%|▎| 1145/4114 [1:13:58<3:07:06,  3.78s/it]Training 1/2 epoch (loss 0.4277):  28%|▎| 1145/4114 [1:14:02<3:07:06,  3.78s/it]Training 1/2 epoch (loss 0.4277):  28%|▎| 1146/4114 [1:14:02<3:10:59,  3.86s/it]Training 1/2 epoch (loss 0.4883):  28%|▎| 1146/4114 [1:14:06<3:10:59,  3.86s/it]Training 1/2 epoch (loss 0.4883):  28%|▎| 1147/4114 [1:14:06<3:09:36,  3.83s/it]Training 1/2 epoch (loss 0.3672):  28%|▎| 1147/4114 [1:14:10<3:09:36,  3.83s/it]Training 1/2 epoch (loss 0.3672):  28%|▎| 1148/4114 [1:14:10<3:10:56,  3.86s/it]Training 1/2 epoch (loss 0.3262):  28%|▎| 1148/4114 [1:14:13<3:10:56,  3.86s/it]Training 1/2 epoch (loss 0.3262):  28%|▎| 1149/4114 [1:14:13<3:11:18,  3.87s/it]Training 1/2 epoch (loss 0.5391):  28%|▎| 1149/4114 [1:14:17<3:11:18,  3.87s/it]Training 1/2 epoch (loss 0.5391):  28%|▎| 1150/4114 [1:14:17<3:09:54,  3.84s/it]Training 1/2 epoch (loss 0.5117):  28%|▎| 1150/4114 [1:14:21<3:09:54,  3.84s/it]Training 1/2 epoch (loss 0.5117):  28%|▎| 1151/4114 [1:14:21<3:08:29,  3.82s/it]Training 1/2 epoch (loss 0.5312):  28%|▎| 1151/4114 [1:14:25<3:08:29,  3.82s/it]Training 1/2 epoch (loss 0.5312):  28%|▎| 1152/4114 [1:14:25<3:15:17,  3.96s/it]Training 1/2 epoch (loss 0.4023):  28%|▎| 1152/4114 [1:14:29<3:15:17,  3.96s/it]Training 1/2 epoch (loss 0.4023):  28%|▎| 1153/4114 [1:14:29<3:13:04,  3.91s/it]Training 1/2 epoch (loss 0.4062):  28%|▎| 1153/4114 [1:14:33<3:13:04,  3.91s/it]Training 1/2 epoch (loss 0.4062):  28%|▎| 1154/4114 [1:14:33<3:08:22,  3.82s/it]Training 1/2 epoch (loss 0.3887):  28%|▎| 1154/4114 [1:14:37<3:08:22,  3.82s/it]Training 1/2 epoch (loss 0.3887):  28%|▎| 1155/4114 [1:14:37<3:15:13,  3.96s/it]Training 1/2 epoch (loss 0.4727):  28%|▎| 1155/4114 [1:14:40<3:15:13,  3.96s/it]Training 1/2 epoch (loss 0.4727):  28%|▎| 1156/4114 [1:14:40<3:07:28,  3.80s/it]Training 1/2 epoch (loss 0.5430):  28%|▎| 1156/4114 [1:14:44<3:07:28,  3.80s/it]Training 1/2 epoch (loss 0.5430):  28%|▎| 1157/4114 [1:14:44<3:09:21,  3.84s/it]Training 1/2 epoch (loss 0.2832):  28%|▎| 1157/4114 [1:14:48<3:09:21,  3.84s/it]Training 1/2 epoch (loss 0.2832):  28%|▎| 1158/4114 [1:14:48<3:12:53,  3.92s/it]Training 1/2 epoch (loss 0.2422):  28%|▎| 1158/4114 [1:14:52<3:12:53,  3.92s/it]Training 1/2 epoch (loss 0.2422):  28%|▎| 1159/4114 [1:14:52<3:10:17,  3.86s/it]Training 1/2 epoch (loss 0.5039):  28%|▎| 1159/4114 [1:14:56<3:10:17,  3.86s/it]Training 1/2 epoch (loss 0.5039):  28%|▎| 1160/4114 [1:14:56<3:03:37,  3.73s/it]Training 1/2 epoch (loss 0.3594):  28%|▎| 1160/4114 [1:15:00<3:03:37,  3.73s/it]Training 1/2 epoch (loss 0.3594):  28%|▎| 1161/4114 [1:15:00<3:07:13,  3.80s/it]Training 1/2 epoch (loss 0.4375):  28%|▎| 1161/4114 [1:15:03<3:07:13,  3.80s/it]Training 1/2 epoch (loss 0.4375):  28%|▎| 1162/4114 [1:15:03<3:06:46,  3.80s/it]Training 1/2 epoch (loss 0.3750):  28%|▎| 1162/4114 [1:15:07<3:06:46,  3.80s/it]Training 1/2 epoch (loss 0.3750):  28%|▎| 1163/4114 [1:15:07<3:07:10,  3.81s/it]Training 1/2 epoch (loss 0.4375):  28%|▎| 1163/4114 [1:15:11<3:07:10,  3.81s/it]Training 1/2 epoch (loss 0.4375):  28%|▎| 1164/4114 [1:15:11<3:04:36,  3.75s/it]Training 1/2 epoch (loss 0.4023):  28%|▎| 1164/4114 [1:15:15<3:04:36,  3.75s/it]Training 1/2 epoch (loss 0.4023):  28%|▎| 1165/4114 [1:15:15<3:07:54,  3.82s/it]Training 1/2 epoch (loss 0.3730):  28%|▎| 1165/4114 [1:15:19<3:07:54,  3.82s/it]Training 1/2 epoch (loss 0.3730):  28%|▎| 1166/4114 [1:15:19<3:07:48,  3.82s/it]Training 1/2 epoch (loss 0.4609):  28%|▎| 1166/4114 [1:15:23<3:07:48,  3.82s/it]Training 1/2 epoch (loss 0.4609):  28%|▎| 1167/4114 [1:15:23<3:10:12,  3.87s/it]Training 1/2 epoch (loss 0.3516):  28%|▎| 1167/4114 [1:15:27<3:10:12,  3.87s/it]Training 1/2 epoch (loss 0.3516):  28%|▎| 1168/4114 [1:15:27<3:11:54,  3.91s/it]Training 1/2 epoch (loss 0.4258):  28%|▎| 1168/4114 [1:15:30<3:11:54,  3.91s/it]Training 1/2 epoch (loss 0.4258):  28%|▎| 1169/4114 [1:15:30<3:11:48,  3.91s/it]Training 1/2 epoch (loss 0.3672):  28%|▎| 1169/4114 [1:15:35<3:11:48,  3.91s/it]Training 1/2 epoch (loss 0.3672):  28%|▎| 1170/4114 [1:15:35<3:13:49,  3.95s/it]Training 1/2 epoch (loss 0.4863):  28%|▎| 1170/4114 [1:15:39<3:13:49,  3.95s/it]Training 1/2 epoch (loss 0.4863):  28%|▎| 1171/4114 [1:15:39<3:14:48,  3.97s/it]Training 1/2 epoch (loss 0.4453):  28%|▎| 1171/4114 [1:15:42<3:14:48,  3.97s/it]Training 1/2 epoch (loss 0.4453):  28%|▎| 1172/4114 [1:15:42<3:12:51,  3.93s/it]Training 1/2 epoch (loss 0.4844):  28%|▎| 1172/4114 [1:15:46<3:12:51,  3.93s/it]Training 1/2 epoch (loss 0.4844):  29%|▎| 1173/4114 [1:15:46<3:15:00,  3.98s/it]Training 1/2 epoch (loss 0.5000):  29%|▎| 1173/4114 [1:15:50<3:15:00,  3.98s/it]Training 1/2 epoch (loss 0.5000):  29%|▎| 1174/4114 [1:15:50<3:03:44,  3.75s/it]Training 1/2 epoch (loss 0.3262):  29%|▎| 1174/4114 [1:15:53<3:03:44,  3.75s/it]Training 1/2 epoch (loss 0.3262):  29%|▎| 1175/4114 [1:15:53<2:58:14,  3.64s/it]Training 1/2 epoch (loss 0.4707):  29%|▎| 1175/4114 [1:15:57<2:58:14,  3.64s/it]Training 1/2 epoch (loss 0.4707):  29%|▎| 1176/4114 [1:15:57<3:02:30,  3.73s/it]Training 1/2 epoch (loss 0.3145):  29%|▎| 1176/4114 [1:16:01<3:02:30,  3.73s/it]Training 1/2 epoch (loss 0.3145):  29%|▎| 1177/4114 [1:16:01<2:59:59,  3.68s/it]Training 1/2 epoch (loss 0.3242):  29%|▎| 1177/4114 [1:16:04<2:59:59,  3.68s/it]Training 1/2 epoch (loss 0.3242):  29%|▎| 1178/4114 [1:16:04<3:03:01,  3.74s/it]Training 1/2 epoch (loss 0.3867):  29%|▎| 1178/4114 [1:16:09<3:03:01,  3.74s/it]Training 1/2 epoch (loss 0.3867):  29%|▎| 1179/4114 [1:16:09<3:08:28,  3.85s/it]Training 1/2 epoch (loss 0.3730):  29%|▎| 1179/4114 [1:16:12<3:08:28,  3.85s/it]Training 1/2 epoch (loss 0.3730):  29%|▎| 1180/4114 [1:16:12<3:07:52,  3.84s/it]Training 1/2 epoch (loss 0.3750):  29%|▎| 1180/4114 [1:16:16<3:07:52,  3.84s/it]Training 1/2 epoch (loss 0.3750):  29%|▎| 1181/4114 [1:16:16<3:00:03,  3.68s/it]Training 1/2 epoch (loss 0.3438):  29%|▎| 1181/4114 [1:16:20<3:00:03,  3.68s/it]Training 1/2 epoch (loss 0.3438):  29%|▎| 1182/4114 [1:16:20<3:05:25,  3.79s/it]Training 1/2 epoch (loss 0.4590):  29%|▎| 1182/4114 [1:16:24<3:05:25,  3.79s/it]Training 1/2 epoch (loss 0.4590):  29%|▎| 1183/4114 [1:16:24<3:08:04,  3.85s/it]Training 1/2 epoch (loss 0.5156):  29%|▎| 1183/4114 [1:16:28<3:08:04,  3.85s/it]Training 1/2 epoch (loss 0.5156):  29%|▎| 1184/4114 [1:16:28<3:09:45,  3.89s/it]Training 1/2 epoch (loss 0.4062):  29%|▎| 1184/4114 [1:16:32<3:09:45,  3.89s/it]Training 1/2 epoch (loss 0.4062):  29%|▎| 1185/4114 [1:16:32<3:13:15,  3.96s/it]Training 1/2 epoch (loss 0.5430):  29%|▎| 1185/4114 [1:16:36<3:13:15,  3.96s/it]Training 1/2 epoch (loss 0.5430):  29%|▎| 1186/4114 [1:16:36<3:13:31,  3.97s/it]Training 1/2 epoch (loss 0.2910):  29%|▎| 1186/4114 [1:16:40<3:13:31,  3.97s/it]Training 1/2 epoch (loss 0.2910):  29%|▎| 1187/4114 [1:16:40<3:10:28,  3.90s/it]Training 1/2 epoch (loss 0.2969):  29%|▎| 1187/4114 [1:16:44<3:10:28,  3.90s/it]Training 1/2 epoch (loss 0.2969):  29%|▎| 1188/4114 [1:16:44<3:13:51,  3.98s/it]Training 1/2 epoch (loss 0.4023):  29%|▎| 1188/4114 [1:16:48<3:13:51,  3.98s/it]Training 1/2 epoch (loss 0.4023):  29%|▎| 1189/4114 [1:16:48<3:12:38,  3.95s/it]Training 1/2 epoch (loss 0.4902):  29%|▎| 1189/4114 [1:16:51<3:12:38,  3.95s/it]Training 1/2 epoch (loss 0.4902):  29%|▎| 1190/4114 [1:16:51<3:10:45,  3.91s/it]Training 1/2 epoch (loss 0.2793):  29%|▎| 1190/4114 [1:16:56<3:10:45,  3.91s/it]Training 1/2 epoch (loss 0.2793):  29%|▎| 1191/4114 [1:16:56<3:14:40,  4.00s/it]Training 1/2 epoch (loss 0.3984):  29%|▎| 1191/4114 [1:17:00<3:14:40,  4.00s/it]Training 1/2 epoch (loss 0.3984):  29%|▎| 1192/4114 [1:17:00<3:12:46,  3.96s/it]Training 1/2 epoch (loss 0.6641):  29%|▎| 1192/4114 [1:17:03<3:12:46,  3.96s/it]Training 1/2 epoch (loss 0.6641):  29%|▎| 1193/4114 [1:17:03<3:10:29,  3.91s/it]Training 1/2 epoch (loss 0.4336):  29%|▎| 1193/4114 [1:17:07<3:10:29,  3.91s/it]Training 1/2 epoch (loss 0.4336):  29%|▎| 1194/4114 [1:17:07<3:10:36,  3.92s/it]Training 1/2 epoch (loss 0.3301):  29%|▎| 1194/4114 [1:17:10<3:10:36,  3.92s/it]Training 1/2 epoch (loss 0.3301):  29%|▎| 1195/4114 [1:17:10<2:56:51,  3.64s/it]Training 1/2 epoch (loss 0.3516):  29%|▎| 1195/4114 [1:17:14<2:56:51,  3.64s/it]Training 1/2 epoch (loss 0.3516):  29%|▎| 1196/4114 [1:17:14<3:02:44,  3.76s/it]Training 1/2 epoch (loss 0.4375):  29%|▎| 1196/4114 [1:17:18<3:02:44,  3.76s/it]Training 1/2 epoch (loss 0.4375):  29%|▎| 1197/4114 [1:17:18<3:08:41,  3.88s/it]Training 1/2 epoch (loss 0.3965):  29%|▎| 1197/4114 [1:17:22<3:08:41,  3.88s/it]Training 1/2 epoch (loss 0.3965):  29%|▎| 1198/4114 [1:17:22<3:09:01,  3.89s/it]Training 1/2 epoch (loss 0.4375):  29%|▎| 1198/4114 [1:17:26<3:09:01,  3.89s/it]Training 1/2 epoch (loss 0.4375):  29%|▎| 1199/4114 [1:17:26<3:06:28,  3.84s/it]Training 1/2 epoch (loss 0.4785):  29%|▎| 1199/4114 [1:17:30<3:06:28,  3.84s/it]Training 1/2 epoch (loss 0.4785):  29%|▎| 1200/4114 [1:17:30<3:10:22,  3.92s/it]Training 1/2 epoch (loss 0.3887):  29%|▎| 1200/4114 [1:17:34<3:10:22,  3.92s/it]Training 1/2 epoch (loss 0.3887):  29%|▎| 1201/4114 [1:17:34<3:08:51,  3.89s/it]Training 1/2 epoch (loss 0.3750):  29%|▎| 1201/4114 [1:17:37<3:08:51,  3.89s/it]Training 1/2 epoch (loss 0.3750):  29%|▎| 1202/4114 [1:17:37<3:01:51,  3.75s/it]Training 1/2 epoch (loss 0.3633):  29%|▎| 1202/4114 [1:17:42<3:01:51,  3.75s/it]Training 1/2 epoch (loss 0.3633):  29%|▎| 1203/4114 [1:17:42<3:08:50,  3.89s/it]Training 1/2 epoch (loss 0.4531):  29%|▎| 1203/4114 [1:17:45<3:08:50,  3.89s/it]Training 1/2 epoch (loss 0.4531):  29%|▎| 1204/4114 [1:17:45<3:07:06,  3.86s/it]Training 1/2 epoch (loss 0.4551):  29%|▎| 1204/4114 [1:17:49<3:07:06,  3.86s/it]Training 1/2 epoch (loss 0.4551):  29%|▎| 1205/4114 [1:17:49<3:08:04,  3.88s/it]Training 1/2 epoch (loss 0.5938):  29%|▎| 1205/4114 [1:17:54<3:08:04,  3.88s/it]Training 1/2 epoch (loss 0.5938):  29%|▎| 1206/4114 [1:17:54<3:12:03,  3.96s/it]Training 1/2 epoch (loss 0.4043):  29%|▎| 1206/4114 [1:17:57<3:12:03,  3.96s/it]Training 1/2 epoch (loss 0.4043):  29%|▎| 1207/4114 [1:17:57<3:09:14,  3.91s/it]Training 1/2 epoch (loss 0.5000):  29%|▎| 1207/4114 [1:18:01<3:09:14,  3.91s/it]Training 1/2 epoch (loss 0.5000):  29%|▎| 1208/4114 [1:18:01<3:05:45,  3.84s/it]Training 1/2 epoch (loss 0.4590):  29%|▎| 1208/4114 [1:18:05<3:05:45,  3.84s/it]Training 1/2 epoch (loss 0.4590):  29%|▎| 1209/4114 [1:18:05<3:11:21,  3.95s/it]Training 1/2 epoch (loss 0.3613):  29%|▎| 1209/4114 [1:18:09<3:11:21,  3.95s/it]Training 1/2 epoch (loss 0.3613):  29%|▎| 1210/4114 [1:18:09<3:02:47,  3.78s/it]Training 1/2 epoch (loss 0.4062):  29%|▎| 1210/4114 [1:18:12<3:02:47,  3.78s/it]Training 1/2 epoch (loss 0.4062):  29%|▎| 1211/4114 [1:18:12<3:02:54,  3.78s/it]Training 1/2 epoch (loss 0.4648):  29%|▎| 1211/4114 [1:18:16<3:02:54,  3.78s/it]Training 1/2 epoch (loss 0.4648):  29%|▎| 1212/4114 [1:18:16<3:08:18,  3.89s/it]Training 1/2 epoch (loss 0.3184):  29%|▎| 1212/4114 [1:18:21<3:08:18,  3.89s/it]Training 1/2 epoch (loss 0.3184):  29%|▎| 1213/4114 [1:18:21<3:10:02,  3.93s/it]Training 1/2 epoch (loss 0.3945):  29%|▎| 1213/4114 [1:18:24<3:10:02,  3.93s/it]Training 1/2 epoch (loss 0.3945):  30%|▎| 1214/4114 [1:18:24<3:09:53,  3.93s/it]Training 1/2 epoch (loss 0.4199):  30%|▎| 1214/4114 [1:18:28<3:09:53,  3.93s/it]Training 1/2 epoch (loss 0.4199):  30%|▎| 1215/4114 [1:18:28<3:09:48,  3.93s/it]Training 1/2 epoch (loss 0.4707):  30%|▎| 1215/4114 [1:18:32<3:09:48,  3.93s/it]Training 1/2 epoch (loss 0.4707):  30%|▎| 1216/4114 [1:18:32<3:12:07,  3.98s/it]Training 1/2 epoch (loss 0.5039):  30%|▎| 1216/4114 [1:18:36<3:12:07,  3.98s/it]Training 1/2 epoch (loss 0.5039):  30%|▎| 1217/4114 [1:18:36<3:09:02,  3.92s/it]Training 1/2 epoch (loss 0.3379):  30%|▎| 1217/4114 [1:18:40<3:09:02,  3.92s/it]Training 1/2 epoch (loss 0.3379):  30%|▎| 1218/4114 [1:18:40<3:08:03,  3.90s/it]Training 1/2 epoch (loss 0.4062):  30%|▎| 1218/4114 [1:18:44<3:08:03,  3.90s/it]Training 1/2 epoch (loss 0.4062):  30%|▎| 1219/4114 [1:18:44<3:09:41,  3.93s/it]Training 1/2 epoch (loss 0.4492):  30%|▎| 1219/4114 [1:18:48<3:09:41,  3.93s/it]Training 1/2 epoch (loss 0.4492):  30%|▎| 1220/4114 [1:18:48<3:05:52,  3.85s/it]Training 1/2 epoch (loss 0.4160):  30%|▎| 1220/4114 [1:18:52<3:05:52,  3.85s/it]Training 1/2 epoch (loss 0.4160):  30%|▎| 1221/4114 [1:18:52<3:11:50,  3.98s/it]Training 1/2 epoch (loss 0.3984):  30%|▎| 1221/4114 [1:18:56<3:11:50,  3.98s/it]Training 1/2 epoch (loss 0.3984):  30%|▎| 1222/4114 [1:18:56<3:08:42,  3.92s/it]Training 1/2 epoch (loss 0.4102):  30%|▎| 1222/4114 [1:18:59<3:08:42,  3.92s/it]Training 1/2 epoch (loss 0.4102):  30%|▎| 1223/4114 [1:18:59<3:02:49,  3.79s/it]Training 1/2 epoch (loss 0.3496):  30%|▎| 1223/4114 [1:19:04<3:02:49,  3.79s/it]Training 1/2 epoch (loss 0.3496):  30%|▎| 1224/4114 [1:19:04<3:08:42,  3.92s/it]Training 1/2 epoch (loss 0.4824):  30%|▎| 1224/4114 [1:19:08<3:08:42,  3.92s/it]Training 1/2 epoch (loss 0.4824):  30%|▎| 1225/4114 [1:19:08<3:10:08,  3.95s/it]Training 1/2 epoch (loss 0.4512):  30%|▎| 1225/4114 [1:19:12<3:10:08,  3.95s/it]Training 1/2 epoch (loss 0.4512):  30%|▎| 1226/4114 [1:19:12<3:10:27,  3.96s/it]Training 1/2 epoch (loss 0.2949):  30%|▎| 1226/4114 [1:19:16<3:10:27,  3.96s/it]Training 1/2 epoch (loss 0.2949):  30%|▎| 1227/4114 [1:19:16<3:11:37,  3.98s/it]Training 1/2 epoch (loss 0.4043):  30%|▎| 1227/4114 [1:19:20<3:11:37,  3.98s/it]Training 1/2 epoch (loss 0.4043):  30%|▎| 1228/4114 [1:19:20<3:12:47,  4.01s/it]Training 1/2 epoch (loss 0.4121):  30%|▎| 1228/4114 [1:19:23<3:12:47,  4.01s/it]Training 1/2 epoch (loss 0.4121):  30%|▎| 1229/4114 [1:19:23<3:02:00,  3.79s/it]Training 1/2 epoch (loss 0.5117):  30%|▎| 1229/4114 [1:19:26<3:02:00,  3.79s/it]Training 1/2 epoch (loss 0.5117):  30%|▎| 1230/4114 [1:19:26<2:59:20,  3.73s/it]Training 1/2 epoch (loss 0.3789):  30%|▎| 1230/4114 [1:19:30<2:59:20,  3.73s/it]Training 1/2 epoch (loss 0.3789):  30%|▎| 1231/4114 [1:19:30<3:00:19,  3.75s/it]Training 1/2 epoch (loss 0.3574):  30%|▎| 1231/4114 [1:19:34<3:00:19,  3.75s/it]Training 1/2 epoch (loss 0.3574):  30%|▎| 1232/4114 [1:19:34<3:00:53,  3.77s/it]Training 1/2 epoch (loss 0.3887):  30%|▎| 1232/4114 [1:19:38<3:00:53,  3.77s/it]Training 1/2 epoch (loss 0.3887):  30%|▎| 1233/4114 [1:19:38<3:07:18,  3.90s/it]Training 1/2 epoch (loss 0.3398):  30%|▎| 1233/4114 [1:19:42<3:07:18,  3.90s/it]Training 1/2 epoch (loss 0.3398):  30%|▎| 1234/4114 [1:19:42<2:58:33,  3.72s/it]Training 1/2 epoch (loss 0.3516):  30%|▎| 1234/4114 [1:19:46<2:58:33,  3.72s/it]Training 1/2 epoch (loss 0.3516):  30%|▎| 1235/4114 [1:19:46<3:01:52,  3.79s/it]Training 1/2 epoch (loss 0.4277):  30%|▎| 1235/4114 [1:19:50<3:01:52,  3.79s/it]Training 1/2 epoch (loss 0.4277):  30%|▎| 1236/4114 [1:19:50<3:08:45,  3.94s/it]Training 1/2 epoch (loss 0.4062):  30%|▎| 1236/4114 [1:19:54<3:08:45,  3.94s/it]Training 1/2 epoch (loss 0.4062):  30%|▎| 1237/4114 [1:19:54<3:06:30,  3.89s/it]Training 1/2 epoch (loss 0.3438):  30%|▎| 1237/4114 [1:19:57<3:06:30,  3.89s/it]Training 1/2 epoch (loss 0.3438):  30%|▎| 1238/4114 [1:19:57<2:59:17,  3.74s/it]Training 1/2 epoch (loss 0.5195):  30%|▎| 1238/4114 [1:20:01<2:59:17,  3.74s/it]Training 1/2 epoch (loss 0.5195):  30%|▎| 1239/4114 [1:20:01<3:07:19,  3.91s/it]Training 1/2 epoch (loss 0.4180):  30%|▎| 1239/4114 [1:20:05<3:07:19,  3.91s/it]Training 1/2 epoch (loss 0.4180):  30%|▎| 1240/4114 [1:20:05<3:08:22,  3.93s/it]Training 1/2 epoch (loss 0.2812):  30%|▎| 1240/4114 [1:20:09<3:08:22,  3.93s/it]Training 1/2 epoch (loss 0.2812):  30%|▎| 1241/4114 [1:20:09<3:00:18,  3.77s/it]Training 1/2 epoch (loss 0.4258):  30%|▎| 1241/4114 [1:20:13<3:00:18,  3.77s/it]Training 1/2 epoch (loss 0.4258):  30%|▎| 1242/4114 [1:20:13<3:03:28,  3.83s/it]Training 1/2 epoch (loss 0.5352):  30%|▎| 1242/4114 [1:20:17<3:03:28,  3.83s/it]Training 1/2 epoch (loss 0.5352):  30%|▎| 1243/4114 [1:20:17<3:03:41,  3.84s/it]Training 1/2 epoch (loss 0.2910):  30%|▎| 1243/4114 [1:20:20<3:03:41,  3.84s/it]Training 1/2 epoch (loss 0.2910):  30%|▎| 1244/4114 [1:20:20<2:55:44,  3.67s/it]Training 1/2 epoch (loss 0.4062):  30%|▎| 1244/4114 [1:20:24<2:55:44,  3.67s/it]Training 1/2 epoch (loss 0.4062):  30%|▎| 1245/4114 [1:20:24<3:01:22,  3.79s/it]Training 1/2 epoch (loss 0.3242):  30%|▎| 1245/4114 [1:20:27<3:01:22,  3.79s/it]Training 1/2 epoch (loss 0.3242):  30%|▎| 1246/4114 [1:20:27<2:55:25,  3.67s/it]Training 1/2 epoch (loss 0.2500):  30%|▎| 1246/4114 [1:20:31<2:55:25,  3.67s/it]Training 1/2 epoch (loss 0.2500):  30%|▎| 1247/4114 [1:20:31<2:52:57,  3.62s/it]Training 1/2 epoch (loss 0.4395):  30%|▎| 1247/4114 [1:20:35<2:52:57,  3.62s/it]Training 1/2 epoch (loss 0.4395):  30%|▎| 1248/4114 [1:20:35<2:58:21,  3.73s/it]Training 1/2 epoch (loss 0.3945):  30%|▎| 1248/4114 [1:20:39<2:58:21,  3.73s/it]Training 1/2 epoch (loss 0.3945):  30%|▎| 1249/4114 [1:20:39<2:58:53,  3.75s/it]Training 1/2 epoch (loss 0.3125):  30%|▎| 1249/4114 [1:20:42<2:58:53,  3.75s/it]Training 1/2 epoch (loss 0.3125):  30%|▎| 1250/4114 [1:20:42<2:59:52,  3.77s/it]Training 1/2 epoch (loss 0.3789):  30%|▎| 1250/4114 [1:20:47<2:59:52,  3.77s/it]Training 1/2 epoch (loss 0.3789):  30%|▎| 1251/4114 [1:20:47<3:05:40,  3.89s/it]Training 1/2 epoch (loss 0.3066):  30%|▎| 1251/4114 [1:20:50<3:05:40,  3.89s/it]Training 1/2 epoch (loss 0.3066):  30%|▎| 1252/4114 [1:20:50<3:04:13,  3.86s/it]Training 1/2 epoch (loss 0.3008):  30%|▎| 1252/4114 [1:20:54<3:04:13,  3.86s/it]Training 1/2 epoch (loss 0.3008):  30%|▎| 1253/4114 [1:20:54<2:58:06,  3.74s/it]Training 1/2 epoch (loss 0.3184):  30%|▎| 1253/4114 [1:20:58<2:58:06,  3.74s/it]Training 1/2 epoch (loss 0.3184):  30%|▎| 1254/4114 [1:20:58<3:02:37,  3.83s/it]Training 1/2 epoch (loss 0.4551):  30%|▎| 1254/4114 [1:21:02<3:02:37,  3.83s/it]Training 1/2 epoch (loss 0.4551):  31%|▎| 1255/4114 [1:21:02<3:04:33,  3.87s/it]Training 1/2 epoch (loss 0.4082):  31%|▎| 1255/4114 [1:21:06<3:04:33,  3.87s/it]Training 1/2 epoch (loss 0.4082):  31%|▎| 1256/4114 [1:21:06<3:05:34,  3.90s/it]Training 1/2 epoch (loss 0.5508):  31%|▎| 1256/4114 [1:21:10<3:05:34,  3.90s/it]Training 1/2 epoch (loss 0.5508):  31%|▎| 1257/4114 [1:21:10<3:07:31,  3.94s/it]Training 1/2 epoch (loss 0.4453):  31%|▎| 1257/4114 [1:21:14<3:07:31,  3.94s/it]Training 1/2 epoch (loss 0.4453):  31%|▎| 1258/4114 [1:21:14<3:06:50,  3.93s/it]Training 1/2 epoch (loss 0.4648):  31%|▎| 1258/4114 [1:21:18<3:06:50,  3.93s/it]Training 1/2 epoch (loss 0.4648):  31%|▎| 1259/4114 [1:21:18<3:07:47,  3.95s/it]Training 1/2 epoch (loss 0.4629):  31%|▎| 1259/4114 [1:21:21<3:07:47,  3.95s/it]Training 1/2 epoch (loss 0.4629):  31%|▎| 1260/4114 [1:21:21<3:03:17,  3.85s/it]Training 1/2 epoch (loss 0.3359):  31%|▎| 1260/4114 [1:21:25<3:03:17,  3.85s/it]Training 1/2 epoch (loss 0.3359):  31%|▎| 1261/4114 [1:21:25<2:58:57,  3.76s/it]Training 1/2 epoch (loss 0.4805):  31%|▎| 1261/4114 [1:21:29<2:58:57,  3.76s/it]Training 1/2 epoch (loss 0.4805):  31%|▎| 1262/4114 [1:21:29<2:59:32,  3.78s/it]Training 1/2 epoch (loss 0.3633):  31%|▎| 1262/4114 [1:21:33<2:59:32,  3.78s/it]Training 1/2 epoch (loss 0.3633):  31%|▎| 1263/4114 [1:21:33<3:04:50,  3.89s/it]Training 1/2 epoch (loss 0.6953):  31%|▎| 1263/4114 [1:21:37<3:04:50,  3.89s/it]Training 1/2 epoch (loss 0.6953):  31%|▎| 1264/4114 [1:21:37<3:04:39,  3.89s/it]Training 1/2 epoch (loss 0.7227):  31%|▎| 1264/4114 [1:21:41<3:04:39,  3.89s/it]Training 1/2 epoch (loss 0.7227):  31%|▎| 1265/4114 [1:21:41<3:08:01,  3.96s/it]Training 1/2 epoch (loss 0.4082):  31%|▎| 1265/4114 [1:21:45<3:08:01,  3.96s/it]Training 1/2 epoch (loss 0.4082):  31%|▎| 1266/4114 [1:21:45<3:11:45,  4.04s/it]Training 1/2 epoch (loss 0.4395):  31%|▎| 1266/4114 [1:21:49<3:11:45,  4.04s/it]Training 1/2 epoch (loss 0.4395):  31%|▎| 1267/4114 [1:21:49<3:10:04,  4.01s/it]Training 1/2 epoch (loss 0.5078):  31%|▎| 1267/4114 [1:21:53<3:10:04,  4.01s/it]Training 1/2 epoch (loss 0.5078):  31%|▎| 1268/4114 [1:21:53<3:08:55,  3.98s/it]Training 1/2 epoch (loss 0.3945):  31%|▎| 1268/4114 [1:21:57<3:08:55,  3.98s/it]Training 1/2 epoch (loss 0.3945):  31%|▎| 1269/4114 [1:21:57<3:04:20,  3.89s/it]Training 1/2 epoch (loss 0.3105):  31%|▎| 1269/4114 [1:22:00<3:04:20,  3.89s/it]Training 1/2 epoch (loss 0.3105):  31%|▎| 1270/4114 [1:22:00<2:57:28,  3.74s/it]Training 1/2 epoch (loss 0.2559):  31%|▎| 1270/4114 [1:22:04<2:57:28,  3.74s/it]Training 1/2 epoch (loss 0.2559):  31%|▎| 1271/4114 [1:22:04<2:57:12,  3.74s/it]Training 1/2 epoch (loss 0.3945):  31%|▎| 1271/4114 [1:22:07<2:57:12,  3.74s/it]Training 1/2 epoch (loss 0.3945):  31%|▎| 1272/4114 [1:22:07<2:54:19,  3.68s/it]Training 1/2 epoch (loss 0.2617):  31%|▎| 1272/4114 [1:22:11<2:54:19,  3.68s/it]Training 1/2 epoch (loss 0.2617):  31%|▎| 1273/4114 [1:22:11<2:56:00,  3.72s/it]Training 1/2 epoch (loss 0.5117):  31%|▎| 1273/4114 [1:22:15<2:56:00,  3.72s/it]Training 1/2 epoch (loss 0.5117):  31%|▎| 1274/4114 [1:22:15<2:57:49,  3.76s/it]Training 1/2 epoch (loss 0.3691):  31%|▎| 1274/4114 [1:22:19<2:57:49,  3.76s/it]Training 1/2 epoch (loss 0.3691):  31%|▎| 1275/4114 [1:22:19<3:03:29,  3.88s/it]Training 1/2 epoch (loss 0.3574):  31%|▎| 1275/4114 [1:22:23<3:03:29,  3.88s/it]Training 1/2 epoch (loss 0.3574):  31%|▎| 1276/4114 [1:22:23<3:04:48,  3.91s/it]Training 1/2 epoch (loss 0.4375):  31%|▎| 1276/4114 [1:22:27<3:04:48,  3.91s/it]Training 1/2 epoch (loss 0.4375):  31%|▎| 1277/4114 [1:22:27<3:02:55,  3.87s/it]Training 1/2 epoch (loss 0.3789):  31%|▎| 1277/4114 [1:22:31<3:02:55,  3.87s/it]Training 1/2 epoch (loss 0.3789):  31%|▎| 1278/4114 [1:22:31<3:06:16,  3.94s/it]Training 1/2 epoch (loss 0.2930):  31%|▎| 1278/4114 [1:22:35<3:06:16,  3.94s/it]Training 1/2 epoch (loss 0.2930):  31%|▎| 1279/4114 [1:22:35<3:06:02,  3.94s/it]Training 1/2 epoch (loss 0.3750):  31%|▎| 1279/4114 [1:22:39<3:06:02,  3.94s/it]Training 1/2 epoch (loss 0.3750):  31%|▎| 1280/4114 [1:22:39<3:01:46,  3.85s/it]Training 1/2 epoch (loss 0.4043):  31%|▎| 1280/4114 [1:22:43<3:01:46,  3.85s/it]Training 1/2 epoch (loss 0.4043):  31%|▎| 1281/4114 [1:22:43<3:07:23,  3.97s/it]Training 1/2 epoch (loss 0.3027):  31%|▎| 1281/4114 [1:22:47<3:07:23,  3.97s/it]Training 1/2 epoch (loss 0.3027):  31%|▎| 1282/4114 [1:22:47<3:08:37,  4.00s/it]Training 1/2 epoch (loss 0.2637):  31%|▎| 1282/4114 [1:22:51<3:08:37,  4.00s/it]Training 1/2 epoch (loss 0.2637):  31%|▎| 1283/4114 [1:22:51<3:07:49,  3.98s/it]Training 1/2 epoch (loss 0.3066):  31%|▎| 1283/4114 [1:22:55<3:07:49,  3.98s/it]Training 1/2 epoch (loss 0.3066):  31%|▎| 1284/4114 [1:22:55<3:08:39,  4.00s/it]Training 1/2 epoch (loss 0.4531):  31%|▎| 1284/4114 [1:22:59<3:08:39,  4.00s/it]Training 1/2 epoch (loss 0.4531):  31%|▎| 1285/4114 [1:22:59<3:08:04,  3.99s/it]Training 1/2 epoch (loss 0.5156):  31%|▎| 1285/4114 [1:23:03<3:08:04,  3.99s/it]Training 1/2 epoch (loss 0.5156):  31%|▎| 1286/4114 [1:23:03<3:08:10,  3.99s/it]Training 1/2 epoch (loss 0.4570):  31%|▎| 1286/4114 [1:23:07<3:08:10,  3.99s/it]Training 1/2 epoch (loss 0.4570):  31%|▎| 1287/4114 [1:23:07<3:08:21,  4.00s/it]Training 1/2 epoch (loss 0.3633):  31%|▎| 1287/4114 [1:23:11<3:08:21,  4.00s/it]Training 1/2 epoch (loss 0.3633):  31%|▎| 1288/4114 [1:23:11<3:07:33,  3.98s/it]Training 1/2 epoch (loss 0.4082):  31%|▎| 1288/4114 [1:23:15<3:07:33,  3.98s/it]Training 1/2 epoch (loss 0.4082):  31%|▎| 1289/4114 [1:23:15<3:06:51,  3.97s/it]Training 1/2 epoch (loss 0.3633):  31%|▎| 1289/4114 [1:23:19<3:06:51,  3.97s/it]Training 1/2 epoch (loss 0.3633):  31%|▎| 1290/4114 [1:23:19<3:07:01,  3.97s/it]Training 1/2 epoch (loss 0.5156):  31%|▎| 1290/4114 [1:23:22<3:07:01,  3.97s/it]Training 1/2 epoch (loss 0.5156):  31%|▎| 1291/4114 [1:23:22<3:04:24,  3.92s/it]Training 1/2 epoch (loss 0.3965):  31%|▎| 1291/4114 [1:23:27<3:04:24,  3.92s/it]Training 1/2 epoch (loss 0.3965):  31%|▎| 1292/4114 [1:23:27<3:06:51,  3.97s/it]Training 1/2 epoch (loss 0.3984):  31%|▎| 1292/4114 [1:23:31<3:06:51,  3.97s/it]Training 1/2 epoch (loss 0.3984):  31%|▎| 1293/4114 [1:23:31<3:11:33,  4.07s/it]Training 1/2 epoch (loss 0.4453):  31%|▎| 1293/4114 [1:23:35<3:11:33,  4.07s/it]Training 1/2 epoch (loss 0.4453):  31%|▎| 1294/4114 [1:23:35<3:10:11,  4.05s/it]Training 1/2 epoch (loss 0.3496):  31%|▎| 1294/4114 [1:23:38<3:10:11,  4.05s/it]Training 1/2 epoch (loss 0.3496):  31%|▎| 1295/4114 [1:23:38<3:00:09,  3.83s/it]Training 1/2 epoch (loss 0.2871):  31%|▎| 1295/4114 [1:23:42<3:00:09,  3.83s/it]Training 1/2 epoch (loss 0.2871):  32%|▎| 1296/4114 [1:23:42<2:58:30,  3.80s/it]Training 1/2 epoch (loss 0.3125):  32%|▎| 1296/4114 [1:23:46<2:58:30,  3.80s/it]Training 1/2 epoch (loss 0.3125):  32%|▎| 1297/4114 [1:23:46<2:57:52,  3.79s/it]Training 1/2 epoch (loss 0.5625):  32%|▎| 1297/4114 [1:23:50<2:57:52,  3.79s/it]Training 1/2 epoch (loss 0.5625):  32%|▎| 1298/4114 [1:23:50<3:00:02,  3.84s/it]Training 1/2 epoch (loss 0.2734):  32%|▎| 1298/4114 [1:23:54<3:00:02,  3.84s/it]Training 1/2 epoch (loss 0.2734):  32%|▎| 1299/4114 [1:23:54<3:01:56,  3.88s/it]Training 1/2 epoch (loss 0.3555):  32%|▎| 1299/4114 [1:23:57<3:01:56,  3.88s/it]Training 1/2 epoch (loss 0.3555):  32%|▎| 1300/4114 [1:23:57<2:58:36,  3.81s/it]Training 1/2 epoch (loss 0.4492):  32%|▎| 1300/4114 [1:24:01<2:58:36,  3.81s/it]Training 1/2 epoch (loss 0.4492):  32%|▎| 1301/4114 [1:24:01<3:01:06,  3.86s/it]Training 1/2 epoch (loss 0.5078):  32%|▎| 1301/4114 [1:24:05<3:01:06,  3.86s/it]Training 1/2 epoch (loss 0.5078):  32%|▎| 1302/4114 [1:24:05<3:04:21,  3.93s/it]Training 1/2 epoch (loss 0.4141):  32%|▎| 1302/4114 [1:24:09<3:04:21,  3.93s/it]Training 1/2 epoch (loss 0.4141):  32%|▎| 1303/4114 [1:24:09<3:06:05,  3.97s/it]Training 1/2 epoch (loss 0.3535):  32%|▎| 1303/4114 [1:24:13<3:06:05,  3.97s/it]Training 1/2 epoch (loss 0.3535):  32%|▎| 1304/4114 [1:24:13<3:07:21,  4.00s/it]Training 1/2 epoch (loss 0.2754):  32%|▎| 1304/4114 [1:24:17<3:07:21,  4.00s/it]Training 1/2 epoch (loss 0.2754):  32%|▎| 1305/4114 [1:24:17<3:02:09,  3.89s/it]Training 1/2 epoch (loss 0.4355):  32%|▎| 1305/4114 [1:24:21<3:02:09,  3.89s/it]Training 1/2 epoch (loss 0.4355):  32%|▎| 1306/4114 [1:24:21<3:03:22,  3.92s/it]Training 1/2 epoch (loss 0.5039):  32%|▎| 1306/4114 [1:24:25<3:03:22,  3.92s/it]Training 1/2 epoch (loss 0.5039):  32%|▎| 1307/4114 [1:24:25<3:02:10,  3.89s/it]Training 1/2 epoch (loss 0.4766):  32%|▎| 1307/4114 [1:24:29<3:02:10,  3.89s/it]Training 1/2 epoch (loss 0.4766):  32%|▎| 1308/4114 [1:24:29<3:06:36,  3.99s/it]Training 1/2 epoch (loss 0.3516):  32%|▎| 1308/4114 [1:24:33<3:06:36,  3.99s/it]Training 1/2 epoch (loss 0.3516):  32%|▎| 1309/4114 [1:24:33<3:06:28,  3.99s/it]Training 1/2 epoch (loss 0.4961):  32%|▎| 1309/4114 [1:24:37<3:06:28,  3.99s/it]Training 1/2 epoch (loss 0.4961):  32%|▎| 1310/4114 [1:24:37<3:07:21,  4.01s/it]Training 1/2 epoch (loss 0.3301):  32%|▎| 1310/4114 [1:24:41<3:07:21,  4.01s/it]Training 1/2 epoch (loss 0.3301):  32%|▎| 1311/4114 [1:24:41<3:11:44,  4.10s/it]Training 1/2 epoch (loss 0.2295):  32%|▎| 1311/4114 [1:24:45<3:11:44,  4.10s/it]Training 1/2 epoch (loss 0.2295):  32%|▎| 1312/4114 [1:24:45<3:09:33,  4.06s/it]Training 1/2 epoch (loss 0.4102):  32%|▎| 1312/4114 [1:24:49<3:09:33,  4.06s/it]Training 1/2 epoch (loss 0.4102):  32%|▎| 1313/4114 [1:24:49<3:08:04,  4.03s/it]Training 1/2 epoch (loss 0.3945):  32%|▎| 1313/4114 [1:24:53<3:08:04,  4.03s/it]Training 1/2 epoch (loss 0.3945):  32%|▎| 1314/4114 [1:24:53<3:04:26,  3.95s/it]Training 1/2 epoch (loss 0.4453):  32%|▎| 1314/4114 [1:24:57<3:04:26,  3.95s/it]Training 1/2 epoch (loss 0.4453):  32%|▎| 1315/4114 [1:24:57<3:04:08,  3.95s/it]Training 1/2 epoch (loss 0.2305):  32%|▎| 1315/4114 [1:25:01<3:04:08,  3.95s/it]Training 1/2 epoch (loss 0.2305):  32%|▎| 1316/4114 [1:25:01<3:02:31,  3.91s/it]Training 1/2 epoch (loss 0.5234):  32%|▎| 1316/4114 [1:25:05<3:02:31,  3.91s/it]Training 1/2 epoch (loss 0.5234):  32%|▎| 1317/4114 [1:25:05<3:05:22,  3.98s/it]Training 1/2 epoch (loss 0.3066):  32%|▎| 1317/4114 [1:25:09<3:05:22,  3.98s/it]Training 1/2 epoch (loss 0.3066):  32%|▎| 1318/4114 [1:25:09<2:57:55,  3.82s/it]Training 1/2 epoch (loss 0.5234):  32%|▎| 1318/4114 [1:25:12<2:57:55,  3.82s/it]Training 1/2 epoch (loss 0.5234):  32%|▎| 1319/4114 [1:25:12<2:57:59,  3.82s/it]Training 1/2 epoch (loss 0.4082):  32%|▎| 1319/4114 [1:25:17<2:57:59,  3.82s/it]Training 1/2 epoch (loss 0.4082):  32%|▎| 1320/4114 [1:25:17<3:05:14,  3.98s/it]Training 1/2 epoch (loss 0.5547):  32%|▎| 1320/4114 [1:25:20<3:05:14,  3.98s/it]Training 1/2 epoch (loss 0.5547):  32%|▎| 1321/4114 [1:25:20<3:02:46,  3.93s/it]Training 1/2 epoch (loss 0.3828):  32%|▎| 1321/4114 [1:25:24<3:02:46,  3.93s/it]Training 1/2 epoch (loss 0.3828):  32%|▎| 1322/4114 [1:25:24<3:03:19,  3.94s/it]Training 1/2 epoch (loss 0.5039):  32%|▎| 1322/4114 [1:25:28<3:03:19,  3.94s/it]Training 1/2 epoch (loss 0.5039):  32%|▎| 1323/4114 [1:25:28<3:02:37,  3.93s/it]Training 1/2 epoch (loss 0.3809):  32%|▎| 1323/4114 [1:25:32<3:02:37,  3.93s/it]Training 1/2 epoch (loss 0.3809):  32%|▎| 1324/4114 [1:25:32<2:56:24,  3.79s/it]Training 1/2 epoch (loss 0.4844):  32%|▎| 1324/4114 [1:25:36<2:56:24,  3.79s/it]Training 1/2 epoch (loss 0.4844):  32%|▎| 1325/4114 [1:25:36<2:59:04,  3.85s/it]Training 1/2 epoch (loss 0.3418):  32%|▎| 1325/4114 [1:25:40<2:59:04,  3.85s/it]Training 1/2 epoch (loss 0.3418):  32%|▎| 1326/4114 [1:25:40<3:02:49,  3.93s/it]Training 1/2 epoch (loss 0.4336):  32%|▎| 1326/4114 [1:25:44<3:02:49,  3.93s/it]Training 1/2 epoch (loss 0.4336):  32%|▎| 1327/4114 [1:25:44<3:01:08,  3.90s/it]Training 1/2 epoch (loss 0.2773):  32%|▎| 1327/4114 [1:25:48<3:01:08,  3.90s/it]Training 1/2 epoch (loss 0.2773):  32%|▎| 1328/4114 [1:25:48<2:59:13,  3.86s/it]Training 1/2 epoch (loss 0.4492):  32%|▎| 1328/4114 [1:25:51<2:59:13,  3.86s/it]Training 1/2 epoch (loss 0.4492):  32%|▎| 1329/4114 [1:25:51<2:56:31,  3.80s/it]Training 1/2 epoch (loss 0.4180):  32%|▎| 1329/4114 [1:25:55<2:56:31,  3.80s/it]Training 1/2 epoch (loss 0.4180):  32%|▎| 1330/4114 [1:25:55<2:58:49,  3.85s/it]Training 1/2 epoch (loss 0.3164):  32%|▎| 1330/4114 [1:25:59<2:58:49,  3.85s/it]Training 1/2 epoch (loss 0.3164):  32%|▎| 1331/4114 [1:25:59<2:56:55,  3.81s/it]Training 1/2 epoch (loss 0.4453):  32%|▎| 1331/4114 [1:26:03<2:56:55,  3.81s/it]Training 1/2 epoch (loss 0.4453):  32%|▎| 1332/4114 [1:26:03<3:01:25,  3.91s/it]Training 1/2 epoch (loss 0.4375):  32%|▎| 1332/4114 [1:26:07<3:01:25,  3.91s/it]Training 1/2 epoch (loss 0.4375):  32%|▎| 1333/4114 [1:26:07<3:00:04,  3.89s/it]Training 1/2 epoch (loss 0.4062):  32%|▎| 1333/4114 [1:26:11<3:00:04,  3.89s/it]Training 1/2 epoch (loss 0.4062):  32%|▎| 1334/4114 [1:26:11<2:58:41,  3.86s/it]Training 1/2 epoch (loss 0.4688):  32%|▎| 1334/4114 [1:26:15<2:58:41,  3.86s/it]Training 1/2 epoch (loss 0.4688):  32%|▎| 1335/4114 [1:26:15<3:04:15,  3.98s/it]Training 1/2 epoch (loss 0.2812):  32%|▎| 1335/4114 [1:26:19<3:04:15,  3.98s/it]Training 1/2 epoch (loss 0.2812):  32%|▎| 1336/4114 [1:26:19<3:01:03,  3.91s/it]Training 1/2 epoch (loss 0.3184):  32%|▎| 1336/4114 [1:26:22<3:01:03,  3.91s/it]Training 1/2 epoch (loss 0.3184):  32%|▎| 1337/4114 [1:26:22<2:52:08,  3.72s/it]Training 1/2 epoch (loss 0.3340):  32%|▎| 1337/4114 [1:26:26<2:52:08,  3.72s/it]Training 1/2 epoch (loss 0.3340):  33%|▎| 1338/4114 [1:26:26<2:58:34,  3.86s/it]Training 1/2 epoch (loss 0.4492):  33%|▎| 1338/4114 [1:26:30<2:58:34,  3.86s/it]Training 1/2 epoch (loss 0.4492):  33%|▎| 1339/4114 [1:26:30<2:53:18,  3.75s/it]Training 1/2 epoch (loss 0.3340):  33%|▎| 1339/4114 [1:26:33<2:53:18,  3.75s/it]Training 1/2 epoch (loss 0.3340):  33%|▎| 1340/4114 [1:26:33<2:54:26,  3.77s/it]Training 1/2 epoch (loss 0.4297):  33%|▎| 1340/4114 [1:26:37<2:54:26,  3.77s/it]Training 1/2 epoch (loss 0.4297):  33%|▎| 1341/4114 [1:26:37<2:51:29,  3.71s/it]Training 1/2 epoch (loss 0.3125):  33%|▎| 1341/4114 [1:26:41<2:51:29,  3.71s/it]Training 1/2 epoch (loss 0.3125):  33%|▎| 1342/4114 [1:26:41<2:52:29,  3.73s/it]Training 1/2 epoch (loss 0.5859):  33%|▎| 1342/4114 [1:26:45<2:52:29,  3.73s/it]Training 1/2 epoch (loss 0.5859):  33%|▎| 1343/4114 [1:26:45<2:53:51,  3.76s/it]Training 1/2 epoch (loss 0.3359):  33%|▎| 1343/4114 [1:26:49<2:53:51,  3.76s/it]Training 1/2 epoch (loss 0.3359):  33%|▎| 1344/4114 [1:26:49<2:59:32,  3.89s/it]Training 1/2 epoch (loss 0.5312):  33%|▎| 1344/4114 [1:26:53<2:59:32,  3.89s/it]Training 1/2 epoch (loss 0.5312):  33%|▎| 1345/4114 [1:26:53<2:59:02,  3.88s/it]Training 1/2 epoch (loss 0.4512):  33%|▎| 1345/4114 [1:26:56<2:59:02,  3.88s/it]Training 1/2 epoch (loss 0.4512):  33%|▎| 1346/4114 [1:26:56<2:57:36,  3.85s/it]Training 1/2 epoch (loss 0.2598):  33%|▎| 1346/4114 [1:27:00<2:57:36,  3.85s/it]Training 1/2 epoch (loss 0.2598):  33%|▎| 1347/4114 [1:27:00<2:57:54,  3.86s/it]Training 1/2 epoch (loss 0.3184):  33%|▎| 1347/4114 [1:27:04<2:57:54,  3.86s/it]Training 1/2 epoch (loss 0.3184):  33%|▎| 1348/4114 [1:27:04<3:00:42,  3.92s/it]Training 1/2 epoch (loss 0.2852):  33%|▎| 1348/4114 [1:27:08<3:00:42,  3.92s/it]Training 1/2 epoch (loss 0.2852):  33%|▎| 1349/4114 [1:27:08<2:58:29,  3.87s/it]Training 1/2 epoch (loss 0.3848):  33%|▎| 1349/4114 [1:27:12<2:58:29,  3.87s/it]Training 1/2 epoch (loss 0.3848):  33%|▎| 1350/4114 [1:27:12<2:52:52,  3.75s/it]Training 1/2 epoch (loss 0.4004):  33%|▎| 1350/4114 [1:27:16<2:52:52,  3.75s/it]Training 1/2 epoch (loss 0.4004):  33%|▎| 1351/4114 [1:27:16<2:54:44,  3.79s/it]Training 1/2 epoch (loss 0.3809):  33%|▎| 1351/4114 [1:27:19<2:54:44,  3.79s/it]Training 1/2 epoch (loss 0.3809):  33%|▎| 1352/4114 [1:27:19<2:50:38,  3.71s/it]Training 1/2 epoch (loss 0.6055):  33%|▎| 1352/4114 [1:27:23<2:50:38,  3.71s/it]Training 1/2 epoch (loss 0.6055):  33%|▎| 1353/4114 [1:27:23<2:51:58,  3.74s/it]Training 1/2 epoch (loss 0.3828):  33%|▎| 1353/4114 [1:27:26<2:51:58,  3.74s/it]Training 1/2 epoch (loss 0.3828):  33%|▎| 1354/4114 [1:27:26<2:46:13,  3.61s/it]Training 1/2 epoch (loss 0.3008):  33%|▎| 1354/4114 [1:27:30<2:46:13,  3.61s/it]Training 1/2 epoch (loss 0.3008):  33%|▎| 1355/4114 [1:27:30<2:46:01,  3.61s/it]Training 1/2 epoch (loss 0.5742):  33%|▎| 1355/4114 [1:27:34<2:46:01,  3.61s/it]Training 1/2 epoch (loss 0.5742):  33%|▎| 1356/4114 [1:27:34<2:54:40,  3.80s/it]Training 1/2 epoch (loss 0.3965):  33%|▎| 1356/4114 [1:27:38<2:54:40,  3.80s/it]Training 1/2 epoch (loss 0.3965):  33%|▎| 1357/4114 [1:27:38<2:54:50,  3.81s/it]Training 1/2 epoch (loss 0.5273):  33%|▎| 1357/4114 [1:27:42<2:54:50,  3.81s/it]Training 1/2 epoch (loss 0.5273):  33%|▎| 1358/4114 [1:27:42<2:57:00,  3.85s/it]Training 1/2 epoch (loss 0.3340):  33%|▎| 1358/4114 [1:27:46<2:57:00,  3.85s/it]Training 1/2 epoch (loss 0.3340):  33%|▎| 1359/4114 [1:27:46<3:02:36,  3.98s/it]Training 1/2 epoch (loss 0.5547):  33%|▎| 1359/4114 [1:27:50<3:02:36,  3.98s/it]Training 1/2 epoch (loss 0.5547):  33%|▎| 1360/4114 [1:27:50<2:59:49,  3.92s/it]Training 1/2 epoch (loss 0.3242):  33%|▎| 1360/4114 [1:27:54<2:59:49,  3.92s/it]Training 1/2 epoch (loss 0.3242):  33%|▎| 1361/4114 [1:27:54<3:00:02,  3.92s/it]Training 1/2 epoch (loss 0.3516):  33%|▎| 1361/4114 [1:27:58<3:00:02,  3.92s/it]Training 1/2 epoch (loss 0.3516):  33%|▎| 1362/4114 [1:27:58<3:00:14,  3.93s/it]Training 1/2 epoch (loss 0.4590):  33%|▎| 1362/4114 [1:28:01<3:00:14,  3.93s/it]Training 1/2 epoch (loss 0.4590):  33%|▎| 1363/4114 [1:28:01<2:47:53,  3.66s/it]Training 1/2 epoch (loss 0.3477):  33%|▎| 1363/4114 [1:28:05<2:47:53,  3.66s/it]Training 1/2 epoch (loss 0.3477):  33%|▎| 1364/4114 [1:28:05<2:53:19,  3.78s/it]Training 1/2 epoch (loss 0.3965):  33%|▎| 1364/4114 [1:28:09<2:53:19,  3.78s/it]Training 1/2 epoch (loss 0.3965):  33%|▎| 1365/4114 [1:28:09<2:56:10,  3.85s/it]Training 1/2 epoch (loss 0.2432):  33%|▎| 1365/4114 [1:28:13<2:56:10,  3.85s/it]Training 1/2 epoch (loss 0.2432):  33%|▎| 1366/4114 [1:28:13<2:58:31,  3.90s/it]Training 1/2 epoch (loss 0.5703):  33%|▎| 1366/4114 [1:28:17<2:58:31,  3.90s/it]Training 1/2 epoch (loss 0.5703):  33%|▎| 1367/4114 [1:28:17<2:56:58,  3.87s/it]Training 1/2 epoch (loss 0.3027):  33%|▎| 1367/4114 [1:28:21<2:56:58,  3.87s/it]Training 1/2 epoch (loss 0.3027):  33%|▎| 1368/4114 [1:28:21<3:00:43,  3.95s/it]Training 1/2 epoch (loss 0.5117):  33%|▎| 1368/4114 [1:28:25<3:00:43,  3.95s/it]Training 1/2 epoch (loss 0.5117):  33%|▎| 1369/4114 [1:28:25<3:01:11,  3.96s/it]Training 1/2 epoch (loss 0.4727):  33%|▎| 1369/4114 [1:28:29<3:01:11,  3.96s/it]Training 1/2 epoch (loss 0.4727):  33%|▎| 1370/4114 [1:28:29<2:58:45,  3.91s/it]Training 1/2 epoch (loss 0.4336):  33%|▎| 1370/4114 [1:28:33<2:58:45,  3.91s/it]Training 1/2 epoch (loss 0.4336):  33%|▎| 1371/4114 [1:28:33<3:00:48,  3.95s/it]Training 1/2 epoch (loss 0.5000):  33%|▎| 1371/4114 [1:28:36<3:00:48,  3.95s/it]Training 1/2 epoch (loss 0.5000):  33%|▎| 1372/4114 [1:28:36<2:52:48,  3.78s/it]Training 1/2 epoch (loss 0.4395):  33%|▎| 1372/4114 [1:28:40<2:52:48,  3.78s/it]Training 1/2 epoch (loss 0.4395):  33%|▎| 1373/4114 [1:28:40<2:50:44,  3.74s/it]Training 1/2 epoch (loss 0.3203):  33%|▎| 1373/4114 [1:28:44<2:50:44,  3.74s/it]Training 1/2 epoch (loss 0.3203):  33%|▎| 1374/4114 [1:28:44<2:55:06,  3.83s/it]Training 1/2 epoch (loss 0.4668):  33%|▎| 1374/4114 [1:28:47<2:55:06,  3.83s/it]Training 1/2 epoch (loss 0.4668):  33%|▎| 1375/4114 [1:28:47<2:54:39,  3.83s/it]Training 1/2 epoch (loss 0.4668):  33%|▎| 1375/4114 [1:28:51<2:54:39,  3.83s/it]Training 1/2 epoch (loss 0.4668):  33%|▎| 1376/4114 [1:28:51<2:56:22,  3.87s/it]Training 1/2 epoch (loss 0.3867):  33%|▎| 1376/4114 [1:28:56<2:56:22,  3.87s/it]Training 1/2 epoch (loss 0.3867):  33%|▎| 1377/4114 [1:28:56<3:00:20,  3.95s/it]Training 1/2 epoch (loss 0.3652):  33%|▎| 1377/4114 [1:28:59<3:00:20,  3.95s/it]Training 1/2 epoch (loss 0.3652):  33%|▎| 1378/4114 [1:28:59<2:58:11,  3.91s/it]Training 1/2 epoch (loss 0.3848):  33%|▎| 1378/4114 [1:29:03<2:58:11,  3.91s/it]Training 1/2 epoch (loss 0.3848):  34%|▎| 1379/4114 [1:29:03<2:58:04,  3.91s/it]Training 1/2 epoch (loss 0.2793):  34%|▎| 1379/4114 [1:29:07<2:58:04,  3.91s/it]Training 1/2 epoch (loss 0.2793):  34%|▎| 1380/4114 [1:29:07<2:59:37,  3.94s/it]Training 1/2 epoch (loss 0.4375):  34%|▎| 1380/4114 [1:29:10<2:59:37,  3.94s/it]Training 1/2 epoch (loss 0.4375):  34%|▎| 1381/4114 [1:29:10<2:48:59,  3.71s/it]Training 1/2 epoch (loss 0.4941):  34%|▎| 1381/4114 [1:29:14<2:48:59,  3.71s/it]Training 1/2 epoch (loss 0.4941):  34%|▎| 1382/4114 [1:29:14<2:40:17,  3.52s/it]Training 1/2 epoch (loss 0.3516):  34%|▎| 1382/4114 [1:29:18<2:40:17,  3.52s/it]Training 1/2 epoch (loss 0.3516):  34%|▎| 1383/4114 [1:29:18<2:48:28,  3.70s/it]Training 1/2 epoch (loss 0.4219):  34%|▎| 1383/4114 [1:29:22<2:48:28,  3.70s/it]Training 1/2 epoch (loss 0.4219):  34%|▎| 1384/4114 [1:29:22<2:53:01,  3.80s/it]Training 1/2 epoch (loss 0.5000):  34%|▎| 1384/4114 [1:29:26<2:53:01,  3.80s/it]Training 1/2 epoch (loss 0.5000):  34%|▎| 1385/4114 [1:29:26<2:56:24,  3.88s/it]Training 1/2 epoch (loss 0.6250):  34%|▎| 1385/4114 [1:29:30<2:56:24,  3.88s/it]Training 1/2 epoch (loss 0.6250):  34%|▎| 1386/4114 [1:29:30<2:58:55,  3.94s/it]Training 1/2 epoch (loss 0.3750):  34%|▎| 1386/4114 [1:29:34<2:58:55,  3.94s/it]Training 1/2 epoch (loss 0.3750):  34%|▎| 1387/4114 [1:29:34<2:59:02,  3.94s/it]Training 1/2 epoch (loss 0.4336):  34%|▎| 1387/4114 [1:29:38<2:59:02,  3.94s/it]Training 1/2 epoch (loss 0.4336):  34%|▎| 1388/4114 [1:29:38<2:59:28,  3.95s/it]Training 1/2 epoch (loss 0.4648):  34%|▎| 1388/4114 [1:29:42<2:59:28,  3.95s/it]Training 1/2 epoch (loss 0.4648):  34%|▎| 1389/4114 [1:29:42<3:00:33,  3.98s/it]Training 1/2 epoch (loss 0.4355):  34%|▎| 1389/4114 [1:29:45<3:00:33,  3.98s/it]Training 1/2 epoch (loss 0.4355):  34%|▎| 1390/4114 [1:29:45<2:53:43,  3.83s/it]Training 1/2 epoch (loss 0.3789):  34%|▎| 1390/4114 [1:29:49<2:53:43,  3.83s/it]Training 1/2 epoch (loss 0.3789):  34%|▎| 1391/4114 [1:29:49<2:53:56,  3.83s/it]Training 1/2 epoch (loss 0.5234):  34%|▎| 1391/4114 [1:29:53<2:53:56,  3.83s/it]Training 1/2 epoch (loss 0.5234):  34%|▎| 1392/4114 [1:29:53<2:51:54,  3.79s/it]Training 1/2 epoch (loss 0.3145):  34%|▎| 1392/4114 [1:29:57<2:51:54,  3.79s/it]Training 1/2 epoch (loss 0.3145):  34%|▎| 1393/4114 [1:29:57<2:53:09,  3.82s/it]Training 1/2 epoch (loss 0.4883):  34%|▎| 1393/4114 [1:30:01<2:53:09,  3.82s/it]Training 1/2 epoch (loss 0.4883):  34%|▎| 1394/4114 [1:30:01<2:55:42,  3.88s/it]Training 1/2 epoch (loss 0.2656):  34%|▎| 1394/4114 [1:30:05<2:55:42,  3.88s/it]Training 1/2 epoch (loss 0.2656):  34%|▎| 1395/4114 [1:30:05<3:00:08,  3.98s/it]Training 1/2 epoch (loss 0.3477):  34%|▎| 1395/4114 [1:30:09<3:00:08,  3.98s/it]Training 1/2 epoch (loss 0.3477):  34%|▎| 1396/4114 [1:30:09<2:58:58,  3.95s/it]Training 1/2 epoch (loss 0.3262):  34%|▎| 1396/4114 [1:30:12<2:58:58,  3.95s/it]Training 1/2 epoch (loss 0.3262):  34%|▎| 1397/4114 [1:30:12<2:53:25,  3.83s/it]Training 1/2 epoch (loss 0.4141):  34%|▎| 1397/4114 [1:30:16<2:53:25,  3.83s/it]Training 1/2 epoch (loss 0.4141):  34%|▎| 1398/4114 [1:30:16<2:54:23,  3.85s/it]Training 1/2 epoch (loss 0.4551):  34%|▎| 1398/4114 [1:30:20<2:54:23,  3.85s/it]Training 1/2 epoch (loss 0.4551):  34%|▎| 1399/4114 [1:30:20<2:52:53,  3.82s/it]Training 1/2 epoch (loss 0.2852):  34%|▎| 1399/4114 [1:30:24<2:52:53,  3.82s/it]Training 1/2 epoch (loss 0.2852):  34%|▎| 1400/4114 [1:30:24<2:54:49,  3.87s/it]Training 1/2 epoch (loss 0.3848):  34%|▎| 1400/4114 [1:30:28<2:54:49,  3.87s/it]Training 1/2 epoch (loss 0.3848):  34%|▎| 1401/4114 [1:30:28<2:59:52,  3.98s/it]Training 1/2 epoch (loss 0.3613):  34%|▎| 1401/4114 [1:30:32<2:59:52,  3.98s/it]Training 1/2 epoch (loss 0.3613):  34%|▎| 1402/4114 [1:30:32<2:59:37,  3.97s/it]Training 1/2 epoch (loss 0.4023):  34%|▎| 1402/4114 [1:30:36<2:59:37,  3.97s/it]Training 1/2 epoch (loss 0.4023):  34%|▎| 1403/4114 [1:30:36<3:00:43,  4.00s/it]Training 1/2 epoch (loss 0.3555):  34%|▎| 1403/4114 [1:30:40<3:00:43,  4.00s/it]Training 1/2 epoch (loss 0.3555):  34%|▎| 1404/4114 [1:30:40<3:03:36,  4.07s/it]Training 1/2 epoch (loss 0.3633):  34%|▎| 1404/4114 [1:30:44<3:03:36,  4.07s/it]Training 1/2 epoch (loss 0.3633):  34%|▎| 1405/4114 [1:30:44<2:59:50,  3.98s/it]Training 1/2 epoch (loss 0.3750):  34%|▎| 1405/4114 [1:30:48<2:59:50,  3.98s/it]Training 1/2 epoch (loss 0.3750):  34%|▎| 1406/4114 [1:30:48<2:51:29,  3.80s/it]Training 1/2 epoch (loss 0.3633):  34%|▎| 1406/4114 [1:30:52<2:51:29,  3.80s/it]Training 1/2 epoch (loss 0.3633):  34%|▎| 1407/4114 [1:30:52<2:53:20,  3.84s/it]Training 1/2 epoch (loss 0.2637):  34%|▎| 1407/4114 [1:30:55<2:53:20,  3.84s/it]Training 1/2 epoch (loss 0.2637):  34%|▎| 1408/4114 [1:30:55<2:53:21,  3.84s/it]Training 1/2 epoch (loss 0.4141):  34%|▎| 1408/4114 [1:30:59<2:53:21,  3.84s/it]Training 1/2 epoch (loss 0.4141):  34%|▎| 1409/4114 [1:30:59<2:45:05,  3.66s/it]Training 1/2 epoch (loss 0.4922):  34%|▎| 1409/4114 [1:31:03<2:45:05,  3.66s/it]Training 1/2 epoch (loss 0.4922):  34%|▎| 1410/4114 [1:31:03<2:51:56,  3.82s/it]Training 1/2 epoch (loss 0.4199):  34%|▎| 1410/4114 [1:31:07<2:51:56,  3.82s/it]Training 1/2 epoch (loss 0.4199):  34%|▎| 1411/4114 [1:31:07<2:54:32,  3.87s/it]Training 1/2 epoch (loss 0.3438):  34%|▎| 1411/4114 [1:31:11<2:54:32,  3.87s/it]Training 1/2 epoch (loss 0.3438):  34%|▎| 1412/4114 [1:31:11<2:55:41,  3.90s/it]Training 1/2 epoch (loss 0.4414):  34%|▎| 1412/4114 [1:31:14<2:55:41,  3.90s/it]Training 1/2 epoch (loss 0.4414):  34%|▎| 1413/4114 [1:31:14<2:50:36,  3.79s/it]Training 1/2 epoch (loss 0.3320):  34%|▎| 1413/4114 [1:31:18<2:50:36,  3.79s/it]Training 1/2 epoch (loss 0.3320):  34%|▎| 1414/4114 [1:31:18<2:47:04,  3.71s/it]Training 1/2 epoch (loss 0.3242):  34%|▎| 1414/4114 [1:31:22<2:47:04,  3.71s/it]Training 1/2 epoch (loss 0.3242):  34%|▎| 1415/4114 [1:31:22<2:48:25,  3.74s/it]Training 1/2 epoch (loss 0.4219):  34%|▎| 1415/4114 [1:31:26<2:48:25,  3.74s/it]Training 1/2 epoch (loss 0.4219):  34%|▎| 1416/4114 [1:31:26<2:55:48,  3.91s/it]Training 1/2 epoch (loss 0.3984):  34%|▎| 1416/4114 [1:31:30<2:55:48,  3.91s/it]Training 1/2 epoch (loss 0.3984):  34%|▎| 1417/4114 [1:31:30<2:54:47,  3.89s/it]Training 1/2 epoch (loss 0.3594):  34%|▎| 1417/4114 [1:31:34<2:54:47,  3.89s/it]Training 1/2 epoch (loss 0.3594):  34%|▎| 1418/4114 [1:31:34<2:53:59,  3.87s/it]Training 1/2 epoch (loss 0.4805):  34%|▎| 1418/4114 [1:31:38<2:53:59,  3.87s/it]Training 1/2 epoch (loss 0.4805):  34%|▎| 1419/4114 [1:31:38<2:55:55,  3.92s/it]Training 1/2 epoch (loss 0.3379):  34%|▎| 1419/4114 [1:31:42<2:55:55,  3.92s/it]Training 1/2 epoch (loss 0.3379):  35%|▎| 1420/4114 [1:31:42<2:56:10,  3.92s/it]Training 1/2 epoch (loss 0.4180):  35%|▎| 1420/4114 [1:31:45<2:56:10,  3.92s/it]Training 1/2 epoch (loss 0.4180):  35%|▎| 1421/4114 [1:31:45<2:54:53,  3.90s/it]Training 1/2 epoch (loss 0.4883):  35%|▎| 1421/4114 [1:31:50<2:54:53,  3.90s/it]Training 1/2 epoch (loss 0.4883):  35%|▎| 1422/4114 [1:31:50<2:57:02,  3.95s/it]Training 1/2 epoch (loss 0.3945):  35%|▎| 1422/4114 [1:31:53<2:57:02,  3.95s/it]Training 1/2 epoch (loss 0.3945):  35%|▎| 1423/4114 [1:31:53<2:55:56,  3.92s/it]Training 1/2 epoch (loss 0.3828):  35%|▎| 1423/4114 [1:31:57<2:55:56,  3.92s/it]Training 1/2 epoch (loss 0.3828):  35%|▎| 1424/4114 [1:31:57<2:55:07,  3.91s/it]Training 1/2 epoch (loss 0.7500):  35%|▎| 1424/4114 [1:32:01<2:55:07,  3.91s/it]Training 1/2 epoch (loss 0.7500):  35%|▎| 1425/4114 [1:32:01<2:50:58,  3.82s/it]Training 1/2 epoch (loss 0.4414):  35%|▎| 1425/4114 [1:32:05<2:50:58,  3.82s/it]Training 1/2 epoch (loss 0.4414):  35%|▎| 1426/4114 [1:32:05<2:51:06,  3.82s/it]Training 1/2 epoch (loss 0.3965):  35%|▎| 1426/4114 [1:32:08<2:51:06,  3.82s/it]Training 1/2 epoch (loss 0.3965):  35%|▎| 1427/4114 [1:32:08<2:48:19,  3.76s/it]Training 1/2 epoch (loss 0.4570):  35%|▎| 1427/4114 [1:32:12<2:48:19,  3.76s/it]Training 1/2 epoch (loss 0.4570):  35%|▎| 1428/4114 [1:32:13<2:54:01,  3.89s/it]Training 1/2 epoch (loss 0.3613):  35%|▎| 1428/4114 [1:32:16<2:54:01,  3.89s/it]Training 1/2 epoch (loss 0.3613):  35%|▎| 1429/4114 [1:32:16<2:54:19,  3.90s/it]Training 1/2 epoch (loss 0.3086):  35%|▎| 1429/4114 [1:32:20<2:54:19,  3.90s/it]Training 1/2 epoch (loss 0.3086):  35%|▎| 1430/4114 [1:32:20<2:47:16,  3.74s/it]Training 1/2 epoch (loss 0.3516):  35%|▎| 1430/4114 [1:32:24<2:47:16,  3.74s/it]Training 1/2 epoch (loss 0.3516):  35%|▎| 1431/4114 [1:32:24<2:51:57,  3.85s/it]Training 1/2 epoch (loss 0.4434):  35%|▎| 1431/4114 [1:32:28<2:51:57,  3.85s/it]Training 1/2 epoch (loss 0.4434):  35%|▎| 1432/4114 [1:32:28<2:52:30,  3.86s/it]Training 1/2 epoch (loss 0.3457):  35%|▎| 1432/4114 [1:32:32<2:52:30,  3.86s/it]Training 1/2 epoch (loss 0.3457):  35%|▎| 1433/4114 [1:32:32<2:51:35,  3.84s/it]Training 1/2 epoch (loss 0.3320):  35%|▎| 1433/4114 [1:32:36<2:51:35,  3.84s/it]Training 1/2 epoch (loss 0.3320):  35%|▎| 1434/4114 [1:32:36<2:55:43,  3.93s/it]Training 1/2 epoch (loss 0.4023):  35%|▎| 1434/4114 [1:32:40<2:55:43,  3.93s/it]Training 1/2 epoch (loss 0.4023):  35%|▎| 1435/4114 [1:32:40<2:55:42,  3.94s/it]Training 1/2 epoch (loss 0.4688):  35%|▎| 1435/4114 [1:32:44<2:55:42,  3.94s/it]Training 1/2 epoch (loss 0.4688):  35%|▎| 1436/4114 [1:32:44<2:56:21,  3.95s/it]Training 1/2 epoch (loss 0.3066):  35%|▎| 1436/4114 [1:32:47<2:56:21,  3.95s/it]Training 1/2 epoch (loss 0.3066):  35%|▎| 1437/4114 [1:32:47<2:52:36,  3.87s/it]Training 1/2 epoch (loss 0.4824):  35%|▎| 1437/4114 [1:32:51<2:52:36,  3.87s/it]Training 1/2 epoch (loss 0.4824):  35%|▎| 1438/4114 [1:32:51<2:53:15,  3.88s/it]Training 1/2 epoch (loss 0.2734):  35%|▎| 1438/4114 [1:32:55<2:53:15,  3.88s/it]Training 1/2 epoch (loss 0.2734):  35%|▎| 1439/4114 [1:32:55<2:53:57,  3.90s/it]Training 1/2 epoch (loss 0.3535):  35%|▎| 1439/4114 [1:32:59<2:53:57,  3.90s/it]Training 1/2 epoch (loss 0.3535):  35%|▎| 1440/4114 [1:32:59<2:55:44,  3.94s/it]Training 1/2 epoch (loss 0.4531):  35%|▎| 1440/4114 [1:33:03<2:55:44,  3.94s/it]Training 1/2 epoch (loss 0.4531):  35%|▎| 1441/4114 [1:33:03<2:52:43,  3.88s/it]Training 1/2 epoch (loss 0.2617):  35%|▎| 1441/4114 [1:33:07<2:52:43,  3.88s/it]Training 1/2 epoch (loss 0.2617):  35%|▎| 1442/4114 [1:33:07<2:51:28,  3.85s/it]Training 1/2 epoch (loss 0.4453):  35%|▎| 1442/4114 [1:33:11<2:51:28,  3.85s/it]Training 1/2 epoch (loss 0.4453):  35%|▎| 1443/4114 [1:33:11<2:53:31,  3.90s/it]Training 1/2 epoch (loss 0.4102):  35%|▎| 1443/4114 [1:33:15<2:53:31,  3.90s/it]Training 1/2 epoch (loss 0.4102):  35%|▎| 1444/4114 [1:33:15<2:55:30,  3.94s/it]Training 1/2 epoch (loss 0.5859):  35%|▎| 1444/4114 [1:33:19<2:55:30,  3.94s/it]Training 1/2 epoch (loss 0.5859):  35%|▎| 1445/4114 [1:33:19<2:53:11,  3.89s/it]Training 1/2 epoch (loss 0.4199):  35%|▎| 1445/4114 [1:33:23<2:53:11,  3.89s/it]Training 1/2 epoch (loss 0.4199):  35%|▎| 1446/4114 [1:33:23<2:58:47,  4.02s/it]Training 1/2 epoch (loss 0.4688):  35%|▎| 1446/4114 [1:33:27<2:58:47,  4.02s/it]Training 1/2 epoch (loss 0.4688):  35%|▎| 1447/4114 [1:33:27<3:00:09,  4.05s/it]Training 1/2 epoch (loss 0.4570):  35%|▎| 1447/4114 [1:33:30<3:00:09,  4.05s/it]Training 1/2 epoch (loss 0.4570):  35%|▎| 1448/4114 [1:33:30<2:47:13,  3.76s/it]Training 1/2 epoch (loss 0.4883):  35%|▎| 1448/4114 [1:33:34<2:47:13,  3.76s/it]Training 1/2 epoch (loss 0.4883):  35%|▎| 1449/4114 [1:33:34<2:51:45,  3.87s/it]Training 1/2 epoch (loss 0.3828):  35%|▎| 1449/4114 [1:33:38<2:51:45,  3.87s/it]Training 1/2 epoch (loss 0.3828):  35%|▎| 1450/4114 [1:33:38<2:50:28,  3.84s/it]Training 1/2 epoch (loss 0.4512):  35%|▎| 1450/4114 [1:33:42<2:50:28,  3.84s/it]Training 1/2 epoch (loss 0.4512):  35%|▎| 1451/4114 [1:33:42<2:52:01,  3.88s/it]Training 1/2 epoch (loss 0.3750):  35%|▎| 1451/4114 [1:33:46<2:52:01,  3.88s/it]Training 1/2 epoch (loss 0.3750):  35%|▎| 1452/4114 [1:33:46<2:56:20,  3.97s/it]Training 1/2 epoch (loss 0.4062):  35%|▎| 1452/4114 [1:33:50<2:56:20,  3.97s/it]Training 1/2 epoch (loss 0.4062):  35%|▎| 1453/4114 [1:33:50<2:56:37,  3.98s/it]Training 1/2 epoch (loss 0.5312):  35%|▎| 1453/4114 [1:33:54<2:56:37,  3.98s/it]Training 1/2 epoch (loss 0.5312):  35%|▎| 1454/4114 [1:33:54<2:53:44,  3.92s/it]Training 1/2 epoch (loss 0.4336):  35%|▎| 1454/4114 [1:33:58<2:53:44,  3.92s/it]Training 1/2 epoch (loss 0.4336):  35%|▎| 1455/4114 [1:33:58<2:57:24,  4.00s/it]Training 1/2 epoch (loss 0.5117):  35%|▎| 1455/4114 [1:34:02<2:57:24,  4.00s/it]Training 1/2 epoch (loss 0.5117):  35%|▎| 1456/4114 [1:34:02<2:50:22,  3.85s/it]Training 1/2 epoch (loss 0.4629):  35%|▎| 1456/4114 [1:34:06<2:50:22,  3.85s/it]Training 1/2 epoch (loss 0.4629):  35%|▎| 1457/4114 [1:34:06<2:53:08,  3.91s/it]Training 1/2 epoch (loss 0.3984):  35%|▎| 1457/4114 [1:34:10<2:53:08,  3.91s/it]Training 1/2 epoch (loss 0.3984):  35%|▎| 1458/4114 [1:34:10<2:57:18,  4.01s/it]Training 1/2 epoch (loss 0.3535):  35%|▎| 1458/4114 [1:34:14<2:57:18,  4.01s/it]Training 1/2 epoch (loss 0.3535):  35%|▎| 1459/4114 [1:34:14<2:58:01,  4.02s/it]Training 1/2 epoch (loss 0.3164):  35%|▎| 1459/4114 [1:34:18<2:58:01,  4.02s/it]Training 1/2 epoch (loss 0.3164):  35%|▎| 1460/4114 [1:34:18<2:57:22,  4.01s/it]Training 1/2 epoch (loss 0.3691):  35%|▎| 1460/4114 [1:34:22<2:57:22,  4.01s/it]Training 1/2 epoch (loss 0.3691):  36%|▎| 1461/4114 [1:34:22<2:57:11,  4.01s/it]Training 1/2 epoch (loss 0.3398):  36%|▎| 1461/4114 [1:34:26<2:57:11,  4.01s/it]Training 1/2 epoch (loss 0.3398):  36%|▎| 1462/4114 [1:34:26<2:57:26,  4.01s/it]Training 1/2 epoch (loss 0.3633):  36%|▎| 1462/4114 [1:34:29<2:57:26,  4.01s/it]Training 1/2 epoch (loss 0.3633):  36%|▎| 1463/4114 [1:34:29<2:45:49,  3.75s/it]Training 1/2 epoch (loss 0.4043):  36%|▎| 1463/4114 [1:34:33<2:45:49,  3.75s/it]Training 1/2 epoch (loss 0.4043):  36%|▎| 1464/4114 [1:34:33<2:44:32,  3.73s/it]Training 1/2 epoch (loss 0.4863):  36%|▎| 1464/4114 [1:34:37<2:44:32,  3.73s/it]Training 1/2 epoch (loss 0.4863):  36%|▎| 1465/4114 [1:34:37<2:45:18,  3.74s/it]Training 1/2 epoch (loss 0.4102):  36%|▎| 1465/4114 [1:34:40<2:45:18,  3.74s/it]Training 1/2 epoch (loss 0.4102):  36%|▎| 1466/4114 [1:34:40<2:45:54,  3.76s/it]Training 1/2 epoch (loss 0.4238):  36%|▎| 1466/4114 [1:34:44<2:45:54,  3.76s/it]Training 1/2 epoch (loss 0.4238):  36%|▎| 1467/4114 [1:34:44<2:49:24,  3.84s/it]Training 1/2 epoch (loss 0.3867):  36%|▎| 1467/4114 [1:34:48<2:49:24,  3.84s/it]Training 1/2 epoch (loss 0.3867):  36%|▎| 1468/4114 [1:34:48<2:43:51,  3.72s/it]Training 1/2 epoch (loss 0.3340):  36%|▎| 1468/4114 [1:34:52<2:43:51,  3.72s/it]Training 1/2 epoch (loss 0.3340):  36%|▎| 1469/4114 [1:34:52<2:48:29,  3.82s/it]Training 1/2 epoch (loss 0.2461):  36%|▎| 1469/4114 [1:34:56<2:48:29,  3.82s/it]Training 1/2 epoch (loss 0.2461):  36%|▎| 1470/4114 [1:34:56<2:50:42,  3.87s/it]Training 1/2 epoch (loss 0.4336):  36%|▎| 1470/4114 [1:35:00<2:50:42,  3.87s/it]Training 1/2 epoch (loss 0.4336):  36%|▎| 1471/4114 [1:35:00<2:51:27,  3.89s/it]Training 1/2 epoch (loss 0.4121):  36%|▎| 1471/4114 [1:35:04<2:51:27,  3.89s/it]Training 1/2 epoch (loss 0.4121):  36%|▎| 1472/4114 [1:35:04<2:50:38,  3.88s/it]Training 1/2 epoch (loss 0.4453):  36%|▎| 1472/4114 [1:35:08<2:50:38,  3.88s/it]Training 1/2 epoch (loss 0.4453):  36%|▎| 1473/4114 [1:35:08<2:54:40,  3.97s/it]Training 1/2 epoch (loss 0.4570):  36%|▎| 1473/4114 [1:35:12<2:54:40,  3.97s/it]Training 1/2 epoch (loss 0.4570):  36%|▎| 1474/4114 [1:35:12<2:52:28,  3.92s/it]Training 1/2 epoch (loss 0.3320):  36%|▎| 1474/4114 [1:35:16<2:52:28,  3.92s/it]Training 1/2 epoch (loss 0.3320):  36%|▎| 1475/4114 [1:35:16<2:51:37,  3.90s/it]Training 1/2 epoch (loss 0.3730):  36%|▎| 1475/4114 [1:35:19<2:51:37,  3.90s/it]Training 1/2 epoch (loss 0.3730):  36%|▎| 1476/4114 [1:35:19<2:52:10,  3.92s/it]Training 1/2 epoch (loss 0.3906):  36%|▎| 1476/4114 [1:35:23<2:52:10,  3.92s/it]Training 1/2 epoch (loss 0.3906):  36%|▎| 1477/4114 [1:35:23<2:52:56,  3.93s/it]Training 1/2 epoch (loss 0.4121):  36%|▎| 1477/4114 [1:35:27<2:52:56,  3.93s/it]Training 1/2 epoch (loss 0.4121):  36%|▎| 1478/4114 [1:35:27<2:47:07,  3.80s/it]Training 1/2 epoch (loss 0.4004):  36%|▎| 1478/4114 [1:35:31<2:47:07,  3.80s/it]Training 1/2 epoch (loss 0.4004):  36%|▎| 1479/4114 [1:35:31<2:53:28,  3.95s/it]Training 1/2 epoch (loss 0.4375):  36%|▎| 1479/4114 [1:35:34<2:53:28,  3.95s/it]Training 1/2 epoch (loss 0.4375):  36%|▎| 1480/4114 [1:35:34<2:43:33,  3.73s/it]Training 1/2 epoch (loss 0.3848):  36%|▎| 1480/4114 [1:35:38<2:43:33,  3.73s/it]Training 1/2 epoch (loss 0.3848):  36%|▎| 1481/4114 [1:35:38<2:44:01,  3.74s/it]Training 1/2 epoch (loss 0.4492):  36%|▎| 1481/4114 [1:35:42<2:44:01,  3.74s/it]Training 1/2 epoch (loss 0.4492):  36%|▎| 1482/4114 [1:35:42<2:47:38,  3.82s/it]Training 1/2 epoch (loss 0.4102):  36%|▎| 1482/4114 [1:35:46<2:47:38,  3.82s/it]Training 1/2 epoch (loss 0.4102):  36%|▎| 1483/4114 [1:35:46<2:47:49,  3.83s/it]Training 1/2 epoch (loss 0.3535):  36%|▎| 1483/4114 [1:35:50<2:47:49,  3.83s/it]Training 1/2 epoch (loss 0.3535):  36%|▎| 1484/4114 [1:35:50<2:48:55,  3.85s/it]Training 1/2 epoch (loss 0.2910):  36%|▎| 1484/4114 [1:35:54<2:48:55,  3.85s/it]Training 1/2 epoch (loss 0.2910):  36%|▎| 1485/4114 [1:35:54<2:50:54,  3.90s/it]Training 1/2 epoch (loss 0.5859):  36%|▎| 1485/4114 [1:35:58<2:50:54,  3.90s/it]Training 1/2 epoch (loss 0.5859):  36%|▎| 1486/4114 [1:35:58<2:51:37,  3.92s/it]Training 1/2 epoch (loss 0.4199):  36%|▎| 1486/4114 [1:36:01<2:51:37,  3.92s/it]Training 1/2 epoch (loss 0.4199):  36%|▎| 1487/4114 [1:36:01<2:45:09,  3.77s/it]Training 1/2 epoch (loss 0.5234):  36%|▎| 1487/4114 [1:36:05<2:45:09,  3.77s/it]Training 1/2 epoch (loss 0.5234):  36%|▎| 1488/4114 [1:36:05<2:44:41,  3.76s/it]Training 1/2 epoch (loss 0.4141):  36%|▎| 1488/4114 [1:36:08<2:44:41,  3.76s/it]Training 1/2 epoch (loss 0.4141):  36%|▎| 1489/4114 [1:36:08<2:39:41,  3.65s/it]Training 1/2 epoch (loss 0.2949):  36%|▎| 1489/4114 [1:36:12<2:39:41,  3.65s/it]Training 1/2 epoch (loss 0.2949):  36%|▎| 1490/4114 [1:36:12<2:44:12,  3.75s/it]Training 1/2 epoch (loss 0.3789):  36%|▎| 1490/4114 [1:36:16<2:44:12,  3.75s/it]Training 1/2 epoch (loss 0.3789):  36%|▎| 1491/4114 [1:36:16<2:47:09,  3.82s/it]Training 1/2 epoch (loss 0.3633):  36%|▎| 1491/4114 [1:36:20<2:47:09,  3.82s/it]Training 1/2 epoch (loss 0.3633):  36%|▎| 1492/4114 [1:36:20<2:48:43,  3.86s/it]Training 1/2 epoch (loss 0.5117):  36%|▎| 1492/4114 [1:36:24<2:48:43,  3.86s/it]Training 1/2 epoch (loss 0.5117):  36%|▎| 1493/4114 [1:36:24<2:50:26,  3.90s/it]Training 1/2 epoch (loss 0.4590):  36%|▎| 1493/4114 [1:36:29<2:50:26,  3.90s/it]Training 1/2 epoch (loss 0.4590):  36%|▎| 1494/4114 [1:36:29<2:54:47,  4.00s/it]Training 1/2 epoch (loss 0.4141):  36%|▎| 1494/4114 [1:36:33<2:54:47,  4.00s/it]Training 1/2 epoch (loss 0.4141):  36%|▎| 1495/4114 [1:36:33<2:55:00,  4.01s/it]Training 1/2 epoch (loss 0.2832):  36%|▎| 1495/4114 [1:36:37<2:55:00,  4.01s/it]Training 1/2 epoch (loss 0.2832):  36%|▎| 1496/4114 [1:36:37<2:55:06,  4.01s/it]Training 1/2 epoch (loss 0.2402):  36%|▎| 1496/4114 [1:36:40<2:55:06,  4.01s/it]Training 1/2 epoch (loss 0.2402):  36%|▎| 1497/4114 [1:36:40<2:51:05,  3.92s/it]Training 1/2 epoch (loss 0.3203):  36%|▎| 1497/4114 [1:36:44<2:51:05,  3.92s/it]Training 1/2 epoch (loss 0.3203):  36%|▎| 1498/4114 [1:36:44<2:51:29,  3.93s/it]Training 1/2 epoch (loss 0.3965):  36%|▎| 1498/4114 [1:36:48<2:51:29,  3.93s/it]Training 1/2 epoch (loss 0.3965):  36%|▎| 1499/4114 [1:36:48<2:44:21,  3.77s/it]Training 1/2 epoch (loss 0.6211):  36%|▎| 1499/4114 [1:36:52<2:44:21,  3.77s/it]Training 1/2 epoch (loss 0.6211):  36%|▎| 1500/4114 [1:36:52<2:49:29,  3.89s/it]Training 1/2 epoch (loss 0.3223):  36%|▎| 1500/4114 [1:36:55<2:49:29,  3.89s/it]Training 1/2 epoch (loss 0.3223):  36%|▎| 1501/4114 [1:36:55<2:42:05,  3.72s/it]Training 1/2 epoch (loss 0.3477):  36%|▎| 1501/4114 [1:36:59<2:42:05,  3.72s/it]Training 1/2 epoch (loss 0.3477):  37%|▎| 1502/4114 [1:36:59<2:45:58,  3.81s/it]Training 1/2 epoch (loss 0.2676):  37%|▎| 1502/4114 [1:37:04<2:45:58,  3.81s/it]Training 1/2 epoch (loss 0.2676):  37%|▎| 1503/4114 [1:37:04<2:52:08,  3.96s/it]Training 1/2 epoch (loss 0.3516):  37%|▎| 1503/4114 [1:37:08<2:52:08,  3.96s/it]Training 1/2 epoch (loss 0.3516):  37%|▎| 1504/4114 [1:37:08<2:52:31,  3.97s/it]Training 1/2 epoch (loss 0.3516):  37%|▎| 1504/4114 [1:37:11<2:52:31,  3.97s/it]Training 1/2 epoch (loss 0.3516):  37%|▎| 1505/4114 [1:37:11<2:43:49,  3.77s/it]Training 1/2 epoch (loss 0.2227):  37%|▎| 1505/4114 [1:37:15<2:43:49,  3.77s/it]Training 1/2 epoch (loss 0.2227):  37%|▎| 1506/4114 [1:37:15<2:48:51,  3.88s/it]Training 1/2 epoch (loss 0.3496):  37%|▎| 1506/4114 [1:37:19<2:48:51,  3.88s/it]Training 1/2 epoch (loss 0.3496):  37%|▎| 1507/4114 [1:37:19<2:46:48,  3.84s/it]Training 1/2 epoch (loss 0.4668):  37%|▎| 1507/4114 [1:37:22<2:46:48,  3.84s/it]Training 1/2 epoch (loss 0.4668):  37%|▎| 1508/4114 [1:37:22<2:41:51,  3.73s/it]Training 1/2 epoch (loss 0.2969):  37%|▎| 1508/4114 [1:37:26<2:41:51,  3.73s/it]Training 1/2 epoch (loss 0.2969):  37%|▎| 1509/4114 [1:37:26<2:48:13,  3.87s/it]Training 1/2 epoch (loss 0.6758):  37%|▎| 1509/4114 [1:37:30<2:48:13,  3.87s/it]Training 1/2 epoch (loss 0.6758):  37%|▎| 1510/4114 [1:37:30<2:49:09,  3.90s/it]Training 1/2 epoch (loss 0.4258):  37%|▎| 1510/4114 [1:37:34<2:49:09,  3.90s/it]Training 1/2 epoch (loss 0.4258):  37%|▎| 1511/4114 [1:37:34<2:47:08,  3.85s/it]Training 1/2 epoch (loss 0.6172):  37%|▎| 1511/4114 [1:37:38<2:47:08,  3.85s/it]Training 1/2 epoch (loss 0.6172):  37%|▎| 1512/4114 [1:37:38<2:52:15,  3.97s/it]Training 1/2 epoch (loss 0.4883):  37%|▎| 1512/4114 [1:37:42<2:52:15,  3.97s/it]Training 1/2 epoch (loss 0.4883):  37%|▎| 1513/4114 [1:37:42<2:50:30,  3.93s/it]Training 1/2 epoch (loss 0.5391):  37%|▎| 1513/4114 [1:37:46<2:50:30,  3.93s/it]Training 1/2 epoch (loss 0.5391):  37%|▎| 1514/4114 [1:37:46<2:48:39,  3.89s/it]Training 1/2 epoch (loss 0.4922):  37%|▎| 1514/4114 [1:37:50<2:48:39,  3.89s/it]Training 1/2 epoch (loss 0.4922):  37%|▎| 1515/4114 [1:37:50<2:50:40,  3.94s/it]Training 1/2 epoch (loss 0.5312):  37%|▎| 1515/4114 [1:37:54<2:50:40,  3.94s/it]Training 1/2 epoch (loss 0.5312):  37%|▎| 1516/4114 [1:37:54<2:48:20,  3.89s/it]Training 1/2 epoch (loss 0.2598):  37%|▎| 1516/4114 [1:37:58<2:48:20,  3.89s/it]Training 1/2 epoch (loss 0.2598):  37%|▎| 1517/4114 [1:37:58<2:46:49,  3.85s/it]Training 1/2 epoch (loss 0.4492):  37%|▎| 1517/4114 [1:38:02<2:46:49,  3.85s/it]Training 1/2 epoch (loss 0.4492):  37%|▎| 1518/4114 [1:38:02<2:50:47,  3.95s/it]Training 1/2 epoch (loss 0.3965):  37%|▎| 1518/4114 [1:38:06<2:50:47,  3.95s/it]Training 1/2 epoch (loss 0.3965):  37%|▎| 1519/4114 [1:38:06<2:52:28,  3.99s/it]Training 1/2 epoch (loss 0.4141):  37%|▎| 1519/4114 [1:38:10<2:52:28,  3.99s/it]Training 1/2 epoch (loss 0.4141):  37%|▎| 1520/4114 [1:38:10<2:52:36,  3.99s/it]Training 1/2 epoch (loss 0.4121):  37%|▎| 1520/4114 [1:38:14<2:52:36,  3.99s/it]Training 1/2 epoch (loss 0.4121):  37%|▎| 1521/4114 [1:38:14<2:49:59,  3.93s/it]Training 1/2 epoch (loss 0.4062):  37%|▎| 1521/4114 [1:38:17<2:49:59,  3.93s/it]Training 1/2 epoch (loss 0.4062):  37%|▎| 1522/4114 [1:38:17<2:46:30,  3.85s/it]Training 1/2 epoch (loss 0.3711):  37%|▎| 1522/4114 [1:38:21<2:46:30,  3.85s/it]Training 1/2 epoch (loss 0.3711):  37%|▎| 1523/4114 [1:38:21<2:46:56,  3.87s/it]Training 1/2 epoch (loss 0.5625):  37%|▎| 1523/4114 [1:38:25<2:46:56,  3.87s/it]Training 1/2 epoch (loss 0.5625):  37%|▎| 1524/4114 [1:38:25<2:51:43,  3.98s/it]Training 1/2 epoch (loss 0.3223):  37%|▎| 1524/4114 [1:38:29<2:51:43,  3.98s/it]Training 1/2 epoch (loss 0.3223):  37%|▎| 1525/4114 [1:38:29<2:46:22,  3.86s/it]Training 1/2 epoch (loss 0.4980):  37%|▎| 1525/4114 [1:38:33<2:46:22,  3.86s/it]Training 1/2 epoch (loss 0.4980):  37%|▎| 1526/4114 [1:38:33<2:46:29,  3.86s/it]Training 1/2 epoch (loss 0.4043):  37%|▎| 1526/4114 [1:38:37<2:46:29,  3.86s/it]Training 1/2 epoch (loss 0.4043):  37%|▎| 1527/4114 [1:38:37<2:49:47,  3.94s/it]Training 1/2 epoch (loss 0.4121):  37%|▎| 1527/4114 [1:38:41<2:49:47,  3.94s/it]Training 1/2 epoch (loss 0.4121):  37%|▎| 1528/4114 [1:38:41<2:44:00,  3.81s/it]Training 1/2 epoch (loss 0.4414):  37%|▎| 1528/4114 [1:38:44<2:44:00,  3.81s/it]Training 1/2 epoch (loss 0.4414):  37%|▎| 1529/4114 [1:38:44<2:42:22,  3.77s/it]Training 1/2 epoch (loss 0.4961):  37%|▎| 1529/4114 [1:38:48<2:42:22,  3.77s/it]Training 1/2 epoch (loss 0.4961):  37%|▎| 1530/4114 [1:38:48<2:46:33,  3.87s/it]Training 1/2 epoch (loss 0.3477):  37%|▎| 1530/4114 [1:38:52<2:46:33,  3.87s/it]Training 1/2 epoch (loss 0.3477):  37%|▎| 1531/4114 [1:38:52<2:45:37,  3.85s/it]Training 1/2 epoch (loss 0.4473):  37%|▎| 1531/4114 [1:38:55<2:45:37,  3.85s/it]Training 1/2 epoch (loss 0.4473):  37%|▎| 1532/4114 [1:38:55<2:38:35,  3.69s/it]Training 1/2 epoch (loss 0.4922):  37%|▎| 1532/4114 [1:39:00<2:38:35,  3.69s/it]Training 1/2 epoch (loss 0.4922):  37%|▎| 1533/4114 [1:39:00<2:46:08,  3.86s/it]Training 1/2 epoch (loss 0.4141):  37%|▎| 1533/4114 [1:39:03<2:46:08,  3.86s/it]Training 1/2 epoch (loss 0.4141):  37%|▎| 1534/4114 [1:39:03<2:45:15,  3.84s/it]Training 1/2 epoch (loss 0.4922):  37%|▎| 1534/4114 [1:39:07<2:45:15,  3.84s/it]Training 1/2 epoch (loss 0.4922):  37%|▎| 1535/4114 [1:39:07<2:44:18,  3.82s/it]Training 1/2 epoch (loss 0.4648):  37%|▎| 1535/4114 [1:39:11<2:44:18,  3.82s/it]Training 1/2 epoch (loss 0.4648):  37%|▎| 1536/4114 [1:39:11<2:49:08,  3.94s/it]Training 1/2 epoch (loss 0.3711):  37%|▎| 1536/4114 [1:39:15<2:49:08,  3.94s/it]Training 1/2 epoch (loss 0.3711):  37%|▎| 1537/4114 [1:39:15<2:47:13,  3.89s/it]Training 1/2 epoch (loss 0.4980):  37%|▎| 1537/4114 [1:39:19<2:47:13,  3.89s/it]Training 1/2 epoch (loss 0.4980):  37%|▎| 1538/4114 [1:39:19<2:47:27,  3.90s/it]Training 1/2 epoch (loss 0.3477):  37%|▎| 1538/4114 [1:39:23<2:47:27,  3.90s/it]Training 1/2 epoch (loss 0.3477):  37%|▎| 1539/4114 [1:39:23<2:49:27,  3.95s/it]Training 1/2 epoch (loss 0.4473):  37%|▎| 1539/4114 [1:39:27<2:49:27,  3.95s/it]Training 1/2 epoch (loss 0.4473):  37%|▎| 1540/4114 [1:39:27<2:48:59,  3.94s/it]Training 1/2 epoch (loss 0.4258):  37%|▎| 1540/4114 [1:39:31<2:48:59,  3.94s/it]Training 1/2 epoch (loss 0.4258):  37%|▎| 1541/4114 [1:39:31<2:46:25,  3.88s/it]Training 1/2 epoch (loss 0.4492):  37%|▎| 1541/4114 [1:39:35<2:46:25,  3.88s/it]Training 1/2 epoch (loss 0.4492):  37%|▎| 1542/4114 [1:39:35<2:43:04,  3.80s/it]Training 1/2 epoch (loss 0.4512):  37%|▎| 1542/4114 [1:39:38<2:43:04,  3.80s/it]Training 1/2 epoch (loss 0.4512):  38%|▍| 1543/4114 [1:39:38<2:43:37,  3.82s/it]Training 1/2 epoch (loss 0.5352):  38%|▍| 1543/4114 [1:39:42<2:43:37,  3.82s/it]Training 1/2 epoch (loss 0.5352):  38%|▍| 1544/4114 [1:39:42<2:45:31,  3.86s/it]Training 1/2 epoch (loss 0.4688):  38%|▍| 1544/4114 [1:39:46<2:45:31,  3.86s/it]Training 1/2 epoch (loss 0.4688):  38%|▍| 1545/4114 [1:39:46<2:48:50,  3.94s/it]Training 1/2 epoch (loss 0.3633):  38%|▍| 1545/4114 [1:39:51<2:48:50,  3.94s/it]Training 1/2 epoch (loss 0.3633):  38%|▍| 1546/4114 [1:39:51<2:50:06,  3.97s/it]Training 1/2 epoch (loss 0.3652):  38%|▍| 1546/4114 [1:39:54<2:50:06,  3.97s/it]Training 1/2 epoch (loss 0.3652):  38%|▍| 1547/4114 [1:39:54<2:49:40,  3.97s/it]Training 1/2 epoch (loss 0.4746):  38%|▍| 1547/4114 [1:39:59<2:49:40,  3.97s/it]Training 1/2 epoch (loss 0.4746):  38%|▍| 1548/4114 [1:39:59<2:53:08,  4.05s/it]Training 1/2 epoch (loss 0.4434):  38%|▍| 1548/4114 [1:40:02<2:53:08,  4.05s/it]Training 1/2 epoch (loss 0.4434):  38%|▍| 1549/4114 [1:40:02<2:49:33,  3.97s/it]Training 1/2 epoch (loss 0.4297):  38%|▍| 1549/4114 [1:40:06<2:49:33,  3.97s/it]Training 1/2 epoch (loss 0.4297):  38%|▍| 1550/4114 [1:40:06<2:48:54,  3.95s/it]Training 1/2 epoch (loss 0.3926):  38%|▍| 1550/4114 [1:40:10<2:48:54,  3.95s/it]Training 1/2 epoch (loss 0.3926):  38%|▍| 1551/4114 [1:40:10<2:50:11,  3.98s/it]Training 1/2 epoch (loss 0.3320):  38%|▍| 1551/4114 [1:40:14<2:50:11,  3.98s/it]Training 1/2 epoch (loss 0.3320):  38%|▍| 1552/4114 [1:40:14<2:47:54,  3.93s/it]Training 1/2 epoch (loss 0.3496):  38%|▍| 1552/4114 [1:40:18<2:47:54,  3.93s/it]Training 1/2 epoch (loss 0.3496):  38%|▍| 1553/4114 [1:40:18<2:45:55,  3.89s/it]Training 1/2 epoch (loss 0.5078):  38%|▍| 1553/4114 [1:40:22<2:45:55,  3.89s/it]Training 1/2 epoch (loss 0.5078):  38%|▍| 1554/4114 [1:40:22<2:45:13,  3.87s/it]Training 1/2 epoch (loss 0.4473):  38%|▍| 1554/4114 [1:40:26<2:45:13,  3.87s/it]Training 1/2 epoch (loss 0.4473):  38%|▍| 1555/4114 [1:40:26<2:46:05,  3.89s/it]Training 1/2 epoch (loss 0.4883):  38%|▍| 1555/4114 [1:40:30<2:46:05,  3.89s/it]Training 1/2 epoch (loss 0.4883):  38%|▍| 1556/4114 [1:40:30<2:45:25,  3.88s/it]Training 1/2 epoch (loss 0.3887):  38%|▍| 1556/4114 [1:40:34<2:45:25,  3.88s/it]Training 1/2 epoch (loss 0.3887):  38%|▍| 1557/4114 [1:40:34<2:48:05,  3.94s/it]Training 1/2 epoch (loss 0.4316):  38%|▍| 1557/4114 [1:40:37<2:48:05,  3.94s/it]Training 1/2 epoch (loss 0.4316):  38%|▍| 1558/4114 [1:40:37<2:40:21,  3.76s/it]Training 1/2 epoch (loss 0.3711):  38%|▍| 1558/4114 [1:40:41<2:40:21,  3.76s/it]Training 1/2 epoch (loss 0.3711):  38%|▍| 1559/4114 [1:40:41<2:45:10,  3.88s/it]Training 1/2 epoch (loss 0.4316):  38%|▍| 1559/4114 [1:40:46<2:45:10,  3.88s/it]Training 1/2 epoch (loss 0.4316):  38%|▍| 1560/4114 [1:40:46<2:49:50,  3.99s/it]Training 1/2 epoch (loss 0.4590):  38%|▍| 1560/4114 [1:40:50<2:49:50,  3.99s/it]Training 1/2 epoch (loss 0.4590):  38%|▍| 1561/4114 [1:40:50<2:50:20,  4.00s/it]Training 1/2 epoch (loss 0.3926):  38%|▍| 1561/4114 [1:40:54<2:50:20,  4.00s/it]Training 1/2 epoch (loss 0.3926):  38%|▍| 1562/4114 [1:40:54<2:50:24,  4.01s/it]Training 1/2 epoch (loss 0.3242):  38%|▍| 1562/4114 [1:40:58<2:50:24,  4.01s/it]Training 1/2 epoch (loss 0.3242):  38%|▍| 1563/4114 [1:40:58<2:53:08,  4.07s/it]Training 1/2 epoch (loss 0.3867):  38%|▍| 1563/4114 [1:41:02<2:53:08,  4.07s/it]Training 1/2 epoch (loss 0.3867):  38%|▍| 1564/4114 [1:41:02<2:51:23,  4.03s/it]Training 1/2 epoch (loss 0.3574):  38%|▍| 1564/4114 [1:41:06<2:51:23,  4.03s/it]Training 1/2 epoch (loss 0.3574):  38%|▍| 1565/4114 [1:41:06<2:48:12,  3.96s/it]Training 1/2 epoch (loss 0.3145):  38%|▍| 1565/4114 [1:41:10<2:48:12,  3.96s/it]Training 1/2 epoch (loss 0.3145):  38%|▍| 1566/4114 [1:41:10<2:52:11,  4.05s/it]Training 1/2 epoch (loss 0.4180):  38%|▍| 1566/4114 [1:41:14<2:52:11,  4.05s/it]Training 1/2 epoch (loss 0.4180):  38%|▍| 1567/4114 [1:41:14<2:50:53,  4.03s/it]Training 1/2 epoch (loss 0.3086):  38%|▍| 1567/4114 [1:41:18<2:50:53,  4.03s/it]Training 1/2 epoch (loss 0.3086):  38%|▍| 1568/4114 [1:41:18<2:47:25,  3.95s/it]Training 1/2 epoch (loss 0.3516):  38%|▍| 1568/4114 [1:41:22<2:47:25,  3.95s/it]Training 1/2 epoch (loss 0.3516):  38%|▍| 1569/4114 [1:41:22<2:51:28,  4.04s/it]Training 1/2 epoch (loss 0.3516):  38%|▍| 1569/4114 [1:41:26<2:51:28,  4.04s/it]Training 1/2 epoch (loss 0.3516):  38%|▍| 1570/4114 [1:41:26<2:48:34,  3.98s/it]Training 1/2 epoch (loss 0.3145):  38%|▍| 1570/4114 [1:41:30<2:48:34,  3.98s/it]Training 1/2 epoch (loss 0.3145):  38%|▍| 1571/4114 [1:41:30<2:48:21,  3.97s/it]Training 1/2 epoch (loss 0.4453):  38%|▍| 1571/4114 [1:41:34<2:48:21,  3.97s/it]Training 1/2 epoch (loss 0.4453):  38%|▍| 1572/4114 [1:41:34<2:49:35,  4.00s/it]Training 1/2 epoch (loss 0.4316):  38%|▍| 1572/4114 [1:41:37<2:49:35,  4.00s/it]Training 1/2 epoch (loss 0.4316):  38%|▍| 1573/4114 [1:41:37<2:45:06,  3.90s/it]Training 1/2 epoch (loss 0.4727):  38%|▍| 1573/4114 [1:41:41<2:45:06,  3.90s/it]Training 1/2 epoch (loss 0.4727):  38%|▍| 1574/4114 [1:41:41<2:45:26,  3.91s/it]Training 1/2 epoch (loss 0.4062):  38%|▍| 1574/4114 [1:41:45<2:45:26,  3.91s/it]Training 1/2 epoch (loss 0.4062):  38%|▍| 1575/4114 [1:41:45<2:45:27,  3.91s/it]Training 1/2 epoch (loss 0.4375):  38%|▍| 1575/4114 [1:41:49<2:45:27,  3.91s/it]Training 1/2 epoch (loss 0.4375):  38%|▍| 1576/4114 [1:41:49<2:43:23,  3.86s/it]Training 1/2 epoch (loss 0.3965):  38%|▍| 1576/4114 [1:41:52<2:43:23,  3.86s/it]Training 1/2 epoch (loss 0.3965):  38%|▍| 1577/4114 [1:41:52<2:38:38,  3.75s/it]Training 1/2 epoch (loss 0.3184):  38%|▍| 1577/4114 [1:41:57<2:38:38,  3.75s/it]Training 1/2 epoch (loss 0.3184):  38%|▍| 1578/4114 [1:41:57<2:45:19,  3.91s/it]Training 1/2 epoch (loss 0.3242):  38%|▍| 1578/4114 [1:42:01<2:45:19,  3.91s/it]Training 1/2 epoch (loss 0.3242):  38%|▍| 1579/4114 [1:42:01<2:45:17,  3.91s/it]Training 1/2 epoch (loss 0.4395):  38%|▍| 1579/4114 [1:42:05<2:45:17,  3.91s/it]Training 1/2 epoch (loss 0.4395):  38%|▍| 1580/4114 [1:42:05<2:45:16,  3.91s/it]Training 1/2 epoch (loss 0.4746):  38%|▍| 1580/4114 [1:42:08<2:45:16,  3.91s/it]Training 1/2 epoch (loss 0.4746):  38%|▍| 1581/4114 [1:42:08<2:41:44,  3.83s/it]Training 1/2 epoch (loss 0.3809):  38%|▍| 1581/4114 [1:42:12<2:41:44,  3.83s/it]Training 1/2 epoch (loss 0.3809):  38%|▍| 1582/4114 [1:42:12<2:41:19,  3.82s/it]Training 1/2 epoch (loss 0.3262):  38%|▍| 1582/4114 [1:42:16<2:41:19,  3.82s/it]Training 1/2 epoch (loss 0.3262):  38%|▍| 1583/4114 [1:42:16<2:41:38,  3.83s/it]Training 1/2 epoch (loss 0.3047):  38%|▍| 1583/4114 [1:42:20<2:41:38,  3.83s/it]Training 1/2 epoch (loss 0.3047):  39%|▍| 1584/4114 [1:42:20<2:47:12,  3.97s/it]Training 1/2 epoch (loss 0.5078):  39%|▍| 1584/4114 [1:42:23<2:47:12,  3.97s/it]Training 1/2 epoch (loss 0.5078):  39%|▍| 1585/4114 [1:42:23<2:40:07,  3.80s/it]Training 1/2 epoch (loss 0.3125):  39%|▍| 1585/4114 [1:42:27<2:40:07,  3.80s/it]Training 1/2 epoch (loss 0.3125):  39%|▍| 1586/4114 [1:42:27<2:35:01,  3.68s/it]Training 1/2 epoch (loss 0.2773):  39%|▍| 1586/4114 [1:42:31<2:35:01,  3.68s/it]Training 1/2 epoch (loss 0.2773):  39%|▍| 1587/4114 [1:42:31<2:39:25,  3.79s/it]Training 1/2 epoch (loss 0.4707):  39%|▍| 1587/4114 [1:42:35<2:39:25,  3.79s/it]Training 1/2 epoch (loss 0.4707):  39%|▍| 1588/4114 [1:42:35<2:40:49,  3.82s/it]Training 1/2 epoch (loss 0.3965):  39%|▍| 1588/4114 [1:42:39<2:40:49,  3.82s/it]Training 1/2 epoch (loss 0.3965):  39%|▍| 1589/4114 [1:42:39<2:40:04,  3.80s/it]Training 1/2 epoch (loss 0.3203):  39%|▍| 1589/4114 [1:42:43<2:40:04,  3.80s/it]Training 1/2 epoch (loss 0.3203):  39%|▍| 1590/4114 [1:42:43<2:45:00,  3.92s/it]Training 1/2 epoch (loss 0.6953):  39%|▍| 1590/4114 [1:42:47<2:45:00,  3.92s/it]Training 1/2 epoch (loss 0.6953):  39%|▍| 1591/4114 [1:42:47<2:42:26,  3.86s/it]Training 1/2 epoch (loss 0.2314):  39%|▍| 1591/4114 [1:42:50<2:42:26,  3.86s/it]Training 1/2 epoch (loss 0.2314):  39%|▍| 1592/4114 [1:42:50<2:36:30,  3.72s/it]Training 1/2 epoch (loss 0.4082):  39%|▍| 1592/4114 [1:42:54<2:36:30,  3.72s/it]Training 1/2 epoch (loss 0.4082):  39%|▍| 1593/4114 [1:42:54<2:43:45,  3.90s/it]Training 1/2 epoch (loss 0.3164):  39%|▍| 1593/4114 [1:42:58<2:43:45,  3.90s/it]Training 1/2 epoch (loss 0.3164):  39%|▍| 1594/4114 [1:42:58<2:44:54,  3.93s/it]Training 1/2 epoch (loss 0.3008):  39%|▍| 1594/4114 [1:43:02<2:44:54,  3.93s/it]Training 1/2 epoch (loss 0.3008):  39%|▍| 1595/4114 [1:43:02<2:37:13,  3.74s/it]Training 1/2 epoch (loss 0.4023):  39%|▍| 1595/4114 [1:43:05<2:37:13,  3.74s/it]Training 1/2 epoch (loss 0.4023):  39%|▍| 1596/4114 [1:43:05<2:36:17,  3.72s/it]Training 1/2 epoch (loss 0.4941):  39%|▍| 1596/4114 [1:43:08<2:36:17,  3.72s/it]Training 1/2 epoch (loss 0.4941):  39%|▍| 1597/4114 [1:43:08<2:30:22,  3.58s/it]Training 1/2 epoch (loss 0.3633):  39%|▍| 1597/4114 [1:43:12<2:30:22,  3.58s/it]Training 1/2 epoch (loss 0.3633):  39%|▍| 1598/4114 [1:43:12<2:28:20,  3.54s/it]Training 1/2 epoch (loss 0.5312):  39%|▍| 1598/4114 [1:43:16<2:28:20,  3.54s/it]Training 1/2 epoch (loss 0.5312):  39%|▍| 1599/4114 [1:43:16<2:33:04,  3.65s/it]Training 1/2 epoch (loss 0.4258):  39%|▍| 1599/4114 [1:43:20<2:33:04,  3.65s/it]Training 1/2 epoch (loss 0.4258):  39%|▍| 1600/4114 [1:43:20<2:35:25,  3.71s/it]Training 1/2 epoch (loss 0.3926):  39%|▍| 1600/4114 [1:43:23<2:35:25,  3.71s/it]Training 1/2 epoch (loss 0.3926):  39%|▍| 1601/4114 [1:43:23<2:36:07,  3.73s/it]Training 1/2 epoch (loss 0.4980):  39%|▍| 1601/4114 [1:43:28<2:36:07,  3.73s/it]Training 1/2 epoch (loss 0.4980):  39%|▍| 1602/4114 [1:43:28<2:43:13,  3.90s/it]Training 1/2 epoch (loss 0.3496):  39%|▍| 1602/4114 [1:43:31<2:43:13,  3.90s/it]Training 1/2 epoch (loss 0.3496):  39%|▍| 1603/4114 [1:43:31<2:37:00,  3.75s/it]Training 1/2 epoch (loss 0.4707):  39%|▍| 1603/4114 [1:43:35<2:37:00,  3.75s/it]Training 1/2 epoch (loss 0.4707):  39%|▍| 1604/4114 [1:43:35<2:40:54,  3.85s/it]Training 1/2 epoch (loss 0.3984):  39%|▍| 1604/4114 [1:43:39<2:40:54,  3.85s/it]Training 1/2 epoch (loss 0.3984):  39%|▍| 1605/4114 [1:43:39<2:44:44,  3.94s/it]Training 1/2 epoch (loss 0.4160):  39%|▍| 1605/4114 [1:43:44<2:44:44,  3.94s/it]Training 1/2 epoch (loss 0.4160):  39%|▍| 1606/4114 [1:43:44<2:47:10,  4.00s/it]Training 1/2 epoch (loss 0.4766):  39%|▍| 1606/4114 [1:43:47<2:47:10,  4.00s/it]Training 1/2 epoch (loss 0.4766):  39%|▍| 1607/4114 [1:43:47<2:46:32,  3.99s/it]Training 1/2 epoch (loss 0.6016):  39%|▍| 1607/4114 [1:43:52<2:46:32,  3.99s/it]Training 1/2 epoch (loss 0.6016):  39%|▍| 1608/4114 [1:43:52<2:48:39,  4.04s/it]Training 1/2 epoch (loss 0.4395):  39%|▍| 1608/4114 [1:43:55<2:48:39,  4.04s/it]Training 1/2 epoch (loss 0.4395):  39%|▍| 1609/4114 [1:43:55<2:40:17,  3.84s/it]Training 1/2 epoch (loss 0.5625):  39%|▍| 1609/4114 [1:43:58<2:40:17,  3.84s/it]Training 1/2 epoch (loss 0.5625):  39%|▍| 1610/4114 [1:43:58<2:35:28,  3.73s/it]Training 1/2 epoch (loss 0.3750):  39%|▍| 1610/4114 [1:44:03<2:35:28,  3.73s/it]Training 1/2 epoch (loss 0.3750):  39%|▍| 1611/4114 [1:44:03<2:41:40,  3.88s/it]Training 1/2 epoch (loss 0.5000):  39%|▍| 1611/4114 [1:44:06<2:41:40,  3.88s/it]Training 1/2 epoch (loss 0.5000):  39%|▍| 1612/4114 [1:44:06<2:36:48,  3.76s/it]Training 1/2 epoch (loss 0.3125):  39%|▍| 1612/4114 [1:44:10<2:36:48,  3.76s/it]Training 1/2 epoch (loss 0.3125):  39%|▍| 1613/4114 [1:44:10<2:39:30,  3.83s/it]Training 1/2 epoch (loss 0.4453):  39%|▍| 1613/4114 [1:44:14<2:39:30,  3.83s/it]Training 1/2 epoch (loss 0.4453):  39%|▍| 1614/4114 [1:44:14<2:44:34,  3.95s/it]Training 1/2 epoch (loss 0.4961):  39%|▍| 1614/4114 [1:44:18<2:44:34,  3.95s/it]Training 1/2 epoch (loss 0.4961):  39%|▍| 1615/4114 [1:44:18<2:39:03,  3.82s/it]Training 1/2 epoch (loss 0.2080):  39%|▍| 1615/4114 [1:44:22<2:39:03,  3.82s/it]Training 1/2 epoch (loss 0.2080):  39%|▍| 1616/4114 [1:44:22<2:38:10,  3.80s/it]Training 1/2 epoch (loss 0.4727):  39%|▍| 1616/4114 [1:44:26<2:38:10,  3.80s/it]Training 1/2 epoch (loss 0.4727):  39%|▍| 1617/4114 [1:44:26<2:43:49,  3.94s/it]Training 1/2 epoch (loss 0.3457):  39%|▍| 1617/4114 [1:44:30<2:43:49,  3.94s/it]Training 1/2 epoch (loss 0.3457):  39%|▍| 1618/4114 [1:44:30<2:43:39,  3.93s/it]Training 1/2 epoch (loss 0.3379):  39%|▍| 1618/4114 [1:44:34<2:43:39,  3.93s/it]Training 1/2 epoch (loss 0.3379):  39%|▍| 1619/4114 [1:44:34<2:41:39,  3.89s/it]Training 1/2 epoch (loss 0.4531):  39%|▍| 1619/4114 [1:44:38<2:41:39,  3.89s/it]Training 1/2 epoch (loss 0.4531):  39%|▍| 1620/4114 [1:44:38<2:43:37,  3.94s/it]Training 1/2 epoch (loss 0.4902):  39%|▍| 1620/4114 [1:44:41<2:43:37,  3.94s/it]Training 1/2 epoch (loss 0.4902):  39%|▍| 1621/4114 [1:44:41<2:36:59,  3.78s/it]Training 1/2 epoch (loss 0.3359):  39%|▍| 1621/4114 [1:44:45<2:36:59,  3.78s/it]Training 1/2 epoch (loss 0.3359):  39%|▍| 1622/4114 [1:44:45<2:38:00,  3.80s/it]Training 1/2 epoch (loss 0.3672):  39%|▍| 1622/4114 [1:44:49<2:38:00,  3.80s/it]Training 1/2 epoch (loss 0.3672):  39%|▍| 1623/4114 [1:44:49<2:43:48,  3.95s/it]Training 1/2 epoch (loss 0.3516):  39%|▍| 1623/4114 [1:44:53<2:43:48,  3.95s/it]Training 1/2 epoch (loss 0.3516):  39%|▍| 1624/4114 [1:44:53<2:44:55,  3.97s/it]Training 1/2 epoch (loss 0.4609):  39%|▍| 1624/4114 [1:44:57<2:44:55,  3.97s/it]Training 1/2 epoch (loss 0.4609):  39%|▍| 1625/4114 [1:44:57<2:38:34,  3.82s/it]Training 1/2 epoch (loss 0.3555):  39%|▍| 1625/4114 [1:45:00<2:38:34,  3.82s/it]Training 1/2 epoch (loss 0.3555):  40%|▍| 1626/4114 [1:45:00<2:36:40,  3.78s/it]Training 1/2 epoch (loss 0.3906):  40%|▍| 1626/4114 [1:45:04<2:36:40,  3.78s/it]Training 1/2 epoch (loss 0.3906):  40%|▍| 1627/4114 [1:45:04<2:38:23,  3.82s/it]Training 1/2 epoch (loss 0.3809):  40%|▍| 1627/4114 [1:45:08<2:38:23,  3.82s/it]Training 1/2 epoch (loss 0.3809):  40%|▍| 1628/4114 [1:45:08<2:38:22,  3.82s/it]Training 1/2 epoch (loss 0.4199):  40%|▍| 1628/4114 [1:45:12<2:38:22,  3.82s/it]Training 1/2 epoch (loss 0.4199):  40%|▍| 1629/4114 [1:45:12<2:41:46,  3.91s/it]Training 1/2 epoch (loss 0.4180):  40%|▍| 1629/4114 [1:45:16<2:41:46,  3.91s/it]Training 1/2 epoch (loss 0.4180):  40%|▍| 1630/4114 [1:45:16<2:40:02,  3.87s/it]Training 1/2 epoch (loss 0.4414):  40%|▍| 1630/4114 [1:45:19<2:40:02,  3.87s/it]Training 1/2 epoch (loss 0.4414):  40%|▍| 1631/4114 [1:45:19<2:34:26,  3.73s/it]Training 1/2 epoch (loss 0.4297):  40%|▍| 1631/4114 [1:45:24<2:34:26,  3.73s/it]Training 1/2 epoch (loss 0.4297):  40%|▍| 1632/4114 [1:45:24<2:39:52,  3.86s/it]Training 1/2 epoch (loss 0.4355):  40%|▍| 1632/4114 [1:45:28<2:39:52,  3.86s/it]Training 1/2 epoch (loss 0.4355):  40%|▍| 1633/4114 [1:45:28<2:42:18,  3.93s/it]Training 1/2 epoch (loss 0.4492):  40%|▍| 1633/4114 [1:45:32<2:42:18,  3.93s/it]Training 1/2 epoch (loss 0.4492):  40%|▍| 1634/4114 [1:45:32<2:43:45,  3.96s/it]Training 1/2 epoch (loss 0.5000):  40%|▍| 1634/4114 [1:45:36<2:43:45,  3.96s/it]Training 1/2 epoch (loss 0.5000):  40%|▍| 1635/4114 [1:45:36<2:46:21,  4.03s/it]Training 1/2 epoch (loss 0.3828):  40%|▍| 1635/4114 [1:45:40<2:46:21,  4.03s/it]Training 1/2 epoch (loss 0.3828):  40%|▍| 1636/4114 [1:45:40<2:43:48,  3.97s/it]Training 1/2 epoch (loss 0.5234):  40%|▍| 1636/4114 [1:45:44<2:43:48,  3.97s/it]Training 1/2 epoch (loss 0.5234):  40%|▍| 1637/4114 [1:45:44<2:44:22,  3.98s/it]Training 1/2 epoch (loss 0.3984):  40%|▍| 1637/4114 [1:45:48<2:44:22,  3.98s/it]Training 1/2 epoch (loss 0.3984):  40%|▍| 1638/4114 [1:45:48<2:47:15,  4.05s/it]Training 1/2 epoch (loss 0.4707):  40%|▍| 1638/4114 [1:45:52<2:47:15,  4.05s/it]Training 1/2 epoch (loss 0.4707):  40%|▍| 1639/4114 [1:45:52<2:44:03,  3.98s/it]Training 1/2 epoch (loss 0.4219):  40%|▍| 1639/4114 [1:45:56<2:44:03,  3.98s/it]Training 1/2 epoch (loss 0.4219):  40%|▍| 1640/4114 [1:45:56<2:43:39,  3.97s/it]Training 1/2 epoch (loss 0.6250):  40%|▍| 1640/4114 [1:46:00<2:43:39,  3.97s/it]Training 1/2 epoch (loss 0.6250):  40%|▍| 1641/4114 [1:46:00<2:42:18,  3.94s/it]Training 1/2 epoch (loss 0.5664):  40%|▍| 1641/4114 [1:46:03<2:42:18,  3.94s/it]Training 1/2 epoch (loss 0.5664):  40%|▍| 1642/4114 [1:46:03<2:39:46,  3.88s/it]Training 1/2 epoch (loss 0.4512):  40%|▍| 1642/4114 [1:46:07<2:39:46,  3.88s/it]Training 1/2 epoch (loss 0.4512):  40%|▍| 1643/4114 [1:46:07<2:38:41,  3.85s/it]Training 1/2 epoch (loss 0.4023):  40%|▍| 1643/4114 [1:46:11<2:38:41,  3.85s/it]Training 1/2 epoch (loss 0.4023):  40%|▍| 1644/4114 [1:46:11<2:35:34,  3.78s/it]Training 1/2 epoch (loss 0.5469):  40%|▍| 1644/4114 [1:46:15<2:35:34,  3.78s/it]Training 1/2 epoch (loss 0.5469):  40%|▍| 1645/4114 [1:46:15<2:36:37,  3.81s/it]Training 1/2 epoch (loss 0.4883):  40%|▍| 1645/4114 [1:46:18<2:36:37,  3.81s/it]Training 1/2 epoch (loss 0.4883):  40%|▍| 1646/4114 [1:46:18<2:34:57,  3.77s/it]Training 1/2 epoch (loss 0.3594):  40%|▍| 1646/4114 [1:46:22<2:34:57,  3.77s/it]Training 1/2 epoch (loss 0.3594):  40%|▍| 1647/4114 [1:46:22<2:40:09,  3.90s/it]Training 1/2 epoch (loss 0.3105):  40%|▍| 1647/4114 [1:46:26<2:40:09,  3.90s/it]Training 1/2 epoch (loss 0.3105):  40%|▍| 1648/4114 [1:46:26<2:41:04,  3.92s/it]Training 1/2 epoch (loss 0.4219):  40%|▍| 1648/4114 [1:46:30<2:41:04,  3.92s/it]Training 1/2 epoch (loss 0.4219):  40%|▍| 1649/4114 [1:46:30<2:39:12,  3.88s/it]Training 1/2 epoch (loss 0.4961):  40%|▍| 1649/4114 [1:46:34<2:39:12,  3.88s/it]Training 1/2 epoch (loss 0.4961):  40%|▍| 1650/4114 [1:46:34<2:41:21,  3.93s/it]Training 1/2 epoch (loss 0.4102):  40%|▍| 1650/4114 [1:46:38<2:41:21,  3.93s/it]Training 1/2 epoch (loss 0.4102):  40%|▍| 1651/4114 [1:46:38<2:32:45,  3.72s/it]Training 1/2 epoch (loss 0.3672):  40%|▍| 1651/4114 [1:46:41<2:32:45,  3.72s/it]Training 1/2 epoch (loss 0.3672):  40%|▍| 1652/4114 [1:46:41<2:28:51,  3.63s/it]Training 1/2 epoch (loss 0.5273):  40%|▍| 1652/4114 [1:46:45<2:28:51,  3.63s/it]Training 1/2 epoch (loss 0.5273):  40%|▍| 1653/4114 [1:46:45<2:34:26,  3.77s/it]Training 1/2 epoch (loss 0.3906):  40%|▍| 1653/4114 [1:46:48<2:34:26,  3.77s/it]Training 1/2 epoch (loss 0.3906):  40%|▍| 1654/4114 [1:46:48<2:29:20,  3.64s/it]Training 1/2 epoch (loss 0.4336):  40%|▍| 1654/4114 [1:46:52<2:29:20,  3.64s/it]Training 1/2 epoch (loss 0.4336):  40%|▍| 1655/4114 [1:46:52<2:32:50,  3.73s/it]Training 1/2 epoch (loss 0.4062):  40%|▍| 1655/4114 [1:46:56<2:32:50,  3.73s/it]Training 1/2 epoch (loss 0.4062):  40%|▍| 1656/4114 [1:46:56<2:31:37,  3.70s/it]Training 1/2 epoch (loss 0.4414):  40%|▍| 1656/4114 [1:47:00<2:31:37,  3.70s/it]Training 1/2 epoch (loss 0.4414):  40%|▍| 1657/4114 [1:47:00<2:33:21,  3.74s/it]Training 1/2 epoch (loss 0.4297):  40%|▍| 1657/4114 [1:47:03<2:33:21,  3.74s/it]Training 1/2 epoch (loss 0.4297):  40%|▍| 1658/4114 [1:47:03<2:30:40,  3.68s/it]Training 1/2 epoch (loss 0.4590):  40%|▍| 1658/4114 [1:47:08<2:30:40,  3.68s/it]Training 1/2 epoch (loss 0.4590):  40%|▍| 1659/4114 [1:47:08<2:38:14,  3.87s/it]Training 1/2 epoch (loss 0.4199):  40%|▍| 1659/4114 [1:47:11<2:38:14,  3.87s/it]Training 1/2 epoch (loss 0.4199):  40%|▍| 1660/4114 [1:47:11<2:31:44,  3.71s/it]Training 1/2 epoch (loss 0.2754):  40%|▍| 1660/4114 [1:47:15<2:31:44,  3.71s/it]Training 1/2 epoch (loss 0.2754):  40%|▍| 1661/4114 [1:47:15<2:35:46,  3.81s/it]Training 1/2 epoch (loss 0.3711):  40%|▍| 1661/4114 [1:47:19<2:35:46,  3.81s/it]Training 1/2 epoch (loss 0.3711):  40%|▍| 1662/4114 [1:47:19<2:38:41,  3.88s/it]Training 1/2 epoch (loss 0.3887):  40%|▍| 1662/4114 [1:47:23<2:38:41,  3.88s/it]Training 1/2 epoch (loss 0.3887):  40%|▍| 1663/4114 [1:47:23<2:37:15,  3.85s/it]Training 1/2 epoch (loss 0.3281):  40%|▍| 1663/4114 [1:47:27<2:37:15,  3.85s/it]Training 1/2 epoch (loss 0.3281):  40%|▍| 1664/4114 [1:47:27<2:39:07,  3.90s/it]Training 1/2 epoch (loss 0.5000):  40%|▍| 1664/4114 [1:47:31<2:39:07,  3.90s/it]Training 1/2 epoch (loss 0.5000):  40%|▍| 1665/4114 [1:47:31<2:42:48,  3.99s/it]Training 1/2 epoch (loss 0.3145):  40%|▍| 1665/4114 [1:47:35<2:42:48,  3.99s/it]Training 1/2 epoch (loss 0.3145):  40%|▍| 1666/4114 [1:47:35<2:41:00,  3.95s/it]Training 1/2 epoch (loss 0.4531):  40%|▍| 1666/4114 [1:47:39<2:41:00,  3.95s/it]Training 1/2 epoch (loss 0.4531):  41%|▍| 1667/4114 [1:47:39<2:41:45,  3.97s/it]Training 1/2 epoch (loss 0.3398):  41%|▍| 1667/4114 [1:47:43<2:41:45,  3.97s/it]Training 1/2 epoch (loss 0.3398):  41%|▍| 1668/4114 [1:47:43<2:40:47,  3.94s/it]Training 1/2 epoch (loss 0.3965):  41%|▍| 1668/4114 [1:47:47<2:40:47,  3.94s/it]Training 1/2 epoch (loss 0.3965):  41%|▍| 1669/4114 [1:47:47<2:38:06,  3.88s/it]Training 1/2 epoch (loss 0.4180):  41%|▍| 1669/4114 [1:47:50<2:38:06,  3.88s/it]Training 1/2 epoch (loss 0.4180):  41%|▍| 1670/4114 [1:47:50<2:35:55,  3.83s/it]Training 1/2 epoch (loss 0.3926):  41%|▍| 1670/4114 [1:47:54<2:35:55,  3.83s/it]Training 1/2 epoch (loss 0.3926):  41%|▍| 1671/4114 [1:47:54<2:38:24,  3.89s/it]Training 1/2 epoch (loss 0.5859):  41%|▍| 1671/4114 [1:47:58<2:38:24,  3.89s/it]Training 1/2 epoch (loss 0.5859):  41%|▍| 1672/4114 [1:47:58<2:40:12,  3.94s/it]Training 1/2 epoch (loss 0.4277):  41%|▍| 1672/4114 [1:48:02<2:40:12,  3.94s/it]Training 1/2 epoch (loss 0.4277):  41%|▍| 1673/4114 [1:48:02<2:40:38,  3.95s/it]Training 1/2 epoch (loss 0.4453):  41%|▍| 1673/4114 [1:48:06<2:40:38,  3.95s/it]Training 1/2 epoch (loss 0.4453):  41%|▍| 1674/4114 [1:48:06<2:42:55,  4.01s/it]Training 1/2 epoch (loss 0.3633):  41%|▍| 1674/4114 [1:48:11<2:42:55,  4.01s/it]Training 1/2 epoch (loss 0.3633):  41%|▍| 1675/4114 [1:48:11<2:43:58,  4.03s/it]Training 1/2 epoch (loss 0.3984):  41%|▍| 1675/4114 [1:48:14<2:43:58,  4.03s/it]Training 1/2 epoch (loss 0.3984):  41%|▍| 1676/4114 [1:48:14<2:39:27,  3.92s/it]Training 1/2 epoch (loss 0.5117):  41%|▍| 1676/4114 [1:48:18<2:39:27,  3.92s/it]Training 1/2 epoch (loss 0.5117):  41%|▍| 1677/4114 [1:48:18<2:41:27,  3.98s/it]Training 1/2 epoch (loss 0.3730):  41%|▍| 1677/4114 [1:48:22<2:41:27,  3.98s/it]Training 1/2 epoch (loss 0.3730):  41%|▍| 1678/4114 [1:48:22<2:39:31,  3.93s/it]Training 1/2 epoch (loss 0.3984):  41%|▍| 1678/4114 [1:48:26<2:39:31,  3.93s/it]Training 1/2 epoch (loss 0.3984):  41%|▍| 1679/4114 [1:48:26<2:38:10,  3.90s/it]Training 1/2 epoch (loss 0.3164):  41%|▍| 1679/4114 [1:48:30<2:38:10,  3.90s/it]Training 1/2 epoch (loss 0.3164):  41%|▍| 1680/4114 [1:48:30<2:39:33,  3.93s/it]Training 1/2 epoch (loss 0.4180):  41%|▍| 1680/4114 [1:48:34<2:39:33,  3.93s/it]Training 1/2 epoch (loss 0.4180):  41%|▍| 1681/4114 [1:48:34<2:39:05,  3.92s/it]Training 1/2 epoch (loss 0.4922):  41%|▍| 1681/4114 [1:48:38<2:39:05,  3.92s/it]Training 1/2 epoch (loss 0.4922):  41%|▍| 1682/4114 [1:48:38<2:38:41,  3.92s/it]Training 1/2 epoch (loss 0.4707):  41%|▍| 1682/4114 [1:48:42<2:38:41,  3.92s/it]Training 1/2 epoch (loss 0.4707):  41%|▍| 1683/4114 [1:48:42<2:42:33,  4.01s/it]Training 1/2 epoch (loss 0.4785):  41%|▍| 1683/4114 [1:48:46<2:42:33,  4.01s/it]Training 1/2 epoch (loss 0.4785):  41%|▍| 1684/4114 [1:48:46<2:41:42,  3.99s/it]Training 1/2 epoch (loss 0.3438):  41%|▍| 1684/4114 [1:48:50<2:41:42,  3.99s/it]Training 1/2 epoch (loss 0.3438):  41%|▍| 1685/4114 [1:48:50<2:40:36,  3.97s/it]Training 1/2 epoch (loss 0.4121):  41%|▍| 1685/4114 [1:48:54<2:40:36,  3.97s/it]Training 1/2 epoch (loss 0.4121):  41%|▍| 1686/4114 [1:48:54<2:42:39,  4.02s/it]Training 1/2 epoch (loss 0.3398):  41%|▍| 1686/4114 [1:48:58<2:42:39,  4.02s/it]Training 1/2 epoch (loss 0.3398):  41%|▍| 1687/4114 [1:48:58<2:42:13,  4.01s/it]Training 1/2 epoch (loss 0.5000):  41%|▍| 1687/4114 [1:49:02<2:42:13,  4.01s/it]Training 1/2 epoch (loss 0.5000):  41%|▍| 1688/4114 [1:49:02<2:40:57,  3.98s/it]Training 1/2 epoch (loss 0.2852):  41%|▍| 1688/4114 [1:49:06<2:40:57,  3.98s/it]Training 1/2 epoch (loss 0.2852):  41%|▍| 1689/4114 [1:49:06<2:44:42,  4.08s/it]Training 1/2 epoch (loss 0.3906):  41%|▍| 1689/4114 [1:49:10<2:44:42,  4.08s/it]Training 1/2 epoch (loss 0.3906):  41%|▍| 1690/4114 [1:49:10<2:41:26,  4.00s/it]Training 1/2 epoch (loss 0.3711):  41%|▍| 1690/4114 [1:49:14<2:41:26,  4.00s/it]Training 1/2 epoch (loss 0.3711):  41%|▍| 1691/4114 [1:49:14<2:40:24,  3.97s/it]Training 1/2 epoch (loss 0.5391):  41%|▍| 1691/4114 [1:49:18<2:40:24,  3.97s/it]Training 1/2 epoch (loss 0.5391):  41%|▍| 1692/4114 [1:49:18<2:43:19,  4.05s/it]Training 1/2 epoch (loss 0.4609):  41%|▍| 1692/4114 [1:49:22<2:43:19,  4.05s/it]Training 1/2 epoch (loss 0.4609):  41%|▍| 1693/4114 [1:49:22<2:39:58,  3.96s/it]Training 1/2 epoch (loss 0.2891):  41%|▍| 1693/4114 [1:49:26<2:39:58,  3.96s/it]Training 1/2 epoch (loss 0.2891):  41%|▍| 1694/4114 [1:49:26<2:39:17,  3.95s/it]Training 1/2 epoch (loss 0.3301):  41%|▍| 1694/4114 [1:49:30<2:39:17,  3.95s/it]Training 1/2 epoch (loss 0.3301):  41%|▍| 1695/4114 [1:49:30<2:40:24,  3.98s/it]Training 1/2 epoch (loss 0.3672):  41%|▍| 1695/4114 [1:49:34<2:40:24,  3.98s/it]Training 1/2 epoch (loss 0.3672):  41%|▍| 1696/4114 [1:49:34<2:39:18,  3.95s/it]Training 1/2 epoch (loss 0.3574):  41%|▍| 1696/4114 [1:49:37<2:39:18,  3.95s/it]Training 1/2 epoch (loss 0.3574):  41%|▍| 1697/4114 [1:49:37<2:32:55,  3.80s/it]Training 1/2 epoch (loss 0.4297):  41%|▍| 1697/4114 [1:49:41<2:32:55,  3.80s/it]Training 1/2 epoch (loss 0.4297):  41%|▍| 1698/4114 [1:49:41<2:39:16,  3.96s/it]Training 1/2 epoch (loss 0.4102):  41%|▍| 1698/4114 [1:49:46<2:39:16,  3.96s/it]Training 1/2 epoch (loss 0.4102):  41%|▍| 1699/4114 [1:49:46<2:41:10,  4.00s/it]Training 1/2 epoch (loss 0.3555):  41%|▍| 1699/4114 [1:49:50<2:41:10,  4.00s/it]Training 1/2 epoch (loss 0.3555):  41%|▍| 1700/4114 [1:49:50<2:41:30,  4.01s/it]Training 1/2 epoch (loss 0.3477):  41%|▍| 1700/4114 [1:49:54<2:41:30,  4.01s/it]Training 1/2 epoch (loss 0.3477):  41%|▍| 1701/4114 [1:49:54<2:45:07,  4.11s/it]Training 1/2 epoch (loss 0.4160):  41%|▍| 1701/4114 [1:49:58<2:45:07,  4.11s/it]Training 1/2 epoch (loss 0.4160):  41%|▍| 1702/4114 [1:49:58<2:41:16,  4.01s/it]Training 1/2 epoch (loss 0.2969):  41%|▍| 1702/4114 [1:50:02<2:41:16,  4.01s/it]Training 1/2 epoch (loss 0.2969):  41%|▍| 1703/4114 [1:50:02<2:40:30,  3.99s/it]Training 1/2 epoch (loss 0.4883):  41%|▍| 1703/4114 [1:50:05<2:40:30,  3.99s/it]Training 1/2 epoch (loss 0.4883):  41%|▍| 1704/4114 [1:50:05<2:34:43,  3.85s/it]Training 1/2 epoch (loss 0.4355):  41%|▍| 1704/4114 [1:50:09<2:34:43,  3.85s/it]Training 1/2 epoch (loss 0.4355):  41%|▍| 1705/4114 [1:50:09<2:36:46,  3.90s/it]Training 1/2 epoch (loss 0.4492):  41%|▍| 1705/4114 [1:50:13<2:36:46,  3.90s/it]Training 1/2 epoch (loss 0.4492):  41%|▍| 1706/4114 [1:50:13<2:38:32,  3.95s/it]Training 1/2 epoch (loss 0.5312):  41%|▍| 1706/4114 [1:50:17<2:38:32,  3.95s/it]Training 1/2 epoch (loss 0.5312):  41%|▍| 1707/4114 [1:50:17<2:40:38,  4.00s/it]Training 1/2 epoch (loss 0.3340):  41%|▍| 1707/4114 [1:50:21<2:40:38,  4.00s/it]Training 1/2 epoch (loss 0.3340):  42%|▍| 1708/4114 [1:50:21<2:38:59,  3.96s/it]Training 1/2 epoch (loss 0.4414):  42%|▍| 1708/4114 [1:50:25<2:38:59,  3.96s/it]Training 1/2 epoch (loss 0.4414):  42%|▍| 1709/4114 [1:50:25<2:40:32,  4.01s/it]Training 1/2 epoch (loss 0.2949):  42%|▍| 1709/4114 [1:50:30<2:40:32,  4.01s/it]Training 1/2 epoch (loss 0.2949):  42%|▍| 1710/4114 [1:50:30<2:41:29,  4.03s/it]Training 1/2 epoch (loss 0.5469):  42%|▍| 1710/4114 [1:50:33<2:41:29,  4.03s/it]Training 1/2 epoch (loss 0.5469):  42%|▍| 1711/4114 [1:50:33<2:36:16,  3.90s/it]Training 1/2 epoch (loss 0.3438):  42%|▍| 1711/4114 [1:50:37<2:36:16,  3.90s/it]Training 1/2 epoch (loss 0.3438):  42%|▍| 1712/4114 [1:50:37<2:36:32,  3.91s/it]Training 1/2 epoch (loss 0.5039):  42%|▍| 1712/4114 [1:50:41<2:36:32,  3.91s/it]Training 1/2 epoch (loss 0.5039):  42%|▍| 1713/4114 [1:50:41<2:31:07,  3.78s/it]Training 1/2 epoch (loss 0.4160):  42%|▍| 1713/4114 [1:50:44<2:31:07,  3.78s/it]Training 1/2 epoch (loss 0.4160):  42%|▍| 1714/4114 [1:50:44<2:32:00,  3.80s/it]Training 1/2 epoch (loss 0.4609):  42%|▍| 1714/4114 [1:50:48<2:32:00,  3.80s/it]Training 1/2 epoch (loss 0.4609):  42%|▍| 1715/4114 [1:50:48<2:32:52,  3.82s/it]Training 1/2 epoch (loss 0.2559):  42%|▍| 1715/4114 [1:50:52<2:32:52,  3.82s/it]Training 1/2 epoch (loss 0.2559):  42%|▍| 1716/4114 [1:50:52<2:34:45,  3.87s/it]Training 1/2 epoch (loss 0.3047):  42%|▍| 1716/4114 [1:50:56<2:34:45,  3.87s/it]Training 1/2 epoch (loss 0.3047):  42%|▍| 1717/4114 [1:50:56<2:35:32,  3.89s/it]Training 1/2 epoch (loss 0.3867):  42%|▍| 1717/4114 [1:51:00<2:35:32,  3.89s/it]Training 1/2 epoch (loss 0.3867):  42%|▍| 1718/4114 [1:51:00<2:34:41,  3.87s/it]Training 1/2 epoch (loss 0.4082):  42%|▍| 1718/4114 [1:51:04<2:34:41,  3.87s/it]Training 1/2 epoch (loss 0.4082):  42%|▍| 1719/4114 [1:51:04<2:36:04,  3.91s/it]Training 1/2 epoch (loss 0.2344):  42%|▍| 1719/4114 [1:51:08<2:36:04,  3.91s/it]Training 1/2 epoch (loss 0.2344):  42%|▍| 1720/4114 [1:51:08<2:38:02,  3.96s/it]Training 1/2 epoch (loss 0.3105):  42%|▍| 1720/4114 [1:51:12<2:38:02,  3.96s/it]Training 1/2 epoch (loss 0.3105):  42%|▍| 1721/4114 [1:51:12<2:37:28,  3.95s/it]Training 1/2 epoch (loss 0.3652):  42%|▍| 1721/4114 [1:51:16<2:37:28,  3.95s/it]Training 1/2 epoch (loss 0.3652):  42%|▍| 1722/4114 [1:51:16<2:39:31,  4.00s/it]Training 1/2 epoch (loss 0.3887):  42%|▍| 1722/4114 [1:51:20<2:39:31,  4.00s/it]Training 1/2 epoch (loss 0.3887):  42%|▍| 1723/4114 [1:51:20<2:37:38,  3.96s/it]Training 1/2 epoch (loss 0.3691):  42%|▍| 1723/4114 [1:51:24<2:37:38,  3.96s/it]Training 1/2 epoch (loss 0.3691):  42%|▍| 1724/4114 [1:51:24<2:37:38,  3.96s/it]Training 1/2 epoch (loss 0.3203):  42%|▍| 1724/4114 [1:51:28<2:37:38,  3.96s/it]Training 1/2 epoch (loss 0.3203):  42%|▍| 1725/4114 [1:51:28<2:38:55,  3.99s/it]Training 1/2 epoch (loss 0.5000):  42%|▍| 1725/4114 [1:51:32<2:38:55,  3.99s/it]Training 1/2 epoch (loss 0.5000):  42%|▍| 1726/4114 [1:51:32<2:36:01,  3.92s/it]Training 1/2 epoch (loss 0.3867):  42%|▍| 1726/4114 [1:51:36<2:36:01,  3.92s/it]Training 1/2 epoch (loss 0.3867):  42%|▍| 1727/4114 [1:51:36<2:34:07,  3.87s/it]Training 1/2 epoch (loss 0.4355):  42%|▍| 1727/4114 [1:51:40<2:34:07,  3.87s/it]Training 1/2 epoch (loss 0.4355):  42%|▍| 1728/4114 [1:51:40<2:39:24,  4.01s/it]Training 1/2 epoch (loss 0.4512):  42%|▍| 1728/4114 [1:51:43<2:39:24,  4.01s/it]Training 1/2 epoch (loss 0.4512):  42%|▍| 1729/4114 [1:51:43<2:33:08,  3.85s/it]Training 1/2 epoch (loss 0.3574):  42%|▍| 1729/4114 [1:51:47<2:33:08,  3.85s/it]Training 1/2 epoch (loss 0.3574):  42%|▍| 1730/4114 [1:51:47<2:33:43,  3.87s/it]Training 1/2 epoch (loss 0.3867):  42%|▍| 1730/4114 [1:51:50<2:33:43,  3.87s/it]Training 1/2 epoch (loss 0.3867):  42%|▍| 1731/4114 [1:51:50<2:23:24,  3.61s/it]Training 1/2 epoch (loss 0.3086):  42%|▍| 1731/4114 [1:51:54<2:23:24,  3.61s/it]Training 1/2 epoch (loss 0.3086):  42%|▍| 1732/4114 [1:51:54<2:27:27,  3.71s/it]Training 1/2 epoch (loss 0.3613):  42%|▍| 1732/4114 [1:51:58<2:27:27,  3.71s/it]Training 1/2 epoch (loss 0.3613):  42%|▍| 1733/4114 [1:51:58<2:29:07,  3.76s/it]Training 1/2 epoch (loss 0.2910):  42%|▍| 1733/4114 [1:52:02<2:29:07,  3.76s/it]Training 1/2 epoch (loss 0.2910):  42%|▍| 1734/4114 [1:52:02<2:32:17,  3.84s/it]Training 1/2 epoch (loss 0.3828):  42%|▍| 1734/4114 [1:52:05<2:32:17,  3.84s/it]Training 1/2 epoch (loss 0.3828):  42%|▍| 1735/4114 [1:52:05<2:23:01,  3.61s/it]Training 1/2 epoch (loss 0.2480):  42%|▍| 1735/4114 [1:52:09<2:23:01,  3.61s/it]Training 1/2 epoch (loss 0.2480):  42%|▍| 1736/4114 [1:52:09<2:24:55,  3.66s/it]Training 1/2 epoch (loss 0.4492):  42%|▍| 1736/4114 [1:52:13<2:24:55,  3.66s/it]Training 1/2 epoch (loss 0.4492):  42%|▍| 1737/4114 [1:52:13<2:24:28,  3.65s/it]Training 1/2 epoch (loss 0.2754):  42%|▍| 1737/4114 [1:52:16<2:24:28,  3.65s/it]Training 1/2 epoch (loss 0.2754):  42%|▍| 1738/4114 [1:52:16<2:24:40,  3.65s/it]Training 1/2 epoch (loss 0.2832):  42%|▍| 1738/4114 [1:52:20<2:24:40,  3.65s/it]Training 1/2 epoch (loss 0.2832):  42%|▍| 1739/4114 [1:52:20<2:27:36,  3.73s/it]Training 1/2 epoch (loss 0.2793):  42%|▍| 1739/4114 [1:52:24<2:27:36,  3.73s/it]Training 1/2 epoch (loss 0.2793):  42%|▍| 1740/4114 [1:52:24<2:29:40,  3.78s/it]Training 1/2 epoch (loss 0.5625):  42%|▍| 1740/4114 [1:52:28<2:29:40,  3.78s/it]Training 1/2 epoch (loss 0.5625):  42%|▍| 1741/4114 [1:52:28<2:28:56,  3.77s/it]Training 1/2 epoch (loss 0.4375):  42%|▍| 1741/4114 [1:52:32<2:28:56,  3.77s/it]Training 1/2 epoch (loss 0.4375):  42%|▍| 1742/4114 [1:52:32<2:29:56,  3.79s/it]Training 1/2 epoch (loss 0.2852):  42%|▍| 1742/4114 [1:52:36<2:29:56,  3.79s/it]Training 1/2 epoch (loss 0.2852):  42%|▍| 1743/4114 [1:52:36<2:32:46,  3.87s/it]Training 1/2 epoch (loss 0.2656):  42%|▍| 1743/4114 [1:52:40<2:32:46,  3.87s/it]Training 1/2 epoch (loss 0.2656):  42%|▍| 1744/4114 [1:52:40<2:34:49,  3.92s/it]Training 1/2 epoch (loss 0.4414):  42%|▍| 1744/4114 [1:52:44<2:34:49,  3.92s/it]Training 1/2 epoch (loss 0.4414):  42%|▍| 1745/4114 [1:52:44<2:33:44,  3.89s/it]Training 1/2 epoch (loss 0.4648):  42%|▍| 1745/4114 [1:52:47<2:33:44,  3.89s/it]Training 1/2 epoch (loss 0.4648):  42%|▍| 1746/4114 [1:52:47<2:30:35,  3.82s/it]Training 1/2 epoch (loss 0.2910):  42%|▍| 1746/4114 [1:52:51<2:30:35,  3.82s/it]Training 1/2 epoch (loss 0.2910):  42%|▍| 1747/4114 [1:52:51<2:31:59,  3.85s/it]Training 1/2 epoch (loss 0.3574):  42%|▍| 1747/4114 [1:52:55<2:31:59,  3.85s/it]Training 1/2 epoch (loss 0.3574):  42%|▍| 1748/4114 [1:52:55<2:32:54,  3.88s/it]Training 1/2 epoch (loss 0.2695):  42%|▍| 1748/4114 [1:52:59<2:32:54,  3.88s/it]Training 1/2 epoch (loss 0.2695):  43%|▍| 1749/4114 [1:52:59<2:37:07,  3.99s/it]Training 1/2 epoch (loss 0.4922):  43%|▍| 1749/4114 [1:53:03<2:37:07,  3.99s/it]Training 1/2 epoch (loss 0.4922):  43%|▍| 1750/4114 [1:53:03<2:34:33,  3.92s/it]Training 1/2 epoch (loss 0.3926):  43%|▍| 1750/4114 [1:53:07<2:34:33,  3.92s/it]Training 1/2 epoch (loss 0.3926):  43%|▍| 1751/4114 [1:53:07<2:32:53,  3.88s/it]Training 1/2 epoch (loss 0.3691):  43%|▍| 1751/4114 [1:53:10<2:32:53,  3.88s/it]Training 1/2 epoch (loss 0.3691):  43%|▍| 1752/4114 [1:53:10<2:29:04,  3.79s/it]Training 1/2 epoch (loss 0.3711):  43%|▍| 1752/4114 [1:53:14<2:29:04,  3.79s/it]Training 1/2 epoch (loss 0.3711):  43%|▍| 1753/4114 [1:53:14<2:32:02,  3.86s/it]Training 1/2 epoch (loss 0.4512):  43%|▍| 1753/4114 [1:53:18<2:32:02,  3.86s/it]Training 1/2 epoch (loss 0.4512):  43%|▍| 1754/4114 [1:53:18<2:33:01,  3.89s/it]Training 1/2 epoch (loss 0.3730):  43%|▍| 1754/4114 [1:53:23<2:33:01,  3.89s/it]Training 1/2 epoch (loss 0.3730):  43%|▍| 1755/4114 [1:53:23<2:36:57,  3.99s/it]Training 1/2 epoch (loss 0.2949):  43%|▍| 1755/4114 [1:53:27<2:36:57,  3.99s/it]Training 1/2 epoch (loss 0.2949):  43%|▍| 1756/4114 [1:53:27<2:36:42,  3.99s/it]Training 1/2 epoch (loss 0.3262):  43%|▍| 1756/4114 [1:53:30<2:36:42,  3.99s/it]Training 1/2 epoch (loss 0.3262):  43%|▍| 1757/4114 [1:53:30<2:34:45,  3.94s/it]Training 1/2 epoch (loss 0.4570):  43%|▍| 1757/4114 [1:53:35<2:34:45,  3.94s/it]Training 1/2 epoch (loss 0.4570):  43%|▍| 1758/4114 [1:53:35<2:37:49,  4.02s/it]Training 1/2 epoch (loss 0.5898):  43%|▍| 1758/4114 [1:53:39<2:37:49,  4.02s/it]Training 1/2 epoch (loss 0.5898):  43%|▍| 1759/4114 [1:53:39<2:37:07,  4.00s/it]Training 1/2 epoch (loss 0.2852):  43%|▍| 1759/4114 [1:53:43<2:37:07,  4.00s/it]Training 1/2 epoch (loss 0.2852):  43%|▍| 1760/4114 [1:53:43<2:36:34,  3.99s/it]Training 1/2 epoch (loss 0.2393):  43%|▍| 1760/4114 [1:53:47<2:36:34,  3.99s/it]Training 1/2 epoch (loss 0.2393):  43%|▍| 1761/4114 [1:53:47<2:39:05,  4.06s/it]Training 1/2 epoch (loss 0.4805):  43%|▍| 1761/4114 [1:53:51<2:39:05,  4.06s/it]Training 1/2 epoch (loss 0.4805):  43%|▍| 1762/4114 [1:53:51<2:35:42,  3.97s/it]Training 1/2 epoch (loss 0.3027):  43%|▍| 1762/4114 [1:53:54<2:35:42,  3.97s/it]Training 1/2 epoch (loss 0.3027):  43%|▍| 1763/4114 [1:53:54<2:31:08,  3.86s/it]Training 1/2 epoch (loss 0.3281):  43%|▍| 1763/4114 [1:53:58<2:31:08,  3.86s/it]Training 1/2 epoch (loss 0.3281):  43%|▍| 1764/4114 [1:53:58<2:32:51,  3.90s/it]Training 1/2 epoch (loss 0.4844):  43%|▍| 1764/4114 [1:54:02<2:32:51,  3.90s/it]Training 1/2 epoch (loss 0.4844):  43%|▍| 1765/4114 [1:54:02<2:33:11,  3.91s/it]Training 1/2 epoch (loss 0.5781):  43%|▍| 1765/4114 [1:54:06<2:33:11,  3.91s/it]Training 1/2 epoch (loss 0.5781):  43%|▍| 1766/4114 [1:54:06<2:33:40,  3.93s/it]Training 1/2 epoch (loss 0.3027):  43%|▍| 1766/4114 [1:54:10<2:33:40,  3.93s/it]Training 1/2 epoch (loss 0.3027):  43%|▍| 1767/4114 [1:54:10<2:36:56,  4.01s/it]Training 1/2 epoch (loss 0.2852):  43%|▍| 1767/4114 [1:54:14<2:36:56,  4.01s/it]Training 1/2 epoch (loss 0.2852):  43%|▍| 1768/4114 [1:54:14<2:34:15,  3.95s/it]Training 1/2 epoch (loss 0.5430):  43%|▍| 1768/4114 [1:54:18<2:34:15,  3.95s/it]Training 1/2 epoch (loss 0.5430):  43%|▍| 1769/4114 [1:54:18<2:34:25,  3.95s/it]Training 1/2 epoch (loss 0.3242):  43%|▍| 1769/4114 [1:54:22<2:34:25,  3.95s/it]Training 1/2 epoch (loss 0.3242):  43%|▍| 1770/4114 [1:54:22<2:35:48,  3.99s/it]Training 1/2 epoch (loss 0.3496):  43%|▍| 1770/4114 [1:54:26<2:35:48,  3.99s/it]Training 1/2 epoch (loss 0.3496):  43%|▍| 1771/4114 [1:54:26<2:35:34,  3.98s/it]Training 1/2 epoch (loss 0.5469):  43%|▍| 1771/4114 [1:54:30<2:35:34,  3.98s/it]Training 1/2 epoch (loss 0.5469):  43%|▍| 1772/4114 [1:54:30<2:33:23,  3.93s/it]Training 1/2 epoch (loss 0.3789):  43%|▍| 1772/4114 [1:54:34<2:33:23,  3.93s/it]Training 1/2 epoch (loss 0.3789):  43%|▍| 1773/4114 [1:54:34<2:34:24,  3.96s/it]Training 1/2 epoch (loss 0.5078):  43%|▍| 1773/4114 [1:54:37<2:34:24,  3.96s/it]Training 1/2 epoch (loss 0.5078):  43%|▍| 1774/4114 [1:54:37<2:30:10,  3.85s/it]Training 1/2 epoch (loss 0.3555):  43%|▍| 1774/4114 [1:54:42<2:30:10,  3.85s/it]Training 1/2 epoch (loss 0.3555):  43%|▍| 1775/4114 [1:54:42<2:31:57,  3.90s/it]Training 1/2 epoch (loss 0.4746):  43%|▍| 1775/4114 [1:54:45<2:31:57,  3.90s/it]Training 1/2 epoch (loss 0.4746):  43%|▍| 1776/4114 [1:54:45<2:28:41,  3.82s/it]Training 1/2 epoch (loss 0.3184):  43%|▍| 1776/4114 [1:54:49<2:28:41,  3.82s/it]Training 1/2 epoch (loss 0.3184):  43%|▍| 1777/4114 [1:54:49<2:30:23,  3.86s/it]Training 1/2 epoch (loss 0.4844):  43%|▍| 1777/4114 [1:54:53<2:30:23,  3.86s/it]Training 1/2 epoch (loss 0.4844):  43%|▍| 1778/4114 [1:54:53<2:32:16,  3.91s/it]Training 1/2 epoch (loss 0.5000):  43%|▍| 1778/4114 [1:54:58<2:32:16,  3.91s/it]Training 1/2 epoch (loss 0.5000):  43%|▍| 1779/4114 [1:54:58<2:37:49,  4.06s/it]Training 1/2 epoch (loss 0.3633):  43%|▍| 1779/4114 [1:55:01<2:37:49,  4.06s/it]Training 1/2 epoch (loss 0.3633):  43%|▍| 1780/4114 [1:55:01<2:35:22,  3.99s/it]Training 1/2 epoch (loss 0.3418):  43%|▍| 1780/4114 [1:55:05<2:35:22,  3.99s/it]Training 1/2 epoch (loss 0.3418):  43%|▍| 1781/4114 [1:55:05<2:29:54,  3.86s/it]Training 1/2 epoch (loss 0.3633):  43%|▍| 1781/4114 [1:55:09<2:29:54,  3.86s/it]Training 1/2 epoch (loss 0.3633):  43%|▍| 1782/4114 [1:55:09<2:32:20,  3.92s/it]Training 1/2 epoch (loss 0.4766):  43%|▍| 1782/4114 [1:55:13<2:32:20,  3.92s/it]Training 1/2 epoch (loss 0.4766):  43%|▍| 1783/4114 [1:55:13<2:30:48,  3.88s/it]Training 1/2 epoch (loss 0.5625):  43%|▍| 1783/4114 [1:55:16<2:30:48,  3.88s/it]Training 1/2 epoch (loss 0.5625):  43%|▍| 1784/4114 [1:55:16<2:23:50,  3.70s/it]Training 1/2 epoch (loss 0.2246):  43%|▍| 1784/4114 [1:55:20<2:23:50,  3.70s/it]Training 1/2 epoch (loss 0.2246):  43%|▍| 1785/4114 [1:55:20<2:29:34,  3.85s/it]Training 1/2 epoch (loss 0.3262):  43%|▍| 1785/4114 [1:55:24<2:29:34,  3.85s/it]Training 1/2 epoch (loss 0.3262):  43%|▍| 1786/4114 [1:55:24<2:28:37,  3.83s/it]Training 1/2 epoch (loss 0.3281):  43%|▍| 1786/4114 [1:55:28<2:28:37,  3.83s/it]Training 1/2 epoch (loss 0.3281):  43%|▍| 1787/4114 [1:55:28<2:28:09,  3.82s/it]Training 1/2 epoch (loss 0.4199):  43%|▍| 1787/4114 [1:55:32<2:28:09,  3.82s/it]Training 1/2 epoch (loss 0.4199):  43%|▍| 1788/4114 [1:55:32<2:30:25,  3.88s/it]Training 1/2 epoch (loss 0.3438):  43%|▍| 1788/4114 [1:55:36<2:30:25,  3.88s/it]Training 1/2 epoch (loss 0.3438):  43%|▍| 1789/4114 [1:55:36<2:29:02,  3.85s/it]Training 1/2 epoch (loss 0.5039):  43%|▍| 1789/4114 [1:55:40<2:29:02,  3.85s/it]Training 1/2 epoch (loss 0.5039):  44%|▍| 1790/4114 [1:55:40<2:30:38,  3.89s/it]Training 1/2 epoch (loss 0.3574):  44%|▍| 1790/4114 [1:55:44<2:30:38,  3.89s/it]Training 1/2 epoch (loss 0.3574):  44%|▍| 1791/4114 [1:55:44<2:33:56,  3.98s/it]Training 1/2 epoch (loss 0.3613):  44%|▍| 1791/4114 [1:55:48<2:33:56,  3.98s/it]Training 1/2 epoch (loss 0.3613):  44%|▍| 1792/4114 [1:55:48<2:34:06,  3.98s/it]Training 1/2 epoch (loss 0.5000):  44%|▍| 1792/4114 [1:55:52<2:34:06,  3.98s/it]Training 1/2 epoch (loss 0.5000):  44%|▍| 1793/4114 [1:55:52<2:32:54,  3.95s/it]Training 1/2 epoch (loss 0.3438):  44%|▍| 1793/4114 [1:55:56<2:32:54,  3.95s/it]Training 1/2 epoch (loss 0.3438):  44%|▍| 1794/4114 [1:55:56<2:35:12,  4.01s/it]Training 1/2 epoch (loss 0.4766):  44%|▍| 1794/4114 [1:56:00<2:35:12,  4.01s/it]Training 1/2 epoch (loss 0.4766):  44%|▍| 1795/4114 [1:56:00<2:34:38,  4.00s/it]Training 1/2 epoch (loss 0.6328):  44%|▍| 1795/4114 [1:56:04<2:34:38,  4.00s/it]Training 1/2 epoch (loss 0.6328):  44%|▍| 1796/4114 [1:56:04<2:32:13,  3.94s/it]Training 1/2 epoch (loss 0.2520):  44%|▍| 1796/4114 [1:56:07<2:32:13,  3.94s/it]Training 1/2 epoch (loss 0.2520):  44%|▍| 1797/4114 [1:56:07<2:29:52,  3.88s/it]Training 1/2 epoch (loss 0.4023):  44%|▍| 1797/4114 [1:56:11<2:29:52,  3.88s/it]Training 1/2 epoch (loss 0.4023):  44%|▍| 1798/4114 [1:56:11<2:30:13,  3.89s/it]Training 1/2 epoch (loss 0.3457):  44%|▍| 1798/4114 [1:56:14<2:30:13,  3.89s/it]Training 1/2 epoch (loss 0.3457):  44%|▍| 1799/4114 [1:56:14<2:19:44,  3.62s/it]Training 1/2 epoch (loss 0.3652):  44%|▍| 1799/4114 [1:56:18<2:19:44,  3.62s/it]Training 1/2 epoch (loss 0.3652):  44%|▍| 1800/4114 [1:56:18<2:25:08,  3.76s/it]Training 1/2 epoch (loss 0.2988):  44%|▍| 1800/4114 [1:56:22<2:25:08,  3.76s/it]Training 1/2 epoch (loss 0.2988):  44%|▍| 1801/4114 [1:56:22<2:19:08,  3.61s/it]Training 1/2 epoch (loss 0.5391):  44%|▍| 1801/4114 [1:56:25<2:19:08,  3.61s/it]Training 1/2 epoch (loss 0.5391):  44%|▍| 1802/4114 [1:56:25<2:16:54,  3.55s/it]Training 1/2 epoch (loss 0.4297):  44%|▍| 1802/4114 [1:56:29<2:16:54,  3.55s/it]Training 1/2 epoch (loss 0.4297):  44%|▍| 1803/4114 [1:56:29<2:24:10,  3.74s/it]Training 1/2 epoch (loss 0.4805):  44%|▍| 1803/4114 [1:56:33<2:24:10,  3.74s/it]Training 1/2 epoch (loss 0.4805):  44%|▍| 1804/4114 [1:56:33<2:26:28,  3.80s/it]Training 1/2 epoch (loss 0.3828):  44%|▍| 1804/4114 [1:56:37<2:26:28,  3.80s/it]Training 1/2 epoch (loss 0.3828):  44%|▍| 1805/4114 [1:56:37<2:27:26,  3.83s/it]Training 1/2 epoch (loss 0.3770):  44%|▍| 1805/4114 [1:56:41<2:27:26,  3.83s/it]Training 1/2 epoch (loss 0.3770):  44%|▍| 1806/4114 [1:56:41<2:31:30,  3.94s/it]Training 1/2 epoch (loss 0.4434):  44%|▍| 1806/4114 [1:56:45<2:31:30,  3.94s/it]Training 1/2 epoch (loss 0.4434):  44%|▍| 1807/4114 [1:56:45<2:29:58,  3.90s/it]Training 1/2 epoch (loss 0.4414):  44%|▍| 1807/4114 [1:56:49<2:29:58,  3.90s/it]Training 1/2 epoch (loss 0.4414):  44%|▍| 1808/4114 [1:56:49<2:26:48,  3.82s/it]Training 1/2 epoch (loss 0.3535):  44%|▍| 1808/4114 [1:56:53<2:26:48,  3.82s/it]Training 1/2 epoch (loss 0.3535):  44%|▍| 1809/4114 [1:56:53<2:30:30,  3.92s/it]Training 1/2 epoch (loss 0.4922):  44%|▍| 1809/4114 [1:56:57<2:30:30,  3.92s/it]Training 1/2 epoch (loss 0.4922):  44%|▍| 1810/4114 [1:56:57<2:28:57,  3.88s/it]Training 1/2 epoch (loss 0.5469):  44%|▍| 1810/4114 [1:57:01<2:28:57,  3.88s/it]Training 1/2 epoch (loss 0.5469):  44%|▍| 1811/4114 [1:57:01<2:29:54,  3.91s/it]Training 1/2 epoch (loss 0.4023):  44%|▍| 1811/4114 [1:57:05<2:29:54,  3.91s/it]Training 1/2 epoch (loss 0.4023):  44%|▍| 1812/4114 [1:57:05<2:33:21,  4.00s/it]Training 1/2 epoch (loss 0.3965):  44%|▍| 1812/4114 [1:57:09<2:33:21,  4.00s/it]Training 1/2 epoch (loss 0.3965):  44%|▍| 1813/4114 [1:57:09<2:33:16,  4.00s/it]Training 1/2 epoch (loss 0.3379):  44%|▍| 1813/4114 [1:57:13<2:33:16,  4.00s/it]Training 1/2 epoch (loss 0.3379):  44%|▍| 1814/4114 [1:57:13<2:31:20,  3.95s/it]Training 1/2 epoch (loss 0.3887):  44%|▍| 1814/4114 [1:57:17<2:31:20,  3.95s/it]Training 1/2 epoch (loss 0.3887):  44%|▍| 1815/4114 [1:57:17<2:33:59,  4.02s/it]Training 1/2 epoch (loss 0.4551):  44%|▍| 1815/4114 [1:57:21<2:33:59,  4.02s/it]Training 1/2 epoch (loss 0.4551):  44%|▍| 1816/4114 [1:57:21<2:32:03,  3.97s/it]Training 1/2 epoch (loss 0.3281):  44%|▍| 1816/4114 [1:57:25<2:32:03,  3.97s/it]Training 1/2 epoch (loss 0.3281):  44%|▍| 1817/4114 [1:57:25<2:30:40,  3.94s/it]Training 1/2 epoch (loss 0.2393):  44%|▍| 1817/4114 [1:57:29<2:30:40,  3.94s/it]Training 1/2 epoch (loss 0.2393):  44%|▍| 1818/4114 [1:57:29<2:34:56,  4.05s/it]Training 1/2 epoch (loss 0.2988):  44%|▍| 1818/4114 [1:57:33<2:34:56,  4.05s/it]Training 1/2 epoch (loss 0.2988):  44%|▍| 1819/4114 [1:57:33<2:32:11,  3.98s/it]Training 1/2 epoch (loss 0.4082):  44%|▍| 1819/4114 [1:57:36<2:32:11,  3.98s/it]Training 1/2 epoch (loss 0.4082):  44%|▍| 1820/4114 [1:57:36<2:29:37,  3.91s/it]Training 1/2 epoch (loss 0.4199):  44%|▍| 1820/4114 [1:57:40<2:29:37,  3.91s/it]Training 1/2 epoch (loss 0.4199):  44%|▍| 1821/4114 [1:57:40<2:31:32,  3.97s/it]Training 1/2 epoch (loss 0.2773):  44%|▍| 1821/4114 [1:57:44<2:31:32,  3.97s/it]Training 1/2 epoch (loss 0.2773):  44%|▍| 1822/4114 [1:57:44<2:24:22,  3.78s/it]Training 1/2 epoch (loss 0.3359):  44%|▍| 1822/4114 [1:57:48<2:24:22,  3.78s/it]Training 1/2 epoch (loss 0.3359):  44%|▍| 1823/4114 [1:57:48<2:24:28,  3.78s/it]Training 1/2 epoch (loss 0.4023):  44%|▍| 1823/4114 [1:57:52<2:24:28,  3.78s/it]Training 1/2 epoch (loss 0.4023):  44%|▍| 1824/4114 [1:57:52<2:28:37,  3.89s/it]Training 1/2 epoch (loss 0.5430):  44%|▍| 1824/4114 [1:57:56<2:28:37,  3.89s/it]Training 1/2 epoch (loss 0.5430):  44%|▍| 1825/4114 [1:57:56<2:29:41,  3.92s/it]Training 1/2 epoch (loss 0.2383):  44%|▍| 1825/4114 [1:58:00<2:29:41,  3.92s/it]Training 1/2 epoch (loss 0.2383):  44%|▍| 1826/4114 [1:58:00<2:27:39,  3.87s/it]Training 1/2 epoch (loss 0.3535):  44%|▍| 1826/4114 [1:58:04<2:27:39,  3.87s/it]Training 1/2 epoch (loss 0.3535):  44%|▍| 1827/4114 [1:58:04<2:30:29,  3.95s/it]Training 1/2 epoch (loss 0.2471):  44%|▍| 1827/4114 [1:58:08<2:30:29,  3.95s/it]Training 1/2 epoch (loss 0.2471):  44%|▍| 1828/4114 [1:58:08<2:29:37,  3.93s/it]Training 1/2 epoch (loss 0.4629):  44%|▍| 1828/4114 [1:58:11<2:29:37,  3.93s/it]Training 1/2 epoch (loss 0.4629):  44%|▍| 1829/4114 [1:58:11<2:28:11,  3.89s/it]Training 1/2 epoch (loss 0.5938):  44%|▍| 1829/4114 [1:58:15<2:28:11,  3.89s/it]Training 1/2 epoch (loss 0.5938):  44%|▍| 1830/4114 [1:58:15<2:31:15,  3.97s/it]Training 1/2 epoch (loss 0.3398):  44%|▍| 1830/4114 [1:58:19<2:31:15,  3.97s/it]Training 1/2 epoch (loss 0.3398):  45%|▍| 1831/4114 [1:58:19<2:31:10,  3.97s/it]Training 1/2 epoch (loss 0.4355):  45%|▍| 1831/4114 [1:58:24<2:31:10,  3.97s/it]Training 1/2 epoch (loss 0.4355):  45%|▍| 1832/4114 [1:58:24<2:32:27,  4.01s/it]Training 1/2 epoch (loss 0.4922):  45%|▍| 1832/4114 [1:58:28<2:32:27,  4.01s/it]Training 1/2 epoch (loss 0.4922):  45%|▍| 1833/4114 [1:58:28<2:35:35,  4.09s/it]Training 1/2 epoch (loss 0.3477):  45%|▍| 1833/4114 [1:58:31<2:35:35,  4.09s/it]Training 1/2 epoch (loss 0.3477):  45%|▍| 1834/4114 [1:58:31<2:28:43,  3.91s/it]Training 1/2 epoch (loss 0.3223):  45%|▍| 1834/4114 [1:58:35<2:28:43,  3.91s/it]Training 1/2 epoch (loss 0.3223):  45%|▍| 1835/4114 [1:58:35<2:29:49,  3.94s/it]Training 1/2 epoch (loss 0.4062):  45%|▍| 1835/4114 [1:58:40<2:29:49,  3.94s/it]Training 1/2 epoch (loss 0.4062):  45%|▍| 1836/4114 [1:58:40<2:32:52,  4.03s/it]Training 1/2 epoch (loss 0.5078):  45%|▍| 1836/4114 [1:58:43<2:32:52,  4.03s/it]Training 1/2 epoch (loss 0.5078):  45%|▍| 1837/4114 [1:58:43<2:30:56,  3.98s/it]Training 1/2 epoch (loss 0.3438):  45%|▍| 1837/4114 [1:58:47<2:30:56,  3.98s/it]Training 1/2 epoch (loss 0.3438):  45%|▍| 1838/4114 [1:58:47<2:30:39,  3.97s/it]Training 1/2 epoch (loss 0.2471):  45%|▍| 1838/4114 [1:58:51<2:30:39,  3.97s/it]Training 1/2 epoch (loss 0.2471):  45%|▍| 1839/4114 [1:58:51<2:25:02,  3.83s/it]Training 1/2 epoch (loss 0.4023):  45%|▍| 1839/4114 [1:58:54<2:25:02,  3.83s/it]Training 1/2 epoch (loss 0.4023):  45%|▍| 1840/4114 [1:58:54<2:21:26,  3.73s/it]Training 1/2 epoch (loss 0.2871):  45%|▍| 1840/4114 [1:58:58<2:21:26,  3.73s/it]Training 1/2 epoch (loss 0.2871):  45%|▍| 1841/4114 [1:58:58<2:24:36,  3.82s/it]Training 1/2 epoch (loss 0.2891):  45%|▍| 1841/4114 [1:59:02<2:24:36,  3.82s/it]Training 1/2 epoch (loss 0.2891):  45%|▍| 1842/4114 [1:59:02<2:22:56,  3.77s/it]Training 1/2 epoch (loss 0.5078):  45%|▍| 1842/4114 [1:59:06<2:22:56,  3.77s/it]Training 1/2 epoch (loss 0.5078):  45%|▍| 1843/4114 [1:59:06<2:25:07,  3.83s/it]Training 1/2 epoch (loss 0.2334):  45%|▍| 1843/4114 [1:59:10<2:25:07,  3.83s/it]Training 1/2 epoch (loss 0.2334):  45%|▍| 1844/4114 [1:59:10<2:26:10,  3.86s/it]Training 1/2 epoch (loss 0.5195):  45%|▍| 1844/4114 [1:59:14<2:26:10,  3.86s/it]Training 1/2 epoch (loss 0.5195):  45%|▍| 1845/4114 [1:59:14<2:24:31,  3.82s/it]Training 1/2 epoch (loss 0.7070):  45%|▍| 1845/4114 [1:59:18<2:24:31,  3.82s/it]Training 1/2 epoch (loss 0.7070):  45%|▍| 1846/4114 [1:59:18<2:25:05,  3.84s/it]Training 1/2 epoch (loss 0.4180):  45%|▍| 1846/4114 [1:59:22<2:25:05,  3.84s/it]Training 1/2 epoch (loss 0.4180):  45%|▍| 1847/4114 [1:59:22<2:27:04,  3.89s/it]Training 1/2 epoch (loss 0.4785):  45%|▍| 1847/4114 [1:59:26<2:27:04,  3.89s/it]Training 1/2 epoch (loss 0.4785):  45%|▍| 1848/4114 [1:59:26<2:28:21,  3.93s/it]Training 1/2 epoch (loss 0.4785):  45%|▍| 1848/4114 [1:59:30<2:28:21,  3.93s/it]Training 1/2 epoch (loss 0.4785):  45%|▍| 1849/4114 [1:59:30<2:28:01,  3.92s/it]Training 1/2 epoch (loss 0.2910):  45%|▍| 1849/4114 [1:59:33<2:28:01,  3.92s/it]Training 1/2 epoch (loss 0.2910):  45%|▍| 1850/4114 [1:59:33<2:28:26,  3.93s/it]Training 1/2 epoch (loss 0.3047):  45%|▍| 1850/4114 [1:59:38<2:28:26,  3.93s/it]Training 1/2 epoch (loss 0.3047):  45%|▍| 1851/4114 [1:59:38<2:30:23,  3.99s/it]Training 1/2 epoch (loss 0.4414):  45%|▍| 1851/4114 [1:59:42<2:30:23,  3.99s/it]Training 1/2 epoch (loss 0.4414):  45%|▍| 1852/4114 [1:59:42<2:31:35,  4.02s/it]Training 1/2 epoch (loss 0.2969):  45%|▍| 1852/4114 [1:59:45<2:31:35,  4.02s/it]Training 1/2 epoch (loss 0.2969):  45%|▍| 1853/4114 [1:59:45<2:23:18,  3.80s/it]Training 1/2 epoch (loss 0.4121):  45%|▍| 1853/4114 [1:59:49<2:23:18,  3.80s/it]Training 1/2 epoch (loss 0.4121):  45%|▍| 1854/4114 [1:59:49<2:23:48,  3.82s/it]Training 1/2 epoch (loss 0.3867):  45%|▍| 1854/4114 [1:59:53<2:23:48,  3.82s/it]Training 1/2 epoch (loss 0.3867):  45%|▍| 1855/4114 [1:59:53<2:23:30,  3.81s/it]Training 1/2 epoch (loss 0.2637):  45%|▍| 1855/4114 [1:59:57<2:23:30,  3.81s/it]Training 1/2 epoch (loss 0.2637):  45%|▍| 1856/4114 [1:59:57<2:25:23,  3.86s/it]Training 1/2 epoch (loss 0.3730):  45%|▍| 1856/4114 [2:00:01<2:25:23,  3.86s/it]Training 1/2 epoch (loss 0.3730):  45%|▍| 1857/4114 [2:00:01<2:30:16,  4.00s/it]Training 1/2 epoch (loss 0.4219):  45%|▍| 1857/4114 [2:00:04<2:30:16,  4.00s/it]Training 1/2 epoch (loss 0.4219):  45%|▍| 1858/4114 [2:00:04<2:21:12,  3.76s/it]Training 1/2 epoch (loss 0.4766):  45%|▍| 1858/4114 [2:00:08<2:21:12,  3.76s/it]Training 1/2 epoch (loss 0.4766):  45%|▍| 1859/4114 [2:00:08<2:23:35,  3.82s/it]Training 1/2 epoch (loss 0.3125):  45%|▍| 1859/4114 [2:00:12<2:23:35,  3.82s/it]Training 1/2 epoch (loss 0.3125):  45%|▍| 1860/4114 [2:00:12<2:25:50,  3.88s/it]Training 1/2 epoch (loss 0.3652):  45%|▍| 1860/4114 [2:00:16<2:25:50,  3.88s/it]Training 1/2 epoch (loss 0.3652):  45%|▍| 1861/4114 [2:00:16<2:27:10,  3.92s/it]Training 1/2 epoch (loss 0.4316):  45%|▍| 1861/4114 [2:00:20<2:27:10,  3.92s/it]Training 1/2 epoch (loss 0.4316):  45%|▍| 1862/4114 [2:00:20<2:22:11,  3.79s/it]Training 1/2 epoch (loss 0.2021):  45%|▍| 1862/4114 [2:00:23<2:22:11,  3.79s/it]Training 1/2 epoch (loss 0.2021):  45%|▍| 1863/4114 [2:00:23<2:21:12,  3.76s/it]Training 1/2 epoch (loss 0.4473):  45%|▍| 1863/4114 [2:00:27<2:21:12,  3.76s/it]Training 1/2 epoch (loss 0.4473):  45%|▍| 1864/4114 [2:00:27<2:21:37,  3.78s/it]Training 1/2 epoch (loss 0.3203):  45%|▍| 1864/4114 [2:00:31<2:21:37,  3.78s/it]Training 1/2 epoch (loss 0.3203):  45%|▍| 1865/4114 [2:00:31<2:22:48,  3.81s/it]Training 1/2 epoch (loss 0.2988):  45%|▍| 1865/4114 [2:00:35<2:22:48,  3.81s/it]Training 1/2 epoch (loss 0.2988):  45%|▍| 1866/4114 [2:00:35<2:25:34,  3.89s/it]Training 1/2 epoch (loss 0.3906):  45%|▍| 1866/4114 [2:00:39<2:25:34,  3.89s/it]Training 1/2 epoch (loss 0.3906):  45%|▍| 1867/4114 [2:00:39<2:22:26,  3.80s/it]Training 1/2 epoch (loss 0.3320):  45%|▍| 1867/4114 [2:00:43<2:22:26,  3.80s/it]Training 1/2 epoch (loss 0.3320):  45%|▍| 1868/4114 [2:00:43<2:22:48,  3.81s/it]Training 1/2 epoch (loss 0.3594):  45%|▍| 1868/4114 [2:00:47<2:22:48,  3.81s/it]Training 1/2 epoch (loss 0.3594):  45%|▍| 1869/4114 [2:00:47<2:26:42,  3.92s/it]Training 1/2 epoch (loss 0.3203):  45%|▍| 1869/4114 [2:00:51<2:26:42,  3.92s/it]Training 1/2 epoch (loss 0.3203):  45%|▍| 1870/4114 [2:00:51<2:26:16,  3.91s/it]Training 1/2 epoch (loss 0.3359):  45%|▍| 1870/4114 [2:00:55<2:26:16,  3.91s/it]Training 1/2 epoch (loss 0.3359):  45%|▍| 1871/4114 [2:00:55<2:27:58,  3.96s/it]Training 1/2 epoch (loss 0.4492):  45%|▍| 1871/4114 [2:00:59<2:27:58,  3.96s/it]Training 1/2 epoch (loss 0.4492):  46%|▍| 1872/4114 [2:00:59<2:29:09,  3.99s/it]Training 1/2 epoch (loss 0.3164):  46%|▍| 1872/4114 [2:01:03<2:29:09,  3.99s/it]Training 1/2 epoch (loss 0.3164):  46%|▍| 1873/4114 [2:01:03<2:28:29,  3.98s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1873/4114 [2:01:06<2:28:29,  3.98s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1874/4114 [2:01:06<2:26:10,  3.92s/it]Training 1/2 epoch (loss 0.4414):  46%|▍| 1874/4114 [2:01:10<2:26:10,  3.92s/it]Training 1/2 epoch (loss 0.4414):  46%|▍| 1875/4114 [2:01:10<2:27:16,  3.95s/it]Training 1/2 epoch (loss 0.4980):  46%|▍| 1875/4114 [2:01:14<2:27:16,  3.95s/it]Training 1/2 epoch (loss 0.4980):  46%|▍| 1876/4114 [2:01:14<2:24:59,  3.89s/it]Training 1/2 epoch (loss 0.3906):  46%|▍| 1876/4114 [2:01:18<2:24:59,  3.89s/it]Training 1/2 epoch (loss 0.3906):  46%|▍| 1877/4114 [2:01:18<2:26:08,  3.92s/it]Training 1/2 epoch (loss 0.4062):  46%|▍| 1877/4114 [2:01:22<2:26:08,  3.92s/it]Training 1/2 epoch (loss 0.4062):  46%|▍| 1878/4114 [2:01:22<2:28:54,  4.00s/it]Training 1/2 epoch (loss 0.2812):  46%|▍| 1878/4114 [2:01:26<2:28:54,  4.00s/it]Training 1/2 epoch (loss 0.2812):  46%|▍| 1879/4114 [2:01:26<2:26:26,  3.93s/it]Training 1/2 epoch (loss 0.4141):  46%|▍| 1879/4114 [2:01:30<2:26:26,  3.93s/it]Training 1/2 epoch (loss 0.4141):  46%|▍| 1880/4114 [2:01:30<2:26:16,  3.93s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1880/4114 [2:01:34<2:26:16,  3.93s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1881/4114 [2:01:34<2:27:09,  3.95s/it]Training 1/2 epoch (loss 0.4199):  46%|▍| 1881/4114 [2:01:38<2:27:09,  3.95s/it]Training 1/2 epoch (loss 0.4199):  46%|▍| 1882/4114 [2:01:38<2:24:23,  3.88s/it]Training 1/2 epoch (loss 0.5273):  46%|▍| 1882/4114 [2:01:42<2:24:23,  3.88s/it]Training 1/2 epoch (loss 0.5273):  46%|▍| 1883/4114 [2:01:42<2:24:52,  3.90s/it]Training 1/2 epoch (loss 0.4785):  46%|▍| 1883/4114 [2:01:46<2:24:52,  3.90s/it]Training 1/2 epoch (loss 0.4785):  46%|▍| 1884/4114 [2:01:46<2:28:02,  3.98s/it]Training 1/2 epoch (loss 0.3555):  46%|▍| 1884/4114 [2:01:50<2:28:02,  3.98s/it]Training 1/2 epoch (loss 0.3555):  46%|▍| 1885/4114 [2:01:50<2:26:44,  3.95s/it]Training 1/2 epoch (loss 0.3477):  46%|▍| 1885/4114 [2:01:54<2:26:44,  3.95s/it]Training 1/2 epoch (loss 0.3477):  46%|▍| 1886/4114 [2:01:54<2:26:38,  3.95s/it]Training 1/2 epoch (loss 0.3262):  46%|▍| 1886/4114 [2:01:58<2:26:38,  3.95s/it]Training 1/2 epoch (loss 0.3262):  46%|▍| 1887/4114 [2:01:58<2:28:37,  4.00s/it]Training 1/2 epoch (loss 0.2344):  46%|▍| 1887/4114 [2:02:01<2:28:37,  4.00s/it]Training 1/2 epoch (loss 0.2344):  46%|▍| 1888/4114 [2:02:01<2:22:10,  3.83s/it]Training 1/2 epoch (loss 0.3086):  46%|▍| 1888/4114 [2:02:05<2:22:10,  3.83s/it]Training 1/2 epoch (loss 0.3086):  46%|▍| 1889/4114 [2:02:05<2:21:52,  3.83s/it]Training 1/2 epoch (loss 0.2910):  46%|▍| 1889/4114 [2:02:09<2:21:52,  3.83s/it]Training 1/2 epoch (loss 0.2910):  46%|▍| 1890/4114 [2:02:09<2:19:32,  3.76s/it]Training 1/2 epoch (loss 0.3027):  46%|▍| 1890/4114 [2:02:13<2:19:32,  3.76s/it]Training 1/2 epoch (loss 0.3027):  46%|▍| 1891/4114 [2:02:13<2:22:53,  3.86s/it]Training 1/2 epoch (loss 0.1885):  46%|▍| 1891/4114 [2:02:17<2:22:53,  3.86s/it]Training 1/2 epoch (loss 0.1885):  46%|▍| 1892/4114 [2:02:17<2:24:01,  3.89s/it]Training 1/2 epoch (loss 0.4785):  46%|▍| 1892/4114 [2:02:21<2:24:01,  3.89s/it]Training 1/2 epoch (loss 0.4785):  46%|▍| 1893/4114 [2:02:21<2:27:41,  3.99s/it]Training 1/2 epoch (loss 0.4043):  46%|▍| 1893/4114 [2:02:24<2:27:41,  3.99s/it]Training 1/2 epoch (loss 0.4043):  46%|▍| 1894/4114 [2:02:24<2:19:24,  3.77s/it]Training 1/2 epoch (loss 0.2969):  46%|▍| 1894/4114 [2:02:28<2:19:24,  3.77s/it]Training 1/2 epoch (loss 0.2969):  46%|▍| 1895/4114 [2:02:28<2:19:40,  3.78s/it]Training 1/2 epoch (loss 0.3652):  46%|▍| 1895/4114 [2:02:32<2:19:40,  3.78s/it]Training 1/2 epoch (loss 0.3652):  46%|▍| 1896/4114 [2:02:32<2:25:04,  3.92s/it]Training 1/2 epoch (loss 0.3184):  46%|▍| 1896/4114 [2:02:36<2:25:04,  3.92s/it]Training 1/2 epoch (loss 0.3184):  46%|▍| 1897/4114 [2:02:36<2:20:21,  3.80s/it]Training 1/2 epoch (loss 0.2578):  46%|▍| 1897/4114 [2:02:40<2:20:21,  3.80s/it]Training 1/2 epoch (loss 0.2578):  46%|▍| 1898/4114 [2:02:40<2:18:58,  3.76s/it]Training 1/2 epoch (loss 0.3125):  46%|▍| 1898/4114 [2:02:44<2:18:58,  3.76s/it]Training 1/2 epoch (loss 0.3125):  46%|▍| 1899/4114 [2:02:44<2:23:19,  3.88s/it]Training 1/2 epoch (loss 0.5391):  46%|▍| 1899/4114 [2:02:47<2:23:19,  3.88s/it]Training 1/2 epoch (loss 0.5391):  46%|▍| 1900/4114 [2:02:47<2:18:48,  3.76s/it]Training 1/2 epoch (loss 0.5195):  46%|▍| 1900/4114 [2:02:51<2:18:48,  3.76s/it]Training 1/2 epoch (loss 0.5195):  46%|▍| 1901/4114 [2:02:51<2:17:51,  3.74s/it]Training 1/2 epoch (loss 0.5586):  46%|▍| 1901/4114 [2:02:55<2:17:51,  3.74s/it]Training 1/2 epoch (loss 0.5586):  46%|▍| 1902/4114 [2:02:55<2:23:40,  3.90s/it]Training 1/2 epoch (loss 0.3379):  46%|▍| 1902/4114 [2:02:59<2:23:40,  3.90s/it]Training 1/2 epoch (loss 0.3379):  46%|▍| 1903/4114 [2:02:59<2:23:27,  3.89s/it]Training 1/2 epoch (loss 0.3828):  46%|▍| 1903/4114 [2:03:03<2:23:27,  3.89s/it]Training 1/2 epoch (loss 0.3828):  46%|▍| 1904/4114 [2:03:03<2:21:56,  3.85s/it]Training 1/2 epoch (loss 0.3242):  46%|▍| 1904/4114 [2:03:07<2:21:56,  3.85s/it]Training 1/2 epoch (loss 0.3242):  46%|▍| 1905/4114 [2:03:07<2:25:38,  3.96s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1905/4114 [2:03:11<2:25:38,  3.96s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1906/4114 [2:03:11<2:25:37,  3.96s/it]Training 1/2 epoch (loss 0.5234):  46%|▍| 1906/4114 [2:03:15<2:25:37,  3.96s/it]Training 1/2 epoch (loss 0.5234):  46%|▍| 1907/4114 [2:03:15<2:25:23,  3.95s/it]Training 1/2 epoch (loss 0.3086):  46%|▍| 1907/4114 [2:03:19<2:25:23,  3.95s/it]Training 1/2 epoch (loss 0.3086):  46%|▍| 1908/4114 [2:03:19<2:26:44,  3.99s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1908/4114 [2:03:23<2:26:44,  3.99s/it]Training 1/2 epoch (loss 0.4102):  46%|▍| 1909/4114 [2:03:23<2:25:35,  3.96s/it]Training 1/2 epoch (loss 0.4551):  46%|▍| 1909/4114 [2:03:27<2:25:35,  3.96s/it]Training 1/2 epoch (loss 0.4551):  46%|▍| 1910/4114 [2:03:27<2:23:46,  3.91s/it]Training 1/2 epoch (loss 0.3438):  46%|▍| 1910/4114 [2:03:31<2:23:46,  3.91s/it]Training 1/2 epoch (loss 0.3438):  46%|▍| 1911/4114 [2:03:31<2:27:20,  4.01s/it]Training 1/2 epoch (loss 0.4805):  46%|▍| 1911/4114 [2:03:35<2:27:20,  4.01s/it]Training 1/2 epoch (loss 0.4805):  46%|▍| 1912/4114 [2:03:35<2:24:44,  3.94s/it]Training 1/2 epoch (loss 0.5547):  46%|▍| 1912/4114 [2:03:38<2:24:44,  3.94s/it]Training 1/2 epoch (loss 0.5547):  46%|▍| 1913/4114 [2:03:38<2:18:45,  3.78s/it]Training 1/2 epoch (loss 0.5469):  46%|▍| 1913/4114 [2:03:42<2:18:45,  3.78s/it]Training 1/2 epoch (loss 0.5469):  47%|▍| 1914/4114 [2:03:42<2:23:01,  3.90s/it]Training 1/2 epoch (loss 0.4785):  47%|▍| 1914/4114 [2:03:46<2:23:01,  3.90s/it]Training 1/2 epoch (loss 0.4785):  47%|▍| 1915/4114 [2:03:46<2:25:02,  3.96s/it]Training 1/2 epoch (loss 0.3477):  47%|▍| 1915/4114 [2:03:50<2:25:02,  3.96s/it]Training 1/2 epoch (loss 0.3477):  47%|▍| 1916/4114 [2:03:50<2:22:55,  3.90s/it]Training 1/2 epoch (loss 0.4453):  47%|▍| 1916/4114 [2:03:54<2:22:55,  3.90s/it]Training 1/2 epoch (loss 0.4453):  47%|▍| 1917/4114 [2:03:54<2:24:02,  3.93s/it]Training 1/2 epoch (loss 0.4785):  47%|▍| 1917/4114 [2:03:57<2:24:02,  3.93s/it]Training 1/2 epoch (loss 0.4785):  47%|▍| 1918/4114 [2:03:57<2:13:34,  3.65s/it]Training 1/2 epoch (loss 0.4863):  47%|▍| 1918/4114 [2:04:01<2:13:34,  3.65s/it]Training 1/2 epoch (loss 0.4863):  47%|▍| 1919/4114 [2:04:01<2:17:38,  3.76s/it]Training 1/2 epoch (loss 0.3730):  47%|▍| 1919/4114 [2:04:05<2:17:38,  3.76s/it]Training 1/2 epoch (loss 0.3730):  47%|▍| 1920/4114 [2:04:05<2:19:15,  3.81s/it]Training 1/2 epoch (loss 0.3926):  47%|▍| 1920/4114 [2:04:09<2:19:15,  3.81s/it]Training 1/2 epoch (loss 0.3926):  47%|▍| 1921/4114 [2:04:09<2:19:32,  3.82s/it]Training 1/2 epoch (loss 0.5195):  47%|▍| 1921/4114 [2:04:13<2:19:32,  3.82s/it]Training 1/2 epoch (loss 0.5195):  47%|▍| 1922/4114 [2:04:13<2:20:55,  3.86s/it]Training 1/2 epoch (loss 0.3926):  47%|▍| 1922/4114 [2:04:17<2:20:55,  3.86s/it]Training 1/2 epoch (loss 0.3926):  47%|▍| 1923/4114 [2:04:17<2:24:48,  3.97s/it]Training 1/2 epoch (loss 0.4414):  47%|▍| 1923/4114 [2:04:21<2:24:48,  3.97s/it]Training 1/2 epoch (loss 0.4414):  47%|▍| 1924/4114 [2:04:21<2:23:24,  3.93s/it]Training 1/2 epoch (loss 0.4160):  47%|▍| 1924/4114 [2:04:25<2:23:24,  3.93s/it]Training 1/2 epoch (loss 0.4160):  47%|▍| 1925/4114 [2:04:25<2:24:43,  3.97s/it]Training 1/2 epoch (loss 0.3320):  47%|▍| 1925/4114 [2:04:28<2:24:43,  3.97s/it]Training 1/2 epoch (loss 0.3320):  47%|▍| 1926/4114 [2:04:28<2:18:58,  3.81s/it]Training 1/2 epoch (loss 0.5273):  47%|▍| 1926/4114 [2:04:32<2:18:58,  3.81s/it]Training 1/2 epoch (loss 0.5273):  47%|▍| 1927/4114 [2:04:32<2:11:52,  3.62s/it]Training 1/2 epoch (loss 0.4062):  47%|▍| 1927/4114 [2:04:35<2:11:52,  3.62s/it]Training 1/2 epoch (loss 0.4062):  47%|▍| 1928/4114 [2:04:35<2:15:21,  3.72s/it]Training 1/2 epoch (loss 0.3438):  47%|▍| 1928/4114 [2:04:40<2:15:21,  3.72s/it]Training 1/2 epoch (loss 0.3438):  47%|▍| 1929/4114 [2:04:40<2:19:58,  3.84s/it]Training 1/2 epoch (loss 0.5586):  47%|▍| 1929/4114 [2:04:43<2:19:58,  3.84s/it]Training 1/2 epoch (loss 0.5586):  47%|▍| 1930/4114 [2:04:43<2:18:10,  3.80s/it]Training 1/2 epoch (loss 0.3672):  47%|▍| 1930/4114 [2:04:47<2:18:10,  3.80s/it]Training 1/2 epoch (loss 0.3672):  47%|▍| 1931/4114 [2:04:47<2:20:50,  3.87s/it]Training 1/2 epoch (loss 0.3711):  47%|▍| 1931/4114 [2:04:52<2:20:50,  3.87s/it]Training 1/2 epoch (loss 0.3711):  47%|▍| 1932/4114 [2:04:52<2:25:13,  3.99s/it]Training 1/2 epoch (loss 0.3086):  47%|▍| 1932/4114 [2:04:55<2:25:13,  3.99s/it]Training 1/2 epoch (loss 0.3086):  47%|▍| 1933/4114 [2:04:55<2:23:00,  3.93s/it]Training 1/2 epoch (loss 0.3359):  47%|▍| 1933/4114 [2:04:59<2:23:00,  3.93s/it]Training 1/2 epoch (loss 0.3359):  47%|▍| 1934/4114 [2:04:59<2:22:37,  3.93s/it]Training 1/2 epoch (loss 0.3359):  47%|▍| 1934/4114 [2:05:04<2:22:37,  3.93s/it]Training 1/2 epoch (loss 0.3359):  47%|▍| 1935/4114 [2:05:04<2:25:59,  4.02s/it]Training 1/2 epoch (loss 0.3320):  47%|▍| 1935/4114 [2:05:07<2:25:59,  4.02s/it]Training 1/2 epoch (loss 0.3320):  47%|▍| 1936/4114 [2:05:07<2:23:48,  3.96s/it]Training 1/2 epoch (loss 0.4805):  47%|▍| 1936/4114 [2:05:11<2:23:48,  3.96s/it]Training 1/2 epoch (loss 0.4805):  47%|▍| 1937/4114 [2:05:11<2:23:40,  3.96s/it]Training 1/2 epoch (loss 0.3867):  47%|▍| 1937/4114 [2:05:16<2:23:40,  3.96s/it]Training 1/2 epoch (loss 0.3867):  47%|▍| 1938/4114 [2:05:16<2:25:52,  4.02s/it]Training 1/2 epoch (loss 0.3809):  47%|▍| 1938/4114 [2:05:19<2:25:52,  4.02s/it]Training 1/2 epoch (loss 0.3809):  47%|▍| 1939/4114 [2:05:19<2:18:34,  3.82s/it]Training 1/2 epoch (loss 0.3184):  47%|▍| 1939/4114 [2:05:23<2:18:34,  3.82s/it]Training 1/2 epoch (loss 0.3184):  47%|▍| 1940/4114 [2:05:23<2:20:27,  3.88s/it]Training 1/2 epoch (loss 0.3730):  47%|▍| 1940/4114 [2:05:27<2:20:27,  3.88s/it]Training 1/2 epoch (loss 0.3730):  47%|▍| 1941/4114 [2:05:27<2:23:23,  3.96s/it]Training 1/2 epoch (loss 0.3750):  47%|▍| 1941/4114 [2:05:30<2:23:23,  3.96s/it]Training 1/2 epoch (loss 0.3750):  47%|▍| 1942/4114 [2:05:30<2:15:35,  3.75s/it]Training 1/2 epoch (loss 0.3926):  47%|▍| 1942/4114 [2:05:34<2:15:35,  3.75s/it]Training 1/2 epoch (loss 0.3926):  47%|▍| 1943/4114 [2:05:34<2:11:33,  3.64s/it]Training 1/2 epoch (loss 0.4805):  47%|▍| 1943/4114 [2:05:37<2:11:33,  3.64s/it]Training 1/2 epoch (loss 0.4805):  47%|▍| 1944/4114 [2:05:37<2:11:31,  3.64s/it]Training 1/2 epoch (loss 0.3027):  47%|▍| 1944/4114 [2:05:41<2:11:31,  3.64s/it]Training 1/2 epoch (loss 0.3027):  47%|▍| 1945/4114 [2:05:41<2:14:45,  3.73s/it]Training 1/2 epoch (loss 0.3516):  47%|▍| 1945/4114 [2:05:45<2:14:45,  3.73s/it]Training 1/2 epoch (loss 0.3516):  47%|▍| 1946/4114 [2:05:45<2:17:49,  3.81s/it]Training 1/2 epoch (loss 0.3125):  47%|▍| 1946/4114 [2:05:49<2:17:49,  3.81s/it]Training 1/2 epoch (loss 0.3125):  47%|▍| 1947/4114 [2:05:49<2:14:42,  3.73s/it]Training 1/2 epoch (loss 0.3613):  47%|▍| 1947/4114 [2:05:52<2:14:42,  3.73s/it]Training 1/2 epoch (loss 0.3613):  47%|▍| 1948/4114 [2:05:52<2:10:34,  3.62s/it]Training 1/2 epoch (loss 0.4023):  47%|▍| 1948/4114 [2:05:56<2:10:34,  3.62s/it]Training 1/2 epoch (loss 0.4023):  47%|▍| 1949/4114 [2:05:56<2:12:38,  3.68s/it]Training 1/2 epoch (loss 0.3223):  47%|▍| 1949/4114 [2:06:00<2:12:38,  3.68s/it]Training 1/2 epoch (loss 0.3223):  47%|▍| 1950/4114 [2:06:00<2:19:36,  3.87s/it]Training 1/2 epoch (loss 0.3594):  47%|▍| 1950/4114 [2:06:04<2:19:36,  3.87s/it]Training 1/2 epoch (loss 0.3594):  47%|▍| 1951/4114 [2:06:04<2:21:03,  3.91s/it]Training 1/2 epoch (loss 0.3027):  47%|▍| 1951/4114 [2:06:08<2:21:03,  3.91s/it]Training 1/2 epoch (loss 0.3027):  47%|▍| 1952/4114 [2:06:08<2:20:35,  3.90s/it]Training 1/2 epoch (loss 0.4453):  47%|▍| 1952/4114 [2:06:12<2:20:35,  3.90s/it]Training 1/2 epoch (loss 0.4453):  47%|▍| 1953/4114 [2:06:12<2:22:56,  3.97s/it]Training 1/2 epoch (loss 0.2129):  47%|▍| 1953/4114 [2:06:16<2:22:56,  3.97s/it]Training 1/2 epoch (loss 0.2129):  47%|▍| 1954/4114 [2:06:16<2:23:51,  4.00s/it]Training 1/2 epoch (loss 0.3047):  47%|▍| 1954/4114 [2:06:20<2:23:51,  4.00s/it]Training 1/2 epoch (loss 0.3047):  48%|▍| 1955/4114 [2:06:20<2:18:16,  3.84s/it]Training 1/2 epoch (loss 0.3613):  48%|▍| 1955/4114 [2:06:24<2:18:16,  3.84s/it]Training 1/2 epoch (loss 0.3613):  48%|▍| 1956/4114 [2:06:24<2:21:50,  3.94s/it]Training 1/2 epoch (loss 0.2373):  48%|▍| 1956/4114 [2:06:28<2:21:50,  3.94s/it]Training 1/2 epoch (loss 0.2373):  48%|▍| 1957/4114 [2:06:28<2:22:09,  3.95s/it]Training 1/2 epoch (loss 0.4434):  48%|▍| 1957/4114 [2:06:32<2:22:09,  3.95s/it]Training 1/2 epoch (loss 0.4434):  48%|▍| 1958/4114 [2:06:32<2:19:56,  3.89s/it]Training 1/2 epoch (loss 0.5391):  48%|▍| 1958/4114 [2:06:35<2:19:56,  3.89s/it]Training 1/2 epoch (loss 0.5391):  48%|▍| 1959/4114 [2:06:35<2:17:57,  3.84s/it]Training 1/2 epoch (loss 0.4336):  48%|▍| 1959/4114 [2:06:40<2:17:57,  3.84s/it]Training 1/2 epoch (loss 0.4336):  48%|▍| 1960/4114 [2:06:40<2:20:18,  3.91s/it]Training 1/2 epoch (loss 0.4707):  48%|▍| 1960/4114 [2:06:43<2:20:18,  3.91s/it]Training 1/2 epoch (loss 0.4707):  48%|▍| 1961/4114 [2:06:43<2:20:44,  3.92s/it]Training 1/2 epoch (loss 0.5000):  48%|▍| 1961/4114 [2:06:47<2:20:44,  3.92s/it]Training 1/2 epoch (loss 0.5000):  48%|▍| 1962/4114 [2:06:47<2:21:30,  3.95s/it]Training 1/2 epoch (loss 0.4102):  48%|▍| 1962/4114 [2:06:52<2:21:30,  3.95s/it]Training 1/2 epoch (loss 0.4102):  48%|▍| 1963/4114 [2:06:52<2:22:23,  3.97s/it]Training 1/2 epoch (loss 0.4922):  48%|▍| 1963/4114 [2:06:55<2:22:23,  3.97s/it]Training 1/2 epoch (loss 0.4922):  48%|▍| 1964/4114 [2:06:55<2:21:05,  3.94s/it]Training 1/2 epoch (loss 0.3164):  48%|▍| 1964/4114 [2:06:59<2:21:05,  3.94s/it]Training 1/2 epoch (loss 0.3164):  48%|▍| 1965/4114 [2:06:59<2:20:26,  3.92s/it]Training 1/2 epoch (loss 0.4023):  48%|▍| 1965/4114 [2:07:03<2:20:26,  3.92s/it]Training 1/2 epoch (loss 0.4023):  48%|▍| 1966/4114 [2:07:03<2:20:20,  3.92s/it]Training 1/2 epoch (loss 0.3750):  48%|▍| 1966/4114 [2:07:07<2:20:20,  3.92s/it]Training 1/2 epoch (loss 0.3750):  48%|▍| 1967/4114 [2:07:07<2:21:13,  3.95s/it]Training 1/2 epoch (loss 0.2109):  48%|▍| 1967/4114 [2:07:11<2:21:13,  3.95s/it]Training 1/2 epoch (loss 0.2109):  48%|▍| 1968/4114 [2:07:11<2:22:38,  3.99s/it]Training 1/2 epoch (loss 0.3945):  48%|▍| 1968/4114 [2:07:15<2:22:38,  3.99s/it]Training 1/2 epoch (loss 0.3945):  48%|▍| 1969/4114 [2:07:15<2:19:53,  3.91s/it]Training 1/2 epoch (loss 0.4512):  48%|▍| 1969/4114 [2:07:18<2:19:53,  3.91s/it]Training 1/2 epoch (loss 0.4512):  48%|▍| 1970/4114 [2:07:18<2:14:32,  3.77s/it]Training 1/2 epoch (loss 0.3320):  48%|▍| 1970/4114 [2:07:23<2:14:32,  3.77s/it]Training 1/2 epoch (loss 0.3320):  48%|▍| 1971/4114 [2:07:23<2:18:41,  3.88s/it]Training 1/2 epoch (loss 0.4902):  48%|▍| 1971/4114 [2:07:27<2:18:41,  3.88s/it]Training 1/2 epoch (loss 0.4902):  48%|▍| 1972/4114 [2:07:27<2:19:58,  3.92s/it]Training 1/2 epoch (loss 0.3398):  48%|▍| 1972/4114 [2:07:31<2:19:58,  3.92s/it]Training 1/2 epoch (loss 0.3398):  48%|▍| 1973/4114 [2:07:31<2:19:42,  3.92s/it]Training 1/2 epoch (loss 0.5781):  48%|▍| 1973/4114 [2:07:34<2:19:42,  3.92s/it]Training 1/2 epoch (loss 0.5781):  48%|▍| 1974/4114 [2:07:34<2:13:47,  3.75s/it]Training 1/2 epoch (loss 0.3242):  48%|▍| 1974/4114 [2:07:38<2:13:47,  3.75s/it]Training 1/2 epoch (loss 0.3242):  48%|▍| 1975/4114 [2:07:38<2:16:38,  3.83s/it]Training 1/2 epoch (loss 0.3359):  48%|▍| 1975/4114 [2:07:42<2:16:38,  3.83s/it]Training 1/2 epoch (loss 0.3359):  48%|▍| 1976/4114 [2:07:42<2:15:50,  3.81s/it]Training 1/2 epoch (loss 0.4238):  48%|▍| 1976/4114 [2:07:46<2:15:50,  3.81s/it]Training 1/2 epoch (loss 0.4238):  48%|▍| 1977/4114 [2:07:46<2:18:43,  3.89s/it]Training 1/2 epoch (loss 0.5508):  48%|▍| 1977/4114 [2:07:49<2:18:43,  3.89s/it]Training 1/2 epoch (loss 0.5508):  48%|▍| 1978/4114 [2:07:49<2:09:30,  3.64s/it]Training 1/2 epoch (loss 0.3164):  48%|▍| 1978/4114 [2:07:52<2:09:30,  3.64s/it]Training 1/2 epoch (loss 0.3164):  48%|▍| 1979/4114 [2:07:52<2:09:03,  3.63s/it]Training 1/2 epoch (loss 0.4785):  48%|▍| 1979/4114 [2:07:57<2:09:03,  3.63s/it]Training 1/2 epoch (loss 0.4785):  48%|▍| 1980/4114 [2:07:57<2:14:28,  3.78s/it]Training 1/2 epoch (loss 0.3418):  48%|▍| 1980/4114 [2:08:00<2:14:28,  3.78s/it]Training 1/2 epoch (loss 0.3418):  48%|▍| 1981/4114 [2:08:00<2:09:37,  3.65s/it]Training 1/2 epoch (loss 0.3281):  48%|▍| 1981/4114 [2:08:04<2:09:37,  3.65s/it]Training 1/2 epoch (loss 0.3281):  48%|▍| 1982/4114 [2:08:04<2:13:14,  3.75s/it]Training 1/2 epoch (loss 0.4043):  48%|▍| 1982/4114 [2:08:08<2:13:14,  3.75s/it]Training 1/2 epoch (loss 0.4043):  48%|▍| 1983/4114 [2:08:08<2:13:21,  3.75s/it]Training 1/2 epoch (loss 0.3438):  48%|▍| 1983/4114 [2:08:12<2:13:21,  3.75s/it]Training 1/2 epoch (loss 0.3438):  48%|▍| 1984/4114 [2:08:12<2:16:14,  3.84s/it]Training 1/2 epoch (loss 0.4629):  48%|▍| 1984/4114 [2:08:15<2:16:14,  3.84s/it]Training 1/2 epoch (loss 0.4629):  48%|▍| 1985/4114 [2:08:15<2:12:10,  3.72s/it]Training 1/2 epoch (loss 0.4199):  48%|▍| 1985/4114 [2:08:19<2:12:10,  3.72s/it]Training 1/2 epoch (loss 0.4199):  48%|▍| 1986/4114 [2:08:19<2:14:12,  3.78s/it]Training 1/2 epoch (loss 0.3379):  48%|▍| 1986/4114 [2:08:23<2:14:12,  3.78s/it]Training 1/2 epoch (loss 0.3379):  48%|▍| 1987/4114 [2:08:23<2:11:54,  3.72s/it]Training 1/2 epoch (loss 0.2734):  48%|▍| 1987/4114 [2:08:26<2:11:54,  3.72s/it]Training 1/2 epoch (loss 0.2734):  48%|▍| 1988/4114 [2:08:26<2:12:07,  3.73s/it]Training 1/2 epoch (loss 0.3770):  48%|▍| 1988/4114 [2:08:30<2:12:07,  3.73s/it]Training 1/2 epoch (loss 0.3770):  48%|▍| 1989/4114 [2:08:30<2:15:10,  3.82s/it]Training 1/2 epoch (loss 0.3184):  48%|▍| 1989/4114 [2:08:34<2:15:10,  3.82s/it]Training 1/2 epoch (loss 0.3184):  48%|▍| 1990/4114 [2:08:34<2:17:15,  3.88s/it]Training 1/2 epoch (loss 0.2422):  48%|▍| 1990/4114 [2:08:38<2:17:15,  3.88s/it]Training 1/2 epoch (loss 0.2422):  48%|▍| 1991/4114 [2:08:38<2:11:45,  3.72s/it]Training 1/2 epoch (loss 0.4336):  48%|▍| 1991/4114 [2:08:42<2:11:45,  3.72s/it]Training 1/2 epoch (loss 0.4336):  48%|▍| 1992/4114 [2:08:42<2:12:21,  3.74s/it]Training 1/2 epoch (loss 0.4570):  48%|▍| 1992/4114 [2:08:45<2:12:21,  3.74s/it]Training 1/2 epoch (loss 0.4570):  48%|▍| 1993/4114 [2:08:45<2:12:50,  3.76s/it]Training 1/2 epoch (loss 0.5039):  48%|▍| 1993/4114 [2:08:49<2:12:50,  3.76s/it]Training 1/2 epoch (loss 0.5039):  48%|▍| 1994/4114 [2:08:49<2:09:01,  3.65s/it]Training 1/2 epoch (loss 0.4590):  48%|▍| 1994/4114 [2:08:53<2:09:01,  3.65s/it]Training 1/2 epoch (loss 0.4590):  48%|▍| 1995/4114 [2:08:53<2:13:34,  3.78s/it]Training 1/2 epoch (loss 0.3672):  48%|▍| 1995/4114 [2:08:57<2:13:34,  3.78s/it]Training 1/2 epoch (loss 0.3672):  49%|▍| 1996/4114 [2:08:57<2:15:02,  3.83s/it]Training 1/2 epoch (loss 0.3789):  49%|▍| 1996/4114 [2:09:01<2:15:02,  3.83s/it]Training 1/2 epoch (loss 0.3789):  49%|▍| 1997/4114 [2:09:01<2:18:30,  3.93s/it]Training 1/2 epoch (loss 0.4727):  49%|▍| 1997/4114 [2:09:05<2:18:30,  3.93s/it]Training 1/2 epoch (loss 0.4727):  49%|▍| 1998/4114 [2:09:05<2:19:54,  3.97s/it]Training 1/2 epoch (loss 0.3887):  49%|▍| 1998/4114 [2:09:09<2:19:54,  3.97s/it]Training 1/2 epoch (loss 0.3887):  49%|▍| 1999/4114 [2:09:09<2:18:10,  3.92s/it]Training 1/2 epoch (loss 0.4336):  49%|▍| 1999/4114 [2:09:13<2:18:10,  3.92s/it]Training 1/2 epoch (loss 0.4336):  49%|▍| 2000/4114 [2:09:13<2:17:59,  3.92s/it]Training 1/2 epoch (loss 0.3320):  49%|▍| 2000/4114 [2:09:17<2:17:59,  3.92s/it]Training 1/2 epoch (loss 0.3320):  49%|▍| 2001/4114 [2:09:17<2:20:35,  3.99s/it]Training 1/2 epoch (loss 0.4258):  49%|▍| 2001/4114 [2:09:21<2:20:35,  3.99s/it]Training 1/2 epoch (loss 0.4258):  49%|▍| 2002/4114 [2:09:21<2:18:40,  3.94s/it]Training 1/2 epoch (loss 0.3926):  49%|▍| 2002/4114 [2:09:25<2:18:40,  3.94s/it]Training 1/2 epoch (loss 0.3926):  49%|▍| 2003/4114 [2:09:25<2:19:09,  3.96s/it]Training 1/2 epoch (loss 0.3848):  49%|▍| 2003/4114 [2:09:29<2:19:09,  3.96s/it]Training 1/2 epoch (loss 0.3848):  49%|▍| 2004/4114 [2:09:29<2:21:07,  4.01s/it]Training 1/2 epoch (loss 0.4414):  49%|▍| 2004/4114 [2:09:33<2:21:07,  4.01s/it]Training 1/2 epoch (loss 0.4414):  49%|▍| 2005/4114 [2:09:33<2:18:18,  3.93s/it]Training 1/2 epoch (loss 0.3242):  49%|▍| 2005/4114 [2:09:36<2:18:18,  3.93s/it]Training 1/2 epoch (loss 0.3242):  49%|▍| 2006/4114 [2:09:36<2:15:33,  3.86s/it]Training 1/2 epoch (loss 0.4570):  49%|▍| 2006/4114 [2:09:40<2:15:33,  3.86s/it]Training 1/2 epoch (loss 0.4570):  49%|▍| 2007/4114 [2:09:40<2:14:13,  3.82s/it]Training 1/2 epoch (loss 0.3984):  49%|▍| 2007/4114 [2:09:44<2:14:13,  3.82s/it]Training 1/2 epoch (loss 0.3984):  49%|▍| 2008/4114 [2:09:44<2:17:20,  3.91s/it]Training 1/2 epoch (loss 0.3516):  49%|▍| 2008/4114 [2:09:48<2:17:20,  3.91s/it]Training 1/2 epoch (loss 0.3516):  49%|▍| 2009/4114 [2:09:48<2:15:41,  3.87s/it]Training 1/2 epoch (loss 0.2344):  49%|▍| 2009/4114 [2:09:52<2:15:41,  3.87s/it]Training 1/2 epoch (loss 0.2344):  49%|▍| 2010/4114 [2:09:52<2:17:30,  3.92s/it]Training 1/2 epoch (loss 0.4277):  49%|▍| 2010/4114 [2:09:56<2:17:30,  3.92s/it]Training 1/2 epoch (loss 0.4277):  49%|▍| 2011/4114 [2:09:56<2:17:14,  3.92s/it]Training 1/2 epoch (loss 0.4004):  49%|▍| 2011/4114 [2:10:00<2:17:14,  3.92s/it]Training 1/2 epoch (loss 0.4004):  49%|▍| 2012/4114 [2:10:00<2:17:20,  3.92s/it]Training 1/2 epoch (loss 0.2432):  49%|▍| 2012/4114 [2:10:04<2:17:20,  3.92s/it]Training 1/2 epoch (loss 0.2432):  49%|▍| 2013/4114 [2:10:04<2:18:48,  3.96s/it]Training 1/2 epoch (loss 0.3945):  49%|▍| 2013/4114 [2:10:08<2:18:48,  3.96s/it]Training 1/2 epoch (loss 0.3945):  49%|▍| 2014/4114 [2:10:08<2:17:08,  3.92s/it]Training 1/2 epoch (loss 0.2930):  49%|▍| 2014/4114 [2:10:11<2:17:08,  3.92s/it]Training 1/2 epoch (loss 0.2930):  49%|▍| 2015/4114 [2:10:11<2:10:08,  3.72s/it]Training 1/2 epoch (loss 0.4297):  49%|▍| 2015/4114 [2:10:15<2:10:08,  3.72s/it]Training 1/2 epoch (loss 0.4297):  49%|▍| 2016/4114 [2:10:15<2:12:56,  3.80s/it]Training 1/2 epoch (loss 0.4219):  49%|▍| 2016/4114 [2:10:19<2:12:56,  3.80s/it]Training 1/2 epoch (loss 0.4219):  49%|▍| 2017/4114 [2:10:19<2:13:02,  3.81s/it]Training 1/2 epoch (loss 0.4023):  49%|▍| 2017/4114 [2:10:23<2:13:02,  3.81s/it]Training 1/2 epoch (loss 0.4023):  49%|▍| 2018/4114 [2:10:23<2:14:09,  3.84s/it]Training 1/2 epoch (loss 0.3477):  49%|▍| 2018/4114 [2:10:27<2:14:09,  3.84s/it]Training 1/2 epoch (loss 0.3477):  49%|▍| 2019/4114 [2:10:27<2:16:07,  3.90s/it]Training 1/2 epoch (loss 0.3047):  49%|▍| 2019/4114 [2:10:31<2:16:07,  3.90s/it]Training 1/2 epoch (loss 0.3047):  49%|▍| 2020/4114 [2:10:31<2:16:08,  3.90s/it]Training 1/2 epoch (loss 0.3672):  49%|▍| 2020/4114 [2:10:34<2:16:08,  3.90s/it]Training 1/2 epoch (loss 0.3672):  49%|▍| 2021/4114 [2:10:34<2:06:04,  3.61s/it]Training 1/2 epoch (loss 0.3555):  49%|▍| 2021/4114 [2:10:38<2:06:04,  3.61s/it]Training 1/2 epoch (loss 0.3555):  49%|▍| 2022/4114 [2:10:38<2:14:02,  3.84s/it]Training 1/2 epoch (loss 0.3652):  49%|▍| 2022/4114 [2:10:41<2:14:02,  3.84s/it]Training 1/2 epoch (loss 0.3652):  49%|▍| 2023/4114 [2:10:41<2:11:12,  3.76s/it]Training 1/2 epoch (loss 0.2930):  49%|▍| 2023/4114 [2:10:45<2:11:12,  3.76s/it]Training 1/2 epoch (loss 0.2930):  49%|▍| 2024/4114 [2:10:45<2:12:42,  3.81s/it]Training 1/2 epoch (loss 0.3379):  49%|▍| 2024/4114 [2:10:49<2:12:42,  3.81s/it]Training 1/2 epoch (loss 0.3379):  49%|▍| 2025/4114 [2:10:49<2:14:33,  3.86s/it]Training 1/2 epoch (loss 0.4062):  49%|▍| 2025/4114 [2:10:53<2:14:33,  3.86s/it]Training 1/2 epoch (loss 0.4062):  49%|▍| 2026/4114 [2:10:53<2:15:08,  3.88s/it]Training 1/2 epoch (loss 0.3613):  49%|▍| 2026/4114 [2:10:57<2:15:08,  3.88s/it]Training 1/2 epoch (loss 0.3613):  49%|▍| 2027/4114 [2:10:57<2:15:12,  3.89s/it]Training 1/2 epoch (loss 0.2461):  49%|▍| 2027/4114 [2:11:01<2:15:12,  3.89s/it]Training 1/2 epoch (loss 0.2461):  49%|▍| 2028/4114 [2:11:01<2:18:42,  3.99s/it]Training 1/2 epoch (loss 0.3672):  49%|▍| 2028/4114 [2:11:05<2:18:42,  3.99s/it]Training 1/2 epoch (loss 0.3672):  49%|▍| 2029/4114 [2:11:05<2:18:16,  3.98s/it]Training 1/2 epoch (loss 0.3809):  49%|▍| 2029/4114 [2:11:09<2:18:16,  3.98s/it]Training 1/2 epoch (loss 0.3809):  49%|▍| 2030/4114 [2:11:09<2:17:51,  3.97s/it]Training 1/2 epoch (loss 0.3379):  49%|▍| 2030/4114 [2:11:14<2:17:51,  3.97s/it]Training 1/2 epoch (loss 0.3379):  49%|▍| 2031/4114 [2:11:14<2:21:06,  4.06s/it]Training 1/2 epoch (loss 0.4688):  49%|▍| 2031/4114 [2:11:17<2:21:06,  4.06s/it]Training 1/2 epoch (loss 0.4688):  49%|▍| 2032/4114 [2:11:17<2:17:34,  3.96s/it]Training 1/2 epoch (loss 0.3691):  49%|▍| 2032/4114 [2:11:21<2:17:34,  3.96s/it]Training 1/2 epoch (loss 0.3691):  49%|▍| 2033/4114 [2:11:21<2:17:41,  3.97s/it]Training 1/2 epoch (loss 0.3789):  49%|▍| 2033/4114 [2:11:26<2:17:41,  3.97s/it]Training 1/2 epoch (loss 0.3789):  49%|▍| 2034/4114 [2:11:26<2:19:48,  4.03s/it]Training 1/2 epoch (loss 0.3594):  49%|▍| 2034/4114 [2:11:30<2:19:48,  4.03s/it]Training 1/2 epoch (loss 0.3594):  49%|▍| 2035/4114 [2:11:30<2:19:56,  4.04s/it]Training 1/2 epoch (loss 0.4961):  49%|▍| 2035/4114 [2:11:33<2:19:56,  4.04s/it]Training 1/2 epoch (loss 0.4961):  49%|▍| 2036/4114 [2:11:33<2:17:07,  3.96s/it]Training 1/2 epoch (loss 0.4375):  49%|▍| 2036/4114 [2:11:37<2:17:07,  3.96s/it]Training 1/2 epoch (loss 0.4375):  50%|▍| 2037/4114 [2:11:37<2:13:59,  3.87s/it]Training 1/2 epoch (loss 0.3984):  50%|▍| 2037/4114 [2:11:41<2:13:59,  3.87s/it]Training 1/2 epoch (loss 0.3984):  50%|▍| 2038/4114 [2:11:41<2:15:06,  3.90s/it]Training 1/2 epoch (loss 0.5547):  50%|▍| 2038/4114 [2:11:45<2:15:06,  3.90s/it]Training 1/2 epoch (loss 0.5547):  50%|▍| 2039/4114 [2:11:45<2:15:15,  3.91s/it]Training 1/2 epoch (loss 0.4766):  50%|▍| 2039/4114 [2:11:49<2:15:15,  3.91s/it]Training 1/2 epoch (loss 0.4766):  50%|▍| 2040/4114 [2:11:49<2:19:17,  4.03s/it]Training 1/2 epoch (loss 0.4805):  50%|▍| 2040/4114 [2:11:53<2:19:17,  4.03s/it]Training 1/2 epoch (loss 0.4805):  50%|▍| 2041/4114 [2:11:53<2:16:41,  3.96s/it]Training 1/2 epoch (loss 0.3652):  50%|▍| 2041/4114 [2:11:57<2:16:41,  3.96s/it]Training 1/2 epoch (loss 0.3652):  50%|▍| 2042/4114 [2:11:57<2:17:42,  3.99s/it]Training 1/2 epoch (loss 0.3047):  50%|▍| 2042/4114 [2:12:01<2:17:42,  3.99s/it]Training 1/2 epoch (loss 0.3047):  50%|▍| 2043/4114 [2:12:01<2:20:15,  4.06s/it]Training 1/2 epoch (loss 0.3652):  50%|▍| 2043/4114 [2:12:05<2:20:15,  4.06s/it]Training 1/2 epoch (loss 0.3652):  50%|▍| 2044/4114 [2:12:05<2:17:43,  3.99s/it]Training 1/2 epoch (loss 0.3652):  50%|▍| 2044/4114 [2:12:09<2:17:43,  3.99s/it]Training 1/2 epoch (loss 0.3652):  50%|▍| 2045/4114 [2:12:09<2:17:51,  4.00s/it]Training 1/2 epoch (loss 0.3281):  50%|▍| 2045/4114 [2:12:13<2:17:51,  4.00s/it]Training 1/2 epoch (loss 0.3281):  50%|▍| 2046/4114 [2:12:13<2:13:19,  3.87s/it]Training 1/2 epoch (loss 0.3145):  50%|▍| 2046/4114 [2:12:16<2:13:19,  3.87s/it]Training 1/2 epoch (loss 0.3145):  50%|▍| 2047/4114 [2:12:16<2:12:16,  3.84s/it]Training 1/2 epoch (loss 0.4023):  50%|▍| 2047/4114 [2:12:20<2:12:16,  3.84s/it]Training 1/2 epoch (loss 0.4023):  50%|▍| 2048/4114 [2:12:20<2:12:51,  3.86s/it]Training 1/2 epoch (loss 0.2734):  50%|▍| 2048/4114 [2:12:24<2:12:51,  3.86s/it]Training 1/2 epoch (loss 0.2734):  50%|▍| 2049/4114 [2:12:24<2:14:37,  3.91s/it]Training 1/2 epoch (loss 0.2949):  50%|▍| 2049/4114 [2:12:28<2:14:37,  3.91s/it]Training 1/2 epoch (loss 0.2949):  50%|▍| 2050/4114 [2:12:28<2:09:45,  3.77s/it]Training 1/2 epoch (loss 0.2988):  50%|▍| 2050/4114 [2:12:32<2:09:45,  3.77s/it]Training 1/2 epoch (loss 0.2988):  50%|▍| 2051/4114 [2:12:32<2:11:55,  3.84s/it]Training 1/2 epoch (loss 0.4219):  50%|▍| 2051/4114 [2:12:36<2:11:55,  3.84s/it]Training 1/2 epoch (loss 0.4219):  50%|▍| 2052/4114 [2:12:36<2:13:41,  3.89s/it]Training 1/2 epoch (loss 0.3164):  50%|▍| 2052/4114 [2:12:40<2:13:41,  3.89s/it]Training 1/2 epoch (loss 0.3164):  50%|▍| 2053/4114 [2:12:40<2:11:10,  3.82s/it]Training 1/2 epoch (loss 0.3457):  50%|▍| 2053/4114 [2:12:44<2:11:10,  3.82s/it]Training 1/2 epoch (loss 0.3457):  50%|▍| 2054/4114 [2:12:44<2:13:49,  3.90s/it]Training 1/2 epoch (loss 0.3613):  50%|▍| 2054/4114 [2:12:47<2:13:49,  3.90s/it]Training 1/2 epoch (loss 0.3613):  50%|▍| 2055/4114 [2:12:47<2:08:11,  3.74s/it]Training 1/2 epoch (loss 0.2295):  50%|▍| 2055/4114 [2:12:51<2:08:11,  3.74s/it]Training 1/2 epoch (loss 0.2295):  50%|▍| 2056/4114 [2:12:51<2:08:38,  3.75s/it]Training 1/2 epoch (loss 0.4375):  50%|▍| 2056/4114 [2:12:54<2:08:38,  3.75s/it]Training 1/2 epoch (loss 0.4375):  50%|▌| 2057/4114 [2:12:54<2:05:39,  3.67s/it]Training 2/2 epoch (loss 0.4180):  50%|▌| 2057/4114 [2:12:58<2:05:39,  3.67s/it]Training 2/2 epoch (loss 0.4180):  50%|▌| 2058/4114 [2:12:58<2:10:58,  3.82s/it]Training 2/2 epoch (loss 0.3828):  50%|▌| 2058/4114 [2:13:02<2:10:58,  3.82s/it]Training 2/2 epoch (loss 0.3828):  50%|▌| 2059/4114 [2:13:02<2:07:08,  3.71s/it]Training 2/2 epoch (loss 0.4258):  50%|▌| 2059/4114 [2:13:06<2:07:08,  3.71s/it]Training 2/2 epoch (loss 0.4258):  50%|▌| 2060/4114 [2:13:06<2:10:53,  3.82s/it]Training 2/2 epoch (loss 0.3613):  50%|▌| 2060/4114 [2:13:10<2:10:53,  3.82s/it]Training 2/2 epoch (loss 0.3613):  50%|▌| 2061/4114 [2:13:10<2:15:06,  3.95s/it]Training 2/2 epoch (loss 0.3320):  50%|▌| 2061/4114 [2:13:14<2:15:06,  3.95s/it]Training 2/2 epoch (loss 0.3320):  50%|▌| 2062/4114 [2:13:14<2:14:42,  3.94s/it]Training 2/2 epoch (loss 0.3457):  50%|▌| 2062/4114 [2:13:18<2:14:42,  3.94s/it]Training 2/2 epoch (loss 0.3457):  50%|▌| 2063/4114 [2:13:18<2:14:25,  3.93s/it]Training 2/2 epoch (loss 0.3867):  50%|▌| 2063/4114 [2:13:22<2:14:25,  3.93s/it]Training 2/2 epoch (loss 0.3867):  50%|▌| 2064/4114 [2:13:22<2:17:04,  4.01s/it]Training 2/2 epoch (loss 0.3477):  50%|▌| 2064/4114 [2:13:26<2:17:04,  4.01s/it]Training 2/2 epoch (loss 0.3477):  50%|▌| 2065/4114 [2:13:26<2:15:55,  3.98s/it]Training 2/2 epoch (loss 0.1904):  50%|▌| 2065/4114 [2:13:29<2:15:55,  3.98s/it]Training 2/2 epoch (loss 0.1904):  50%|▌| 2066/4114 [2:13:29<2:07:50,  3.75s/it]Training 2/2 epoch (loss 0.3359):  50%|▌| 2066/4114 [2:13:33<2:07:50,  3.75s/it]Training 2/2 epoch (loss 0.3359):  50%|▌| 2067/4114 [2:13:33<2:10:55,  3.84s/it]Training 2/2 epoch (loss 0.3672):  50%|▌| 2067/4114 [2:13:37<2:10:55,  3.84s/it]Training 2/2 epoch (loss 0.3672):  50%|▌| 2068/4114 [2:13:37<2:12:00,  3.87s/it]Training 2/2 epoch (loss 0.4336):  50%|▌| 2068/4114 [2:13:41<2:12:00,  3.87s/it]Training 2/2 epoch (loss 0.4336):  50%|▌| 2069/4114 [2:13:41<2:10:56,  3.84s/it]Training 2/2 epoch (loss 0.2246):  50%|▌| 2069/4114 [2:13:45<2:10:56,  3.84s/it]Training 2/2 epoch (loss 0.2246):  50%|▌| 2070/4114 [2:13:45<2:12:57,  3.90s/it]Training 2/2 epoch (loss 0.2598):  50%|▌| 2070/4114 [2:13:49<2:12:57,  3.90s/it]Training 2/2 epoch (loss 0.2598):  50%|▌| 2071/4114 [2:13:49<2:13:14,  3.91s/it]Training 2/2 epoch (loss 0.2295):  50%|▌| 2071/4114 [2:13:53<2:13:14,  3.91s/it]Training 2/2 epoch (loss 0.2295):  50%|▌| 2072/4114 [2:13:53<2:13:40,  3.93s/it]Training 2/2 epoch (loss 0.2637):  50%|▌| 2072/4114 [2:13:57<2:13:40,  3.93s/it]Training 2/2 epoch (loss 0.2637):  50%|▌| 2073/4114 [2:13:57<2:17:17,  4.04s/it]Training 2/2 epoch (loss 0.3828):  50%|▌| 2073/4114 [2:14:01<2:17:17,  4.04s/it]Training 2/2 epoch (loss 0.3828):  50%|▌| 2074/4114 [2:14:01<2:16:05,  4.00s/it]Training 2/2 epoch (loss 0.2021):  50%|▌| 2074/4114 [2:14:05<2:16:05,  4.00s/it]Training 2/2 epoch (loss 0.2021):  50%|▌| 2075/4114 [2:14:05<2:17:21,  4.04s/it]Training 2/2 epoch (loss 0.2695):  50%|▌| 2075/4114 [2:14:09<2:17:21,  4.04s/it]Training 2/2 epoch (loss 0.2695):  50%|▌| 2076/4114 [2:14:09<2:17:13,  4.04s/it]Training 2/2 epoch (loss 0.1953):  50%|▌| 2076/4114 [2:14:13<2:17:13,  4.04s/it]Training 2/2 epoch (loss 0.1953):  50%|▌| 2077/4114 [2:14:13<2:16:10,  4.01s/it]Training 2/2 epoch (loss 0.2441):  50%|▌| 2077/4114 [2:14:17<2:16:10,  4.01s/it]Training 2/2 epoch (loss 0.2441):  51%|▌| 2078/4114 [2:14:17<2:13:54,  3.95s/it]Training 2/2 epoch (loss 0.1787):  51%|▌| 2078/4114 [2:14:21<2:13:54,  3.95s/it]Training 2/2 epoch (loss 0.1787):  51%|▌| 2079/4114 [2:14:21<2:17:34,  4.06s/it]Training 2/2 epoch (loss 0.2637):  51%|▌| 2079/4114 [2:14:25<2:17:34,  4.06s/it]Training 2/2 epoch (loss 0.2637):  51%|▌| 2080/4114 [2:14:25<2:15:12,  3.99s/it]Training 2/2 epoch (loss 0.1523):  51%|▌| 2080/4114 [2:14:29<2:15:12,  3.99s/it]Training 2/2 epoch (loss 0.1523):  51%|▌| 2081/4114 [2:14:29<2:15:23,  4.00s/it]Training 2/2 epoch (loss 0.2070):  51%|▌| 2081/4114 [2:14:33<2:15:23,  4.00s/it]Training 2/2 epoch (loss 0.2070):  51%|▌| 2082/4114 [2:14:33<2:15:53,  4.01s/it]Training 2/2 epoch (loss 0.2109):  51%|▌| 2082/4114 [2:14:37<2:15:53,  4.01s/it]Training 2/2 epoch (loss 0.2109):  51%|▌| 2083/4114 [2:14:37<2:12:33,  3.92s/it]Training 2/2 epoch (loss 0.1436):  51%|▌| 2083/4114 [2:14:41<2:12:33,  3.92s/it]Training 2/2 epoch (loss 0.1436):  51%|▌| 2084/4114 [2:14:41<2:12:43,  3.92s/it]Training 2/2 epoch (loss 0.1602):  51%|▌| 2084/4114 [2:14:45<2:12:43,  3.92s/it]Training 2/2 epoch (loss 0.1602):  51%|▌| 2085/4114 [2:14:45<2:15:51,  4.02s/it]Training 2/2 epoch (loss 0.1235):  51%|▌| 2085/4114 [2:14:49<2:15:51,  4.02s/it]Training 2/2 epoch (loss 0.1235):  51%|▌| 2086/4114 [2:14:49<2:14:44,  3.99s/it]Training 2/2 epoch (loss 0.1426):  51%|▌| 2086/4114 [2:14:53<2:14:44,  3.99s/it]Training 2/2 epoch (loss 0.1426):  51%|▌| 2087/4114 [2:14:53<2:13:47,  3.96s/it]Training 2/2 epoch (loss 0.1128):  51%|▌| 2087/4114 [2:14:57<2:13:47,  3.96s/it]Training 2/2 epoch (loss 0.1128):  51%|▌| 2088/4114 [2:14:57<2:14:39,  3.99s/it]Training 2/2 epoch (loss 0.0811):  51%|▌| 2088/4114 [2:15:01<2:14:39,  3.99s/it]Training 2/2 epoch (loss 0.0811):  51%|▌| 2089/4114 [2:15:01<2:15:04,  4.00s/it]Training 2/2 epoch (loss 0.2002):  51%|▌| 2089/4114 [2:15:05<2:15:04,  4.00s/it]Training 2/2 epoch (loss 0.2002):  51%|▌| 2090/4114 [2:15:05<2:12:39,  3.93s/it]Training 2/2 epoch (loss 0.3203):  51%|▌| 2090/4114 [2:15:09<2:12:39,  3.93s/it]Training 2/2 epoch (loss 0.3203):  51%|▌| 2091/4114 [2:15:09<2:10:30,  3.87s/it]Training 2/2 epoch (loss 0.1758):  51%|▌| 2091/4114 [2:15:13<2:10:30,  3.87s/it]Training 2/2 epoch (loss 0.1758):  51%|▌| 2092/4114 [2:15:13<2:11:06,  3.89s/it]Training 2/2 epoch (loss 0.1064):  51%|▌| 2092/4114 [2:15:16<2:11:06,  3.89s/it]Training 2/2 epoch (loss 0.1064):  51%|▌| 2093/4114 [2:15:16<2:10:07,  3.86s/it]Training 2/2 epoch (loss 0.1270):  51%|▌| 2093/4114 [2:15:21<2:10:07,  3.86s/it]Training 2/2 epoch (loss 0.1270):  51%|▌| 2094/4114 [2:15:21<2:13:30,  3.97s/it]Training 2/2 epoch (loss 0.0601):  51%|▌| 2094/4114 [2:15:24<2:13:30,  3.97s/it]Training 2/2 epoch (loss 0.0601):  51%|▌| 2095/4114 [2:15:24<2:11:05,  3.90s/it]Training 2/2 epoch (loss 0.1104):  51%|▌| 2095/4114 [2:15:28<2:11:05,  3.90s/it]Training 2/2 epoch (loss 0.1104):  51%|▌| 2096/4114 [2:15:28<2:11:41,  3.92s/it]Training 2/2 epoch (loss 0.2012):  51%|▌| 2096/4114 [2:15:32<2:11:41,  3.92s/it]Training 2/2 epoch (loss 0.2012):  51%|▌| 2097/4114 [2:15:32<2:13:49,  3.98s/it]Training 2/2 epoch (loss 0.2012):  51%|▌| 2097/4114 [2:15:36<2:13:49,  3.98s/it]Training 2/2 epoch (loss 0.2012):  51%|▌| 2098/4114 [2:15:36<2:07:19,  3.79s/it]Training 2/2 epoch (loss 0.1924):  51%|▌| 2098/4114 [2:15:40<2:07:19,  3.79s/it]Training 2/2 epoch (loss 0.1924):  51%|▌| 2099/4114 [2:15:40<2:08:16,  3.82s/it]Training 2/2 epoch (loss 0.2324):  51%|▌| 2099/4114 [2:15:43<2:08:16,  3.82s/it]Training 2/2 epoch (loss 0.2324):  51%|▌| 2100/4114 [2:15:43<2:06:52,  3.78s/it]Training 2/2 epoch (loss 0.3242):  51%|▌| 2100/4114 [2:15:47<2:06:52,  3.78s/it]Training 2/2 epoch (loss 0.3242):  51%|▌| 2101/4114 [2:15:47<2:09:13,  3.85s/it]Training 2/2 epoch (loss 0.1289):  51%|▌| 2101/4114 [2:15:51<2:09:13,  3.85s/it]Training 2/2 epoch (loss 0.1289):  51%|▌| 2102/4114 [2:15:51<2:09:46,  3.87s/it]Training 2/2 epoch (loss 0.0972):  51%|▌| 2102/4114 [2:15:56<2:09:46,  3.87s/it]Training 2/2 epoch (loss 0.0972):  51%|▌| 2103/4114 [2:15:56<2:13:37,  3.99s/it]Training 2/2 epoch (loss 0.2451):  51%|▌| 2103/4114 [2:15:59<2:13:37,  3.99s/it]Training 2/2 epoch (loss 0.2451):  51%|▌| 2104/4114 [2:15:59<2:12:50,  3.97s/it]Training 2/2 epoch (loss 0.0454):  51%|▌| 2104/4114 [2:16:03<2:12:50,  3.97s/it]Training 2/2 epoch (loss 0.0454):  51%|▌| 2105/4114 [2:16:03<2:13:17,  3.98s/it]Training 2/2 epoch (loss 0.0771):  51%|▌| 2105/4114 [2:16:08<2:13:17,  3.98s/it]Training 2/2 epoch (loss 0.0771):  51%|▌| 2106/4114 [2:16:08<2:16:26,  4.08s/it]Training 2/2 epoch (loss 0.0947):  51%|▌| 2106/4114 [2:16:11<2:16:26,  4.08s/it]Training 2/2 epoch (loss 0.0947):  51%|▌| 2107/4114 [2:16:11<2:12:54,  3.97s/it]Training 2/2 epoch (loss 0.0415):  51%|▌| 2107/4114 [2:16:15<2:12:54,  3.97s/it]Training 2/2 epoch (loss 0.0415):  51%|▌| 2108/4114 [2:16:15<2:11:30,  3.93s/it]Training 2/2 epoch (loss 0.0342):  51%|▌| 2108/4114 [2:16:19<2:11:30,  3.93s/it]Training 2/2 epoch (loss 0.0342):  51%|▌| 2109/4114 [2:16:19<2:12:25,  3.96s/it]Training 2/2 epoch (loss 0.0288):  51%|▌| 2109/4114 [2:16:23<2:12:25,  3.96s/it]Training 2/2 epoch (loss 0.0288):  51%|▌| 2110/4114 [2:16:23<2:12:30,  3.97s/it]Training 2/2 epoch (loss 0.0718):  51%|▌| 2110/4114 [2:16:27<2:12:30,  3.97s/it]Training 2/2 epoch (loss 0.0718):  51%|▌| 2111/4114 [2:16:27<2:06:44,  3.80s/it]Training 2/2 epoch (loss 0.0277):  51%|▌| 2111/4114 [2:16:31<2:06:44,  3.80s/it]Training 2/2 epoch (loss 0.0277):  51%|▌| 2112/4114 [2:16:31<2:08:56,  3.86s/it]Training 2/2 epoch (loss 0.0311):  51%|▌| 2112/4114 [2:16:35<2:08:56,  3.86s/it]Training 2/2 epoch (loss 0.0311):  51%|▌| 2113/4114 [2:16:35<2:09:11,  3.87s/it]Training 2/2 epoch (loss 0.0243):  51%|▌| 2113/4114 [2:16:38<2:09:11,  3.87s/it]Training 2/2 epoch (loss 0.0243):  51%|▌| 2114/4114 [2:16:38<2:08:22,  3.85s/it]Training 2/2 epoch (loss 0.0327):  51%|▌| 2114/4114 [2:16:43<2:08:22,  3.85s/it]Training 2/2 epoch (loss 0.0327):  51%|▌| 2115/4114 [2:16:43<2:10:34,  3.92s/it]Training 2/2 epoch (loss 0.0396):  51%|▌| 2115/4114 [2:16:46<2:10:34,  3.92s/it]Training 2/2 epoch (loss 0.0396):  51%|▌| 2116/4114 [2:16:46<2:10:02,  3.91s/it]Training 2/2 epoch (loss 0.0486):  51%|▌| 2116/4114 [2:16:50<2:10:02,  3.91s/it]Training 2/2 epoch (loss 0.0486):  51%|▌| 2117/4114 [2:16:50<2:08:52,  3.87s/it]Training 2/2 epoch (loss 0.0015):  51%|▌| 2117/4114 [2:16:54<2:08:52,  3.87s/it]Training 2/2 epoch (loss 0.0015):  51%|▌| 2118/4114 [2:16:54<2:11:17,  3.95s/it]Training 2/2 epoch (loss 0.1572):  51%|▌| 2118/4114 [2:16:58<2:11:17,  3.95s/it]Training 2/2 epoch (loss 0.1572):  52%|▌| 2119/4114 [2:16:58<2:11:25,  3.95s/it]Training 2/2 epoch (loss 0.1621):  52%|▌| 2119/4114 [2:17:02<2:11:25,  3.95s/it]Training 2/2 epoch (loss 0.1621):  52%|▌| 2120/4114 [2:17:02<2:10:13,  3.92s/it]Training 2/2 epoch (loss 0.0292):  52%|▌| 2120/4114 [2:17:06<2:10:13,  3.92s/it]Training 2/2 epoch (loss 0.0292):  52%|▌| 2121/4114 [2:17:06<2:08:04,  3.86s/it]Training 2/2 epoch (loss 0.0776):  52%|▌| 2121/4114 [2:17:09<2:08:04,  3.86s/it]Training 2/2 epoch (loss 0.0776):  52%|▌| 2122/4114 [2:17:09<2:02:09,  3.68s/it]Training 2/2 epoch (loss 0.1807):  52%|▌| 2122/4114 [2:17:13<2:02:09,  3.68s/it]Training 2/2 epoch (loss 0.1807):  52%|▌| 2123/4114 [2:17:13<2:04:27,  3.75s/it]Training 2/2 epoch (loss 0.1206):  52%|▌| 2123/4114 [2:17:17<2:04:27,  3.75s/it]Training 2/2 epoch (loss 0.1206):  52%|▌| 2124/4114 [2:17:17<2:09:08,  3.89s/it]Training 2/2 epoch (loss 0.0210):  52%|▌| 2124/4114 [2:17:21<2:09:08,  3.89s/it]Training 2/2 epoch (loss 0.0210):  52%|▌| 2125/4114 [2:17:21<2:03:52,  3.74s/it]Training 2/2 epoch (loss 0.0527):  52%|▌| 2125/4114 [2:17:25<2:03:52,  3.74s/it]Training 2/2 epoch (loss 0.0527):  52%|▌| 2126/4114 [2:17:25<2:06:17,  3.81s/it]Training 2/2 epoch (loss 0.0781):  52%|▌| 2126/4114 [2:17:29<2:06:17,  3.81s/it]Training 2/2 epoch (loss 0.0781):  52%|▌| 2127/4114 [2:17:29<2:09:34,  3.91s/it]Training 2/2 epoch (loss 0.0287):  52%|▌| 2127/4114 [2:17:33<2:09:34,  3.91s/it]Training 2/2 epoch (loss 0.0287):  52%|▌| 2128/4114 [2:17:33<2:08:08,  3.87s/it]Training 2/2 epoch (loss 0.1338):  52%|▌| 2128/4114 [2:17:36<2:08:08,  3.87s/it]Training 2/2 epoch (loss 0.1338):  52%|▌| 2129/4114 [2:17:36<2:03:23,  3.73s/it]Training 2/2 epoch (loss 0.1953):  52%|▌| 2129/4114 [2:17:40<2:03:23,  3.73s/it]Training 2/2 epoch (loss 0.1953):  52%|▌| 2130/4114 [2:17:40<2:08:18,  3.88s/it]Training 2/2 epoch (loss 0.1953):  52%|▌| 2130/4114 [2:17:44<2:08:18,  3.88s/it]Training 2/2 epoch (loss 0.1953):  52%|▌| 2131/4114 [2:17:44<2:08:43,  3.89s/it]Training 2/2 epoch (loss 0.0311):  52%|▌| 2131/4114 [2:17:48<2:08:43,  3.89s/it]Training 2/2 epoch (loss 0.0311):  52%|▌| 2132/4114 [2:17:48<2:07:46,  3.87s/it]Training 2/2 epoch (loss 0.1357):  52%|▌| 2132/4114 [2:17:52<2:07:46,  3.87s/it]Training 2/2 epoch (loss 0.1357):  52%|▌| 2133/4114 [2:17:52<2:05:37,  3.80s/it]Training 2/2 epoch (loss 0.0060):  52%|▌| 2133/4114 [2:17:55<2:05:37,  3.80s/it]Training 2/2 epoch (loss 0.0060):  52%|▌| 2134/4114 [2:17:55<2:06:21,  3.83s/it]Training 2/2 epoch (loss 0.0320):  52%|▌| 2134/4114 [2:17:59<2:06:21,  3.83s/it]Training 2/2 epoch (loss 0.0320):  52%|▌| 2135/4114 [2:17:59<2:07:47,  3.87s/it]Training 2/2 epoch (loss 0.0045):  52%|▌| 2135/4114 [2:18:04<2:07:47,  3.87s/it]Training 2/2 epoch (loss 0.0045):  52%|▌| 2136/4114 [2:18:04<2:11:21,  3.98s/it]Training 2/2 epoch (loss 0.0072):  52%|▌| 2136/4114 [2:18:08<2:11:21,  3.98s/it]Training 2/2 epoch (loss 0.0072):  52%|▌| 2137/4114 [2:18:08<2:11:41,  4.00s/it]Training 2/2 epoch (loss 0.0273):  52%|▌| 2137/4114 [2:18:12<2:11:41,  4.00s/it]Training 2/2 epoch (loss 0.0273):  52%|▌| 2138/4114 [2:18:12<2:11:31,  3.99s/it]Training 2/2 epoch (loss 0.1484):  52%|▌| 2138/4114 [2:18:16<2:11:31,  3.99s/it]Training 2/2 epoch (loss 0.1484):  52%|▌| 2139/4114 [2:18:16<2:12:09,  4.02s/it]Training 2/2 epoch (loss 0.1738):  52%|▌| 2139/4114 [2:18:20<2:12:09,  4.02s/it]Training 2/2 epoch (loss 0.1738):  52%|▌| 2140/4114 [2:18:20<2:10:46,  3.97s/it]Training 2/2 epoch (loss 0.0957):  52%|▌| 2140/4114 [2:18:24<2:10:46,  3.97s/it]Training 2/2 epoch (loss 0.0957):  52%|▌| 2141/4114 [2:18:24<2:10:26,  3.97s/it]Training 2/2 epoch (loss 0.0461):  52%|▌| 2141/4114 [2:18:28<2:10:26,  3.97s/it]Training 2/2 epoch (loss 0.0461):  52%|▌| 2142/4114 [2:18:28<2:10:41,  3.98s/it]Training 2/2 epoch (loss 0.0454):  52%|▌| 2142/4114 [2:18:31<2:10:41,  3.98s/it]Training 2/2 epoch (loss 0.0454):  52%|▌| 2143/4114 [2:18:31<2:05:20,  3.82s/it]Training 2/2 epoch (loss 0.0962):  52%|▌| 2143/4114 [2:18:35<2:05:20,  3.82s/it]Training 2/2 epoch (loss 0.0962):  52%|▌| 2144/4114 [2:18:35<2:06:15,  3.85s/it]Training 2/2 epoch (loss 0.1670):  52%|▌| 2144/4114 [2:18:39<2:06:15,  3.85s/it]Training 2/2 epoch (loss 0.1670):  52%|▌| 2145/4114 [2:18:39<2:10:12,  3.97s/it]Training 2/2 epoch (loss 0.3555):  52%|▌| 2145/4114 [2:18:43<2:10:12,  3.97s/it]Training 2/2 epoch (loss 0.3555):  52%|▌| 2146/4114 [2:18:43<2:10:49,  3.99s/it]Training 2/2 epoch (loss 0.2041):  52%|▌| 2146/4114 [2:18:47<2:10:49,  3.99s/it]Training 2/2 epoch (loss 0.2041):  52%|▌| 2147/4114 [2:18:47<2:06:15,  3.85s/it]Training 2/2 epoch (loss 0.0684):  52%|▌| 2147/4114 [2:18:51<2:06:15,  3.85s/it]Training 2/2 epoch (loss 0.0684):  52%|▌| 2148/4114 [2:18:51<2:10:01,  3.97s/it]Training 2/2 epoch (loss 0.1865):  52%|▌| 2148/4114 [2:18:55<2:10:01,  3.97s/it]Training 2/2 epoch (loss 0.1865):  52%|▌| 2149/4114 [2:18:55<2:09:42,  3.96s/it]Training 2/2 epoch (loss 0.0630):  52%|▌| 2149/4114 [2:18:59<2:09:42,  3.96s/it]Training 2/2 epoch (loss 0.0630):  52%|▌| 2150/4114 [2:18:59<2:10:39,  3.99s/it]Training 2/2 epoch (loss 0.0315):  52%|▌| 2150/4114 [2:19:03<2:10:39,  3.99s/it]Training 2/2 epoch (loss 0.0315):  52%|▌| 2151/4114 [2:19:03<2:12:16,  4.04s/it]Training 2/2 epoch (loss 0.1167):  52%|▌| 2151/4114 [2:19:06<2:12:16,  4.04s/it]Training 2/2 epoch (loss 0.1167):  52%|▌| 2152/4114 [2:19:07<2:05:33,  3.84s/it]Training 2/2 epoch (loss 0.0884):  52%|▌| 2152/4114 [2:19:10<2:05:33,  3.84s/it]Training 2/2 epoch (loss 0.0884):  52%|▌| 2153/4114 [2:19:10<2:01:07,  3.71s/it]Training 2/2 epoch (loss 0.1245):  52%|▌| 2153/4114 [2:19:14<2:01:07,  3.71s/it]Training 2/2 epoch (loss 0.1245):  52%|▌| 2154/4114 [2:19:14<2:05:19,  3.84s/it]Training 2/2 epoch (loss 0.0747):  52%|▌| 2154/4114 [2:19:18<2:05:19,  3.84s/it]Training 2/2 epoch (loss 0.0747):  52%|▌| 2155/4114 [2:19:18<2:04:47,  3.82s/it]Training 2/2 epoch (loss 0.4297):  52%|▌| 2155/4114 [2:19:22<2:04:47,  3.82s/it]Training 2/2 epoch (loss 0.4297):  52%|▌| 2156/4114 [2:19:22<2:07:14,  3.90s/it]Training 2/2 epoch (loss 0.0454):  52%|▌| 2156/4114 [2:19:26<2:07:14,  3.90s/it]Training 2/2 epoch (loss 0.0454):  52%|▌| 2157/4114 [2:19:26<2:08:48,  3.95s/it]Training 2/2 epoch (loss 0.1133):  52%|▌| 2157/4114 [2:19:30<2:08:48,  3.95s/it]Training 2/2 epoch (loss 0.1133):  52%|▌| 2158/4114 [2:19:30<2:09:41,  3.98s/it]Training 2/2 epoch (loss 0.1040):  52%|▌| 2158/4114 [2:19:34<2:09:41,  3.98s/it]Training 2/2 epoch (loss 0.1040):  52%|▌| 2159/4114 [2:19:34<2:08:35,  3.95s/it]Training 2/2 epoch (loss 0.0493):  52%|▌| 2159/4114 [2:19:38<2:08:35,  3.95s/it]Training 2/2 epoch (loss 0.0493):  53%|▌| 2160/4114 [2:19:38<2:11:12,  4.03s/it]Training 2/2 epoch (loss 0.0295):  53%|▌| 2160/4114 [2:19:42<2:11:12,  4.03s/it]Training 2/2 epoch (loss 0.0295):  53%|▌| 2161/4114 [2:19:42<2:09:54,  3.99s/it]Training 2/2 epoch (loss 0.0796):  53%|▌| 2161/4114 [2:19:46<2:09:54,  3.99s/it]Training 2/2 epoch (loss 0.0796):  53%|▌| 2162/4114 [2:19:46<2:09:29,  3.98s/it]Training 2/2 epoch (loss 0.0977):  53%|▌| 2162/4114 [2:19:50<2:09:29,  3.98s/it]Training 2/2 epoch (loss 0.0977):  53%|▌| 2163/4114 [2:19:50<2:11:30,  4.04s/it]Training 2/2 epoch (loss 0.0615):  53%|▌| 2163/4114 [2:19:54<2:11:30,  4.04s/it]Training 2/2 epoch (loss 0.0615):  53%|▌| 2164/4114 [2:19:54<2:10:23,  4.01s/it]Training 2/2 epoch (loss 0.0289):  53%|▌| 2164/4114 [2:19:58<2:10:23,  4.01s/it]Training 2/2 epoch (loss 0.0289):  53%|▌| 2165/4114 [2:19:58<2:10:11,  4.01s/it]Training 2/2 epoch (loss 0.0593):  53%|▌| 2165/4114 [2:20:02<2:10:11,  4.01s/it]Training 2/2 epoch (loss 0.0593):  53%|▌| 2166/4114 [2:20:02<2:12:40,  4.09s/it]Training 2/2 epoch (loss 0.0369):  53%|▌| 2166/4114 [2:20:06<2:12:40,  4.09s/it]Training 2/2 epoch (loss 0.0369):  53%|▌| 2167/4114 [2:20:06<2:09:38,  4.00s/it]Training 2/2 epoch (loss 0.1006):  53%|▌| 2167/4114 [2:20:10<2:09:38,  4.00s/it]Training 2/2 epoch (loss 0.1006):  53%|▌| 2168/4114 [2:20:10<2:09:34,  4.00s/it]Training 2/2 epoch (loss 0.0432):  53%|▌| 2168/4114 [2:20:14<2:09:34,  4.00s/it]Training 2/2 epoch (loss 0.0432):  53%|▌| 2169/4114 [2:20:14<2:07:13,  3.92s/it]Training 2/2 epoch (loss 0.1543):  53%|▌| 2169/4114 [2:20:18<2:07:13,  3.92s/it]Training 2/2 epoch (loss 0.1543):  53%|▌| 2170/4114 [2:20:18<2:08:31,  3.97s/it]Training 2/2 epoch (loss 0.0437):  53%|▌| 2170/4114 [2:20:21<2:08:31,  3.97s/it]Training 2/2 epoch (loss 0.0437):  53%|▌| 2171/4114 [2:20:21<2:03:32,  3.81s/it]Training 2/2 epoch (loss 0.2363):  53%|▌| 2171/4114 [2:20:25<2:03:32,  3.81s/it]Training 2/2 epoch (loss 0.2363):  53%|▌| 2172/4114 [2:20:25<2:05:26,  3.88s/it]Training 2/2 epoch (loss 0.0732):  53%|▌| 2172/4114 [2:20:29<2:05:26,  3.88s/it]Training 2/2 epoch (loss 0.0732):  53%|▌| 2173/4114 [2:20:29<2:05:59,  3.89s/it]Training 2/2 epoch (loss 0.1309):  53%|▌| 2173/4114 [2:20:33<2:05:59,  3.89s/it]Training 2/2 epoch (loss 0.1309):  53%|▌| 2174/4114 [2:20:33<2:06:46,  3.92s/it]Training 2/2 epoch (loss 0.1216):  53%|▌| 2174/4114 [2:20:38<2:06:46,  3.92s/it]Training 2/2 epoch (loss 0.1216):  53%|▌| 2175/4114 [2:20:38<2:08:57,  3.99s/it]Training 2/2 epoch (loss 0.2393):  53%|▌| 2175/4114 [2:20:41<2:08:57,  3.99s/it]Training 2/2 epoch (loss 0.2393):  53%|▌| 2176/4114 [2:20:41<2:06:41,  3.92s/it]Training 2/2 epoch (loss 0.1758):  53%|▌| 2176/4114 [2:20:45<2:06:41,  3.92s/it]Training 2/2 epoch (loss 0.1758):  53%|▌| 2177/4114 [2:20:45<2:06:57,  3.93s/it]Training 2/2 epoch (loss 0.0835):  53%|▌| 2177/4114 [2:20:49<2:06:57,  3.93s/it]Training 2/2 epoch (loss 0.0835):  53%|▌| 2178/4114 [2:20:49<2:02:09,  3.79s/it]Training 2/2 epoch (loss 0.0500):  53%|▌| 2178/4114 [2:20:52<2:02:09,  3.79s/it]Training 2/2 epoch (loss 0.0500):  53%|▌| 2179/4114 [2:20:52<2:00:19,  3.73s/it]Training 2/2 epoch (loss 0.0386):  53%|▌| 2179/4114 [2:20:56<2:00:19,  3.73s/it]Training 2/2 epoch (loss 0.0386):  53%|▌| 2180/4114 [2:20:56<2:02:09,  3.79s/it]Training 2/2 epoch (loss 0.2871):  53%|▌| 2180/4114 [2:21:00<2:02:09,  3.79s/it]Training 2/2 epoch (loss 0.2871):  53%|▌| 2181/4114 [2:21:00<2:04:32,  3.87s/it]Training 2/2 epoch (loss 0.0723):  53%|▌| 2181/4114 [2:21:04<2:04:32,  3.87s/it]Training 2/2 epoch (loss 0.0723):  53%|▌| 2182/4114 [2:21:04<2:04:31,  3.87s/it]Training 2/2 epoch (loss 0.2471):  53%|▌| 2182/4114 [2:21:08<2:04:31,  3.87s/it]Training 2/2 epoch (loss 0.2471):  53%|▌| 2183/4114 [2:21:08<2:03:32,  3.84s/it]Training 2/2 epoch (loss 0.1836):  53%|▌| 2183/4114 [2:21:12<2:03:32,  3.84s/it]Training 2/2 epoch (loss 0.1836):  53%|▌| 2184/4114 [2:21:12<2:07:35,  3.97s/it]Training 2/2 epoch (loss 0.0302):  53%|▌| 2184/4114 [2:21:16<2:07:35,  3.97s/it]Training 2/2 epoch (loss 0.0302):  53%|▌| 2185/4114 [2:21:16<2:07:51,  3.98s/it]Training 2/2 epoch (loss 0.0796):  53%|▌| 2185/4114 [2:21:20<2:07:51,  3.98s/it]Training 2/2 epoch (loss 0.0796):  53%|▌| 2186/4114 [2:21:20<2:07:54,  3.98s/it]Training 2/2 epoch (loss 0.1279):  53%|▌| 2186/4114 [2:21:25<2:07:54,  3.98s/it]Training 2/2 epoch (loss 0.1279):  53%|▌| 2187/4114 [2:21:25<2:11:27,  4.09s/it]Training 2/2 epoch (loss 0.0908):  53%|▌| 2187/4114 [2:21:28<2:11:27,  4.09s/it]Training 2/2 epoch (loss 0.0908):  53%|▌| 2188/4114 [2:21:28<2:04:46,  3.89s/it]Training 2/2 epoch (loss 0.0859):  53%|▌| 2188/4114 [2:21:31<2:04:46,  3.89s/it]Training 2/2 epoch (loss 0.0859):  53%|▌| 2189/4114 [2:21:31<2:00:03,  3.74s/it]Training 2/2 epoch (loss 0.0309):  53%|▌| 2189/4114 [2:21:35<2:00:03,  3.74s/it]Training 2/2 epoch (loss 0.0309):  53%|▌| 2190/4114 [2:21:35<1:59:35,  3.73s/it]Training 2/2 epoch (loss 0.1523):  53%|▌| 2190/4114 [2:21:39<1:59:35,  3.73s/it]Training 2/2 epoch (loss 0.1523):  53%|▌| 2191/4114 [2:21:39<2:00:01,  3.74s/it]Training 2/2 epoch (loss 0.2178):  53%|▌| 2191/4114 [2:21:42<2:00:01,  3.74s/it]Training 2/2 epoch (loss 0.2178):  53%|▌| 2192/4114 [2:21:42<1:57:31,  3.67s/it]Training 2/2 epoch (loss 0.1250):  53%|▌| 2192/4114 [2:21:46<1:57:31,  3.67s/it]Training 2/2 epoch (loss 0.1250):  53%|▌| 2193/4114 [2:21:46<2:01:37,  3.80s/it]Training 2/2 epoch (loss 0.2227):  53%|▌| 2193/4114 [2:21:50<2:01:37,  3.80s/it]Training 2/2 epoch (loss 0.2227):  53%|▌| 2194/4114 [2:21:50<2:01:34,  3.80s/it]Training 2/2 epoch (loss 0.2441):  53%|▌| 2194/4114 [2:21:54<2:01:34,  3.80s/it]Training 2/2 epoch (loss 0.2441):  53%|▌| 2195/4114 [2:21:54<2:01:33,  3.80s/it]Training 2/2 epoch (loss 0.1650):  53%|▌| 2195/4114 [2:21:58<2:01:33,  3.80s/it]Training 2/2 epoch (loss 0.1650):  53%|▌| 2196/4114 [2:21:58<2:03:18,  3.86s/it]Training 2/2 epoch (loss 0.0854):  53%|▌| 2196/4114 [2:22:01<2:03:18,  3.86s/it]Training 2/2 epoch (loss 0.0854):  53%|▌| 2197/4114 [2:22:01<1:58:29,  3.71s/it]Training 2/2 epoch (loss 0.2207):  53%|▌| 2197/4114 [2:22:05<1:58:29,  3.71s/it]Training 2/2 epoch (loss 0.2207):  53%|▌| 2198/4114 [2:22:05<1:59:40,  3.75s/it]Training 2/2 epoch (loss 0.0277):  53%|▌| 2198/4114 [2:22:09<1:59:40,  3.75s/it]Training 2/2 epoch (loss 0.0277):  53%|▌| 2199/4114 [2:22:09<1:57:01,  3.67s/it]Training 2/2 epoch (loss 0.1030):  53%|▌| 2199/4114 [2:22:13<1:57:01,  3.67s/it]Training 2/2 epoch (loss 0.1030):  53%|▌| 2200/4114 [2:22:13<2:00:50,  3.79s/it]Training 2/2 epoch (loss 0.3047):  53%|▌| 2200/4114 [2:22:16<2:00:50,  3.79s/it]Training 2/2 epoch (loss 0.3047):  54%|▌| 2201/4114 [2:22:16<1:57:35,  3.69s/it]Training 2/2 epoch (loss 0.4004):  54%|▌| 2201/4114 [2:22:20<1:57:35,  3.69s/it]Training 2/2 epoch (loss 0.4004):  54%|▌| 2202/4114 [2:22:20<2:02:26,  3.84s/it]Training 2/2 epoch (loss 0.1533):  54%|▌| 2202/4114 [2:22:24<2:02:26,  3.84s/it]Training 2/2 epoch (loss 0.1533):  54%|▌| 2203/4114 [2:22:24<2:04:27,  3.91s/it]Training 2/2 epoch (loss 0.1426):  54%|▌| 2203/4114 [2:22:29<2:04:27,  3.91s/it]Training 2/2 epoch (loss 0.1426):  54%|▌| 2204/4114 [2:22:29<2:06:14,  3.97s/it]Training 2/2 epoch (loss 0.3047):  54%|▌| 2204/4114 [2:22:33<2:06:14,  3.97s/it]Training 2/2 epoch (loss 0.3047):  54%|▌| 2205/4114 [2:22:33<2:08:49,  4.05s/it]Training 2/2 epoch (loss 0.3672):  54%|▌| 2205/4114 [2:22:37<2:08:49,  4.05s/it]Training 2/2 epoch (loss 0.3672):  54%|▌| 2206/4114 [2:22:37<2:05:49,  3.96s/it]Training 2/2 epoch (loss 0.0356):  54%|▌| 2206/4114 [2:22:41<2:05:49,  3.96s/it]Training 2/2 epoch (loss 0.0356):  54%|▌| 2207/4114 [2:22:41<2:06:38,  3.98s/it]Training 2/2 epoch (loss 0.0713):  54%|▌| 2207/4114 [2:22:45<2:06:38,  3.98s/it]Training 2/2 epoch (loss 0.0713):  54%|▌| 2208/4114 [2:22:45<2:06:45,  3.99s/it]Training 2/2 epoch (loss 0.0703):  54%|▌| 2208/4114 [2:22:48<2:06:45,  3.99s/it]Training 2/2 epoch (loss 0.0703):  54%|▌| 2209/4114 [2:22:48<2:05:25,  3.95s/it]Training 2/2 epoch (loss 0.3613):  54%|▌| 2209/4114 [2:22:52<2:05:25,  3.95s/it]Training 2/2 epoch (loss 0.3613):  54%|▌| 2210/4114 [2:22:52<2:03:18,  3.89s/it]Training 2/2 epoch (loss 0.1147):  54%|▌| 2210/4114 [2:22:56<2:03:18,  3.89s/it]Training 2/2 epoch (loss 0.1147):  54%|▌| 2211/4114 [2:22:56<2:06:20,  3.98s/it]Training 2/2 epoch (loss 0.1475):  54%|▌| 2211/4114 [2:23:00<2:06:20,  3.98s/it]Training 2/2 epoch (loss 0.1475):  54%|▌| 2212/4114 [2:23:00<1:58:32,  3.74s/it]Training 2/2 epoch (loss 0.2539):  54%|▌| 2212/4114 [2:23:03<1:58:32,  3.74s/it]Training 2/2 epoch (loss 0.2539):  54%|▌| 2213/4114 [2:23:03<1:55:42,  3.65s/it]Training 2/2 epoch (loss 0.2988):  54%|▌| 2213/4114 [2:23:07<1:55:42,  3.65s/it]Training 2/2 epoch (loss 0.2988):  54%|▌| 2214/4114 [2:23:07<1:59:43,  3.78s/it]Training 2/2 epoch (loss 0.1436):  54%|▌| 2214/4114 [2:23:11<1:59:43,  3.78s/it]Training 2/2 epoch (loss 0.1436):  54%|▌| 2215/4114 [2:23:11<2:02:10,  3.86s/it]Training 2/2 epoch (loss 0.1709):  54%|▌| 2215/4114 [2:23:15<2:02:10,  3.86s/it]Training 2/2 epoch (loss 0.1709):  54%|▌| 2216/4114 [2:23:15<2:03:01,  3.89s/it]Training 2/2 epoch (loss 0.1436):  54%|▌| 2216/4114 [2:23:18<2:03:01,  3.89s/it]Training 2/2 epoch (loss 0.1436):  54%|▌| 2217/4114 [2:23:18<1:55:54,  3.67s/it]Training 2/2 epoch (loss 0.1445):  54%|▌| 2217/4114 [2:23:22<1:55:54,  3.67s/it]Training 2/2 epoch (loss 0.1445):  54%|▌| 2218/4114 [2:23:22<1:58:25,  3.75s/it]Training 2/2 epoch (loss 0.1055):  54%|▌| 2218/4114 [2:23:26<1:58:25,  3.75s/it]Training 2/2 epoch (loss 0.1055):  54%|▌| 2219/4114 [2:23:26<2:01:16,  3.84s/it]Training 2/2 epoch (loss 0.1680):  54%|▌| 2219/4114 [2:23:30<2:01:16,  3.84s/it]Training 2/2 epoch (loss 0.1680):  54%|▌| 2220/4114 [2:23:30<2:02:57,  3.90s/it]Training 2/2 epoch (loss 0.2471):  54%|▌| 2220/4114 [2:23:34<2:02:57,  3.90s/it]Training 2/2 epoch (loss 0.2471):  54%|▌| 2221/4114 [2:23:34<2:03:12,  3.91s/it]Training 2/2 epoch (loss 0.1826):  54%|▌| 2221/4114 [2:23:38<2:03:12,  3.91s/it]Training 2/2 epoch (loss 0.1826):  54%|▌| 2222/4114 [2:23:38<2:04:53,  3.96s/it]Training 2/2 epoch (loss 0.0928):  54%|▌| 2222/4114 [2:23:42<2:04:53,  3.96s/it]Training 2/2 epoch (loss 0.0928):  54%|▌| 2223/4114 [2:23:42<2:01:14,  3.85s/it]Training 2/2 epoch (loss 0.1406):  54%|▌| 2223/4114 [2:23:46<2:01:14,  3.85s/it]Training 2/2 epoch (loss 0.1406):  54%|▌| 2224/4114 [2:23:46<2:00:59,  3.84s/it]Training 2/2 epoch (loss 0.1206):  54%|▌| 2224/4114 [2:23:50<2:00:59,  3.84s/it]Training 2/2 epoch (loss 0.1206):  54%|▌| 2225/4114 [2:23:50<2:00:53,  3.84s/it]Training 2/2 epoch (loss 0.1934):  54%|▌| 2225/4114 [2:23:54<2:00:53,  3.84s/it]Training 2/2 epoch (loss 0.1934):  54%|▌| 2226/4114 [2:23:54<2:04:51,  3.97s/it]Training 2/2 epoch (loss 0.0947):  54%|▌| 2226/4114 [2:23:58<2:04:51,  3.97s/it]Training 2/2 epoch (loss 0.0947):  54%|▌| 2227/4114 [2:23:58<2:05:55,  4.00s/it]Training 2/2 epoch (loss 0.0981):  54%|▌| 2227/4114 [2:24:02<2:05:55,  4.00s/it]Training 2/2 epoch (loss 0.0981):  54%|▌| 2228/4114 [2:24:02<2:05:47,  4.00s/it]Training 2/2 epoch (loss 0.1533):  54%|▌| 2228/4114 [2:24:06<2:05:47,  4.00s/it]Training 2/2 epoch (loss 0.1533):  54%|▌| 2229/4114 [2:24:06<2:08:14,  4.08s/it]Training 2/2 epoch (loss 0.0564):  54%|▌| 2229/4114 [2:24:10<2:08:14,  4.08s/it]Training 2/2 epoch (loss 0.0564):  54%|▌| 2230/4114 [2:24:10<2:06:27,  4.03s/it]Training 2/2 epoch (loss 0.1021):  54%|▌| 2230/4114 [2:24:14<2:06:27,  4.03s/it]Training 2/2 epoch (loss 0.1021):  54%|▌| 2231/4114 [2:24:14<2:05:02,  3.98s/it]Training 2/2 epoch (loss 0.0344):  54%|▌| 2231/4114 [2:24:18<2:05:02,  3.98s/it]Training 2/2 epoch (loss 0.0344):  54%|▌| 2232/4114 [2:24:18<2:05:08,  3.99s/it]Training 2/2 epoch (loss 0.0889):  54%|▌| 2232/4114 [2:24:22<2:05:08,  3.99s/it]Training 2/2 epoch (loss 0.0889):  54%|▌| 2233/4114 [2:24:22<2:04:32,  3.97s/it]Training 2/2 epoch (loss 0.1523):  54%|▌| 2233/4114 [2:24:26<2:04:32,  3.97s/it]Training 2/2 epoch (loss 0.1523):  54%|▌| 2234/4114 [2:24:26<2:05:31,  4.01s/it]Training 2/2 epoch (loss 0.2178):  54%|▌| 2234/4114 [2:24:30<2:05:31,  4.01s/it]Training 2/2 epoch (loss 0.2178):  54%|▌| 2235/4114 [2:24:30<2:07:55,  4.08s/it]Training 2/2 epoch (loss 0.1396):  54%|▌| 2235/4114 [2:24:34<2:07:55,  4.08s/it]Training 2/2 epoch (loss 0.1396):  54%|▌| 2236/4114 [2:24:34<2:05:01,  3.99s/it]Training 2/2 epoch (loss 0.1001):  54%|▌| 2236/4114 [2:24:38<2:05:01,  3.99s/it]Training 2/2 epoch (loss 0.1001):  54%|▌| 2237/4114 [2:24:38<2:04:09,  3.97s/it]Training 2/2 epoch (loss 0.0742):  54%|▌| 2237/4114 [2:24:42<2:04:09,  3.97s/it]Training 2/2 epoch (loss 0.0742):  54%|▌| 2238/4114 [2:24:42<2:05:38,  4.02s/it]Training 2/2 epoch (loss 0.1406):  54%|▌| 2238/4114 [2:24:46<2:05:38,  4.02s/it]Training 2/2 epoch (loss 0.1406):  54%|▌| 2239/4114 [2:24:46<2:05:05,  4.00s/it]Training 2/2 epoch (loss 0.1484):  54%|▌| 2239/4114 [2:24:50<2:05:05,  4.00s/it]Training 2/2 epoch (loss 0.1484):  54%|▌| 2240/4114 [2:24:50<2:02:59,  3.94s/it]Training 2/2 epoch (loss 0.0221):  54%|▌| 2240/4114 [2:24:53<2:02:59,  3.94s/it]Training 2/2 epoch (loss 0.0221):  54%|▌| 2241/4114 [2:24:53<2:00:41,  3.87s/it]Training 2/2 epoch (loss 0.0825):  54%|▌| 2241/4114 [2:24:57<2:00:41,  3.87s/it]Training 2/2 epoch (loss 0.0825):  54%|▌| 2242/4114 [2:24:57<1:55:55,  3.72s/it]Training 2/2 epoch (loss 0.1035):  54%|▌| 2242/4114 [2:25:00<1:55:55,  3.72s/it]Training 2/2 epoch (loss 0.1035):  55%|▌| 2243/4114 [2:25:00<1:53:23,  3.64s/it]Training 2/2 epoch (loss 0.0654):  55%|▌| 2243/4114 [2:25:04<1:53:23,  3.64s/it]Training 2/2 epoch (loss 0.0654):  55%|▌| 2244/4114 [2:25:04<1:53:26,  3.64s/it]Training 2/2 epoch (loss 0.0664):  55%|▌| 2244/4114 [2:25:08<1:53:26,  3.64s/it]Training 2/2 epoch (loss 0.0664):  55%|▌| 2245/4114 [2:25:08<1:55:04,  3.69s/it]Training 2/2 epoch (loss 0.0742):  55%|▌| 2245/4114 [2:25:11<1:55:04,  3.69s/it]Training 2/2 epoch (loss 0.0742):  55%|▌| 2246/4114 [2:25:11<1:54:31,  3.68s/it]Training 2/2 epoch (loss 0.1226):  55%|▌| 2246/4114 [2:25:15<1:54:31,  3.68s/it]Training 2/2 epoch (loss 0.1226):  55%|▌| 2247/4114 [2:25:15<1:57:53,  3.79s/it]Training 2/2 epoch (loss 0.1650):  55%|▌| 2247/4114 [2:25:19<1:57:53,  3.79s/it]Training 2/2 epoch (loss 0.1650):  55%|▌| 2248/4114 [2:25:19<1:58:36,  3.81s/it]Training 2/2 epoch (loss 0.0100):  55%|▌| 2248/4114 [2:25:23<1:58:36,  3.81s/it]Training 2/2 epoch (loss 0.0100):  55%|▌| 2249/4114 [2:25:23<1:58:27,  3.81s/it]Training 2/2 epoch (loss 0.0297):  55%|▌| 2249/4114 [2:25:27<1:58:27,  3.81s/it]Training 2/2 epoch (loss 0.0297):  55%|▌| 2250/4114 [2:25:27<1:56:33,  3.75s/it]Training 2/2 epoch (loss 0.0464):  55%|▌| 2250/4114 [2:25:31<1:56:33,  3.75s/it]Training 2/2 epoch (loss 0.0464):  55%|▌| 2251/4114 [2:25:31<1:57:49,  3.79s/it]Training 2/2 epoch (loss 0.0991):  55%|▌| 2251/4114 [2:25:35<1:57:49,  3.79s/it]Training 2/2 epoch (loss 0.0991):  55%|▌| 2252/4114 [2:25:35<1:59:03,  3.84s/it]Training 2/2 epoch (loss 0.0347):  55%|▌| 2252/4114 [2:25:39<1:59:03,  3.84s/it]Training 2/2 epoch (loss 0.0347):  55%|▌| 2253/4114 [2:25:39<2:00:02,  3.87s/it]Training 2/2 epoch (loss 0.1279):  55%|▌| 2253/4114 [2:25:42<2:00:02,  3.87s/it]Training 2/2 epoch (loss 0.1279):  55%|▌| 2254/4114 [2:25:42<2:00:06,  3.87s/it]Training 2/2 epoch (loss 0.0281):  55%|▌| 2254/4114 [2:25:46<2:00:06,  3.87s/it]Training 2/2 epoch (loss 0.0281):  55%|▌| 2255/4114 [2:25:46<1:53:42,  3.67s/it]Training 2/2 epoch (loss 0.0908):  55%|▌| 2255/4114 [2:25:50<1:53:42,  3.67s/it]Training 2/2 epoch (loss 0.0908):  55%|▌| 2256/4114 [2:25:50<1:57:11,  3.78s/it]Training 2/2 epoch (loss 0.0796):  55%|▌| 2256/4114 [2:25:54<1:57:11,  3.78s/it]Training 2/2 epoch (loss 0.0796):  55%|▌| 2257/4114 [2:25:54<1:58:46,  3.84s/it]Training 2/2 epoch (loss 0.2393):  55%|▌| 2257/4114 [2:25:58<1:58:46,  3.84s/it]Training 2/2 epoch (loss 0.2393):  55%|▌| 2258/4114 [2:25:58<2:01:25,  3.93s/it]Training 2/2 epoch (loss 0.0747):  55%|▌| 2258/4114 [2:26:02<2:01:25,  3.93s/it]Training 2/2 epoch (loss 0.0747):  55%|▌| 2259/4114 [2:26:02<2:03:45,  4.00s/it]Training 2/2 epoch (loss 0.0630):  55%|▌| 2259/4114 [2:26:06<2:03:45,  4.00s/it]Training 2/2 epoch (loss 0.0630):  55%|▌| 2260/4114 [2:26:06<2:02:59,  3.98s/it]Training 2/2 epoch (loss 0.0884):  55%|▌| 2260/4114 [2:26:09<2:02:59,  3.98s/it]Training 2/2 epoch (loss 0.0884):  55%|▌| 2261/4114 [2:26:09<1:58:50,  3.85s/it]Training 2/2 epoch (loss 0.1270):  55%|▌| 2261/4114 [2:26:13<1:58:50,  3.85s/it]Training 2/2 epoch (loss 0.1270):  55%|▌| 2262/4114 [2:26:13<2:00:56,  3.92s/it]Training 2/2 epoch (loss 0.0762):  55%|▌| 2262/4114 [2:26:17<2:00:56,  3.92s/it]Training 2/2 epoch (loss 0.0762):  55%|▌| 2263/4114 [2:26:17<2:00:25,  3.90s/it]Training 2/2 epoch (loss 0.1475):  55%|▌| 2263/4114 [2:26:21<2:00:25,  3.90s/it]Training 2/2 epoch (loss 0.1475):  55%|▌| 2264/4114 [2:26:21<2:00:29,  3.91s/it]Training 2/2 epoch (loss 0.1104):  55%|▌| 2264/4114 [2:26:26<2:00:29,  3.91s/it]Training 2/2 epoch (loss 0.1104):  55%|▌| 2265/4114 [2:26:26<2:03:22,  4.00s/it]Training 2/2 epoch (loss 0.2734):  55%|▌| 2265/4114 [2:26:29<2:03:22,  4.00s/it]Training 2/2 epoch (loss 0.2734):  55%|▌| 2266/4114 [2:26:29<2:01:26,  3.94s/it]Training 2/2 epoch (loss 0.0938):  55%|▌| 2266/4114 [2:26:33<2:01:26,  3.94s/it]Training 2/2 epoch (loss 0.0938):  55%|▌| 2267/4114 [2:26:33<2:01:06,  3.93s/it]Training 2/2 epoch (loss 0.2100):  55%|▌| 2267/4114 [2:26:37<2:01:06,  3.93s/it]Training 2/2 epoch (loss 0.2100):  55%|▌| 2268/4114 [2:26:37<2:01:33,  3.95s/it]Training 2/2 epoch (loss 0.1089):  55%|▌| 2268/4114 [2:26:40<2:01:33,  3.95s/it]Training 2/2 epoch (loss 0.1089):  55%|▌| 2269/4114 [2:26:40<1:54:32,  3.72s/it]Training 2/2 epoch (loss 0.0427):  55%|▌| 2269/4114 [2:26:44<1:54:32,  3.72s/it]Training 2/2 epoch (loss 0.0427):  55%|▌| 2270/4114 [2:26:44<1:56:41,  3.80s/it]Training 2/2 epoch (loss 0.1680):  55%|▌| 2270/4114 [2:26:48<1:56:41,  3.80s/it]Training 2/2 epoch (loss 0.1680):  55%|▌| 2271/4114 [2:26:48<1:55:48,  3.77s/it]Training 2/2 epoch (loss 0.0811):  55%|▌| 2271/4114 [2:26:52<1:55:48,  3.77s/it]Training 2/2 epoch (loss 0.0811):  55%|▌| 2272/4114 [2:26:52<1:54:19,  3.72s/it]Training 2/2 epoch (loss 0.0334):  55%|▌| 2272/4114 [2:26:56<1:54:19,  3.72s/it]Training 2/2 epoch (loss 0.0334):  55%|▌| 2273/4114 [2:26:56<1:56:42,  3.80s/it]Training 2/2 epoch (loss 0.0334):  55%|▌| 2273/4114 [2:27:00<1:56:42,  3.80s/it]Training 2/2 epoch (loss 0.0334):  55%|▌| 2274/4114 [2:27:00<2:00:41,  3.94s/it]Training 2/2 epoch (loss 0.0269):  55%|▌| 2274/4114 [2:27:03<2:00:41,  3.94s/it]Training 2/2 epoch (loss 0.0269):  55%|▌| 2275/4114 [2:27:03<1:56:05,  3.79s/it]Training 2/2 epoch (loss 0.1621):  55%|▌| 2275/4114 [2:27:07<1:56:05,  3.79s/it]Training 2/2 epoch (loss 0.1621):  55%|▌| 2276/4114 [2:27:07<1:57:16,  3.83s/it]Training 2/2 epoch (loss 0.1729):  55%|▌| 2276/4114 [2:27:12<1:57:16,  3.83s/it]Training 2/2 epoch (loss 0.1729):  55%|▌| 2277/4114 [2:27:12<2:00:59,  3.95s/it]Training 2/2 epoch (loss 0.0527):  55%|▌| 2277/4114 [2:27:15<2:00:59,  3.95s/it]Training 2/2 epoch (loss 0.0527):  55%|▌| 2278/4114 [2:27:15<1:55:10,  3.76s/it]Training 2/2 epoch (loss 0.0564):  55%|▌| 2278/4114 [2:27:18<1:55:10,  3.76s/it]Training 2/2 epoch (loss 0.0564):  55%|▌| 2279/4114 [2:27:18<1:51:23,  3.64s/it]Training 2/2 epoch (loss 0.1147):  55%|▌| 2279/4114 [2:27:22<1:51:23,  3.64s/it]Training 2/2 epoch (loss 0.1147):  55%|▌| 2280/4114 [2:27:22<1:52:21,  3.68s/it]Training 2/2 epoch (loss 0.1260):  55%|▌| 2280/4114 [2:27:26<1:52:21,  3.68s/it]Training 2/2 epoch (loss 0.1260):  55%|▌| 2281/4114 [2:27:26<1:55:32,  3.78s/it]Training 2/2 epoch (loss 0.1621):  55%|▌| 2281/4114 [2:27:30<1:55:32,  3.78s/it]Training 2/2 epoch (loss 0.1621):  55%|▌| 2282/4114 [2:27:30<1:57:45,  3.86s/it]Training 2/2 epoch (loss 0.0669):  55%|▌| 2282/4114 [2:27:34<1:57:45,  3.86s/it]Training 2/2 epoch (loss 0.0669):  55%|▌| 2283/4114 [2:27:34<1:58:34,  3.89s/it]Training 2/2 epoch (loss 0.1689):  55%|▌| 2283/4114 [2:27:38<1:58:34,  3.89s/it]Training 2/2 epoch (loss 0.1689):  56%|▌| 2284/4114 [2:27:38<1:55:07,  3.77s/it]Training 2/2 epoch (loss 0.1729):  56%|▌| 2284/4114 [2:27:41<1:55:07,  3.77s/it]Training 2/2 epoch (loss 0.1729):  56%|▌| 2285/4114 [2:27:41<1:52:35,  3.69s/it]Training 2/2 epoch (loss 0.2021):  56%|▌| 2285/4114 [2:27:45<1:52:35,  3.69s/it]Training 2/2 epoch (loss 0.2021):  56%|▌| 2286/4114 [2:27:45<1:57:32,  3.86s/it]Training 2/2 epoch (loss 0.1133):  56%|▌| 2286/4114 [2:27:49<1:57:32,  3.86s/it]Training 2/2 epoch (loss 0.1133):  56%|▌| 2287/4114 [2:27:49<1:53:21,  3.72s/it]Training 2/2 epoch (loss 0.0776):  56%|▌| 2287/4114 [2:27:52<1:53:21,  3.72s/it]Training 2/2 epoch (loss 0.0776):  56%|▌| 2288/4114 [2:27:52<1:50:22,  3.63s/it]Training 2/2 epoch (loss 0.0918):  56%|▌| 2288/4114 [2:27:56<1:50:22,  3.63s/it]Training 2/2 epoch (loss 0.0918):  56%|▌| 2289/4114 [2:27:56<1:53:29,  3.73s/it]Training 2/2 epoch (loss 0.2461):  56%|▌| 2289/4114 [2:28:00<1:53:29,  3.73s/it]Training 2/2 epoch (loss 0.2461):  56%|▌| 2290/4114 [2:28:00<1:55:21,  3.79s/it]Training 2/2 epoch (loss 0.0226):  56%|▌| 2290/4114 [2:28:04<1:55:21,  3.79s/it]Training 2/2 epoch (loss 0.0226):  56%|▌| 2291/4114 [2:28:04<1:55:15,  3.79s/it]Training 2/2 epoch (loss 0.0815):  56%|▌| 2291/4114 [2:28:08<1:55:15,  3.79s/it]Training 2/2 epoch (loss 0.0815):  56%|▌| 2292/4114 [2:28:08<1:54:53,  3.78s/it]Training 2/2 epoch (loss 0.1553):  56%|▌| 2292/4114 [2:28:11<1:54:53,  3.78s/it]Training 2/2 epoch (loss 0.1553):  56%|▌| 2293/4114 [2:28:11<1:55:54,  3.82s/it]Training 2/2 epoch (loss 0.0566):  56%|▌| 2293/4114 [2:28:15<1:55:54,  3.82s/it]Training 2/2 epoch (loss 0.0566):  56%|▌| 2294/4114 [2:28:15<1:57:12,  3.86s/it]Training 2/2 epoch (loss 0.1709):  56%|▌| 2294/4114 [2:28:19<1:57:12,  3.86s/it]Training 2/2 epoch (loss 0.1709):  56%|▌| 2295/4114 [2:28:19<1:58:49,  3.92s/it]Training 2/2 epoch (loss 0.0172):  56%|▌| 2295/4114 [2:28:23<1:58:49,  3.92s/it]Training 2/2 epoch (loss 0.0172):  56%|▌| 2296/4114 [2:28:23<1:58:32,  3.91s/it]Training 2/2 epoch (loss 0.1182):  56%|▌| 2296/4114 [2:28:27<1:58:32,  3.91s/it]Training 2/2 epoch (loss 0.1182):  56%|▌| 2297/4114 [2:28:27<1:58:10,  3.90s/it]Training 2/2 epoch (loss 0.1631):  56%|▌| 2297/4114 [2:28:31<1:58:10,  3.90s/it]Training 2/2 epoch (loss 0.1631):  56%|▌| 2298/4114 [2:28:31<2:00:01,  3.97s/it]Training 2/2 epoch (loss 0.2891):  56%|▌| 2298/4114 [2:28:35<2:00:01,  3.97s/it]Training 2/2 epoch (loss 0.2891):  56%|▌| 2299/4114 [2:28:35<2:00:19,  3.98s/it]Training 2/2 epoch (loss 0.0119):  56%|▌| 2299/4114 [2:28:39<2:00:19,  3.98s/it]Training 2/2 epoch (loss 0.0119):  56%|▌| 2300/4114 [2:28:39<1:58:19,  3.91s/it]Training 2/2 epoch (loss 0.1196):  56%|▌| 2300/4114 [2:28:43<1:58:19,  3.91s/it]Training 2/2 epoch (loss 0.1196):  56%|▌| 2301/4114 [2:28:43<1:59:36,  3.96s/it]Training 2/2 epoch (loss 0.1143):  56%|▌| 2301/4114 [2:28:47<1:59:36,  3.96s/it]Training 2/2 epoch (loss 0.1143):  56%|▌| 2302/4114 [2:28:47<1:59:26,  3.96s/it]Training 2/2 epoch (loss 0.0635):  56%|▌| 2302/4114 [2:28:51<1:59:26,  3.96s/it]Training 2/2 epoch (loss 0.0635):  56%|▌| 2303/4114 [2:28:51<1:58:45,  3.93s/it]Training 2/2 epoch (loss 0.1157):  56%|▌| 2303/4114 [2:28:55<1:58:45,  3.93s/it]Training 2/2 epoch (loss 0.1157):  56%|▌| 2304/4114 [2:28:55<1:59:12,  3.95s/it]Training 2/2 epoch (loss 0.0312):  56%|▌| 2304/4114 [2:28:59<1:59:12,  3.95s/it]Training 2/2 epoch (loss 0.0312):  56%|▌| 2305/4114 [2:28:59<1:57:54,  3.91s/it]Training 2/2 epoch (loss 0.2275):  56%|▌| 2305/4114 [2:29:03<1:57:54,  3.91s/it]Training 2/2 epoch (loss 0.2275):  56%|▌| 2306/4114 [2:29:03<1:58:03,  3.92s/it]Training 2/2 epoch (loss 0.1543):  56%|▌| 2306/4114 [2:29:06<1:58:03,  3.92s/it]Training 2/2 epoch (loss 0.1543):  56%|▌| 2307/4114 [2:29:06<1:55:52,  3.85s/it]Training 2/2 epoch (loss 0.0110):  56%|▌| 2307/4114 [2:29:10<1:55:52,  3.85s/it]Training 2/2 epoch (loss 0.0110):  56%|▌| 2308/4114 [2:29:10<1:56:47,  3.88s/it]Training 2/2 epoch (loss 0.1992):  56%|▌| 2308/4114 [2:29:14<1:56:47,  3.88s/it]Training 2/2 epoch (loss 0.1992):  56%|▌| 2309/4114 [2:29:14<1:58:40,  3.95s/it]Training 2/2 epoch (loss 0.1299):  56%|▌| 2309/4114 [2:29:18<1:58:40,  3.95s/it]Training 2/2 epoch (loss 0.1299):  56%|▌| 2310/4114 [2:29:18<1:56:28,  3.87s/it]Training 2/2 epoch (loss 0.0752):  56%|▌| 2310/4114 [2:29:22<1:56:28,  3.87s/it]Training 2/2 epoch (loss 0.0752):  56%|▌| 2311/4114 [2:29:22<1:57:28,  3.91s/it]Training 2/2 epoch (loss 0.3379):  56%|▌| 2311/4114 [2:29:25<1:57:28,  3.91s/it]Training 2/2 epoch (loss 0.3379):  56%|▌| 2312/4114 [2:29:25<1:51:29,  3.71s/it]Training 2/2 epoch (loss 0.0237):  56%|▌| 2312/4114 [2:29:30<1:51:29,  3.71s/it]Training 2/2 epoch (loss 0.0237):  56%|▌| 2313/4114 [2:29:30<1:56:12,  3.87s/it]Training 2/2 epoch (loss 0.0374):  56%|▌| 2313/4114 [2:29:33<1:56:12,  3.87s/it]Training 2/2 epoch (loss 0.0374):  56%|▌| 2314/4114 [2:29:33<1:55:37,  3.85s/it]Training 2/2 epoch (loss 0.1445):  56%|▌| 2314/4114 [2:29:37<1:55:37,  3.85s/it]Training 2/2 epoch (loss 0.1445):  56%|▌| 2315/4114 [2:29:37<1:56:18,  3.88s/it]Training 2/2 epoch (loss 0.1543):  56%|▌| 2315/4114 [2:29:41<1:56:18,  3.88s/it]Training 2/2 epoch (loss 0.1543):  56%|▌| 2316/4114 [2:29:41<1:55:56,  3.87s/it]Training 2/2 epoch (loss 0.1367):  56%|▌| 2316/4114 [2:29:45<1:55:56,  3.87s/it]Training 2/2 epoch (loss 0.1367):  56%|▌| 2317/4114 [2:29:45<1:55:22,  3.85s/it]Training 2/2 epoch (loss 0.0491):  56%|▌| 2317/4114 [2:29:49<1:55:22,  3.85s/it]Training 2/2 epoch (loss 0.0491):  56%|▌| 2318/4114 [2:29:49<1:56:22,  3.89s/it]Training 2/2 epoch (loss 0.2305):  56%|▌| 2318/4114 [2:29:53<1:56:22,  3.89s/it]Training 2/2 epoch (loss 0.2305):  56%|▌| 2319/4114 [2:29:53<1:58:19,  3.96s/it]Training 2/2 epoch (loss 0.2246):  56%|▌| 2319/4114 [2:29:57<1:58:19,  3.96s/it]Training 2/2 epoch (loss 0.2246):  56%|▌| 2320/4114 [2:29:57<1:54:47,  3.84s/it]Training 2/2 epoch (loss 0.0425):  56%|▌| 2320/4114 [2:30:00<1:54:47,  3.84s/it]Training 2/2 epoch (loss 0.0425):  56%|▌| 2321/4114 [2:30:00<1:52:49,  3.78s/it]Training 2/2 epoch (loss 0.0583):  56%|▌| 2321/4114 [2:30:04<1:52:49,  3.78s/it]Training 2/2 epoch (loss 0.0583):  56%|▌| 2322/4114 [2:30:04<1:55:55,  3.88s/it]Training 2/2 epoch (loss 0.1582):  56%|▌| 2322/4114 [2:30:08<1:55:55,  3.88s/it]Training 2/2 epoch (loss 0.1582):  56%|▌| 2323/4114 [2:30:08<1:56:28,  3.90s/it]Training 2/2 epoch (loss 0.0479):  56%|▌| 2323/4114 [2:30:12<1:56:28,  3.90s/it]Training 2/2 epoch (loss 0.0479):  56%|▌| 2324/4114 [2:30:12<1:57:15,  3.93s/it]Training 2/2 epoch (loss 0.0947):  56%|▌| 2324/4114 [2:30:17<1:57:15,  3.93s/it]Training 2/2 epoch (loss 0.0947):  57%|▌| 2325/4114 [2:30:17<1:59:58,  4.02s/it]Training 2/2 epoch (loss 0.0645):  57%|▌| 2325/4114 [2:30:21<1:59:58,  4.02s/it]Training 2/2 epoch (loss 0.0645):  57%|▌| 2326/4114 [2:30:21<1:59:53,  4.02s/it]Training 2/2 epoch (loss 0.0752):  57%|▌| 2326/4114 [2:30:25<1:59:53,  4.02s/it]Training 2/2 epoch (loss 0.0752):  57%|▌| 2327/4114 [2:30:25<1:58:53,  3.99s/it]Training 2/2 epoch (loss 0.1680):  57%|▌| 2327/4114 [2:30:29<1:58:53,  3.99s/it]Training 2/2 epoch (loss 0.1680):  57%|▌| 2328/4114 [2:30:29<2:01:32,  4.08s/it]Training 2/2 epoch (loss 0.0928):  57%|▌| 2328/4114 [2:30:33<2:01:32,  4.08s/it]Training 2/2 epoch (loss 0.0928):  57%|▌| 2329/4114 [2:30:33<1:59:01,  4.00s/it]Training 2/2 epoch (loss 0.0479):  57%|▌| 2329/4114 [2:30:37<1:59:01,  4.00s/it]Training 2/2 epoch (loss 0.0479):  57%|▌| 2330/4114 [2:30:37<1:58:20,  3.98s/it]Training 2/2 epoch (loss 0.1143):  57%|▌| 2330/4114 [2:30:41<1:58:20,  3.98s/it]Training 2/2 epoch (loss 0.1143):  57%|▌| 2331/4114 [2:30:41<2:00:45,  4.06s/it]Training 2/2 epoch (loss 0.1226):  57%|▌| 2331/4114 [2:30:45<2:00:45,  4.06s/it]Training 2/2 epoch (loss 0.1226):  57%|▌| 2332/4114 [2:30:45<1:58:43,  4.00s/it]Training 2/2 epoch (loss 0.0525):  57%|▌| 2332/4114 [2:30:49<1:58:43,  4.00s/it]Training 2/2 epoch (loss 0.0525):  57%|▌| 2333/4114 [2:30:49<1:57:01,  3.94s/it]Training 2/2 epoch (loss 0.0654):  57%|▌| 2333/4114 [2:30:53<1:57:01,  3.94s/it]Training 2/2 epoch (loss 0.0654):  57%|▌| 2334/4114 [2:30:53<2:00:16,  4.05s/it]Training 2/2 epoch (loss 0.0767):  57%|▌| 2334/4114 [2:30:56<2:00:16,  4.05s/it]Training 2/2 epoch (loss 0.0767):  57%|▌| 2335/4114 [2:30:56<1:55:50,  3.91s/it]Training 2/2 epoch (loss 0.0684):  57%|▌| 2335/4114 [2:31:00<1:55:50,  3.91s/it]Training 2/2 epoch (loss 0.0684):  57%|▌| 2336/4114 [2:31:00<1:56:25,  3.93s/it]Training 2/2 epoch (loss 0.2324):  57%|▌| 2336/4114 [2:31:04<1:56:25,  3.93s/it]Training 2/2 epoch (loss 0.2324):  57%|▌| 2337/4114 [2:31:04<1:57:18,  3.96s/it]Training 2/2 epoch (loss 0.1523):  57%|▌| 2337/4114 [2:31:08<1:57:18,  3.96s/it]Training 2/2 epoch (loss 0.1523):  57%|▌| 2338/4114 [2:31:08<1:56:59,  3.95s/it]Training 2/2 epoch (loss 0.1050):  57%|▌| 2338/4114 [2:31:12<1:56:59,  3.95s/it]Training 2/2 epoch (loss 0.1050):  57%|▌| 2339/4114 [2:31:12<1:55:13,  3.90s/it]Training 2/2 epoch (loss 0.0488):  57%|▌| 2339/4114 [2:31:16<1:55:13,  3.90s/it]Training 2/2 epoch (loss 0.0488):  57%|▌| 2340/4114 [2:31:16<1:56:32,  3.94s/it]Training 2/2 epoch (loss 0.0420):  57%|▌| 2340/4114 [2:31:20<1:56:32,  3.94s/it]Training 2/2 epoch (loss 0.0420):  57%|▌| 2341/4114 [2:31:20<1:56:59,  3.96s/it]Training 2/2 epoch (loss 0.1123):  57%|▌| 2341/4114 [2:31:24<1:56:59,  3.96s/it]Training 2/2 epoch (loss 0.1123):  57%|▌| 2342/4114 [2:31:24<1:55:11,  3.90s/it]Training 2/2 epoch (loss 0.1177):  57%|▌| 2342/4114 [2:31:28<1:55:11,  3.90s/it]Training 2/2 epoch (loss 0.1177):  57%|▌| 2343/4114 [2:31:28<1:56:01,  3.93s/it]Training 2/2 epoch (loss 0.1318):  57%|▌| 2343/4114 [2:31:32<1:56:01,  3.93s/it]Training 2/2 epoch (loss 0.1318):  57%|▌| 2344/4114 [2:31:32<1:55:30,  3.92s/it]Training 2/2 epoch (loss 0.0601):  57%|▌| 2344/4114 [2:31:36<1:55:30,  3.92s/it]Training 2/2 epoch (loss 0.0601):  57%|▌| 2345/4114 [2:31:36<1:56:09,  3.94s/it]Training 2/2 epoch (loss 0.1660):  57%|▌| 2345/4114 [2:31:40<1:56:09,  3.94s/it]Training 2/2 epoch (loss 0.1660):  57%|▌| 2346/4114 [2:31:40<1:56:53,  3.97s/it]Training 2/2 epoch (loss 0.1279):  57%|▌| 2346/4114 [2:31:44<1:56:53,  3.97s/it]Training 2/2 epoch (loss 0.1279):  57%|▌| 2347/4114 [2:31:44<1:56:19,  3.95s/it]Training 2/2 epoch (loss 0.0459):  57%|▌| 2347/4114 [2:31:48<1:56:19,  3.95s/it]Training 2/2 epoch (loss 0.0459):  57%|▌| 2348/4114 [2:31:48<1:56:49,  3.97s/it]Training 2/2 epoch (loss 0.0581):  57%|▌| 2348/4114 [2:31:52<1:56:49,  3.97s/it]Training 2/2 epoch (loss 0.0581):  57%|▌| 2349/4114 [2:31:52<1:58:47,  4.04s/it]Training 2/2 epoch (loss 0.0466):  57%|▌| 2349/4114 [2:31:56<1:58:47,  4.04s/it]Training 2/2 epoch (loss 0.0466):  57%|▌| 2350/4114 [2:31:56<1:57:01,  3.98s/it]Training 2/2 epoch (loss 0.0723):  57%|▌| 2350/4114 [2:32:00<1:57:01,  3.98s/it]Training 2/2 epoch (loss 0.0723):  57%|▌| 2351/4114 [2:32:00<1:56:33,  3.97s/it]Training 2/2 epoch (loss 0.1182):  57%|▌| 2351/4114 [2:32:03<1:56:33,  3.97s/it]Training 2/2 epoch (loss 0.1182):  57%|▌| 2352/4114 [2:32:03<1:52:21,  3.83s/it]Training 2/2 epoch (loss 0.0811):  57%|▌| 2352/4114 [2:32:07<1:52:21,  3.83s/it]Training 2/2 epoch (loss 0.0811):  57%|▌| 2353/4114 [2:32:07<1:52:17,  3.83s/it]Training 2/2 epoch (loss 0.1094):  57%|▌| 2353/4114 [2:32:11<1:52:17,  3.83s/it]Training 2/2 epoch (loss 0.1094):  57%|▌| 2354/4114 [2:32:11<1:53:39,  3.87s/it]Training 2/2 epoch (loss 0.0913):  57%|▌| 2354/4114 [2:32:15<1:53:39,  3.87s/it]Training 2/2 epoch (loss 0.0913):  57%|▌| 2355/4114 [2:32:15<1:55:27,  3.94s/it]Training 2/2 epoch (loss 0.0820):  57%|▌| 2355/4114 [2:32:19<1:55:27,  3.94s/it]Training 2/2 epoch (loss 0.0820):  57%|▌| 2356/4114 [2:32:19<1:54:21,  3.90s/it]Training 2/2 epoch (loss 0.0840):  57%|▌| 2356/4114 [2:32:23<1:54:21,  3.90s/it]Training 2/2 epoch (loss 0.0840):  57%|▌| 2357/4114 [2:32:23<1:54:14,  3.90s/it]Training 2/2 epoch (loss 0.0118):  57%|▌| 2357/4114 [2:32:27<1:54:14,  3.90s/it]Training 2/2 epoch (loss 0.0118):  57%|▌| 2358/4114 [2:32:27<1:53:23,  3.87s/it]Training 2/2 epoch (loss 0.0732):  57%|▌| 2358/4114 [2:32:30<1:53:23,  3.87s/it]Training 2/2 epoch (loss 0.0732):  57%|▌| 2359/4114 [2:32:30<1:49:15,  3.74s/it]Training 2/2 epoch (loss 0.0386):  57%|▌| 2359/4114 [2:32:34<1:49:15,  3.74s/it]Training 2/2 epoch (loss 0.0386):  57%|▌| 2360/4114 [2:32:34<1:50:54,  3.79s/it]Training 2/2 epoch (loss 0.0608):  57%|▌| 2360/4114 [2:32:38<1:50:54,  3.79s/it]Training 2/2 epoch (loss 0.0608):  57%|▌| 2361/4114 [2:32:38<1:51:43,  3.82s/it]Training 2/2 epoch (loss 0.0737):  57%|▌| 2361/4114 [2:32:42<1:51:43,  3.82s/it]Training 2/2 epoch (loss 0.0737):  57%|▌| 2362/4114 [2:32:42<1:51:46,  3.83s/it]Training 2/2 epoch (loss 0.0435):  57%|▌| 2362/4114 [2:32:46<1:51:46,  3.83s/it]Training 2/2 epoch (loss 0.0435):  57%|▌| 2363/4114 [2:32:46<1:53:13,  3.88s/it]Training 2/2 epoch (loss 0.0938):  57%|▌| 2363/4114 [2:32:50<1:53:13,  3.88s/it]Training 2/2 epoch (loss 0.0938):  57%|▌| 2364/4114 [2:32:50<1:55:31,  3.96s/it]Training 2/2 epoch (loss 0.0776):  57%|▌| 2364/4114 [2:32:54<1:55:31,  3.96s/it]Training 2/2 epoch (loss 0.0776):  57%|▌| 2365/4114 [2:32:54<1:53:48,  3.90s/it]Training 2/2 epoch (loss 0.0352):  57%|▌| 2365/4114 [2:32:58<1:53:48,  3.90s/it]Training 2/2 epoch (loss 0.0352):  58%|▌| 2366/4114 [2:32:58<1:54:33,  3.93s/it]Training 2/2 epoch (loss 0.0718):  58%|▌| 2366/4114 [2:33:02<1:54:33,  3.93s/it]Training 2/2 epoch (loss 0.0718):  58%|▌| 2367/4114 [2:33:02<1:56:02,  3.99s/it]Training 2/2 epoch (loss 0.1016):  58%|▌| 2367/4114 [2:33:06<1:56:02,  3.99s/it]Training 2/2 epoch (loss 0.1016):  58%|▌| 2368/4114 [2:33:06<1:54:16,  3.93s/it]Training 2/2 epoch (loss 0.0435):  58%|▌| 2368/4114 [2:33:09<1:54:16,  3.93s/it]Training 2/2 epoch (loss 0.0435):  58%|▌| 2369/4114 [2:33:09<1:53:27,  3.90s/it]Training 2/2 epoch (loss 0.1006):  58%|▌| 2369/4114 [2:33:14<1:53:27,  3.90s/it]Training 2/2 epoch (loss 0.1006):  58%|▌| 2370/4114 [2:33:14<1:55:12,  3.96s/it]Training 2/2 epoch (loss 0.0635):  58%|▌| 2370/4114 [2:33:17<1:55:12,  3.96s/it]Training 2/2 epoch (loss 0.0635):  58%|▌| 2371/4114 [2:33:17<1:53:43,  3.92s/it]Training 2/2 epoch (loss 0.0864):  58%|▌| 2371/4114 [2:33:21<1:53:43,  3.92s/it]Training 2/2 epoch (loss 0.0864):  58%|▌| 2372/4114 [2:33:21<1:52:26,  3.87s/it]Training 2/2 epoch (loss 0.0923):  58%|▌| 2372/4114 [2:33:25<1:52:26,  3.87s/it]Training 2/2 epoch (loss 0.0923):  58%|▌| 2373/4114 [2:33:25<1:54:59,  3.96s/it]Training 2/2 epoch (loss 0.0569):  58%|▌| 2373/4114 [2:33:29<1:54:59,  3.96s/it]Training 2/2 epoch (loss 0.0569):  58%|▌| 2374/4114 [2:33:29<1:55:51,  4.00s/it]Training 2/2 epoch (loss 0.1191):  58%|▌| 2374/4114 [2:33:33<1:55:51,  4.00s/it]Training 2/2 epoch (loss 0.1191):  58%|▌| 2375/4114 [2:33:33<1:51:25,  3.84s/it]Training 2/2 epoch (loss 0.0298):  58%|▌| 2375/4114 [2:33:37<1:51:25,  3.84s/it]Training 2/2 epoch (loss 0.0298):  58%|▌| 2376/4114 [2:33:37<1:54:16,  3.95s/it]Training 2/2 epoch (loss 0.0114):  58%|▌| 2376/4114 [2:33:41<1:54:16,  3.95s/it]Training 2/2 epoch (loss 0.0114):  58%|▌| 2377/4114 [2:33:41<1:51:53,  3.87s/it]Training 2/2 epoch (loss 0.0289):  58%|▌| 2377/4114 [2:33:45<1:51:53,  3.87s/it]Training 2/2 epoch (loss 0.0289):  58%|▌| 2378/4114 [2:33:45<1:52:42,  3.90s/it]Training 2/2 epoch (loss 0.0099):  58%|▌| 2378/4114 [2:33:49<1:52:42,  3.90s/it]Training 2/2 epoch (loss 0.0099):  58%|▌| 2379/4114 [2:33:49<1:53:44,  3.93s/it]Training 2/2 epoch (loss 0.0198):  58%|▌| 2379/4114 [2:33:53<1:53:44,  3.93s/it]Training 2/2 epoch (loss 0.0198):  58%|▌| 2380/4114 [2:33:53<1:52:44,  3.90s/it]Training 2/2 epoch (loss 0.1484):  58%|▌| 2380/4114 [2:33:56<1:52:44,  3.90s/it]Training 2/2 epoch (loss 0.1484):  58%|▌| 2381/4114 [2:33:56<1:48:33,  3.76s/it]Training 2/2 epoch (loss 0.0708):  58%|▌| 2381/4114 [2:34:00<1:48:33,  3.76s/it]Training 2/2 epoch (loss 0.0708):  58%|▌| 2382/4114 [2:34:00<1:47:42,  3.73s/it]Training 2/2 epoch (loss 0.0391):  58%|▌| 2382/4114 [2:34:03<1:47:42,  3.73s/it]Training 2/2 epoch (loss 0.0391):  58%|▌| 2383/4114 [2:34:03<1:45:14,  3.65s/it]Training 2/2 epoch (loss 0.0172):  58%|▌| 2383/4114 [2:34:07<1:45:14,  3.65s/it]Training 2/2 epoch (loss 0.0172):  58%|▌| 2384/4114 [2:34:07<1:47:28,  3.73s/it]Training 2/2 epoch (loss 0.0271):  58%|▌| 2384/4114 [2:34:11<1:47:28,  3.73s/it]Training 2/2 epoch (loss 0.0271):  58%|▌| 2385/4114 [2:34:11<1:51:55,  3.88s/it]Training 2/2 epoch (loss 0.0008):  58%|▌| 2385/4114 [2:34:15<1:51:55,  3.88s/it]Training 2/2 epoch (loss 0.0008):  58%|▌| 2386/4114 [2:34:15<1:51:10,  3.86s/it]Training 2/2 epoch (loss 0.0071):  58%|▌| 2386/4114 [2:34:19<1:51:10,  3.86s/it]Training 2/2 epoch (loss 0.0071):  58%|▌| 2387/4114 [2:34:19<1:49:33,  3.81s/it]Training 2/2 epoch (loss 0.1260):  58%|▌| 2387/4114 [2:34:22<1:49:33,  3.81s/it]Training 2/2 epoch (loss 0.1260):  58%|▌| 2388/4114 [2:34:22<1:48:09,  3.76s/it]Training 2/2 epoch (loss 0.0247):  58%|▌| 2388/4114 [2:34:26<1:48:09,  3.76s/it]Training 2/2 epoch (loss 0.0247):  58%|▌| 2389/4114 [2:34:26<1:49:44,  3.82s/it]Training 2/2 epoch (loss 0.1128):  58%|▌| 2389/4114 [2:34:30<1:49:44,  3.82s/it]Training 2/2 epoch (loss 0.1128):  58%|▌| 2390/4114 [2:34:30<1:45:47,  3.68s/it]Training 2/2 epoch (loss 0.1973):  58%|▌| 2390/4114 [2:34:33<1:45:47,  3.68s/it]Training 2/2 epoch (loss 0.1973):  58%|▌| 2391/4114 [2:34:33<1:45:41,  3.68s/it]Training 2/2 epoch (loss 0.3242):  58%|▌| 2391/4114 [2:34:37<1:45:41,  3.68s/it]Training 2/2 epoch (loss 0.3242):  58%|▌| 2392/4114 [2:34:37<1:47:08,  3.73s/it]Training 2/2 epoch (loss 0.0576):  58%|▌| 2392/4114 [2:34:41<1:47:08,  3.73s/it]Training 2/2 epoch (loss 0.0576):  58%|▌| 2393/4114 [2:34:41<1:49:10,  3.81s/it]Training 2/2 epoch (loss 0.0942):  58%|▌| 2393/4114 [2:34:45<1:49:10,  3.81s/it]Training 2/2 epoch (loss 0.0942):  58%|▌| 2394/4114 [2:34:45<1:52:53,  3.94s/it]Training 2/2 epoch (loss 0.0140):  58%|▌| 2394/4114 [2:34:49<1:52:53,  3.94s/it]Training 2/2 epoch (loss 0.0140):  58%|▌| 2395/4114 [2:34:49<1:51:53,  3.91s/it]Training 2/2 epoch (loss 0.0598):  58%|▌| 2395/4114 [2:34:53<1:51:53,  3.91s/it]Training 2/2 epoch (loss 0.0598):  58%|▌| 2396/4114 [2:34:53<1:52:25,  3.93s/it]Training 2/2 epoch (loss 0.0947):  58%|▌| 2396/4114 [2:34:57<1:52:25,  3.93s/it]Training 2/2 epoch (loss 0.0947):  58%|▌| 2397/4114 [2:34:57<1:53:54,  3.98s/it]Training 2/2 epoch (loss 0.0986):  58%|▌| 2397/4114 [2:35:01<1:53:54,  3.98s/it]Training 2/2 epoch (loss 0.0986):  58%|▌| 2398/4114 [2:35:01<1:51:07,  3.89s/it]Training 2/2 epoch (loss 0.1914):  58%|▌| 2398/4114 [2:35:05<1:51:07,  3.89s/it]Training 2/2 epoch (loss 0.1914):  58%|▌| 2399/4114 [2:35:05<1:51:10,  3.89s/it]Training 2/2 epoch (loss 0.0132):  58%|▌| 2399/4114 [2:35:09<1:51:10,  3.89s/it]Training 2/2 epoch (loss 0.0132):  58%|▌| 2400/4114 [2:35:09<1:53:56,  3.99s/it]Training 2/2 epoch (loss 0.0030):  58%|▌| 2400/4114 [2:35:13<1:53:56,  3.99s/it]Training 2/2 epoch (loss 0.0030):  58%|▌| 2401/4114 [2:35:13<1:53:28,  3.97s/it]Training 2/2 epoch (loss 0.2021):  58%|▌| 2401/4114 [2:35:17<1:53:28,  3.97s/it]Training 2/2 epoch (loss 0.2021):  58%|▌| 2402/4114 [2:35:17<1:53:03,  3.96s/it]Training 2/2 epoch (loss 0.0747):  58%|▌| 2402/4114 [2:35:21<1:53:03,  3.96s/it]Training 2/2 epoch (loss 0.0747):  58%|▌| 2403/4114 [2:35:21<1:55:16,  4.04s/it]Training 2/2 epoch (loss 0.0610):  58%|▌| 2403/4114 [2:35:25<1:55:16,  4.04s/it]Training 2/2 epoch (loss 0.0610):  58%|▌| 2404/4114 [2:35:25<1:49:23,  3.84s/it]Training 2/2 epoch (loss 0.0884):  58%|▌| 2404/4114 [2:35:29<1:49:23,  3.84s/it]Training 2/2 epoch (loss 0.0884):  58%|▌| 2405/4114 [2:35:29<1:50:07,  3.87s/it]Training 2/2 epoch (loss 0.0432):  58%|▌| 2405/4114 [2:35:33<1:50:07,  3.87s/it]Training 2/2 epoch (loss 0.0432):  58%|▌| 2406/4114 [2:35:33<1:52:22,  3.95s/it]Training 2/2 epoch (loss 0.0129):  58%|▌| 2406/4114 [2:35:37<1:52:22,  3.95s/it]Training 2/2 epoch (loss 0.0129):  59%|▌| 2407/4114 [2:35:37<1:52:35,  3.96s/it]Training 2/2 epoch (loss 0.0918):  59%|▌| 2407/4114 [2:35:40<1:52:35,  3.96s/it]Training 2/2 epoch (loss 0.0918):  59%|▌| 2408/4114 [2:35:40<1:50:48,  3.90s/it]Training 2/2 epoch (loss 0.0796):  59%|▌| 2408/4114 [2:35:44<1:50:48,  3.90s/it]Training 2/2 epoch (loss 0.0796):  59%|▌| 2409/4114 [2:35:44<1:52:04,  3.94s/it]Training 2/2 epoch (loss 0.0098):  59%|▌| 2409/4114 [2:35:48<1:52:04,  3.94s/it]Training 2/2 epoch (loss 0.0098):  59%|▌| 2410/4114 [2:35:48<1:49:41,  3.86s/it]Training 2/2 epoch (loss 0.3066):  59%|▌| 2410/4114 [2:35:52<1:49:41,  3.86s/it]Training 2/2 epoch (loss 0.3066):  59%|▌| 2411/4114 [2:35:52<1:50:14,  3.88s/it]Training 2/2 epoch (loss 0.0087):  59%|▌| 2411/4114 [2:35:56<1:50:14,  3.88s/it]Training 2/2 epoch (loss 0.0087):  59%|▌| 2412/4114 [2:35:56<1:46:43,  3.76s/it]Training 2/2 epoch (loss 0.0154):  59%|▌| 2412/4114 [2:35:59<1:46:43,  3.76s/it]Training 2/2 epoch (loss 0.0154):  59%|▌| 2413/4114 [2:35:59<1:46:59,  3.77s/it]Training 2/2 epoch (loss 0.2500):  59%|▌| 2413/4114 [2:36:03<1:46:59,  3.77s/it]Training 2/2 epoch (loss 0.2500):  59%|▌| 2414/4114 [2:36:03<1:48:27,  3.83s/it]Training 2/2 epoch (loss 0.0654):  59%|▌| 2414/4114 [2:36:07<1:48:27,  3.83s/it]Training 2/2 epoch (loss 0.0654):  59%|▌| 2415/4114 [2:36:07<1:46:43,  3.77s/it]Training 2/2 epoch (loss 0.0179):  59%|▌| 2415/4114 [2:36:11<1:46:43,  3.77s/it]Training 2/2 epoch (loss 0.0179):  59%|▌| 2416/4114 [2:36:11<1:46:48,  3.77s/it]Training 2/2 epoch (loss 0.1187):  59%|▌| 2416/4114 [2:36:15<1:46:48,  3.77s/it]Training 2/2 epoch (loss 0.1187):  59%|▌| 2417/4114 [2:36:15<1:47:35,  3.80s/it]Training 2/2 epoch (loss 0.0757):  59%|▌| 2417/4114 [2:36:18<1:47:35,  3.80s/it]Training 2/2 epoch (loss 0.0757):  59%|▌| 2418/4114 [2:36:18<1:46:39,  3.77s/it]Training 2/2 epoch (loss 0.0322):  59%|▌| 2418/4114 [2:36:22<1:46:39,  3.77s/it]Training 2/2 epoch (loss 0.0322):  59%|▌| 2419/4114 [2:36:22<1:47:57,  3.82s/it]Training 2/2 epoch (loss 0.0237):  59%|▌| 2419/4114 [2:36:26<1:47:57,  3.82s/it]Training 2/2 epoch (loss 0.0237):  59%|▌| 2420/4114 [2:36:26<1:48:52,  3.86s/it]Training 2/2 epoch (loss 0.0311):  59%|▌| 2420/4114 [2:36:30<1:48:52,  3.86s/it]Training 2/2 epoch (loss 0.0311):  59%|▌| 2421/4114 [2:36:30<1:47:42,  3.82s/it]Training 2/2 epoch (loss 0.0457):  59%|▌| 2421/4114 [2:36:33<1:47:42,  3.82s/it]Training 2/2 epoch (loss 0.0457):  59%|▌| 2422/4114 [2:36:33<1:44:06,  3.69s/it]Training 2/2 epoch (loss 0.0242):  59%|▌| 2422/4114 [2:36:37<1:44:06,  3.69s/it]Training 2/2 epoch (loss 0.0242):  59%|▌| 2423/4114 [2:36:37<1:46:01,  3.76s/it]Training 2/2 epoch (loss 0.0586):  59%|▌| 2423/4114 [2:36:41<1:46:01,  3.76s/it]Training 2/2 epoch (loss 0.0586):  59%|▌| 2424/4114 [2:36:41<1:45:35,  3.75s/it]Training 2/2 epoch (loss 0.1523):  59%|▌| 2424/4114 [2:36:45<1:45:35,  3.75s/it]Training 2/2 epoch (loss 0.1523):  59%|▌| 2425/4114 [2:36:45<1:47:45,  3.83s/it]Training 2/2 epoch (loss 0.0781):  59%|▌| 2425/4114 [2:36:49<1:47:45,  3.83s/it]Training 2/2 epoch (loss 0.0781):  59%|▌| 2426/4114 [2:36:49<1:48:16,  3.85s/it]Training 2/2 epoch (loss 0.0378):  59%|▌| 2426/4114 [2:36:53<1:48:16,  3.85s/it]Training 2/2 epoch (loss 0.0378):  59%|▌| 2427/4114 [2:36:53<1:51:33,  3.97s/it]Training 2/2 epoch (loss 0.2598):  59%|▌| 2427/4114 [2:36:57<1:51:33,  3.97s/it]Training 2/2 epoch (loss 0.2598):  59%|▌| 2428/4114 [2:36:57<1:50:39,  3.94s/it]Training 2/2 epoch (loss 0.2207):  59%|▌| 2428/4114 [2:37:01<1:50:39,  3.94s/it]Training 2/2 epoch (loss 0.2207):  59%|▌| 2429/4114 [2:37:01<1:49:27,  3.90s/it]Training 2/2 epoch (loss 0.0649):  59%|▌| 2429/4114 [2:37:05<1:49:27,  3.90s/it]Training 2/2 epoch (loss 0.0649):  59%|▌| 2430/4114 [2:37:05<1:50:24,  3.93s/it]Training 2/2 epoch (loss 0.0840):  59%|▌| 2430/4114 [2:37:09<1:50:24,  3.93s/it]Training 2/2 epoch (loss 0.0840):  59%|▌| 2431/4114 [2:37:09<1:48:50,  3.88s/it]Training 2/2 epoch (loss 0.1182):  59%|▌| 2431/4114 [2:37:12<1:48:50,  3.88s/it]Training 2/2 epoch (loss 0.1182):  59%|▌| 2432/4114 [2:37:12<1:47:08,  3.82s/it]Training 2/2 epoch (loss 0.2539):  59%|▌| 2432/4114 [2:37:16<1:47:08,  3.82s/it]Training 2/2 epoch (loss 0.2539):  59%|▌| 2433/4114 [2:37:16<1:49:46,  3.92s/it]Training 2/2 epoch (loss 0.2324):  59%|▌| 2433/4114 [2:37:20<1:49:46,  3.92s/it]Training 2/2 epoch (loss 0.2324):  59%|▌| 2434/4114 [2:37:20<1:49:48,  3.92s/it]Training 2/2 epoch (loss 0.0554):  59%|▌| 2434/4114 [2:37:24<1:49:48,  3.92s/it]Training 2/2 epoch (loss 0.0554):  59%|▌| 2435/4114 [2:37:24<1:48:13,  3.87s/it]Training 2/2 epoch (loss 0.1816):  59%|▌| 2435/4114 [2:37:28<1:48:13,  3.87s/it]Training 2/2 epoch (loss 0.1816):  59%|▌| 2436/4114 [2:37:28<1:45:01,  3.76s/it]Training 2/2 epoch (loss 0.1064):  59%|▌| 2436/4114 [2:37:31<1:45:01,  3.76s/it]Training 2/2 epoch (loss 0.1064):  59%|▌| 2437/4114 [2:37:31<1:42:19,  3.66s/it]Training 2/2 epoch (loss 0.1416):  59%|▌| 2437/4114 [2:37:35<1:42:19,  3.66s/it]Training 2/2 epoch (loss 0.1416):  59%|▌| 2438/4114 [2:37:35<1:45:55,  3.79s/it]Training 2/2 epoch (loss 0.1895):  59%|▌| 2438/4114 [2:37:39<1:45:55,  3.79s/it]Training 2/2 epoch (loss 0.1895):  59%|▌| 2439/4114 [2:37:39<1:47:14,  3.84s/it]Training 2/2 epoch (loss 0.0583):  59%|▌| 2439/4114 [2:37:43<1:47:14,  3.84s/it]Training 2/2 epoch (loss 0.0583):  59%|▌| 2440/4114 [2:37:43<1:46:30,  3.82s/it]Training 2/2 epoch (loss 0.0986):  59%|▌| 2440/4114 [2:37:47<1:46:30,  3.82s/it]Training 2/2 epoch (loss 0.0986):  59%|▌| 2441/4114 [2:37:47<1:46:21,  3.81s/it]Training 2/2 epoch (loss 0.0376):  59%|▌| 2441/4114 [2:37:51<1:46:21,  3.81s/it]Training 2/2 epoch (loss 0.0376):  59%|▌| 2442/4114 [2:37:51<1:48:21,  3.89s/it]Training 2/2 epoch (loss 0.0544):  59%|▌| 2442/4114 [2:37:54<1:48:21,  3.89s/it]Training 2/2 epoch (loss 0.0544):  59%|▌| 2443/4114 [2:37:54<1:47:09,  3.85s/it]Training 2/2 epoch (loss 0.0442):  59%|▌| 2443/4114 [2:37:58<1:47:09,  3.85s/it]Training 2/2 epoch (loss 0.0442):  59%|▌| 2444/4114 [2:37:58<1:46:50,  3.84s/it]Training 2/2 epoch (loss 0.1348):  59%|▌| 2444/4114 [2:38:02<1:46:50,  3.84s/it]Training 2/2 epoch (loss 0.1348):  59%|▌| 2445/4114 [2:38:02<1:49:41,  3.94s/it]Training 2/2 epoch (loss 0.0447):  59%|▌| 2445/4114 [2:38:06<1:49:41,  3.94s/it]Training 2/2 epoch (loss 0.0447):  59%|▌| 2446/4114 [2:38:06<1:49:31,  3.94s/it]Training 2/2 epoch (loss 0.1079):  59%|▌| 2446/4114 [2:38:10<1:49:31,  3.94s/it]Training 2/2 epoch (loss 0.1079):  59%|▌| 2447/4114 [2:38:10<1:49:51,  3.95s/it]Training 2/2 epoch (loss 0.0737):  59%|▌| 2447/4114 [2:38:14<1:49:51,  3.95s/it]Training 2/2 epoch (loss 0.0737):  60%|▌| 2448/4114 [2:38:14<1:44:16,  3.76s/it]Training 2/2 epoch (loss 0.1143):  60%|▌| 2448/4114 [2:38:17<1:44:16,  3.76s/it]Training 2/2 epoch (loss 0.1143):  60%|▌| 2449/4114 [2:38:17<1:43:34,  3.73s/it]Training 2/2 epoch (loss 0.0825):  60%|▌| 2449/4114 [2:38:21<1:43:34,  3.73s/it]Training 2/2 epoch (loss 0.0825):  60%|▌| 2450/4114 [2:38:21<1:40:39,  3.63s/it]Training 2/2 epoch (loss 0.0498):  60%|▌| 2450/4114 [2:38:24<1:40:39,  3.63s/it]Training 2/2 epoch (loss 0.0498):  60%|▌| 2451/4114 [2:38:24<1:40:46,  3.64s/it]Training 2/2 epoch (loss 0.0356):  60%|▌| 2451/4114 [2:38:28<1:40:46,  3.64s/it]Training 2/2 epoch (loss 0.0356):  60%|▌| 2452/4114 [2:38:28<1:42:35,  3.70s/it]Training 2/2 epoch (loss 0.2129):  60%|▌| 2452/4114 [2:38:32<1:42:35,  3.70s/it]Training 2/2 epoch (loss 0.2129):  60%|▌| 2453/4114 [2:38:32<1:44:11,  3.76s/it]Training 2/2 epoch (loss 0.0605):  60%|▌| 2453/4114 [2:38:36<1:44:11,  3.76s/it]Training 2/2 epoch (loss 0.0605):  60%|▌| 2454/4114 [2:38:36<1:45:54,  3.83s/it]Training 2/2 epoch (loss 0.0830):  60%|▌| 2454/4114 [2:38:40<1:45:54,  3.83s/it]Training 2/2 epoch (loss 0.0830):  60%|▌| 2455/4114 [2:38:40<1:47:30,  3.89s/it]Training 2/2 epoch (loss 0.0854):  60%|▌| 2455/4114 [2:38:44<1:47:30,  3.89s/it]Training 2/2 epoch (loss 0.0854):  60%|▌| 2456/4114 [2:38:44<1:46:56,  3.87s/it]Training 2/2 epoch (loss 0.0654):  60%|▌| 2456/4114 [2:38:48<1:46:56,  3.87s/it]Training 2/2 epoch (loss 0.0654):  60%|▌| 2457/4114 [2:38:48<1:45:24,  3.82s/it]Training 2/2 epoch (loss 0.0894):  60%|▌| 2457/4114 [2:38:51<1:45:24,  3.82s/it]Training 2/2 epoch (loss 0.0894):  60%|▌| 2458/4114 [2:38:51<1:40:45,  3.65s/it]Training 2/2 epoch (loss 0.0432):  60%|▌| 2458/4114 [2:38:55<1:40:45,  3.65s/it]Training 2/2 epoch (loss 0.0432):  60%|▌| 2459/4114 [2:38:55<1:42:28,  3.72s/it]Training 2/2 epoch (loss 0.0168):  60%|▌| 2459/4114 [2:38:58<1:42:28,  3.72s/it]Training 2/2 epoch (loss 0.0168):  60%|▌| 2460/4114 [2:38:58<1:40:30,  3.65s/it]Training 2/2 epoch (loss 0.0376):  60%|▌| 2460/4114 [2:39:02<1:40:30,  3.65s/it]Training 2/2 epoch (loss 0.0376):  60%|▌| 2461/4114 [2:39:02<1:41:52,  3.70s/it]Training 2/2 epoch (loss 0.1436):  60%|▌| 2461/4114 [2:39:06<1:41:52,  3.70s/it]Training 2/2 epoch (loss 0.1436):  60%|▌| 2462/4114 [2:39:06<1:44:30,  3.80s/it]Training 2/2 epoch (loss 0.0374):  60%|▌| 2462/4114 [2:39:10<1:44:30,  3.80s/it]Training 2/2 epoch (loss 0.0374):  60%|▌| 2463/4114 [2:39:10<1:45:07,  3.82s/it]Training 2/2 epoch (loss 0.0226):  60%|▌| 2463/4114 [2:39:14<1:45:07,  3.82s/it]Training 2/2 epoch (loss 0.0226):  60%|▌| 2464/4114 [2:39:14<1:47:01,  3.89s/it]Training 2/2 epoch (loss 0.0791):  60%|▌| 2464/4114 [2:39:18<1:47:01,  3.89s/it]Training 2/2 epoch (loss 0.0791):  60%|▌| 2465/4114 [2:39:18<1:43:32,  3.77s/it]Training 2/2 epoch (loss 0.2021):  60%|▌| 2465/4114 [2:39:21<1:43:32,  3.77s/it]Training 2/2 epoch (loss 0.2021):  60%|▌| 2466/4114 [2:39:21<1:41:13,  3.69s/it]Training 2/2 epoch (loss 0.0236):  60%|▌| 2466/4114 [2:39:25<1:41:13,  3.69s/it]Training 2/2 epoch (loss 0.0236):  60%|▌| 2467/4114 [2:39:25<1:42:57,  3.75s/it]Training 2/2 epoch (loss 0.1621):  60%|▌| 2467/4114 [2:39:29<1:42:57,  3.75s/it]Training 2/2 epoch (loss 0.1621):  60%|▌| 2468/4114 [2:39:29<1:45:17,  3.84s/it]Training 2/2 epoch (loss 0.0771):  60%|▌| 2468/4114 [2:39:33<1:45:17,  3.84s/it]Training 2/2 epoch (loss 0.0771):  60%|▌| 2469/4114 [2:39:33<1:45:39,  3.85s/it]Training 2/2 epoch (loss 0.0150):  60%|▌| 2469/4114 [2:39:37<1:45:39,  3.85s/it]Training 2/2 epoch (loss 0.0150):  60%|▌| 2470/4114 [2:39:37<1:47:25,  3.92s/it]Training 2/2 epoch (loss 0.0166):  60%|▌| 2470/4114 [2:39:41<1:47:25,  3.92s/it]Training 2/2 epoch (loss 0.0166):  60%|▌| 2471/4114 [2:39:41<1:47:15,  3.92s/it]Training 2/2 epoch (loss 0.0053):  60%|▌| 2471/4114 [2:39:45<1:47:15,  3.92s/it]Training 2/2 epoch (loss 0.0053):  60%|▌| 2472/4114 [2:39:45<1:50:43,  4.05s/it]Training 2/2 epoch (loss 0.0075):  60%|▌| 2472/4114 [2:39:49<1:50:43,  4.05s/it]Training 2/2 epoch (loss 0.0075):  60%|▌| 2473/4114 [2:39:49<1:49:54,  4.02s/it]Training 2/2 epoch (loss 0.0283):  60%|▌| 2473/4114 [2:39:53<1:49:54,  4.02s/it]Training 2/2 epoch (loss 0.0283):  60%|▌| 2474/4114 [2:39:53<1:48:16,  3.96s/it]Training 2/2 epoch (loss 0.0349):  60%|▌| 2474/4114 [2:39:57<1:48:16,  3.96s/it]Training 2/2 epoch (loss 0.0349):  60%|▌| 2475/4114 [2:39:57<1:50:10,  4.03s/it]Training 2/2 epoch (loss 0.0139):  60%|▌| 2475/4114 [2:40:01<1:50:10,  4.03s/it]Training 2/2 epoch (loss 0.0139):  60%|▌| 2476/4114 [2:40:01<1:49:24,  4.01s/it]Training 2/2 epoch (loss 0.1328):  60%|▌| 2476/4114 [2:40:05<1:49:24,  4.01s/it]Training 2/2 epoch (loss 0.1328):  60%|▌| 2477/4114 [2:40:05<1:48:42,  3.98s/it]Training 2/2 epoch (loss 0.1177):  60%|▌| 2477/4114 [2:40:09<1:48:42,  3.98s/it]Training 2/2 epoch (loss 0.1177):  60%|▌| 2478/4114 [2:40:09<1:45:52,  3.88s/it]Training 2/2 epoch (loss 0.0571):  60%|▌| 2478/4114 [2:40:12<1:45:52,  3.88s/it]Training 2/2 epoch (loss 0.0571):  60%|▌| 2479/4114 [2:40:12<1:44:54,  3.85s/it]Training 2/2 epoch (loss 0.0244):  60%|▌| 2479/4114 [2:40:16<1:44:54,  3.85s/it]Training 2/2 epoch (loss 0.0244):  60%|▌| 2480/4114 [2:40:16<1:41:36,  3.73s/it]Training 2/2 epoch (loss 0.0222):  60%|▌| 2480/4114 [2:40:20<1:41:36,  3.73s/it]Training 2/2 epoch (loss 0.0222):  60%|▌| 2481/4114 [2:40:20<1:40:52,  3.71s/it]Training 2/2 epoch (loss 0.0461):  60%|▌| 2481/4114 [2:40:23<1:40:52,  3.71s/it]Training 2/2 epoch (loss 0.0461):  60%|▌| 2482/4114 [2:40:23<1:41:29,  3.73s/it]Training 2/2 epoch (loss 0.0364):  60%|▌| 2482/4114 [2:40:27<1:41:29,  3.73s/it]Training 2/2 epoch (loss 0.0364):  60%|▌| 2483/4114 [2:40:27<1:41:48,  3.75s/it]Training 2/2 epoch (loss 0.2422):  60%|▌| 2483/4114 [2:40:30<1:41:48,  3.75s/it]Training 2/2 epoch (loss 0.2422):  60%|▌| 2484/4114 [2:40:30<1:38:12,  3.61s/it]Training 2/2 epoch (loss 0.1523):  60%|▌| 2484/4114 [2:40:34<1:38:12,  3.61s/it]Training 2/2 epoch (loss 0.1523):  60%|▌| 2485/4114 [2:40:34<1:39:24,  3.66s/it]Training 2/2 epoch (loss 0.1924):  60%|▌| 2485/4114 [2:40:38<1:39:24,  3.66s/it]Training 2/2 epoch (loss 0.1924):  60%|▌| 2486/4114 [2:40:38<1:40:57,  3.72s/it]Training 2/2 epoch (loss 0.1182):  60%|▌| 2486/4114 [2:40:42<1:40:57,  3.72s/it]Training 2/2 epoch (loss 0.1182):  60%|▌| 2487/4114 [2:40:42<1:42:08,  3.77s/it]Training 2/2 epoch (loss 0.0649):  60%|▌| 2487/4114 [2:40:46<1:42:08,  3.77s/it]Training 2/2 epoch (loss 0.0649):  60%|▌| 2488/4114 [2:40:46<1:43:49,  3.83s/it]Training 2/2 epoch (loss 0.1079):  60%|▌| 2488/4114 [2:40:50<1:43:49,  3.83s/it]Training 2/2 epoch (loss 0.1079):  61%|▌| 2489/4114 [2:40:50<1:44:10,  3.85s/it]Training 2/2 epoch (loss 0.0188):  61%|▌| 2489/4114 [2:40:54<1:44:10,  3.85s/it]Training 2/2 epoch (loss 0.0188):  61%|▌| 2490/4114 [2:40:54<1:45:39,  3.90s/it]Training 2/2 epoch (loss 0.0576):  61%|▌| 2490/4114 [2:40:58<1:45:39,  3.90s/it]Training 2/2 epoch (loss 0.0576):  61%|▌| 2491/4114 [2:40:58<1:45:19,  3.89s/it]Training 2/2 epoch (loss 0.1514):  61%|▌| 2491/4114 [2:41:02<1:45:19,  3.89s/it]Training 2/2 epoch (loss 0.1514):  61%|▌| 2492/4114 [2:41:02<1:45:10,  3.89s/it]Training 2/2 epoch (loss 0.0266):  61%|▌| 2492/4114 [2:41:06<1:45:10,  3.89s/it]Training 2/2 epoch (loss 0.0266):  61%|▌| 2493/4114 [2:41:06<1:46:17,  3.93s/it]Training 2/2 epoch (loss 0.0505):  61%|▌| 2493/4114 [2:41:09<1:46:17,  3.93s/it]Training 2/2 epoch (loss 0.0505):  61%|▌| 2494/4114 [2:41:09<1:45:25,  3.90s/it]Training 2/2 epoch (loss 0.0703):  61%|▌| 2494/4114 [2:41:13<1:45:25,  3.90s/it]Training 2/2 epoch (loss 0.0703):  61%|▌| 2495/4114 [2:41:13<1:45:53,  3.92s/it]Training 2/2 epoch (loss 0.0957):  61%|▌| 2495/4114 [2:41:18<1:45:53,  3.92s/it]Training 2/2 epoch (loss 0.0957):  61%|▌| 2496/4114 [2:41:18<1:48:24,  4.02s/it]Training 2/2 epoch (loss 0.0542):  61%|▌| 2496/4114 [2:41:21<1:48:24,  4.02s/it]Training 2/2 epoch (loss 0.0542):  61%|▌| 2497/4114 [2:41:21<1:42:32,  3.81s/it]Training 2/2 epoch (loss 0.0459):  61%|▌| 2497/4114 [2:41:25<1:42:32,  3.81s/it]Training 2/2 epoch (loss 0.0459):  61%|▌| 2498/4114 [2:41:25<1:43:55,  3.86s/it]Training 2/2 epoch (loss 0.0535):  61%|▌| 2498/4114 [2:41:28<1:43:55,  3.86s/it]Training 2/2 epoch (loss 0.0535):  61%|▌| 2499/4114 [2:41:28<1:40:54,  3.75s/it]Training 2/2 epoch (loss 0.0050):  61%|▌| 2499/4114 [2:41:32<1:40:54,  3.75s/it]Training 2/2 epoch (loss 0.0050):  61%|▌| 2500/4114 [2:41:32<1:43:02,  3.83s/it]Training 2/2 epoch (loss 0.0238):  61%|▌| 2500/4114 [2:41:36<1:43:02,  3.83s/it]Training 2/2 epoch (loss 0.0238):  61%|▌| 2501/4114 [2:41:36<1:39:27,  3.70s/it]Training 2/2 epoch (loss 0.0688):  61%|▌| 2501/4114 [2:41:40<1:39:27,  3.70s/it]Training 2/2 epoch (loss 0.0688):  61%|▌| 2502/4114 [2:41:40<1:40:46,  3.75s/it]Training 2/2 epoch (loss 0.0089):  61%|▌| 2502/4114 [2:41:43<1:40:46,  3.75s/it]Training 2/2 epoch (loss 0.0089):  61%|▌| 2503/4114 [2:41:43<1:40:35,  3.75s/it]Training 2/2 epoch (loss 0.0339):  61%|▌| 2503/4114 [2:41:48<1:40:35,  3.75s/it]Training 2/2 epoch (loss 0.0339):  61%|▌| 2504/4114 [2:41:48<1:43:29,  3.86s/it]Training 2/2 epoch (loss 0.0486):  61%|▌| 2504/4114 [2:41:52<1:43:29,  3.86s/it]Training 2/2 epoch (loss 0.0486):  61%|▌| 2505/4114 [2:41:52<1:44:28,  3.90s/it]Training 2/2 epoch (loss 0.0253):  61%|▌| 2505/4114 [2:41:55<1:44:28,  3.90s/it]Training 2/2 epoch (loss 0.0253):  61%|▌| 2506/4114 [2:41:55<1:43:05,  3.85s/it]Training 2/2 epoch (loss 0.0264):  61%|▌| 2506/4114 [2:41:59<1:43:05,  3.85s/it]Training 2/2 epoch (loss 0.0264):  61%|▌| 2507/4114 [2:41:59<1:42:19,  3.82s/it]Training 2/2 epoch (loss 0.0142):  61%|▌| 2507/4114 [2:42:03<1:42:19,  3.82s/it]Training 2/2 epoch (loss 0.0142):  61%|▌| 2508/4114 [2:42:03<1:42:49,  3.84s/it]Training 2/2 epoch (loss 0.0613):  61%|▌| 2508/4114 [2:42:06<1:42:49,  3.84s/it]Training 2/2 epoch (loss 0.0613):  61%|▌| 2509/4114 [2:42:06<1:39:54,  3.74s/it]Training 2/2 epoch (loss 0.0771):  61%|▌| 2509/4114 [2:42:10<1:39:54,  3.74s/it]Training 2/2 epoch (loss 0.0771):  61%|▌| 2510/4114 [2:42:10<1:42:11,  3.82s/it]Training 2/2 epoch (loss 0.1118):  61%|▌| 2510/4114 [2:42:14<1:42:11,  3.82s/it]Training 2/2 epoch (loss 0.1118):  61%|▌| 2511/4114 [2:42:14<1:41:03,  3.78s/it]Training 2/2 epoch (loss 0.1035):  61%|▌| 2511/4114 [2:42:18<1:41:03,  3.78s/it]Training 2/2 epoch (loss 0.1035):  61%|▌| 2512/4114 [2:42:18<1:40:55,  3.78s/it]Training 2/2 epoch (loss 0.1494):  61%|▌| 2512/4114 [2:42:22<1:40:55,  3.78s/it]Training 2/2 epoch (loss 0.1494):  61%|▌| 2513/4114 [2:42:22<1:41:08,  3.79s/it]Training 2/2 epoch (loss 0.0277):  61%|▌| 2513/4114 [2:42:26<1:41:08,  3.79s/it]Training 2/2 epoch (loss 0.0277):  61%|▌| 2514/4114 [2:42:26<1:43:43,  3.89s/it]Training 2/2 epoch (loss 0.0398):  61%|▌| 2514/4114 [2:42:29<1:43:43,  3.89s/it]Training 2/2 epoch (loss 0.0398):  61%|▌| 2515/4114 [2:42:29<1:39:41,  3.74s/it]Training 2/2 epoch (loss 0.0079):  61%|▌| 2515/4114 [2:42:33<1:39:41,  3.74s/it]Training 2/2 epoch (loss 0.0079):  61%|▌| 2516/4114 [2:42:33<1:40:58,  3.79s/it]Training 2/2 epoch (loss 0.1299):  61%|▌| 2516/4114 [2:42:37<1:40:58,  3.79s/it]Training 2/2 epoch (loss 0.1299):  61%|▌| 2517/4114 [2:42:37<1:43:12,  3.88s/it]Training 2/2 epoch (loss 0.0674):  61%|▌| 2517/4114 [2:42:41<1:43:12,  3.88s/it]Training 2/2 epoch (loss 0.0674):  61%|▌| 2518/4114 [2:42:41<1:42:22,  3.85s/it]Training 2/2 epoch (loss 0.0786):  61%|▌| 2518/4114 [2:42:45<1:42:22,  3.85s/it]Training 2/2 epoch (loss 0.0786):  61%|▌| 2519/4114 [2:42:45<1:44:34,  3.93s/it]Training 2/2 epoch (loss 0.0713):  61%|▌| 2519/4114 [2:42:49<1:44:34,  3.93s/it]Training 2/2 epoch (loss 0.0713):  61%|▌| 2520/4114 [2:42:49<1:46:15,  4.00s/it]Training 2/2 epoch (loss 0.0040):  61%|▌| 2520/4114 [2:42:53<1:46:15,  4.00s/it]Training 2/2 epoch (loss 0.0040):  61%|▌| 2521/4114 [2:42:53<1:44:29,  3.94s/it]Training 2/2 epoch (loss 0.0151):  61%|▌| 2521/4114 [2:42:57<1:44:29,  3.94s/it]Training 2/2 epoch (loss 0.0151):  61%|▌| 2522/4114 [2:42:57<1:44:03,  3.92s/it]Training 2/2 epoch (loss 0.0757):  61%|▌| 2522/4114 [2:43:01<1:44:03,  3.92s/it]Training 2/2 epoch (loss 0.0757):  61%|▌| 2523/4114 [2:43:01<1:46:16,  4.01s/it]Training 2/2 epoch (loss 0.0859):  61%|▌| 2523/4114 [2:43:05<1:46:16,  4.01s/it]Training 2/2 epoch (loss 0.0859):  61%|▌| 2524/4114 [2:43:05<1:44:33,  3.95s/it]Training 2/2 epoch (loss 0.0884):  61%|▌| 2524/4114 [2:43:09<1:44:33,  3.95s/it]Training 2/2 epoch (loss 0.0884):  61%|▌| 2525/4114 [2:43:09<1:44:57,  3.96s/it]Training 2/2 epoch (loss 0.1260):  61%|▌| 2525/4114 [2:43:13<1:44:57,  3.96s/it]Training 2/2 epoch (loss 0.1260):  61%|▌| 2526/4114 [2:43:13<1:46:01,  4.01s/it]Training 2/2 epoch (loss 0.1016):  61%|▌| 2526/4114 [2:43:17<1:46:01,  4.01s/it]Training 2/2 epoch (loss 0.1016):  61%|▌| 2527/4114 [2:43:17<1:45:36,  3.99s/it]Training 2/2 epoch (loss 0.3047):  61%|▌| 2527/4114 [2:43:21<1:45:36,  3.99s/it]Training 2/2 epoch (loss 0.3047):  61%|▌| 2528/4114 [2:43:21<1:43:19,  3.91s/it]Training 2/2 epoch (loss 0.4180):  61%|▌| 2528/4114 [2:43:25<1:43:19,  3.91s/it]Training 2/2 epoch (loss 0.4180):  61%|▌| 2529/4114 [2:43:25<1:44:11,  3.94s/it]Training 2/2 epoch (loss 0.0742):  61%|▌| 2529/4114 [2:43:29<1:44:11,  3.94s/it]Training 2/2 epoch (loss 0.0742):  61%|▌| 2530/4114 [2:43:29<1:43:52,  3.93s/it]Training 2/2 epoch (loss 0.0320):  61%|▌| 2530/4114 [2:43:33<1:43:52,  3.93s/it]Training 2/2 epoch (loss 0.0320):  62%|▌| 2531/4114 [2:43:33<1:43:32,  3.92s/it]Training 2/2 epoch (loss 0.1572):  62%|▌| 2531/4114 [2:43:37<1:43:32,  3.92s/it]Training 2/2 epoch (loss 0.1572):  62%|▌| 2532/4114 [2:43:37<1:44:42,  3.97s/it]Training 2/2 epoch (loss 0.1816):  62%|▌| 2532/4114 [2:43:41<1:44:42,  3.97s/it]Training 2/2 epoch (loss 0.1816):  62%|▌| 2533/4114 [2:43:41<1:44:25,  3.96s/it]Training 2/2 epoch (loss 0.1748):  62%|▌| 2533/4114 [2:43:44<1:44:25,  3.96s/it]Training 2/2 epoch (loss 0.1748):  62%|▌| 2534/4114 [2:43:44<1:42:59,  3.91s/it]Training 2/2 epoch (loss 0.0298):  62%|▌| 2534/4114 [2:43:48<1:42:59,  3.91s/it]Training 2/2 epoch (loss 0.0298):  62%|▌| 2535/4114 [2:43:48<1:43:26,  3.93s/it]Training 2/2 epoch (loss 0.0054):  62%|▌| 2535/4114 [2:43:52<1:43:26,  3.93s/it]Training 2/2 epoch (loss 0.0054):  62%|▌| 2536/4114 [2:43:52<1:39:04,  3.77s/it]Training 2/2 epoch (loss 0.0060):  62%|▌| 2536/4114 [2:43:56<1:39:04,  3.77s/it]Training 2/2 epoch (loss 0.0060):  62%|▌| 2537/4114 [2:43:56<1:38:42,  3.76s/it]Training 2/2 epoch (loss 0.2207):  62%|▌| 2537/4114 [2:44:00<1:38:42,  3.76s/it]Training 2/2 epoch (loss 0.2207):  62%|▌| 2538/4114 [2:44:00<1:41:47,  3.88s/it]Training 2/2 epoch (loss 0.1025):  62%|▌| 2538/4114 [2:44:03<1:41:47,  3.88s/it]Training 2/2 epoch (loss 0.1025):  62%|▌| 2539/4114 [2:44:03<1:40:56,  3.85s/it]Training 2/2 epoch (loss 0.0101):  62%|▌| 2539/4114 [2:44:07<1:40:56,  3.85s/it]Training 2/2 epoch (loss 0.0101):  62%|▌| 2540/4114 [2:44:07<1:42:12,  3.90s/it]Training 2/2 epoch (loss 0.0505):  62%|▌| 2540/4114 [2:44:12<1:42:12,  3.90s/it]Training 2/2 epoch (loss 0.0505):  62%|▌| 2541/4114 [2:44:12<1:43:17,  3.94s/it]Training 2/2 epoch (loss 0.0155):  62%|▌| 2541/4114 [2:44:15<1:43:17,  3.94s/it]Training 2/2 epoch (loss 0.0155):  62%|▌| 2542/4114 [2:44:15<1:40:11,  3.82s/it]Training 2/2 epoch (loss 0.1562):  62%|▌| 2542/4114 [2:44:19<1:40:11,  3.82s/it]Training 2/2 epoch (loss 0.1562):  62%|▌| 2543/4114 [2:44:19<1:41:05,  3.86s/it]Training 2/2 epoch (loss 0.0369):  62%|▌| 2543/4114 [2:44:23<1:41:05,  3.86s/it]Training 2/2 epoch (loss 0.0369):  62%|▌| 2544/4114 [2:44:23<1:43:19,  3.95s/it]Training 2/2 epoch (loss 0.0654):  62%|▌| 2544/4114 [2:44:27<1:43:19,  3.95s/it]Training 2/2 epoch (loss 0.0654):  62%|▌| 2545/4114 [2:44:27<1:42:37,  3.92s/it]Training 2/2 epoch (loss 0.0391):  62%|▌| 2545/4114 [2:44:31<1:42:37,  3.92s/it]Training 2/2 epoch (loss 0.0391):  62%|▌| 2546/4114 [2:44:31<1:41:44,  3.89s/it]Training 2/2 epoch (loss 0.0703):  62%|▌| 2546/4114 [2:44:35<1:41:44,  3.89s/it]Training 2/2 epoch (loss 0.0703):  62%|▌| 2547/4114 [2:44:35<1:41:21,  3.88s/it]Training 2/2 epoch (loss 0.0069):  62%|▌| 2547/4114 [2:44:39<1:41:21,  3.88s/it]Training 2/2 epoch (loss 0.0069):  62%|▌| 2548/4114 [2:44:39<1:40:32,  3.85s/it]Training 2/2 epoch (loss 0.0598):  62%|▌| 2548/4114 [2:44:42<1:40:32,  3.85s/it]Training 2/2 epoch (loss 0.0598):  62%|▌| 2549/4114 [2:44:42<1:36:00,  3.68s/it]Training 2/2 epoch (loss 0.0918):  62%|▌| 2549/4114 [2:44:46<1:36:00,  3.68s/it]Training 2/2 epoch (loss 0.0918):  62%|▌| 2550/4114 [2:44:46<1:38:35,  3.78s/it]Training 2/2 epoch (loss 0.0535):  62%|▌| 2550/4114 [2:44:50<1:38:35,  3.78s/it]Training 2/2 epoch (loss 0.0535):  62%|▌| 2551/4114 [2:44:50<1:38:27,  3.78s/it]Training 2/2 epoch (loss 0.0271):  62%|▌| 2551/4114 [2:44:53<1:38:27,  3.78s/it]Training 2/2 epoch (loss 0.0271):  62%|▌| 2552/4114 [2:44:53<1:38:15,  3.77s/it]Training 2/2 epoch (loss 0.0051):  62%|▌| 2552/4114 [2:44:57<1:38:15,  3.77s/it]Training 2/2 epoch (loss 0.0051):  62%|▌| 2553/4114 [2:44:57<1:40:18,  3.86s/it]Training 2/2 epoch (loss 0.0286):  62%|▌| 2553/4114 [2:45:01<1:40:18,  3.86s/it]Training 2/2 epoch (loss 0.0286):  62%|▌| 2554/4114 [2:45:01<1:41:17,  3.90s/it]Training 2/2 epoch (loss 0.0121):  62%|▌| 2554/4114 [2:45:05<1:41:17,  3.90s/it]Training 2/2 epoch (loss 0.0121):  62%|▌| 2555/4114 [2:45:05<1:40:47,  3.88s/it]Training 2/2 epoch (loss 0.0148):  62%|▌| 2555/4114 [2:45:09<1:40:47,  3.88s/it]Training 2/2 epoch (loss 0.0148):  62%|▌| 2556/4114 [2:45:09<1:43:09,  3.97s/it]Training 2/2 epoch (loss 0.0840):  62%|▌| 2556/4114 [2:45:13<1:43:09,  3.97s/it]Training 2/2 epoch (loss 0.0840):  62%|▌| 2557/4114 [2:45:13<1:37:26,  3.76s/it]Training 2/2 epoch (loss 0.0996):  62%|▌| 2557/4114 [2:45:16<1:37:26,  3.76s/it]Training 2/2 epoch (loss 0.0996):  62%|▌| 2558/4114 [2:45:16<1:32:35,  3.57s/it]Training 2/2 epoch (loss 0.0154):  62%|▌| 2558/4114 [2:45:19<1:32:35,  3.57s/it]Training 2/2 epoch (loss 0.0154):  62%|▌| 2559/4114 [2:45:19<1:30:02,  3.47s/it]Training 2/2 epoch (loss 0.1514):  62%|▌| 2559/4114 [2:45:23<1:30:02,  3.47s/it]Training 2/2 epoch (loss 0.1514):  62%|▌| 2560/4114 [2:45:23<1:33:57,  3.63s/it]Training 2/2 epoch (loss 0.0254):  62%|▌| 2560/4114 [2:45:27<1:33:57,  3.63s/it]Training 2/2 epoch (loss 0.0254):  62%|▌| 2561/4114 [2:45:27<1:35:58,  3.71s/it]Training 2/2 epoch (loss 0.0659):  62%|▌| 2561/4114 [2:45:31<1:35:58,  3.71s/it]Training 2/2 epoch (loss 0.0659):  62%|▌| 2562/4114 [2:45:31<1:39:37,  3.85s/it]Training 2/2 epoch (loss 0.0742):  62%|▌| 2562/4114 [2:45:35<1:39:37,  3.85s/it]Training 2/2 epoch (loss 0.0742):  62%|▌| 2563/4114 [2:45:35<1:40:38,  3.89s/it]Training 2/2 epoch (loss 0.0898):  62%|▌| 2563/4114 [2:45:39<1:40:38,  3.89s/it]Training 2/2 epoch (loss 0.0898):  62%|▌| 2564/4114 [2:45:39<1:36:52,  3.75s/it]Training 2/2 epoch (loss 0.0559):  62%|▌| 2564/4114 [2:45:43<1:36:52,  3.75s/it]Training 2/2 epoch (loss 0.0559):  62%|▌| 2565/4114 [2:45:43<1:38:49,  3.83s/it]Training 2/2 epoch (loss 0.0562):  62%|▌| 2565/4114 [2:45:46<1:38:49,  3.83s/it]Training 2/2 epoch (loss 0.0562):  62%|▌| 2566/4114 [2:45:46<1:36:27,  3.74s/it]Training 2/2 epoch (loss 0.0693):  62%|▌| 2566/4114 [2:45:49<1:36:27,  3.74s/it]Training 2/2 epoch (loss 0.0693):  62%|▌| 2567/4114 [2:45:49<1:33:15,  3.62s/it]Training 2/2 epoch (loss 0.1230):  62%|▌| 2567/4114 [2:45:54<1:33:15,  3.62s/it]Training 2/2 epoch (loss 0.1230):  62%|▌| 2568/4114 [2:45:54<1:36:54,  3.76s/it]Training 2/2 epoch (loss 0.0474):  62%|▌| 2568/4114 [2:45:57<1:36:54,  3.76s/it]Training 2/2 epoch (loss 0.0474):  62%|▌| 2569/4114 [2:45:57<1:37:04,  3.77s/it]Training 2/2 epoch (loss 0.0513):  62%|▌| 2569/4114 [2:46:01<1:37:04,  3.77s/it]Training 2/2 epoch (loss 0.0513):  62%|▌| 2570/4114 [2:46:01<1:37:03,  3.77s/it]Training 2/2 epoch (loss 0.0510):  62%|▌| 2570/4114 [2:46:05<1:37:03,  3.77s/it]Training 2/2 epoch (loss 0.0510):  62%|▌| 2571/4114 [2:46:05<1:40:20,  3.90s/it]Training 2/2 epoch (loss 0.2373):  62%|▌| 2571/4114 [2:46:09<1:40:20,  3.90s/it]Training 2/2 epoch (loss 0.2373):  63%|▋| 2572/4114 [2:46:09<1:40:30,  3.91s/it]Training 2/2 epoch (loss 0.0505):  63%|▋| 2572/4114 [2:46:13<1:40:30,  3.91s/it]Training 2/2 epoch (loss 0.0505):  63%|▋| 2573/4114 [2:46:13<1:39:23,  3.87s/it]Training 2/2 epoch (loss 0.0162):  63%|▋| 2573/4114 [2:46:17<1:39:23,  3.87s/it]Training 2/2 epoch (loss 0.0162):  63%|▋| 2574/4114 [2:46:17<1:40:52,  3.93s/it]Training 2/2 epoch (loss 0.0938):  63%|▋| 2574/4114 [2:46:21<1:40:52,  3.93s/it]Training 2/2 epoch (loss 0.0938):  63%|▋| 2575/4114 [2:46:21<1:39:30,  3.88s/it]Training 2/2 epoch (loss 0.0530):  63%|▋| 2575/4114 [2:46:25<1:39:30,  3.88s/it]Training 2/2 epoch (loss 0.0530):  63%|▋| 2576/4114 [2:46:25<1:40:08,  3.91s/it]Training 2/2 epoch (loss 0.0220):  63%|▋| 2576/4114 [2:46:29<1:40:08,  3.91s/it]Training 2/2 epoch (loss 0.0220):  63%|▋| 2577/4114 [2:46:29<1:42:16,  3.99s/it]Training 2/2 epoch (loss 0.0349):  63%|▋| 2577/4114 [2:46:32<1:42:16,  3.99s/it]Training 2/2 epoch (loss 0.0349):  63%|▋| 2578/4114 [2:46:32<1:38:03,  3.83s/it]Training 2/2 epoch (loss 0.0466):  63%|▋| 2578/4114 [2:46:36<1:38:03,  3.83s/it]Training 2/2 epoch (loss 0.0466):  63%|▋| 2579/4114 [2:46:36<1:38:26,  3.85s/it]Training 2/2 epoch (loss 0.0176):  63%|▋| 2579/4114 [2:46:41<1:38:26,  3.85s/it]Training 2/2 epoch (loss 0.0176):  63%|▋| 2580/4114 [2:46:41<1:41:28,  3.97s/it]Training 2/2 epoch (loss 0.1963):  63%|▋| 2580/4114 [2:46:44<1:41:28,  3.97s/it]Training 2/2 epoch (loss 0.1963):  63%|▋| 2581/4114 [2:46:44<1:39:04,  3.88s/it]Training 2/2 epoch (loss 0.0330):  63%|▋| 2581/4114 [2:46:48<1:39:04,  3.88s/it]Training 2/2 epoch (loss 0.0330):  63%|▋| 2582/4114 [2:46:48<1:38:57,  3.88s/it]Training 2/2 epoch (loss 0.1074):  63%|▋| 2582/4114 [2:46:52<1:38:57,  3.88s/it]Training 2/2 epoch (loss 0.1074):  63%|▋| 2583/4114 [2:46:52<1:41:49,  3.99s/it]Training 2/2 epoch (loss 0.0186):  63%|▋| 2583/4114 [2:46:56<1:41:49,  3.99s/it]Training 2/2 epoch (loss 0.0186):  63%|▋| 2584/4114 [2:46:56<1:40:11,  3.93s/it]Training 2/2 epoch (loss 0.0991):  63%|▋| 2584/4114 [2:47:00<1:40:11,  3.93s/it]Training 2/2 epoch (loss 0.0991):  63%|▋| 2585/4114 [2:47:00<1:36:12,  3.78s/it]Training 2/2 epoch (loss 0.0840):  63%|▋| 2585/4114 [2:47:03<1:36:12,  3.78s/it]Training 2/2 epoch (loss 0.0840):  63%|▋| 2586/4114 [2:47:03<1:37:10,  3.82s/it]Training 2/2 epoch (loss 0.1157):  63%|▋| 2586/4114 [2:47:06<1:37:10,  3.82s/it]Training 2/2 epoch (loss 0.1157):  63%|▋| 2587/4114 [2:47:06<1:28:18,  3.47s/it]Training 2/2 epoch (loss 0.1206):  63%|▋| 2587/4114 [2:47:10<1:28:18,  3.47s/it]Training 2/2 epoch (loss 0.1206):  63%|▋| 2588/4114 [2:47:10<1:30:59,  3.58s/it]Training 2/2 epoch (loss 0.0967):  63%|▋| 2588/4114 [2:47:14<1:30:59,  3.58s/it]Training 2/2 epoch (loss 0.0967):  63%|▋| 2589/4114 [2:47:14<1:35:02,  3.74s/it]Training 2/2 epoch (loss 0.0859):  63%|▋| 2589/4114 [2:47:18<1:35:02,  3.74s/it]Training 2/2 epoch (loss 0.0859):  63%|▋| 2590/4114 [2:47:18<1:37:09,  3.82s/it]Training 2/2 epoch (loss 0.0537):  63%|▋| 2590/4114 [2:47:22<1:37:09,  3.82s/it]Training 2/2 epoch (loss 0.0537):  63%|▋| 2591/4114 [2:47:22<1:36:27,  3.80s/it]Training 2/2 epoch (loss 0.0796):  63%|▋| 2591/4114 [2:47:25<1:36:27,  3.80s/it]Training 2/2 epoch (loss 0.0796):  63%|▋| 2592/4114 [2:47:25<1:35:04,  3.75s/it]Training 2/2 epoch (loss 0.0559):  63%|▋| 2592/4114 [2:47:30<1:35:04,  3.75s/it]Training 2/2 epoch (loss 0.0559):  63%|▋| 2593/4114 [2:47:30<1:37:11,  3.83s/it]Training 2/2 epoch (loss 0.0275):  63%|▋| 2593/4114 [2:47:33<1:37:11,  3.83s/it]Training 2/2 epoch (loss 0.0275):  63%|▋| 2594/4114 [2:47:33<1:38:10,  3.88s/it]Training 2/2 epoch (loss 0.1055):  63%|▋| 2594/4114 [2:47:37<1:38:10,  3.88s/it]Training 2/2 epoch (loss 0.1055):  63%|▋| 2595/4114 [2:47:37<1:39:10,  3.92s/it]Training 2/2 epoch (loss 0.0732):  63%|▋| 2595/4114 [2:47:42<1:39:10,  3.92s/it]Training 2/2 epoch (loss 0.0732):  63%|▋| 2596/4114 [2:47:42<1:39:54,  3.95s/it]Training 2/2 epoch (loss 0.0815):  63%|▋| 2596/4114 [2:47:45<1:39:54,  3.95s/it]Training 2/2 epoch (loss 0.0815):  63%|▋| 2597/4114 [2:47:45<1:36:03,  3.80s/it]Training 2/2 epoch (loss 0.2275):  63%|▋| 2597/4114 [2:47:49<1:36:03,  3.80s/it]Training 2/2 epoch (loss 0.2275):  63%|▋| 2598/4114 [2:47:49<1:38:35,  3.90s/it]Training 2/2 epoch (loss 0.0815):  63%|▋| 2598/4114 [2:47:53<1:38:35,  3.90s/it]Training 2/2 epoch (loss 0.0815):  63%|▋| 2599/4114 [2:47:53<1:37:18,  3.85s/it]Training 2/2 epoch (loss 0.0056):  63%|▋| 2599/4114 [2:47:57<1:37:18,  3.85s/it]Training 2/2 epoch (loss 0.0056):  63%|▋| 2600/4114 [2:47:57<1:38:00,  3.88s/it]Training 2/2 epoch (loss 0.0288):  63%|▋| 2600/4114 [2:48:01<1:38:00,  3.88s/it]Training 2/2 epoch (loss 0.0288):  63%|▋| 2601/4114 [2:48:01<1:40:07,  3.97s/it]Training 2/2 epoch (loss 0.0076):  63%|▋| 2601/4114 [2:48:05<1:40:07,  3.97s/it]Training 2/2 epoch (loss 0.0076):  63%|▋| 2602/4114 [2:48:05<1:40:09,  3.97s/it]Training 2/2 epoch (loss 0.1162):  63%|▋| 2602/4114 [2:48:09<1:40:09,  3.97s/it]Training 2/2 epoch (loss 0.1162):  63%|▋| 2603/4114 [2:48:09<1:40:19,  3.98s/it]Training 2/2 epoch (loss 0.0121):  63%|▋| 2603/4114 [2:48:13<1:40:19,  3.98s/it]Training 2/2 epoch (loss 0.0121):  63%|▋| 2604/4114 [2:48:13<1:38:41,  3.92s/it]Training 2/2 epoch (loss 0.0435):  63%|▋| 2604/4114 [2:48:16<1:38:41,  3.92s/it]Training 2/2 epoch (loss 0.0435):  63%|▋| 2605/4114 [2:48:16<1:34:40,  3.76s/it]Training 2/2 epoch (loss 0.0688):  63%|▋| 2605/4114 [2:48:20<1:34:40,  3.76s/it]Training 2/2 epoch (loss 0.0688):  63%|▋| 2606/4114 [2:48:20<1:35:37,  3.80s/it]Training 2/2 epoch (loss 0.0562):  63%|▋| 2606/4114 [2:48:24<1:35:37,  3.80s/it]Training 2/2 epoch (loss 0.0562):  63%|▋| 2607/4114 [2:48:24<1:38:10,  3.91s/it]Training 2/2 epoch (loss 0.0762):  63%|▋| 2607/4114 [2:48:28<1:38:10,  3.91s/it]Training 2/2 epoch (loss 0.0762):  63%|▋| 2608/4114 [2:48:28<1:37:21,  3.88s/it]Training 2/2 epoch (loss 0.0383):  63%|▋| 2608/4114 [2:48:31<1:37:21,  3.88s/it]Training 2/2 epoch (loss 0.0383):  63%|▋| 2609/4114 [2:48:31<1:33:43,  3.74s/it]Training 2/2 epoch (loss 0.0330):  63%|▋| 2609/4114 [2:48:35<1:33:43,  3.74s/it]Training 2/2 epoch (loss 0.0330):  63%|▋| 2610/4114 [2:48:35<1:35:55,  3.83s/it]Training 2/2 epoch (loss 0.0410):  63%|▋| 2610/4114 [2:48:39<1:35:55,  3.83s/it]Training 2/2 epoch (loss 0.0410):  63%|▋| 2611/4114 [2:48:39<1:32:42,  3.70s/it]Training 2/2 epoch (loss 0.0554):  63%|▋| 2611/4114 [2:48:43<1:32:42,  3.70s/it]Training 2/2 epoch (loss 0.0554):  63%|▋| 2612/4114 [2:48:43<1:34:20,  3.77s/it]Training 2/2 epoch (loss 0.0325):  63%|▋| 2612/4114 [2:48:47<1:34:20,  3.77s/it]Training 2/2 epoch (loss 0.0325):  64%|▋| 2613/4114 [2:48:47<1:36:38,  3.86s/it]Training 2/2 epoch (loss 0.0518):  64%|▋| 2613/4114 [2:48:50<1:36:38,  3.86s/it]Training 2/2 epoch (loss 0.0518):  64%|▋| 2614/4114 [2:48:50<1:33:02,  3.72s/it]Training 2/2 epoch (loss 0.1133):  64%|▋| 2614/4114 [2:48:54<1:33:02,  3.72s/it]Training 2/2 epoch (loss 0.1133):  64%|▋| 2615/4114 [2:48:54<1:34:01,  3.76s/it]Training 2/2 epoch (loss 0.0303):  64%|▋| 2615/4114 [2:48:58<1:34:01,  3.76s/it]Training 2/2 epoch (loss 0.0303):  64%|▋| 2616/4114 [2:48:58<1:35:58,  3.84s/it]Training 2/2 epoch (loss 0.0322):  64%|▋| 2616/4114 [2:49:02<1:35:58,  3.84s/it]Training 2/2 epoch (loss 0.0322):  64%|▋| 2617/4114 [2:49:02<1:33:11,  3.74s/it]Training 2/2 epoch (loss 0.1270):  64%|▋| 2617/4114 [2:49:06<1:33:11,  3.74s/it]Training 2/2 epoch (loss 0.1270):  64%|▋| 2618/4114 [2:49:06<1:36:02,  3.85s/it]Training 2/2 epoch (loss 0.0437):  64%|▋| 2618/4114 [2:49:09<1:36:02,  3.85s/it]Training 2/2 epoch (loss 0.0437):  64%|▋| 2619/4114 [2:49:09<1:33:13,  3.74s/it]Training 2/2 epoch (loss 0.0099):  64%|▋| 2619/4114 [2:49:13<1:33:13,  3.74s/it]Training 2/2 epoch (loss 0.0099):  64%|▋| 2620/4114 [2:49:13<1:32:56,  3.73s/it]Training 2/2 epoch (loss 0.0344):  64%|▋| 2620/4114 [2:49:17<1:32:56,  3.73s/it]Training 2/2 epoch (loss 0.0344):  64%|▋| 2621/4114 [2:49:17<1:33:45,  3.77s/it]Training 2/2 epoch (loss 0.1147):  64%|▋| 2621/4114 [2:49:21<1:33:45,  3.77s/it]Training 2/2 epoch (loss 0.1147):  64%|▋| 2622/4114 [2:49:21<1:35:58,  3.86s/it]Training 2/2 epoch (loss 0.0209):  64%|▋| 2622/4114 [2:49:25<1:35:58,  3.86s/it]Training 2/2 epoch (loss 0.0209):  64%|▋| 2623/4114 [2:49:25<1:35:05,  3.83s/it]Training 2/2 epoch (loss 0.0879):  64%|▋| 2623/4114 [2:49:28<1:35:05,  3.83s/it]Training 2/2 epoch (loss 0.0879):  64%|▋| 2624/4114 [2:49:28<1:32:46,  3.74s/it]Training 2/2 epoch (loss 0.0579):  64%|▋| 2624/4114 [2:49:32<1:32:46,  3.74s/it]Training 2/2 epoch (loss 0.0579):  64%|▋| 2625/4114 [2:49:32<1:30:55,  3.66s/it]Training 2/2 epoch (loss 0.0038):  64%|▋| 2625/4114 [2:49:36<1:30:55,  3.66s/it]Training 2/2 epoch (loss 0.0038):  64%|▋| 2626/4114 [2:49:36<1:32:44,  3.74s/it]Training 2/2 epoch (loss 0.0247):  64%|▋| 2626/4114 [2:49:39<1:32:44,  3.74s/it]Training 2/2 epoch (loss 0.0247):  64%|▋| 2627/4114 [2:49:39<1:33:50,  3.79s/it]Training 2/2 epoch (loss 0.0405):  64%|▋| 2627/4114 [2:49:44<1:33:50,  3.79s/it]Training 2/2 epoch (loss 0.0405):  64%|▋| 2628/4114 [2:49:44<1:37:27,  3.94s/it]Training 2/2 epoch (loss 0.0315):  64%|▋| 2628/4114 [2:49:48<1:37:27,  3.94s/it]Training 2/2 epoch (loss 0.0315):  64%|▋| 2629/4114 [2:49:48<1:37:41,  3.95s/it]Training 2/2 epoch (loss 0.1465):  64%|▋| 2629/4114 [2:49:52<1:37:41,  3.95s/it]Training 2/2 epoch (loss 0.1465):  64%|▋| 2630/4114 [2:49:52<1:38:07,  3.97s/it]Training 2/2 epoch (loss 0.0693):  64%|▋| 2630/4114 [2:49:56<1:38:07,  3.97s/it]Training 2/2 epoch (loss 0.0693):  64%|▋| 2631/4114 [2:49:56<1:39:33,  4.03s/it]Training 2/2 epoch (loss 0.0435):  64%|▋| 2631/4114 [2:49:59<1:39:33,  4.03s/it]Training 2/2 epoch (loss 0.0435):  64%|▋| 2632/4114 [2:49:59<1:36:15,  3.90s/it]Training 2/2 epoch (loss 0.0508):  64%|▋| 2632/4114 [2:50:03<1:36:15,  3.90s/it]Training 2/2 epoch (loss 0.0508):  64%|▋| 2633/4114 [2:50:03<1:35:34,  3.87s/it]Training 2/2 epoch (loss 0.0505):  64%|▋| 2633/4114 [2:50:08<1:35:34,  3.87s/it]Training 2/2 epoch (loss 0.0505):  64%|▋| 2634/4114 [2:50:08<1:38:09,  3.98s/it]Training 2/2 epoch (loss 0.0552):  64%|▋| 2634/4114 [2:50:12<1:38:09,  3.98s/it]Training 2/2 epoch (loss 0.0552):  64%|▋| 2635/4114 [2:50:12<1:38:46,  4.01s/it]Training 2/2 epoch (loss 0.1934):  64%|▋| 2635/4114 [2:50:16<1:38:46,  4.01s/it]Training 2/2 epoch (loss 0.1934):  64%|▋| 2636/4114 [2:50:16<1:38:46,  4.01s/it]Training 2/2 epoch (loss 0.1230):  64%|▋| 2636/4114 [2:50:20<1:38:46,  4.01s/it]Training 2/2 epoch (loss 0.1230):  64%|▋| 2637/4114 [2:50:20<1:40:07,  4.07s/it]Training 2/2 epoch (loss 0.2344):  64%|▋| 2637/4114 [2:50:24<1:40:07,  4.07s/it]Training 2/2 epoch (loss 0.2344):  64%|▋| 2638/4114 [2:50:24<1:37:42,  3.97s/it]Training 2/2 epoch (loss 0.0535):  64%|▋| 2638/4114 [2:50:27<1:37:42,  3.97s/it]Training 2/2 epoch (loss 0.0535):  64%|▋| 2639/4114 [2:50:27<1:36:17,  3.92s/it]Training 2/2 epoch (loss 0.0474):  64%|▋| 2639/4114 [2:50:31<1:36:17,  3.92s/it]Training 2/2 epoch (loss 0.0474):  64%|▋| 2640/4114 [2:50:31<1:33:42,  3.81s/it]Training 2/2 epoch (loss 0.0132):  64%|▋| 2640/4114 [2:50:34<1:33:42,  3.81s/it]Training 2/2 epoch (loss 0.0132):  64%|▋| 2641/4114 [2:50:34<1:30:25,  3.68s/it]Training 2/2 epoch (loss 0.0464):  64%|▋| 2641/4114 [2:50:38<1:30:25,  3.68s/it]Training 2/2 epoch (loss 0.0464):  64%|▋| 2642/4114 [2:50:38<1:32:12,  3.76s/it]Training 2/2 epoch (loss 0.1846):  64%|▋| 2642/4114 [2:50:42<1:32:12,  3.76s/it]Training 2/2 epoch (loss 0.1846):  64%|▋| 2643/4114 [2:50:42<1:31:02,  3.71s/it]Training 2/2 epoch (loss 0.0349):  64%|▋| 2643/4114 [2:50:46<1:31:02,  3.71s/it]Training 2/2 epoch (loss 0.0349):  64%|▋| 2644/4114 [2:50:46<1:31:45,  3.75s/it]Training 2/2 epoch (loss 0.0708):  64%|▋| 2644/4114 [2:50:50<1:31:45,  3.75s/it]Training 2/2 epoch (loss 0.0708):  64%|▋| 2645/4114 [2:50:50<1:33:05,  3.80s/it]Training 2/2 epoch (loss 0.1816):  64%|▋| 2645/4114 [2:50:54<1:33:05,  3.80s/it]Training 2/2 epoch (loss 0.1816):  64%|▋| 2646/4114 [2:50:54<1:34:23,  3.86s/it]Training 2/2 epoch (loss 0.0591):  64%|▋| 2646/4114 [2:50:58<1:34:23,  3.86s/it]Training 2/2 epoch (loss 0.0591):  64%|▋| 2647/4114 [2:50:58<1:34:48,  3.88s/it]Training 2/2 epoch (loss 0.1270):  64%|▋| 2647/4114 [2:51:01<1:34:48,  3.88s/it]Training 2/2 epoch (loss 0.1270):  64%|▋| 2648/4114 [2:51:01<1:28:44,  3.63s/it]Training 2/2 epoch (loss 0.0977):  64%|▋| 2648/4114 [2:51:05<1:28:44,  3.63s/it]Training 2/2 epoch (loss 0.0977):  64%|▋| 2649/4114 [2:51:05<1:33:43,  3.84s/it]Training 2/2 epoch (loss 0.1040):  64%|▋| 2649/4114 [2:51:09<1:33:43,  3.84s/it]Training 2/2 epoch (loss 0.1040):  64%|▋| 2650/4114 [2:51:09<1:33:36,  3.84s/it]Training 2/2 epoch (loss 0.0623):  64%|▋| 2650/4114 [2:51:13<1:33:36,  3.84s/it]Training 2/2 epoch (loss 0.0623):  64%|▋| 2651/4114 [2:51:13<1:33:26,  3.83s/it]Training 2/2 epoch (loss 0.0160):  64%|▋| 2651/4114 [2:51:17<1:33:26,  3.83s/it]Training 2/2 epoch (loss 0.0160):  64%|▋| 2652/4114 [2:51:17<1:36:10,  3.95s/it]Training 2/2 epoch (loss 0.1069):  64%|▋| 2652/4114 [2:51:21<1:36:10,  3.95s/it]Training 2/2 epoch (loss 0.1069):  64%|▋| 2653/4114 [2:51:21<1:37:01,  3.98s/it]Training 2/2 epoch (loss 0.1196):  64%|▋| 2653/4114 [2:51:25<1:37:01,  3.98s/it]Training 2/2 epoch (loss 0.1196):  65%|▋| 2654/4114 [2:51:25<1:35:35,  3.93s/it]Training 2/2 epoch (loss 0.0444):  65%|▋| 2654/4114 [2:51:29<1:35:35,  3.93s/it]Training 2/2 epoch (loss 0.0444):  65%|▋| 2655/4114 [2:51:29<1:36:31,  3.97s/it]Training 2/2 epoch (loss 0.1982):  65%|▋| 2655/4114 [2:51:33<1:36:31,  3.97s/it]Training 2/2 epoch (loss 0.1982):  65%|▋| 2656/4114 [2:51:33<1:37:58,  4.03s/it]Training 2/2 epoch (loss 0.1875):  65%|▋| 2656/4114 [2:51:37<1:37:58,  4.03s/it]Training 2/2 epoch (loss 0.1875):  65%|▋| 2657/4114 [2:51:37<1:37:46,  4.03s/it]Training 2/2 epoch (loss 0.0369):  65%|▋| 2657/4114 [2:51:41<1:37:46,  4.03s/it]Training 2/2 epoch (loss 0.0369):  65%|▋| 2658/4114 [2:51:41<1:38:43,  4.07s/it]Training 2/2 epoch (loss 0.0762):  65%|▋| 2658/4114 [2:51:45<1:38:43,  4.07s/it]Training 2/2 epoch (loss 0.0762):  65%|▋| 2659/4114 [2:51:45<1:36:54,  4.00s/it]Training 2/2 epoch (loss 0.0486):  65%|▋| 2659/4114 [2:51:49<1:36:54,  4.00s/it]Training 2/2 epoch (loss 0.0486):  65%|▋| 2660/4114 [2:51:49<1:36:08,  3.97s/it]Training 2/2 epoch (loss 0.0182):  65%|▋| 2660/4114 [2:51:53<1:36:08,  3.97s/it]Training 2/2 epoch (loss 0.0182):  65%|▋| 2661/4114 [2:51:53<1:37:08,  4.01s/it]Training 2/2 epoch (loss 0.0474):  65%|▋| 2661/4114 [2:51:57<1:37:08,  4.01s/it]Training 2/2 epoch (loss 0.0474):  65%|▋| 2662/4114 [2:51:57<1:34:08,  3.89s/it]Training 2/2 epoch (loss 0.0378):  65%|▋| 2662/4114 [2:52:00<1:34:08,  3.89s/it]Training 2/2 epoch (loss 0.0378):  65%|▋| 2663/4114 [2:52:00<1:33:21,  3.86s/it]Training 2/2 epoch (loss 0.0200):  65%|▋| 2663/4114 [2:52:04<1:33:21,  3.86s/it]Training 2/2 epoch (loss 0.0200):  65%|▋| 2664/4114 [2:52:04<1:35:17,  3.94s/it]Training 2/2 epoch (loss 0.0101):  65%|▋| 2664/4114 [2:52:08<1:35:17,  3.94s/it]Training 2/2 epoch (loss 0.0101):  65%|▋| 2665/4114 [2:52:08<1:35:10,  3.94s/it]Training 2/2 epoch (loss 0.0364):  65%|▋| 2665/4114 [2:52:12<1:35:10,  3.94s/it]Training 2/2 epoch (loss 0.0364):  65%|▋| 2666/4114 [2:52:12<1:33:42,  3.88s/it]Training 2/2 epoch (loss 0.0342):  65%|▋| 2666/4114 [2:52:16<1:33:42,  3.88s/it]Training 2/2 epoch (loss 0.0342):  65%|▋| 2667/4114 [2:52:16<1:36:08,  3.99s/it]Training 2/2 epoch (loss 0.1309):  65%|▋| 2667/4114 [2:52:20<1:36:08,  3.99s/it]Training 2/2 epoch (loss 0.1309):  65%|▋| 2668/4114 [2:52:20<1:34:38,  3.93s/it]Training 2/2 epoch (loss 0.0762):  65%|▋| 2668/4114 [2:52:24<1:34:38,  3.93s/it]Training 2/2 epoch (loss 0.0762):  65%|▋| 2669/4114 [2:52:24<1:34:17,  3.92s/it]Training 2/2 epoch (loss 0.0027):  65%|▋| 2669/4114 [2:52:28<1:34:17,  3.92s/it]Training 2/2 epoch (loss 0.0027):  65%|▋| 2670/4114 [2:52:28<1:36:18,  4.00s/it]Training 2/2 epoch (loss 0.0198):  65%|▋| 2670/4114 [2:52:32<1:36:18,  4.00s/it]Training 2/2 epoch (loss 0.0198):  65%|▋| 2671/4114 [2:52:32<1:34:29,  3.93s/it]Training 2/2 epoch (loss 0.0265):  65%|▋| 2671/4114 [2:52:36<1:34:29,  3.93s/it]Training 2/2 epoch (loss 0.0265):  65%|▋| 2672/4114 [2:52:36<1:33:59,  3.91s/it]Training 2/2 epoch (loss 0.0391):  65%|▋| 2672/4114 [2:52:40<1:33:59,  3.91s/it]Training 2/2 epoch (loss 0.0391):  65%|▋| 2673/4114 [2:52:40<1:35:36,  3.98s/it]Training 2/2 epoch (loss 0.0596):  65%|▋| 2673/4114 [2:52:43<1:35:36,  3.98s/it]Training 2/2 epoch (loss 0.0596):  65%|▋| 2674/4114 [2:52:43<1:31:01,  3.79s/it]Training 2/2 epoch (loss 0.0967):  65%|▋| 2674/4114 [2:52:47<1:31:01,  3.79s/it]Training 2/2 epoch (loss 0.0967):  65%|▋| 2675/4114 [2:52:47<1:31:07,  3.80s/it]Training 2/2 epoch (loss 0.0645):  65%|▋| 2675/4114 [2:52:51<1:31:07,  3.80s/it]Training 2/2 epoch (loss 0.0645):  65%|▋| 2676/4114 [2:52:51<1:33:29,  3.90s/it]Training 2/2 epoch (loss 0.0266):  65%|▋| 2676/4114 [2:52:55<1:33:29,  3.90s/it]Training 2/2 epoch (loss 0.0266):  65%|▋| 2677/4114 [2:52:55<1:33:44,  3.91s/it]Training 2/2 epoch (loss 0.0320):  65%|▋| 2677/4114 [2:52:59<1:33:44,  3.91s/it]Training 2/2 epoch (loss 0.0320):  65%|▋| 2678/4114 [2:52:59<1:34:20,  3.94s/it]Training 2/2 epoch (loss 0.0198):  65%|▋| 2678/4114 [2:53:03<1:34:20,  3.94s/it]Training 2/2 epoch (loss 0.0198):  65%|▋| 2679/4114 [2:53:03<1:35:40,  4.00s/it]Training 2/2 epoch (loss 0.0356):  65%|▋| 2679/4114 [2:53:07<1:35:40,  4.00s/it]Training 2/2 epoch (loss 0.0356):  65%|▋| 2680/4114 [2:53:07<1:33:52,  3.93s/it]Training 2/2 epoch (loss 0.0132):  65%|▋| 2680/4114 [2:53:10<1:33:52,  3.93s/it]Training 2/2 epoch (loss 0.0132):  65%|▋| 2681/4114 [2:53:10<1:27:15,  3.65s/it]Training 2/2 epoch (loss 0.1035):  65%|▋| 2681/4114 [2:53:14<1:27:15,  3.65s/it]Training 2/2 epoch (loss 0.1035):  65%|▋| 2682/4114 [2:53:14<1:31:00,  3.81s/it]Training 2/2 epoch (loss 0.0284):  65%|▋| 2682/4114 [2:53:18<1:31:00,  3.81s/it]Training 2/2 epoch (loss 0.0284):  65%|▋| 2683/4114 [2:53:18<1:28:23,  3.71s/it]Training 2/2 epoch (loss 0.0347):  65%|▋| 2683/4114 [2:53:22<1:28:23,  3.71s/it]Training 2/2 epoch (loss 0.0347):  65%|▋| 2684/4114 [2:53:22<1:30:09,  3.78s/it]Training 2/2 epoch (loss 0.0132):  65%|▋| 2684/4114 [2:53:26<1:30:09,  3.78s/it]Training 2/2 epoch (loss 0.0132):  65%|▋| 2685/4114 [2:53:26<1:33:20,  3.92s/it]Training 2/2 epoch (loss 0.1523):  65%|▋| 2685/4114 [2:53:30<1:33:20,  3.92s/it]Training 2/2 epoch (loss 0.1523):  65%|▋| 2686/4114 [2:53:30<1:33:06,  3.91s/it]Training 2/2 epoch (loss 0.0403):  65%|▋| 2686/4114 [2:53:34<1:33:06,  3.91s/it]Training 2/2 epoch (loss 0.0403):  65%|▋| 2687/4114 [2:53:34<1:33:55,  3.95s/it]Training 2/2 epoch (loss 0.1074):  65%|▋| 2687/4114 [2:53:38<1:33:55,  3.95s/it]Training 2/2 epoch (loss 0.1074):  65%|▋| 2688/4114 [2:53:38<1:35:37,  4.02s/it]Training 2/2 epoch (loss 0.1182):  65%|▋| 2688/4114 [2:53:42<1:35:37,  4.02s/it]Training 2/2 epoch (loss 0.1182):  65%|▋| 2689/4114 [2:53:42<1:34:23,  3.97s/it]Training 2/2 epoch (loss 0.2148):  65%|▋| 2689/4114 [2:53:46<1:34:23,  3.97s/it]Training 2/2 epoch (loss 0.2148):  65%|▋| 2690/4114 [2:53:46<1:32:47,  3.91s/it]Training 2/2 epoch (loss 0.1377):  65%|▋| 2690/4114 [2:53:50<1:32:47,  3.91s/it]Training 2/2 epoch (loss 0.1377):  65%|▋| 2691/4114 [2:53:50<1:33:07,  3.93s/it]Training 2/2 epoch (loss 0.0258):  65%|▋| 2691/4114 [2:53:54<1:33:07,  3.93s/it]Training 2/2 epoch (loss 0.0258):  65%|▋| 2692/4114 [2:53:54<1:32:58,  3.92s/it]Training 2/2 epoch (loss 0.1089):  65%|▋| 2692/4114 [2:53:57<1:32:58,  3.92s/it]Training 2/2 epoch (loss 0.1089):  65%|▋| 2693/4114 [2:53:57<1:32:08,  3.89s/it]Training 2/2 epoch (loss 0.0654):  65%|▋| 2693/4114 [2:54:02<1:32:08,  3.89s/it]Training 2/2 epoch (loss 0.0654):  65%|▋| 2694/4114 [2:54:02<1:34:29,  3.99s/it]Training 2/2 epoch (loss 0.0630):  65%|▋| 2694/4114 [2:54:06<1:34:29,  3.99s/it]Training 2/2 epoch (loss 0.0630):  66%|▋| 2695/4114 [2:54:06<1:34:15,  3.99s/it]Training 2/2 epoch (loss 0.0054):  66%|▋| 2695/4114 [2:54:10<1:34:15,  3.99s/it]Training 2/2 epoch (loss 0.0054):  66%|▋| 2696/4114 [2:54:10<1:33:40,  3.96s/it]Training 2/2 epoch (loss 0.0162):  66%|▋| 2696/4114 [2:54:14<1:33:40,  3.96s/it]Training 2/2 epoch (loss 0.0162):  66%|▋| 2697/4114 [2:54:14<1:35:58,  4.06s/it]Training 2/2 epoch (loss 0.0146):  66%|▋| 2697/4114 [2:54:18<1:35:58,  4.06s/it]Training 2/2 epoch (loss 0.0146):  66%|▋| 2698/4114 [2:54:18<1:33:32,  3.96s/it]Training 2/2 epoch (loss 0.0369):  66%|▋| 2698/4114 [2:54:21<1:33:32,  3.96s/it]Training 2/2 epoch (loss 0.0369):  66%|▋| 2699/4114 [2:54:21<1:33:02,  3.95s/it]Training 2/2 epoch (loss 0.0248):  66%|▋| 2699/4114 [2:54:25<1:33:02,  3.95s/it]Training 2/2 epoch (loss 0.0248):  66%|▋| 2700/4114 [2:54:25<1:30:59,  3.86s/it]Training 2/2 epoch (loss 0.0146):  66%|▋| 2700/4114 [2:54:29<1:30:59,  3.86s/it]Training 2/2 epoch (loss 0.0146):  66%|▋| 2701/4114 [2:54:29<1:30:38,  3.85s/it]Training 2/2 epoch (loss 0.0112):  66%|▋| 2701/4114 [2:54:33<1:30:38,  3.85s/it]Training 2/2 epoch (loss 0.0112):  66%|▋| 2702/4114 [2:54:33<1:31:06,  3.87s/it]Training 2/2 epoch (loss 0.0299):  66%|▋| 2702/4114 [2:54:37<1:31:06,  3.87s/it]Training 2/2 epoch (loss 0.0299):  66%|▋| 2703/4114 [2:54:37<1:33:42,  3.98s/it]Training 2/2 epoch (loss 0.0796):  66%|▋| 2703/4114 [2:54:41<1:33:42,  3.98s/it]Training 2/2 epoch (loss 0.0796):  66%|▋| 2704/4114 [2:54:41<1:29:43,  3.82s/it]Training 2/2 epoch (loss 0.0522):  66%|▋| 2704/4114 [2:54:45<1:29:43,  3.82s/it]Training 2/2 epoch (loss 0.0522):  66%|▋| 2705/4114 [2:54:45<1:30:23,  3.85s/it]Training 2/2 epoch (loss 0.0128):  66%|▋| 2705/4114 [2:54:49<1:30:23,  3.85s/it]Training 2/2 epoch (loss 0.0128):  66%|▋| 2706/4114 [2:54:49<1:32:00,  3.92s/it]Training 2/2 epoch (loss 0.0505):  66%|▋| 2706/4114 [2:54:52<1:32:00,  3.92s/it]Training 2/2 epoch (loss 0.0505):  66%|▋| 2707/4114 [2:54:52<1:31:26,  3.90s/it]Training 2/2 epoch (loss 0.0233):  66%|▋| 2707/4114 [2:54:56<1:31:26,  3.90s/it]Training 2/2 epoch (loss 0.0233):  66%|▋| 2708/4114 [2:54:56<1:30:41,  3.87s/it]Training 2/2 epoch (loss 0.0947):  66%|▋| 2708/4114 [2:55:00<1:30:41,  3.87s/it]Training 2/2 epoch (loss 0.0947):  66%|▋| 2709/4114 [2:55:00<1:32:28,  3.95s/it]Training 2/2 epoch (loss 0.1699):  66%|▋| 2709/4114 [2:55:04<1:32:28,  3.95s/it]Training 2/2 epoch (loss 0.1699):  66%|▋| 2710/4114 [2:55:04<1:32:36,  3.96s/it]Training 2/2 epoch (loss 0.1426):  66%|▋| 2710/4114 [2:55:08<1:32:36,  3.96s/it]Training 2/2 epoch (loss 0.1426):  66%|▋| 2711/4114 [2:55:08<1:32:49,  3.97s/it]Training 2/2 epoch (loss 0.0342):  66%|▋| 2711/4114 [2:55:12<1:32:49,  3.97s/it]Training 2/2 epoch (loss 0.0342):  66%|▋| 2712/4114 [2:55:12<1:30:38,  3.88s/it]Training 2/2 epoch (loss 0.0425):  66%|▋| 2712/4114 [2:55:16<1:30:38,  3.88s/it]Training 2/2 epoch (loss 0.0425):  66%|▋| 2713/4114 [2:55:16<1:30:01,  3.86s/it]Training 2/2 epoch (loss 0.0623):  66%|▋| 2713/4114 [2:55:20<1:30:01,  3.86s/it]Training 2/2 epoch (loss 0.0623):  66%|▋| 2714/4114 [2:55:20<1:30:47,  3.89s/it]Training 2/2 epoch (loss 0.1050):  66%|▋| 2714/4114 [2:55:24<1:30:47,  3.89s/it]Training 2/2 epoch (loss 0.1050):  66%|▋| 2715/4114 [2:55:24<1:30:44,  3.89s/it]Training 2/2 epoch (loss 0.0742):  66%|▋| 2715/4114 [2:55:28<1:30:44,  3.89s/it]Training 2/2 epoch (loss 0.0742):  66%|▋| 2716/4114 [2:55:28<1:32:01,  3.95s/it]Training 2/2 epoch (loss 0.0039):  66%|▋| 2716/4114 [2:55:32<1:32:01,  3.95s/it]Training 2/2 epoch (loss 0.0039):  66%|▋| 2717/4114 [2:55:32<1:32:15,  3.96s/it]Training 2/2 epoch (loss 0.0009):  66%|▋| 2717/4114 [2:55:36<1:32:15,  3.96s/it]Training 2/2 epoch (loss 0.0009):  66%|▋| 2718/4114 [2:55:36<1:30:57,  3.91s/it]Training 2/2 epoch (loss 0.1631):  66%|▋| 2718/4114 [2:55:39<1:30:57,  3.91s/it]Training 2/2 epoch (loss 0.1631):  66%|▋| 2719/4114 [2:55:39<1:30:07,  3.88s/it]Training 2/2 epoch (loss 0.0310):  66%|▋| 2719/4114 [2:55:43<1:30:07,  3.88s/it]Training 2/2 epoch (loss 0.0310):  66%|▋| 2720/4114 [2:55:43<1:29:48,  3.87s/it]Training 2/2 epoch (loss 0.0240):  66%|▋| 2720/4114 [2:55:48<1:29:48,  3.87s/it]Training 2/2 epoch (loss 0.0240):  66%|▋| 2721/4114 [2:55:48<1:32:54,  4.00s/it]Training 2/2 epoch (loss 0.0308):  66%|▋| 2721/4114 [2:55:51<1:32:54,  4.00s/it]Training 2/2 epoch (loss 0.0308):  66%|▋| 2722/4114 [2:55:51<1:32:42,  4.00s/it]Training 2/2 epoch (loss 0.0562):  66%|▋| 2722/4114 [2:55:55<1:32:42,  4.00s/it]Training 2/2 epoch (loss 0.0562):  66%|▋| 2723/4114 [2:55:55<1:30:59,  3.92s/it]Training 2/2 epoch (loss 0.0630):  66%|▋| 2723/4114 [2:55:59<1:30:59,  3.92s/it]Training 2/2 epoch (loss 0.0630):  66%|▋| 2724/4114 [2:55:59<1:31:44,  3.96s/it]Training 2/2 epoch (loss 0.0255):  66%|▋| 2724/4114 [2:56:03<1:31:44,  3.96s/it]Training 2/2 epoch (loss 0.0255):  66%|▋| 2725/4114 [2:56:03<1:31:50,  3.97s/it]Training 2/2 epoch (loss 0.2969):  66%|▋| 2725/4114 [2:56:07<1:31:50,  3.97s/it]Training 2/2 epoch (loss 0.2969):  66%|▋| 2726/4114 [2:56:07<1:31:13,  3.94s/it]Training 2/2 epoch (loss 0.0378):  66%|▋| 2726/4114 [2:56:11<1:31:13,  3.94s/it]Training 2/2 epoch (loss 0.0378):  66%|▋| 2727/4114 [2:56:11<1:33:22,  4.04s/it]Training 2/2 epoch (loss 0.0347):  66%|▋| 2727/4114 [2:56:15<1:33:22,  4.04s/it]Training 2/2 epoch (loss 0.0347):  66%|▋| 2728/4114 [2:56:15<1:31:35,  3.97s/it]Training 2/2 epoch (loss 0.0405):  66%|▋| 2728/4114 [2:56:19<1:31:35,  3.97s/it]Training 2/2 epoch (loss 0.0405):  66%|▋| 2729/4114 [2:56:19<1:32:10,  3.99s/it]Training 2/2 epoch (loss 0.0080):  66%|▋| 2729/4114 [2:56:23<1:32:10,  3.99s/it]Training 2/2 epoch (loss 0.0080):  66%|▋| 2730/4114 [2:56:23<1:29:08,  3.86s/it]Training 2/2 epoch (loss 0.0569):  66%|▋| 2730/4114 [2:56:26<1:29:08,  3.86s/it]Training 2/2 epoch (loss 0.0569):  66%|▋| 2731/4114 [2:56:26<1:27:04,  3.78s/it]Training 2/2 epoch (loss 0.0129):  66%|▋| 2731/4114 [2:56:30<1:27:04,  3.78s/it]Training 2/2 epoch (loss 0.0129):  66%|▋| 2732/4114 [2:56:30<1:25:25,  3.71s/it]Training 2/2 epoch (loss 0.1040):  66%|▋| 2732/4114 [2:56:34<1:25:25,  3.71s/it]Training 2/2 epoch (loss 0.1040):  66%|▋| 2733/4114 [2:56:34<1:26:13,  3.75s/it]Training 2/2 epoch (loss 0.0537):  66%|▋| 2733/4114 [2:56:38<1:26:13,  3.75s/it]Training 2/2 epoch (loss 0.0537):  66%|▋| 2734/4114 [2:56:38<1:27:41,  3.81s/it]Training 2/2 epoch (loss 0.0894):  66%|▋| 2734/4114 [2:56:42<1:27:41,  3.81s/it]Training 2/2 epoch (loss 0.0894):  66%|▋| 2735/4114 [2:56:42<1:29:20,  3.89s/it]Training 2/2 epoch (loss 0.0391):  66%|▋| 2735/4114 [2:56:46<1:29:20,  3.89s/it]Training 2/2 epoch (loss 0.0391):  67%|▋| 2736/4114 [2:56:46<1:32:07,  4.01s/it]Training 2/2 epoch (loss 0.0312):  67%|▋| 2736/4114 [2:56:50<1:32:07,  4.01s/it]Training 2/2 epoch (loss 0.0312):  67%|▋| 2737/4114 [2:56:50<1:28:01,  3.84s/it]Training 2/2 epoch (loss 0.0374):  67%|▋| 2737/4114 [2:56:53<1:28:01,  3.84s/it]Training 2/2 epoch (loss 0.0374):  67%|▋| 2738/4114 [2:56:53<1:27:55,  3.83s/it]Training 2/2 epoch (loss 0.1152):  67%|▋| 2738/4114 [2:56:57<1:27:55,  3.83s/it]Training 2/2 epoch (loss 0.1152):  67%|▋| 2739/4114 [2:56:57<1:29:07,  3.89s/it]Training 2/2 epoch (loss 0.1768):  67%|▋| 2739/4114 [2:57:01<1:29:07,  3.89s/it]Training 2/2 epoch (loss 0.1768):  67%|▋| 2740/4114 [2:57:01<1:26:01,  3.76s/it]Training 2/2 epoch (loss 0.0435):  67%|▋| 2740/4114 [2:57:05<1:26:01,  3.76s/it]Training 2/2 epoch (loss 0.0435):  67%|▋| 2741/4114 [2:57:05<1:26:04,  3.76s/it]Training 2/2 epoch (loss 0.0110):  67%|▋| 2741/4114 [2:57:09<1:26:04,  3.76s/it]Training 2/2 epoch (loss 0.0110):  67%|▋| 2742/4114 [2:57:09<1:29:01,  3.89s/it]Training 2/2 epoch (loss 0.0287):  67%|▋| 2742/4114 [2:57:13<1:29:01,  3.89s/it]Training 2/2 epoch (loss 0.0287):  67%|▋| 2743/4114 [2:57:13<1:27:37,  3.83s/it]Training 2/2 epoch (loss 0.1641):  67%|▋| 2743/4114 [2:57:17<1:27:37,  3.83s/it]Training 2/2 epoch (loss 0.1641):  67%|▋| 2744/4114 [2:57:17<1:29:01,  3.90s/it]Training 2/2 epoch (loss 0.0771):  67%|▋| 2744/4114 [2:57:21<1:29:01,  3.90s/it]Training 2/2 epoch (loss 0.0771):  67%|▋| 2745/4114 [2:57:21<1:29:46,  3.93s/it]Training 2/2 epoch (loss 0.0050):  67%|▋| 2745/4114 [2:57:24<1:29:46,  3.93s/it]Training 2/2 epoch (loss 0.0050):  67%|▋| 2746/4114 [2:57:24<1:29:31,  3.93s/it]Training 2/2 epoch (loss 0.0762):  67%|▋| 2746/4114 [2:57:28<1:29:31,  3.93s/it]Training 2/2 epoch (loss 0.0762):  67%|▋| 2747/4114 [2:57:28<1:28:24,  3.88s/it]Training 2/2 epoch (loss 0.0165):  67%|▋| 2747/4114 [2:57:32<1:28:24,  3.88s/it]Training 2/2 epoch (loss 0.0165):  67%|▋| 2748/4114 [2:57:32<1:29:33,  3.93s/it]Training 2/2 epoch (loss 0.0093):  67%|▋| 2748/4114 [2:57:36<1:29:33,  3.93s/it]Training 2/2 epoch (loss 0.0093):  67%|▋| 2749/4114 [2:57:36<1:29:17,  3.92s/it]Training 2/2 epoch (loss 0.0933):  67%|▋| 2749/4114 [2:57:40<1:29:17,  3.92s/it]Training 2/2 epoch (loss 0.0933):  67%|▋| 2750/4114 [2:57:40<1:29:54,  3.96s/it]Training 2/2 epoch (loss 0.0425):  67%|▋| 2750/4114 [2:57:44<1:29:54,  3.96s/it]Training 2/2 epoch (loss 0.0425):  67%|▋| 2751/4114 [2:57:44<1:28:14,  3.88s/it]Training 2/2 epoch (loss 0.0200):  67%|▋| 2751/4114 [2:57:48<1:28:14,  3.88s/it]Training 2/2 epoch (loss 0.0200):  67%|▋| 2752/4114 [2:57:48<1:29:01,  3.92s/it]Training 2/2 epoch (loss 0.0019):  67%|▋| 2752/4114 [2:57:52<1:29:01,  3.92s/it]Training 2/2 epoch (loss 0.0019):  67%|▋| 2753/4114 [2:57:52<1:27:49,  3.87s/it]Training 2/2 epoch (loss 0.0009):  67%|▋| 2753/4114 [2:57:56<1:27:49,  3.87s/it]Training 2/2 epoch (loss 0.0009):  67%|▋| 2754/4114 [2:57:56<1:29:56,  3.97s/it]Training 2/2 epoch (loss 0.0659):  67%|▋| 2754/4114 [2:58:00<1:29:56,  3.97s/it]Training 2/2 epoch (loss 0.0659):  67%|▋| 2755/4114 [2:58:00<1:28:24,  3.90s/it]Training 2/2 epoch (loss 0.0205):  67%|▋| 2755/4114 [2:58:04<1:28:24,  3.90s/it]Training 2/2 epoch (loss 0.0205):  67%|▋| 2756/4114 [2:58:04<1:28:26,  3.91s/it]Training 2/2 epoch (loss 0.0139):  67%|▋| 2756/4114 [2:58:08<1:28:26,  3.91s/it]Training 2/2 epoch (loss 0.0139):  67%|▋| 2757/4114 [2:58:08<1:28:31,  3.91s/it]Training 2/2 epoch (loss 0.0101):  67%|▋| 2757/4114 [2:58:12<1:28:31,  3.91s/it]Training 2/2 epoch (loss 0.0101):  67%|▋| 2758/4114 [2:58:12<1:28:53,  3.93s/it]Training 2/2 epoch (loss 0.0008):  67%|▋| 2758/4114 [2:58:16<1:28:53,  3.93s/it]Training 2/2 epoch (loss 0.0008):  67%|▋| 2759/4114 [2:58:16<1:29:31,  3.96s/it]Training 2/2 epoch (loss 0.0359):  67%|▋| 2759/4114 [2:58:20<1:29:31,  3.96s/it]Training 2/2 epoch (loss 0.0359):  67%|▋| 2760/4114 [2:58:20<1:30:04,  3.99s/it]Training 2/2 epoch (loss 0.0608):  67%|▋| 2760/4114 [2:58:23<1:30:04,  3.99s/it]Training 2/2 epoch (loss 0.0608):  67%|▋| 2761/4114 [2:58:23<1:28:32,  3.93s/it]Training 2/2 epoch (loss 0.0269):  67%|▋| 2761/4114 [2:58:27<1:28:32,  3.93s/it]Training 2/2 epoch (loss 0.0269):  67%|▋| 2762/4114 [2:58:27<1:25:15,  3.78s/it]Training 2/2 epoch (loss 0.0223):  67%|▋| 2762/4114 [2:58:31<1:25:15,  3.78s/it]Training 2/2 epoch (loss 0.0223):  67%|▋| 2763/4114 [2:58:31<1:27:04,  3.87s/it]Training 2/2 epoch (loss 0.0510):  67%|▋| 2763/4114 [2:58:35<1:27:04,  3.87s/it]Training 2/2 epoch (loss 0.0510):  67%|▋| 2764/4114 [2:58:35<1:27:16,  3.88s/it]Training 2/2 epoch (loss 0.0405):  67%|▋| 2764/4114 [2:58:39<1:27:16,  3.88s/it]Training 2/2 epoch (loss 0.0405):  67%|▋| 2765/4114 [2:58:39<1:26:27,  3.85s/it]Training 2/2 epoch (loss 0.0767):  67%|▋| 2765/4114 [2:58:43<1:26:27,  3.85s/it]Training 2/2 epoch (loss 0.0767):  67%|▋| 2766/4114 [2:58:43<1:28:59,  3.96s/it]Training 2/2 epoch (loss 0.0520):  67%|▋| 2766/4114 [2:58:47<1:28:59,  3.96s/it]Training 2/2 epoch (loss 0.0520):  67%|▋| 2767/4114 [2:58:47<1:28:55,  3.96s/it]Training 2/2 epoch (loss 0.0254):  67%|▋| 2767/4114 [2:58:51<1:28:55,  3.96s/it]Training 2/2 epoch (loss 0.0254):  67%|▋| 2768/4114 [2:58:51<1:29:56,  4.01s/it]Training 2/2 epoch (loss 0.0469):  67%|▋| 2768/4114 [2:58:54<1:29:56,  4.01s/it]Training 2/2 epoch (loss 0.0469):  67%|▋| 2769/4114 [2:58:54<1:26:27,  3.86s/it]Training 2/2 epoch (loss 0.1289):  67%|▋| 2769/4114 [2:58:58<1:26:27,  3.86s/it]Training 2/2 epoch (loss 0.1289):  67%|▋| 2770/4114 [2:58:58<1:22:53,  3.70s/it]Training 2/2 epoch (loss 0.0018):  67%|▋| 2770/4114 [2:59:02<1:22:53,  3.70s/it]Training 2/2 epoch (loss 0.0018):  67%|▋| 2771/4114 [2:59:02<1:23:26,  3.73s/it]Training 2/2 epoch (loss 0.2051):  67%|▋| 2771/4114 [2:59:05<1:23:26,  3.73s/it]Training 2/2 epoch (loss 0.2051):  67%|▋| 2772/4114 [2:59:05<1:23:17,  3.72s/it]Training 2/2 epoch (loss 0.0491):  67%|▋| 2772/4114 [2:59:09<1:23:17,  3.72s/it]Training 2/2 epoch (loss 0.0491):  67%|▋| 2773/4114 [2:59:09<1:25:00,  3.80s/it]Training 2/2 epoch (loss 0.0093):  67%|▋| 2773/4114 [2:59:13<1:25:00,  3.80s/it]Training 2/2 epoch (loss 0.0093):  67%|▋| 2774/4114 [2:59:13<1:25:07,  3.81s/it]Training 2/2 epoch (loss 0.1191):  67%|▋| 2774/4114 [2:59:17<1:25:07,  3.81s/it]Training 2/2 epoch (loss 0.1191):  67%|▋| 2775/4114 [2:59:17<1:26:21,  3.87s/it]Training 2/2 epoch (loss 0.0435):  67%|▋| 2775/4114 [2:59:20<1:26:21,  3.87s/it]Training 2/2 epoch (loss 0.0435):  67%|▋| 2776/4114 [2:59:20<1:19:40,  3.57s/it]Training 2/2 epoch (loss 0.0278):  67%|▋| 2776/4114 [2:59:24<1:19:40,  3.57s/it]Training 2/2 epoch (loss 0.0278):  68%|▋| 2777/4114 [2:59:24<1:22:43,  3.71s/it]Training 2/2 epoch (loss 0.0004):  68%|▋| 2777/4114 [2:59:28<1:22:43,  3.71s/it]Training 2/2 epoch (loss 0.0004):  68%|▋| 2778/4114 [2:59:28<1:25:02,  3.82s/it]Training 2/2 epoch (loss 0.0835):  68%|▋| 2778/4114 [2:59:31<1:25:02,  3.82s/it]Training 2/2 epoch (loss 0.0835):  68%|▋| 2779/4114 [2:59:31<1:20:39,  3.62s/it]Training 2/2 epoch (loss 0.1504):  68%|▋| 2779/4114 [2:59:35<1:20:39,  3.62s/it]Training 2/2 epoch (loss 0.1504):  68%|▋| 2780/4114 [2:59:35<1:19:30,  3.58s/it]Training 2/2 epoch (loss 0.1289):  68%|▋| 2780/4114 [2:59:39<1:19:30,  3.58s/it]Training 2/2 epoch (loss 0.1289):  68%|▋| 2781/4114 [2:59:39<1:24:39,  3.81s/it]Training 2/2 epoch (loss 0.0245):  68%|▋| 2781/4114 [2:59:43<1:24:39,  3.81s/it]Training 2/2 epoch (loss 0.0245):  68%|▋| 2782/4114 [2:59:43<1:24:28,  3.81s/it]Training 2/2 epoch (loss 0.0010):  68%|▋| 2782/4114 [2:59:47<1:24:28,  3.81s/it]Training 2/2 epoch (loss 0.0010):  68%|▋| 2783/4114 [2:59:47<1:25:16,  3.84s/it]Training 2/2 epoch (loss 0.0007):  68%|▋| 2783/4114 [2:59:51<1:25:16,  3.84s/it]Training 2/2 epoch (loss 0.0007):  68%|▋| 2784/4114 [2:59:51<1:27:02,  3.93s/it]Training 2/2 epoch (loss 0.2285):  68%|▋| 2784/4114 [2:59:55<1:27:02,  3.93s/it]Training 2/2 epoch (loss 0.2285):  68%|▋| 2785/4114 [2:59:55<1:26:32,  3.91s/it]Training 2/2 epoch (loss 0.0249):  68%|▋| 2785/4114 [2:59:59<1:26:32,  3.91s/it]Training 2/2 epoch (loss 0.0249):  68%|▋| 2786/4114 [2:59:59<1:25:40,  3.87s/it]Training 2/2 epoch (loss 0.0022):  68%|▋| 2786/4114 [3:00:03<1:25:40,  3.87s/it]Training 2/2 epoch (loss 0.0022):  68%|▋| 2787/4114 [3:00:03<1:27:17,  3.95s/it]Training 2/2 epoch (loss 0.0005):  68%|▋| 2787/4114 [3:00:07<1:27:17,  3.95s/it]Training 2/2 epoch (loss 0.0005):  68%|▋| 2788/4114 [3:00:07<1:27:39,  3.97s/it]Training 2/2 epoch (loss 0.0791):  68%|▋| 2788/4114 [3:00:11<1:27:39,  3.97s/it]Training 2/2 epoch (loss 0.0791):  68%|▋| 2789/4114 [3:00:11<1:27:39,  3.97s/it]Training 2/2 epoch (loss 0.0297):  68%|▋| 2789/4114 [3:00:15<1:27:39,  3.97s/it]Training 2/2 epoch (loss 0.0297):  68%|▋| 2790/4114 [3:00:15<1:27:53,  3.98s/it]Training 2/2 epoch (loss 0.0146):  68%|▋| 2790/4114 [3:00:18<1:27:53,  3.98s/it]Training 2/2 epoch (loss 0.0146):  68%|▋| 2791/4114 [3:00:18<1:23:37,  3.79s/it]Training 2/2 epoch (loss 0.0093):  68%|▋| 2791/4114 [3:00:22<1:23:37,  3.79s/it]Training 2/2 epoch (loss 0.0093):  68%|▋| 2792/4114 [3:00:22<1:23:59,  3.81s/it]Training 2/2 epoch (loss 0.0447):  68%|▋| 2792/4114 [3:00:26<1:23:59,  3.81s/it]Training 2/2 epoch (loss 0.0447):  68%|▋| 2793/4114 [3:00:26<1:26:43,  3.94s/it]Training 2/2 epoch (loss 0.0015):  68%|▋| 2793/4114 [3:00:30<1:26:43,  3.94s/it]Training 2/2 epoch (loss 0.0015):  68%|▋| 2794/4114 [3:00:30<1:27:00,  3.95s/it]Training 2/2 epoch (loss 0.0674):  68%|▋| 2794/4114 [3:00:34<1:27:00,  3.95s/it]Training 2/2 epoch (loss 0.0674):  68%|▋| 2795/4114 [3:00:34<1:25:53,  3.91s/it]Training 2/2 epoch (loss 0.0498):  68%|▋| 2795/4114 [3:00:38<1:25:53,  3.91s/it]Training 2/2 epoch (loss 0.0498):  68%|▋| 2796/4114 [3:00:38<1:27:31,  3.98s/it]Training 2/2 epoch (loss 0.0114):  68%|▋| 2796/4114 [3:00:42<1:27:31,  3.98s/it]Training 2/2 epoch (loss 0.0114):  68%|▋| 2797/4114 [3:00:42<1:25:24,  3.89s/it]Training 2/2 epoch (loss 0.0471):  68%|▋| 2797/4114 [3:00:46<1:25:24,  3.89s/it]Training 2/2 epoch (loss 0.0471):  68%|▋| 2798/4114 [3:00:46<1:25:54,  3.92s/it]Training 2/2 epoch (loss 0.0266):  68%|▋| 2798/4114 [3:00:50<1:25:54,  3.92s/it]Training 2/2 epoch (loss 0.0266):  68%|▋| 2799/4114 [3:00:50<1:26:38,  3.95s/it]Training 2/2 epoch (loss 0.0469):  68%|▋| 2799/4114 [3:00:54<1:26:38,  3.95s/it]Training 2/2 epoch (loss 0.0469):  68%|▋| 2800/4114 [3:00:54<1:25:51,  3.92s/it]Training 2/2 epoch (loss 0.0025):  68%|▋| 2800/4114 [3:00:58<1:25:51,  3.92s/it]Training 2/2 epoch (loss 0.0025):  68%|▋| 2801/4114 [3:00:58<1:26:10,  3.94s/it]Training 2/2 epoch (loss 0.1543):  68%|▋| 2801/4114 [3:01:02<1:26:10,  3.94s/it]Training 2/2 epoch (loss 0.1543):  68%|▋| 2802/4114 [3:01:02<1:27:33,  4.00s/it]Training 2/2 epoch (loss 0.0094):  68%|▋| 2802/4114 [3:01:06<1:27:33,  4.00s/it]Training 2/2 epoch (loss 0.0094):  68%|▋| 2803/4114 [3:01:06<1:27:11,  3.99s/it]Training 2/2 epoch (loss 0.3086):  68%|▋| 2803/4114 [3:01:10<1:27:11,  3.99s/it]Training 2/2 epoch (loss 0.3086):  68%|▋| 2804/4114 [3:01:10<1:27:37,  4.01s/it]Training 2/2 epoch (loss 0.0029):  68%|▋| 2804/4114 [3:01:14<1:27:37,  4.01s/it]Training 2/2 epoch (loss 0.0029):  68%|▋| 2805/4114 [3:01:14<1:27:16,  4.00s/it]Training 2/2 epoch (loss 0.0156):  68%|▋| 2805/4114 [3:01:17<1:27:16,  4.00s/it]Training 2/2 epoch (loss 0.0156):  68%|▋| 2806/4114 [3:01:17<1:25:50,  3.94s/it]Training 2/2 epoch (loss 0.1094):  68%|▋| 2806/4114 [3:01:21<1:25:50,  3.94s/it]Training 2/2 epoch (loss 0.1094):  68%|▋| 2807/4114 [3:01:21<1:26:03,  3.95s/it]Training 2/2 epoch (loss 0.0042):  68%|▋| 2807/4114 [3:01:26<1:26:03,  3.95s/it]Training 2/2 epoch (loss 0.0042):  68%|▋| 2808/4114 [3:01:26<1:27:02,  4.00s/it]Training 2/2 epoch (loss 0.0209):  68%|▋| 2808/4114 [3:01:29<1:27:02,  4.00s/it]Training 2/2 epoch (loss 0.0209):  68%|▋| 2809/4114 [3:01:29<1:22:37,  3.80s/it]Training 2/2 epoch (loss 0.0145):  68%|▋| 2809/4114 [3:01:33<1:22:37,  3.80s/it]Training 2/2 epoch (loss 0.0145):  68%|▋| 2810/4114 [3:01:33<1:23:34,  3.85s/it]Training 2/2 epoch (loss 0.0066):  68%|▋| 2810/4114 [3:01:37<1:23:34,  3.85s/it]Training 2/2 epoch (loss 0.0066):  68%|▋| 2811/4114 [3:01:37<1:26:22,  3.98s/it]Training 2/2 epoch (loss 0.0173):  68%|▋| 2811/4114 [3:01:41<1:26:22,  3.98s/it]Training 2/2 epoch (loss 0.0173):  68%|▋| 2812/4114 [3:01:41<1:26:22,  3.98s/it]Training 2/2 epoch (loss 0.0019):  68%|▋| 2812/4114 [3:01:45<1:26:22,  3.98s/it]Training 2/2 epoch (loss 0.0019):  68%|▋| 2813/4114 [3:01:45<1:25:47,  3.96s/it]Training 2/2 epoch (loss 0.0262):  68%|▋| 2813/4114 [3:01:49<1:25:47,  3.96s/it]Training 2/2 epoch (loss 0.0262):  68%|▋| 2814/4114 [3:01:49<1:27:09,  4.02s/it]Training 2/2 epoch (loss 0.0123):  68%|▋| 2814/4114 [3:01:53<1:27:09,  4.02s/it]Training 2/2 epoch (loss 0.0123):  68%|▋| 2815/4114 [3:01:53<1:26:30,  4.00s/it]Training 2/2 epoch (loss 0.0801):  68%|▋| 2815/4114 [3:01:57<1:26:30,  4.00s/it]Training 2/2 epoch (loss 0.0801):  68%|▋| 2816/4114 [3:01:57<1:25:51,  3.97s/it]Training 2/2 epoch (loss 0.0209):  68%|▋| 2816/4114 [3:02:01<1:25:51,  3.97s/it]Training 2/2 epoch (loss 0.0209):  68%|▋| 2817/4114 [3:02:01<1:22:41,  3.83s/it]Training 2/2 epoch (loss 0.0437):  68%|▋| 2817/4114 [3:02:04<1:22:41,  3.83s/it]Training 2/2 epoch (loss 0.0437):  68%|▋| 2818/4114 [3:02:04<1:20:01,  3.70s/it]Training 2/2 epoch (loss 0.0080):  68%|▋| 2818/4114 [3:02:08<1:20:01,  3.70s/it]Training 2/2 epoch (loss 0.0080):  69%|▋| 2819/4114 [3:02:08<1:21:40,  3.78s/it]Training 2/2 epoch (loss 0.0061):  69%|▋| 2819/4114 [3:02:12<1:21:40,  3.78s/it]Training 2/2 epoch (loss 0.0061):  69%|▋| 2820/4114 [3:02:12<1:23:26,  3.87s/it]Training 2/2 epoch (loss 0.0874):  69%|▋| 2820/4114 [3:02:15<1:23:26,  3.87s/it]Training 2/2 epoch (loss 0.0874):  69%|▋| 2821/4114 [3:02:15<1:18:42,  3.65s/it]Training 2/2 epoch (loss 0.0027):  69%|▋| 2821/4114 [3:02:19<1:18:42,  3.65s/it]Training 2/2 epoch (loss 0.0027):  69%|▋| 2822/4114 [3:02:19<1:20:31,  3.74s/it]Training 2/2 epoch (loss 0.0045):  69%|▋| 2822/4114 [3:02:23<1:20:31,  3.74s/it]Training 2/2 epoch (loss 0.0045):  69%|▋| 2823/4114 [3:02:23<1:24:09,  3.91s/it]Training 2/2 epoch (loss 0.0093):  69%|▋| 2823/4114 [3:02:27<1:24:09,  3.91s/it]Training 2/2 epoch (loss 0.0093):  69%|▋| 2824/4114 [3:02:27<1:22:31,  3.84s/it]Training 2/2 epoch (loss 0.0236):  69%|▋| 2824/4114 [3:02:31<1:22:31,  3.84s/it]Training 2/2 epoch (loss 0.0236):  69%|▋| 2825/4114 [3:02:31<1:23:17,  3.88s/it]Training 2/2 epoch (loss 0.0420):  69%|▋| 2825/4114 [3:02:35<1:23:17,  3.88s/it]Training 2/2 epoch (loss 0.0420):  69%|▋| 2826/4114 [3:02:35<1:25:19,  3.98s/it]Training 2/2 epoch (loss 0.0025):  69%|▋| 2826/4114 [3:02:39<1:25:19,  3.98s/it]Training 2/2 epoch (loss 0.0025):  69%|▋| 2827/4114 [3:02:39<1:24:24,  3.94s/it]Training 2/2 epoch (loss 0.0251):  69%|▋| 2827/4114 [3:02:43<1:24:24,  3.94s/it]Training 2/2 epoch (loss 0.0251):  69%|▋| 2828/4114 [3:02:43<1:22:25,  3.85s/it]Training 2/2 epoch (loss 0.0693):  69%|▋| 2828/4114 [3:02:47<1:22:25,  3.85s/it]Training 2/2 epoch (loss 0.0693):  69%|▋| 2829/4114 [3:02:47<1:22:41,  3.86s/it]Training 2/2 epoch (loss 0.0767):  69%|▋| 2829/4114 [3:02:50<1:22:41,  3.86s/it]Training 2/2 epoch (loss 0.0767):  69%|▋| 2830/4114 [3:02:50<1:19:21,  3.71s/it]Training 2/2 epoch (loss 0.0354):  69%|▋| 2830/4114 [3:02:54<1:19:21,  3.71s/it]Training 2/2 epoch (loss 0.0354):  69%|▋| 2831/4114 [3:02:54<1:20:23,  3.76s/it]Training 2/2 epoch (loss 0.0635):  69%|▋| 2831/4114 [3:02:58<1:20:23,  3.76s/it]Training 2/2 epoch (loss 0.0635):  69%|▋| 2832/4114 [3:02:58<1:22:33,  3.86s/it]Training 2/2 epoch (loss 0.0205):  69%|▋| 2832/4114 [3:03:01<1:22:33,  3.86s/it]Training 2/2 epoch (loss 0.0205):  69%|▋| 2833/4114 [3:03:01<1:18:25,  3.67s/it]Training 2/2 epoch (loss 0.0007):  69%|▋| 2833/4114 [3:03:05<1:18:25,  3.67s/it]Training 2/2 epoch (loss 0.0007):  69%|▋| 2834/4114 [3:03:05<1:20:23,  3.77s/it]Training 2/2 epoch (loss 0.0101):  69%|▋| 2834/4114 [3:03:09<1:20:23,  3.77s/it]Training 2/2 epoch (loss 0.0101):  69%|▋| 2835/4114 [3:03:09<1:23:25,  3.91s/it]Training 2/2 epoch (loss 0.0266):  69%|▋| 2835/4114 [3:03:13<1:23:25,  3.91s/it]Training 2/2 epoch (loss 0.0266):  69%|▋| 2836/4114 [3:03:13<1:23:32,  3.92s/it]Training 2/2 epoch (loss 0.0933):  69%|▋| 2836/4114 [3:03:17<1:23:32,  3.92s/it]Training 2/2 epoch (loss 0.0933):  69%|▋| 2837/4114 [3:03:17<1:24:00,  3.95s/it]Training 2/2 epoch (loss 0.0310):  69%|▋| 2837/4114 [3:03:22<1:24:00,  3.95s/it]Training 2/2 epoch (loss 0.0310):  69%|▋| 2838/4114 [3:03:22<1:25:09,  4.00s/it]Training 2/2 epoch (loss 0.0007):  69%|▋| 2838/4114 [3:03:25<1:25:09,  4.00s/it]Training 2/2 epoch (loss 0.0007):  69%|▋| 2839/4114 [3:03:25<1:21:44,  3.85s/it]Training 2/2 epoch (loss 0.0017):  69%|▋| 2839/4114 [3:03:29<1:21:44,  3.85s/it]Training 2/2 epoch (loss 0.0017):  69%|▋| 2840/4114 [3:03:29<1:21:46,  3.85s/it]Training 2/2 epoch (loss 0.4062):  69%|▋| 2840/4114 [3:03:32<1:21:46,  3.85s/it]Training 2/2 epoch (loss 0.4062):  69%|▋| 2841/4114 [3:03:32<1:20:15,  3.78s/it]Training 2/2 epoch (loss 0.0869):  69%|▋| 2841/4114 [3:03:36<1:20:15,  3.78s/it]Training 2/2 epoch (loss 0.0869):  69%|▋| 2842/4114 [3:03:36<1:21:17,  3.83s/it]Training 2/2 epoch (loss 0.0635):  69%|▋| 2842/4114 [3:03:40<1:21:17,  3.83s/it]Training 2/2 epoch (loss 0.0635):  69%|▋| 2843/4114 [3:03:40<1:22:05,  3.88s/it]Training 2/2 epoch (loss 0.0028):  69%|▋| 2843/4114 [3:03:45<1:22:05,  3.88s/it]Training 2/2 epoch (loss 0.0028):  69%|▋| 2844/4114 [3:03:45<1:24:21,  3.99s/it]Training 2/2 epoch (loss 0.0168):  69%|▋| 2844/4114 [3:03:49<1:24:21,  3.99s/it]Training 2/2 epoch (loss 0.0168):  69%|▋| 2845/4114 [3:03:49<1:24:25,  3.99s/it]Training 2/2 epoch (loss 0.1074):  69%|▋| 2845/4114 [3:03:52<1:24:25,  3.99s/it]Training 2/2 epoch (loss 0.1074):  69%|▋| 2846/4114 [3:03:52<1:21:27,  3.85s/it]Training 2/2 epoch (loss 0.1260):  69%|▋| 2846/4114 [3:03:56<1:21:27,  3.85s/it]Training 2/2 epoch (loss 0.1260):  69%|▋| 2847/4114 [3:03:56<1:22:36,  3.91s/it]Training 2/2 epoch (loss 0.0097):  69%|▋| 2847/4114 [3:04:00<1:22:36,  3.91s/it]Training 2/2 epoch (loss 0.0097):  69%|▋| 2848/4114 [3:04:00<1:22:41,  3.92s/it]Training 2/2 epoch (loss 0.0010):  69%|▋| 2848/4114 [3:04:04<1:22:41,  3.92s/it]Training 2/2 epoch (loss 0.0010):  69%|▋| 2849/4114 [3:04:04<1:23:56,  3.98s/it]Training 2/2 epoch (loss 0.0242):  69%|▋| 2849/4114 [3:04:08<1:23:56,  3.98s/it]Training 2/2 epoch (loss 0.0242):  69%|▋| 2850/4114 [3:04:08<1:24:18,  4.00s/it]Training 2/2 epoch (loss 0.0820):  69%|▋| 2850/4114 [3:04:12<1:24:18,  4.00s/it]Training 2/2 epoch (loss 0.0820):  69%|▋| 2851/4114 [3:04:12<1:22:41,  3.93s/it]Training 2/2 epoch (loss 0.0645):  69%|▋| 2851/4114 [3:04:16<1:22:41,  3.93s/it]Training 2/2 epoch (loss 0.0645):  69%|▋| 2852/4114 [3:04:16<1:19:23,  3.77s/it]Training 2/2 epoch (loss 0.0156):  69%|▋| 2852/4114 [3:04:19<1:19:23,  3.77s/it]Training 2/2 epoch (loss 0.0156):  69%|▋| 2853/4114 [3:04:19<1:19:19,  3.77s/it]Training 2/2 epoch (loss 0.0098):  69%|▋| 2853/4114 [3:04:23<1:19:19,  3.77s/it]Training 2/2 epoch (loss 0.0098):  69%|▋| 2854/4114 [3:04:23<1:20:01,  3.81s/it]Training 2/2 epoch (loss 0.0581):  69%|▋| 2854/4114 [3:04:27<1:20:01,  3.81s/it]Training 2/2 epoch (loss 0.0581):  69%|▋| 2855/4114 [3:04:27<1:19:58,  3.81s/it]Training 2/2 epoch (loss 0.0259):  69%|▋| 2855/4114 [3:04:31<1:19:58,  3.81s/it]Training 2/2 epoch (loss 0.0259):  69%|▋| 2856/4114 [3:04:31<1:22:37,  3.94s/it]Training 2/2 epoch (loss 0.0369):  69%|▋| 2856/4114 [3:04:35<1:22:37,  3.94s/it]Training 2/2 epoch (loss 0.0369):  69%|▋| 2857/4114 [3:04:35<1:22:33,  3.94s/it]Training 2/2 epoch (loss 0.0349):  69%|▋| 2857/4114 [3:04:39<1:22:33,  3.94s/it]Training 2/2 epoch (loss 0.0349):  69%|▋| 2858/4114 [3:04:39<1:23:14,  3.98s/it]Training 2/2 epoch (loss 0.0258):  69%|▋| 2858/4114 [3:04:43<1:23:14,  3.98s/it]Training 2/2 epoch (loss 0.0258):  69%|▋| 2859/4114 [3:04:43<1:24:45,  4.05s/it]Training 2/2 epoch (loss 0.0488):  69%|▋| 2859/4114 [3:04:47<1:24:45,  4.05s/it]Training 2/2 epoch (loss 0.0488):  70%|▋| 2860/4114 [3:04:47<1:23:49,  4.01s/it]Training 2/2 epoch (loss 0.0332):  70%|▋| 2860/4114 [3:04:51<1:23:49,  4.01s/it]Training 2/2 epoch (loss 0.0332):  70%|▋| 2861/4114 [3:04:51<1:23:24,  3.99s/it]Training 2/2 epoch (loss 0.0479):  70%|▋| 2861/4114 [3:04:55<1:23:24,  3.99s/it]Training 2/2 epoch (loss 0.0479):  70%|▋| 2862/4114 [3:04:55<1:24:09,  4.03s/it]Training 2/2 epoch (loss 0.0618):  70%|▋| 2862/4114 [3:04:59<1:24:09,  4.03s/it]Training 2/2 epoch (loss 0.0618):  70%|▋| 2863/4114 [3:04:59<1:22:32,  3.96s/it]Training 2/2 epoch (loss 0.0713):  70%|▋| 2863/4114 [3:05:03<1:22:32,  3.96s/it]Training 2/2 epoch (loss 0.0713):  70%|▋| 2864/4114 [3:05:03<1:22:41,  3.97s/it]Training 2/2 epoch (loss 0.0226):  70%|▋| 2864/4114 [3:05:07<1:22:41,  3.97s/it]Training 2/2 epoch (loss 0.0226):  70%|▋| 2865/4114 [3:05:07<1:23:46,  4.02s/it]Training 2/2 epoch (loss 0.0162):  70%|▋| 2865/4114 [3:05:11<1:23:46,  4.02s/it]Training 2/2 epoch (loss 0.0162):  70%|▋| 2866/4114 [3:05:11<1:19:56,  3.84s/it]Training 2/2 epoch (loss 0.0011):  70%|▋| 2866/4114 [3:05:14<1:19:56,  3.84s/it]Training 2/2 epoch (loss 0.0011):  70%|▋| 2867/4114 [3:05:14<1:17:26,  3.73s/it]Training 2/2 epoch (loss 0.0084):  70%|▋| 2867/4114 [3:05:18<1:17:26,  3.73s/it]Training 2/2 epoch (loss 0.0084):  70%|▋| 2868/4114 [3:05:18<1:19:11,  3.81s/it]Training 2/2 epoch (loss 0.0352):  70%|▋| 2868/4114 [3:05:22<1:19:11,  3.81s/it]Training 2/2 epoch (loss 0.0352):  70%|▋| 2869/4114 [3:05:22<1:19:03,  3.81s/it]Training 2/2 epoch (loss 0.0222):  70%|▋| 2869/4114 [3:05:25<1:19:03,  3.81s/it]Training 2/2 epoch (loss 0.0222):  70%|▋| 2870/4114 [3:05:25<1:16:07,  3.67s/it]Training 2/2 epoch (loss 0.0031):  70%|▋| 2870/4114 [3:05:30<1:16:07,  3.67s/it]Training 2/2 epoch (loss 0.0031):  70%|▋| 2871/4114 [3:05:30<1:19:23,  3.83s/it]Training 2/2 epoch (loss 0.1001):  70%|▋| 2871/4114 [3:05:33<1:19:23,  3.83s/it]Training 2/2 epoch (loss 0.1001):  70%|▋| 2872/4114 [3:05:33<1:18:44,  3.80s/it]Training 2/2 epoch (loss 0.0342):  70%|▋| 2872/4114 [3:05:37<1:18:44,  3.80s/it]Training 2/2 epoch (loss 0.0342):  70%|▋| 2873/4114 [3:05:37<1:20:13,  3.88s/it]Training 2/2 epoch (loss 0.0415):  70%|▋| 2873/4114 [3:05:42<1:20:13,  3.88s/it]Training 2/2 epoch (loss 0.0415):  70%|▋| 2874/4114 [3:05:42<1:22:19,  3.98s/it]Training 2/2 epoch (loss 0.2266):  70%|▋| 2874/4114 [3:05:46<1:22:19,  3.98s/it]Training 2/2 epoch (loss 0.2266):  70%|▋| 2875/4114 [3:05:46<1:22:54,  4.02s/it]Training 2/2 epoch (loss 0.0021):  70%|▋| 2875/4114 [3:05:49<1:22:54,  4.02s/it]Training 2/2 epoch (loss 0.0021):  70%|▋| 2876/4114 [3:05:49<1:19:20,  3.85s/it]Training 2/2 epoch (loss 0.0171):  70%|▋| 2876/4114 [3:05:53<1:19:20,  3.85s/it]Training 2/2 epoch (loss 0.0171):  70%|▋| 2877/4114 [3:05:53<1:21:10,  3.94s/it]Training 2/2 epoch (loss 0.0322):  70%|▋| 2877/4114 [3:05:57<1:21:10,  3.94s/it]Training 2/2 epoch (loss 0.0322):  70%|▋| 2878/4114 [3:05:57<1:20:58,  3.93s/it]Training 2/2 epoch (loss 0.0025):  70%|▋| 2878/4114 [3:06:01<1:20:58,  3.93s/it]Training 2/2 epoch (loss 0.0025):  70%|▋| 2879/4114 [3:06:01<1:21:52,  3.98s/it]Training 2/2 epoch (loss 0.1270):  70%|▋| 2879/4114 [3:06:05<1:21:52,  3.98s/it]Training 2/2 epoch (loss 0.1270):  70%|▋| 2880/4114 [3:06:05<1:21:20,  3.95s/it]Training 2/2 epoch (loss 0.1582):  70%|▋| 2880/4114 [3:06:09<1:21:20,  3.95s/it]Training 2/2 epoch (loss 0.1582):  70%|▋| 2881/4114 [3:06:09<1:19:30,  3.87s/it]Training 2/2 epoch (loss 0.0588):  70%|▋| 2881/4114 [3:06:12<1:19:30,  3.87s/it]Training 2/2 epoch (loss 0.0588):  70%|▋| 2882/4114 [3:06:12<1:16:38,  3.73s/it]Training 2/2 epoch (loss 0.1914):  70%|▋| 2882/4114 [3:06:15<1:16:38,  3.73s/it]Training 2/2 epoch (loss 0.1914):  70%|▋| 2883/4114 [3:06:15<1:11:16,  3.47s/it]Training 2/2 epoch (loss 0.0287):  70%|▋| 2883/4114 [3:06:19<1:11:16,  3.47s/it]Training 2/2 epoch (loss 0.0287):  70%|▋| 2884/4114 [3:06:19<1:11:03,  3.47s/it]Training 2/2 epoch (loss 0.0684):  70%|▋| 2884/4114 [3:06:22<1:11:03,  3.47s/it]Training 2/2 epoch (loss 0.0684):  70%|▋| 2885/4114 [3:06:22<1:11:12,  3.48s/it]Training 2/2 epoch (loss 0.0217):  70%|▋| 2885/4114 [3:06:26<1:11:12,  3.48s/it]Training 2/2 epoch (loss 0.0217):  70%|▋| 2886/4114 [3:06:26<1:16:18,  3.73s/it]Training 2/2 epoch (loss 0.1494):  70%|▋| 2886/4114 [3:06:30<1:16:18,  3.73s/it]Training 2/2 epoch (loss 0.1494):  70%|▋| 2887/4114 [3:06:30<1:16:33,  3.74s/it]Training 2/2 epoch (loss 0.0903):  70%|▋| 2887/4114 [3:06:34<1:16:33,  3.74s/it]Training 2/2 epoch (loss 0.0903):  70%|▋| 2888/4114 [3:06:34<1:18:07,  3.82s/it]Training 2/2 epoch (loss 0.1719):  70%|▋| 2888/4114 [3:06:38<1:18:07,  3.82s/it]Training 2/2 epoch (loss 0.1719):  70%|▋| 2889/4114 [3:06:38<1:17:09,  3.78s/it]Training 2/2 epoch (loss 0.0276):  70%|▋| 2889/4114 [3:06:42<1:17:09,  3.78s/it]Training 2/2 epoch (loss 0.0276):  70%|▋| 2890/4114 [3:06:42<1:18:19,  3.84s/it]Training 2/2 epoch (loss 0.0078):  70%|▋| 2890/4114 [3:06:46<1:18:19,  3.84s/it]Training 2/2 epoch (loss 0.0078):  70%|▋| 2891/4114 [3:06:46<1:18:59,  3.88s/it]Training 2/2 epoch (loss 0.0013):  70%|▋| 2891/4114 [3:06:50<1:18:59,  3.88s/it]Training 2/2 epoch (loss 0.0013):  70%|▋| 2892/4114 [3:06:50<1:20:12,  3.94s/it]Training 2/2 epoch (loss 0.0228):  70%|▋| 2892/4114 [3:06:54<1:20:12,  3.94s/it]Training 2/2 epoch (loss 0.0228):  70%|▋| 2893/4114 [3:06:54<1:19:09,  3.89s/it]Training 2/2 epoch (loss 0.0220):  70%|▋| 2893/4114 [3:06:58<1:19:09,  3.89s/it]Training 2/2 epoch (loss 0.0220):  70%|▋| 2894/4114 [3:06:58<1:19:22,  3.90s/it]Training 2/2 epoch (loss 0.0113):  70%|▋| 2894/4114 [3:07:02<1:19:22,  3.90s/it]Training 2/2 epoch (loss 0.0113):  70%|▋| 2895/4114 [3:07:02<1:19:33,  3.92s/it]Training 2/2 epoch (loss 0.0049):  70%|▋| 2895/4114 [3:07:05<1:19:33,  3.92s/it]Training 2/2 epoch (loss 0.0049):  70%|▋| 2896/4114 [3:07:05<1:16:21,  3.76s/it]Training 2/2 epoch (loss 0.0062):  70%|▋| 2896/4114 [3:07:09<1:16:21,  3.76s/it]Training 2/2 epoch (loss 0.0062):  70%|▋| 2897/4114 [3:07:09<1:17:11,  3.81s/it]Training 2/2 epoch (loss 0.0386):  70%|▋| 2897/4114 [3:07:13<1:17:11,  3.81s/it]Training 2/2 epoch (loss 0.0386):  70%|▋| 2898/4114 [3:07:13<1:18:50,  3.89s/it]Training 2/2 epoch (loss 0.0635):  70%|▋| 2898/4114 [3:07:16<1:18:50,  3.89s/it]Training 2/2 epoch (loss 0.0635):  70%|▋| 2899/4114 [3:07:16<1:10:21,  3.47s/it]Training 2/2 epoch (loss 0.2285):  70%|▋| 2899/4114 [3:07:20<1:10:21,  3.47s/it]Training 2/2 epoch (loss 0.2285):  70%|▋| 2900/4114 [3:07:20<1:13:30,  3.63s/it]Training 2/2 epoch (loss 0.0289):  70%|▋| 2900/4114 [3:07:23<1:13:30,  3.63s/it]Training 2/2 epoch (loss 0.0289):  71%|▋| 2901/4114 [3:07:23<1:14:23,  3.68s/it]Training 2/2 epoch (loss 0.0444):  71%|▋| 2901/4114 [3:07:26<1:14:23,  3.68s/it]Training 2/2 epoch (loss 0.0444):  71%|▋| 2902/4114 [3:07:26<1:10:45,  3.50s/it]Training 2/2 epoch (loss 0.0177):  71%|▋| 2902/4114 [3:07:30<1:10:45,  3.50s/it]Training 2/2 epoch (loss 0.0177):  71%|▋| 2903/4114 [3:07:30<1:13:56,  3.66s/it]Training 2/2 epoch (loss 0.0171):  71%|▋| 2903/4114 [3:07:34<1:13:56,  3.66s/it]Training 2/2 epoch (loss 0.0171):  71%|▋| 2904/4114 [3:07:34<1:15:05,  3.72s/it]Training 2/2 epoch (loss 0.1816):  71%|▋| 2904/4114 [3:07:38<1:15:05,  3.72s/it]Training 2/2 epoch (loss 0.1816):  71%|▋| 2905/4114 [3:07:38<1:16:35,  3.80s/it]Training 2/2 epoch (loss 0.1357):  71%|▋| 2905/4114 [3:07:42<1:16:35,  3.80s/it]Training 2/2 epoch (loss 0.1357):  71%|▋| 2906/4114 [3:07:42<1:16:43,  3.81s/it]Training 2/2 epoch (loss 0.0664):  71%|▋| 2906/4114 [3:07:46<1:16:43,  3.81s/it]Training 2/2 epoch (loss 0.0664):  71%|▋| 2907/4114 [3:07:46<1:18:45,  3.92s/it]Training 2/2 epoch (loss 0.0908):  71%|▋| 2907/4114 [3:07:50<1:18:45,  3.92s/it]Training 2/2 epoch (loss 0.0908):  71%|▋| 2908/4114 [3:07:50<1:17:49,  3.87s/it]Training 2/2 epoch (loss 0.0417):  71%|▋| 2908/4114 [3:07:54<1:17:49,  3.87s/it]Training 2/2 epoch (loss 0.0417):  71%|▋| 2909/4114 [3:07:54<1:17:45,  3.87s/it]Training 2/2 epoch (loss 0.1064):  71%|▋| 2909/4114 [3:07:58<1:17:45,  3.87s/it]Training 2/2 epoch (loss 0.1064):  71%|▋| 2910/4114 [3:07:58<1:18:24,  3.91s/it]Training 2/2 epoch (loss 0.0806):  71%|▋| 2910/4114 [3:08:02<1:18:24,  3.91s/it]Training 2/2 epoch (loss 0.0806):  71%|▋| 2911/4114 [3:08:02<1:18:52,  3.93s/it]Training 2/2 epoch (loss 0.0879):  71%|▋| 2911/4114 [3:08:06<1:18:52,  3.93s/it]Training 2/2 epoch (loss 0.0879):  71%|▋| 2912/4114 [3:08:06<1:19:00,  3.94s/it]Training 2/2 epoch (loss 0.0820):  71%|▋| 2912/4114 [3:08:09<1:19:00,  3.94s/it]Training 2/2 epoch (loss 0.0820):  71%|▋| 2913/4114 [3:08:09<1:15:46,  3.79s/it]Training 2/2 epoch (loss 0.1543):  71%|▋| 2913/4114 [3:08:13<1:15:46,  3.79s/it]Training 2/2 epoch (loss 0.1543):  71%|▋| 2914/4114 [3:08:13<1:13:33,  3.68s/it]Training 2/2 epoch (loss 0.2051):  71%|▋| 2914/4114 [3:08:17<1:13:33,  3.68s/it]Training 2/2 epoch (loss 0.2051):  71%|▋| 2915/4114 [3:08:17<1:15:23,  3.77s/it]Training 2/2 epoch (loss 0.2129):  71%|▋| 2915/4114 [3:08:20<1:15:23,  3.77s/it]Training 2/2 epoch (loss 0.2129):  71%|▋| 2916/4114 [3:08:20<1:14:57,  3.75s/it]Training 2/2 epoch (loss 0.0605):  71%|▋| 2916/4114 [3:08:24<1:14:57,  3.75s/it]Training 2/2 epoch (loss 0.0605):  71%|▋| 2917/4114 [3:08:24<1:15:37,  3.79s/it]Training 2/2 epoch (loss 0.0278):  71%|▋| 2917/4114 [3:08:28<1:15:37,  3.79s/it]Training 2/2 epoch (loss 0.0278):  71%|▋| 2918/4114 [3:08:28<1:16:59,  3.86s/it]Training 2/2 epoch (loss 0.1133):  71%|▋| 2918/4114 [3:08:32<1:16:59,  3.86s/it]Training 2/2 epoch (loss 0.1133):  71%|▋| 2919/4114 [3:08:32<1:17:12,  3.88s/it]Training 2/2 epoch (loss 0.0090):  71%|▋| 2919/4114 [3:08:36<1:17:12,  3.88s/it]Training 2/2 epoch (loss 0.0090):  71%|▋| 2920/4114 [3:08:36<1:18:01,  3.92s/it]Training 2/2 epoch (loss 0.0189):  71%|▋| 2920/4114 [3:08:40<1:18:01,  3.92s/it]Training 2/2 epoch (loss 0.0189):  71%|▋| 2921/4114 [3:08:40<1:16:43,  3.86s/it]Training 2/2 epoch (loss 0.0449):  71%|▋| 2921/4114 [3:08:44<1:16:43,  3.86s/it]Training 2/2 epoch (loss 0.0449):  71%|▋| 2922/4114 [3:08:44<1:18:31,  3.95s/it]Training 2/2 epoch (loss 0.0503):  71%|▋| 2922/4114 [3:08:48<1:18:31,  3.95s/it]Training 2/2 epoch (loss 0.0503):  71%|▋| 2923/4114 [3:08:48<1:19:22,  4.00s/it]Training 2/2 epoch (loss 0.0391):  71%|▋| 2923/4114 [3:08:52<1:19:22,  4.00s/it]Training 2/2 epoch (loss 0.0391):  71%|▋| 2924/4114 [3:08:52<1:18:48,  3.97s/it]Training 2/2 epoch (loss 0.2119):  71%|▋| 2924/4114 [3:08:56<1:18:48,  3.97s/it]Training 2/2 epoch (loss 0.2119):  71%|▋| 2925/4114 [3:08:56<1:20:28,  4.06s/it]Training 2/2 epoch (loss 0.1025):  71%|▋| 2925/4114 [3:09:00<1:20:28,  4.06s/it]Training 2/2 epoch (loss 0.1025):  71%|▋| 2926/4114 [3:09:00<1:19:10,  4.00s/it]Training 2/2 epoch (loss 0.0114):  71%|▋| 2926/4114 [3:09:04<1:19:10,  4.00s/it]Training 2/2 epoch (loss 0.0114):  71%|▋| 2927/4114 [3:09:04<1:18:36,  3.97s/it]Training 2/2 epoch (loss 0.0447):  71%|▋| 2927/4114 [3:09:08<1:18:36,  3.97s/it]Training 2/2 epoch (loss 0.0447):  71%|▋| 2928/4114 [3:09:08<1:19:42,  4.03s/it]Training 2/2 epoch (loss 0.0280):  71%|▋| 2928/4114 [3:09:12<1:19:42,  4.03s/it]Training 2/2 epoch (loss 0.0280):  71%|▋| 2929/4114 [3:09:12<1:18:55,  4.00s/it]Training 2/2 epoch (loss 0.0640):  71%|▋| 2929/4114 [3:09:16<1:18:55,  4.00s/it]Training 2/2 epoch (loss 0.0640):  71%|▋| 2930/4114 [3:09:16<1:18:17,  3.97s/it]Training 2/2 epoch (loss 0.0645):  71%|▋| 2930/4114 [3:09:20<1:18:17,  3.97s/it]Training 2/2 epoch (loss 0.0645):  71%|▋| 2931/4114 [3:09:20<1:19:06,  4.01s/it]Training 2/2 epoch (loss 0.0554):  71%|▋| 2931/4114 [3:09:24<1:19:06,  4.01s/it]Training 2/2 epoch (loss 0.0554):  71%|▋| 2932/4114 [3:09:24<1:16:12,  3.87s/it]Training 2/2 epoch (loss 0.0435):  71%|▋| 2932/4114 [3:09:27<1:16:12,  3.87s/it]Training 2/2 epoch (loss 0.0435):  71%|▋| 2933/4114 [3:09:27<1:13:21,  3.73s/it]Training 2/2 epoch (loss 0.0723):  71%|▋| 2933/4114 [3:09:31<1:13:21,  3.73s/it]Training 2/2 epoch (loss 0.0723):  71%|▋| 2934/4114 [3:09:31<1:13:12,  3.72s/it]Training 2/2 epoch (loss 0.0703):  71%|▋| 2934/4114 [3:09:35<1:13:12,  3.72s/it]Training 2/2 epoch (loss 0.0703):  71%|▋| 2935/4114 [3:09:35<1:15:13,  3.83s/it]Training 2/2 epoch (loss 0.1846):  71%|▋| 2935/4114 [3:09:39<1:15:13,  3.83s/it]Training 2/2 epoch (loss 0.1846):  71%|▋| 2936/4114 [3:09:39<1:14:53,  3.81s/it]Training 2/2 epoch (loss 0.1748):  71%|▋| 2936/4114 [3:09:43<1:14:53,  3.81s/it]Training 2/2 epoch (loss 0.1748):  71%|▋| 2937/4114 [3:09:43<1:17:56,  3.97s/it]Training 2/2 epoch (loss 0.0442):  71%|▋| 2937/4114 [3:09:47<1:17:56,  3.97s/it]Training 2/2 epoch (loss 0.0442):  71%|▋| 2938/4114 [3:09:47<1:16:57,  3.93s/it]Training 2/2 epoch (loss 0.1094):  71%|▋| 2938/4114 [3:09:51<1:16:57,  3.93s/it]Training 2/2 epoch (loss 0.1094):  71%|▋| 2939/4114 [3:09:51<1:15:58,  3.88s/it]Training 2/2 epoch (loss 0.0298):  71%|▋| 2939/4114 [3:09:54<1:15:58,  3.88s/it]Training 2/2 epoch (loss 0.0298):  71%|▋| 2940/4114 [3:09:54<1:13:48,  3.77s/it]Training 2/2 epoch (loss 0.0413):  71%|▋| 2940/4114 [3:09:57<1:13:48,  3.77s/it]Training 2/2 epoch (loss 0.0413):  71%|▋| 2941/4114 [3:09:57<1:09:06,  3.53s/it]Training 2/2 epoch (loss 0.0459):  71%|▋| 2941/4114 [3:10:01<1:09:06,  3.53s/it]Training 2/2 epoch (loss 0.0459):  72%|▋| 2942/4114 [3:10:01<1:10:29,  3.61s/it]Training 2/2 epoch (loss 0.0869):  72%|▋| 2942/4114 [3:10:05<1:10:29,  3.61s/it]Training 2/2 epoch (loss 0.0869):  72%|▋| 2943/4114 [3:10:05<1:13:48,  3.78s/it]Training 2/2 epoch (loss 0.1865):  72%|▋| 2943/4114 [3:10:09<1:13:48,  3.78s/it]Training 2/2 epoch (loss 0.1865):  72%|▋| 2944/4114 [3:10:09<1:13:42,  3.78s/it]Training 2/2 epoch (loss 0.0786):  72%|▋| 2944/4114 [3:10:13<1:13:42,  3.78s/it]Training 2/2 epoch (loss 0.0786):  72%|▋| 2945/4114 [3:10:13<1:15:00,  3.85s/it]Training 2/2 epoch (loss 0.1484):  72%|▋| 2945/4114 [3:10:17<1:15:00,  3.85s/it]Training 2/2 epoch (loss 0.1484):  72%|▋| 2946/4114 [3:10:17<1:17:01,  3.96s/it]Training 2/2 epoch (loss 0.0203):  72%|▋| 2946/4114 [3:10:21<1:17:01,  3.96s/it]Training 2/2 epoch (loss 0.0203):  72%|▋| 2947/4114 [3:10:21<1:17:05,  3.96s/it]Training 2/2 epoch (loss 0.0195):  72%|▋| 2947/4114 [3:10:25<1:17:05,  3.96s/it]Training 2/2 epoch (loss 0.0195):  72%|▋| 2948/4114 [3:10:25<1:13:58,  3.81s/it]Training 2/2 epoch (loss 0.0381):  72%|▋| 2948/4114 [3:10:29<1:13:58,  3.81s/it]Training 2/2 epoch (loss 0.0381):  72%|▋| 2949/4114 [3:10:29<1:16:04,  3.92s/it]Training 2/2 epoch (loss 0.2695):  72%|▋| 2949/4114 [3:10:32<1:16:04,  3.92s/it]Training 2/2 epoch (loss 0.2695):  72%|▋| 2950/4114 [3:10:32<1:13:15,  3.78s/it]Training 2/2 epoch (loss 0.0967):  72%|▋| 2950/4114 [3:10:36<1:13:15,  3.78s/it]Training 2/2 epoch (loss 0.0967):  72%|▋| 2951/4114 [3:10:36<1:13:11,  3.78s/it]Training 2/2 epoch (loss 0.0864):  72%|▋| 2951/4114 [3:10:40<1:13:11,  3.78s/it]Training 2/2 epoch (loss 0.0864):  72%|▋| 2952/4114 [3:10:40<1:14:39,  3.85s/it]Training 2/2 epoch (loss 0.1021):  72%|▋| 2952/4114 [3:10:44<1:14:39,  3.85s/it]Training 2/2 epoch (loss 0.1021):  72%|▋| 2953/4114 [3:10:44<1:15:18,  3.89s/it]Training 2/2 epoch (loss 0.0703):  72%|▋| 2953/4114 [3:10:48<1:15:18,  3.89s/it]Training 2/2 epoch (loss 0.0703):  72%|▋| 2954/4114 [3:10:48<1:15:17,  3.89s/it]Training 2/2 epoch (loss 0.0732):  72%|▋| 2954/4114 [3:10:52<1:15:17,  3.89s/it]Training 2/2 epoch (loss 0.0732):  72%|▋| 2955/4114 [3:10:52<1:15:52,  3.93s/it]Training 2/2 epoch (loss 0.0282):  72%|▋| 2955/4114 [3:10:56<1:15:52,  3.93s/it]Training 2/2 epoch (loss 0.0282):  72%|▋| 2956/4114 [3:10:56<1:15:05,  3.89s/it]Training 2/2 epoch (loss 0.0515):  72%|▋| 2956/4114 [3:11:00<1:15:05,  3.89s/it]Training 2/2 epoch (loss 0.0515):  72%|▋| 2957/4114 [3:11:00<1:14:22,  3.86s/it]Training 2/2 epoch (loss 0.0732):  72%|▋| 2957/4114 [3:11:04<1:14:22,  3.86s/it]Training 2/2 epoch (loss 0.0732):  72%|▋| 2958/4114 [3:11:04<1:16:19,  3.96s/it]Training 2/2 epoch (loss 0.0786):  72%|▋| 2958/4114 [3:11:07<1:16:19,  3.96s/it]Training 2/2 epoch (loss 0.0786):  72%|▋| 2959/4114 [3:11:07<1:14:09,  3.85s/it]Training 2/2 epoch (loss 0.0299):  72%|▋| 2959/4114 [3:11:11<1:14:09,  3.85s/it]Training 2/2 epoch (loss 0.0299):  72%|▋| 2960/4114 [3:11:11<1:14:26,  3.87s/it]Training 2/2 epoch (loss 0.0102):  72%|▋| 2960/4114 [3:11:16<1:14:26,  3.87s/it]Training 2/2 epoch (loss 0.0102):  72%|▋| 2961/4114 [3:11:16<1:17:09,  4.01s/it]Training 2/2 epoch (loss 0.0247):  72%|▋| 2961/4114 [3:11:20<1:17:09,  4.01s/it]Training 2/2 epoch (loss 0.0247):  72%|▋| 2962/4114 [3:11:20<1:16:35,  3.99s/it]Training 2/2 epoch (loss 0.0378):  72%|▋| 2962/4114 [3:11:24<1:16:35,  3.99s/it]Training 2/2 epoch (loss 0.0378):  72%|▋| 2963/4114 [3:11:24<1:16:41,  4.00s/it]Training 2/2 epoch (loss 0.0332):  72%|▋| 2963/4114 [3:11:27<1:16:41,  4.00s/it]Training 2/2 epoch (loss 0.0332):  72%|▋| 2964/4114 [3:11:27<1:15:28,  3.94s/it]Training 2/2 epoch (loss 0.0186):  72%|▋| 2964/4114 [3:11:31<1:15:28,  3.94s/it]Training 2/2 epoch (loss 0.0186):  72%|▋| 2965/4114 [3:11:31<1:14:37,  3.90s/it]Training 2/2 epoch (loss 0.1060):  72%|▋| 2965/4114 [3:11:35<1:14:37,  3.90s/it]Training 2/2 epoch (loss 0.1060):  72%|▋| 2966/4114 [3:11:35<1:14:13,  3.88s/it]Training 2/2 epoch (loss 0.0125):  72%|▋| 2966/4114 [3:11:39<1:14:13,  3.88s/it]Training 2/2 epoch (loss 0.0125):  72%|▋| 2967/4114 [3:11:39<1:12:47,  3.81s/it]Training 2/2 epoch (loss 0.0630):  72%|▋| 2967/4114 [3:11:43<1:12:47,  3.81s/it]Training 2/2 epoch (loss 0.0630):  72%|▋| 2968/4114 [3:11:43<1:13:29,  3.85s/it]Training 2/2 epoch (loss 0.0267):  72%|▋| 2968/4114 [3:11:47<1:13:29,  3.85s/it]Training 2/2 epoch (loss 0.0267):  72%|▋| 2969/4114 [3:11:47<1:14:29,  3.90s/it]Training 2/2 epoch (loss 0.0330):  72%|▋| 2969/4114 [3:11:50<1:14:29,  3.90s/it]Training 2/2 epoch (loss 0.0330):  72%|▋| 2970/4114 [3:11:50<1:09:29,  3.65s/it]Training 2/2 epoch (loss 0.1650):  72%|▋| 2970/4114 [3:11:54<1:09:29,  3.65s/it]Training 2/2 epoch (loss 0.1650):  72%|▋| 2971/4114 [3:11:54<1:11:13,  3.74s/it]Training 2/2 epoch (loss 0.0796):  72%|▋| 2971/4114 [3:11:57<1:11:13,  3.74s/it]Training 2/2 epoch (loss 0.0796):  72%|▋| 2972/4114 [3:11:57<1:11:15,  3.74s/it]Training 2/2 epoch (loss 0.1211):  72%|▋| 2972/4114 [3:12:01<1:11:15,  3.74s/it]Training 2/2 epoch (loss 0.1211):  72%|▋| 2973/4114 [3:12:01<1:10:57,  3.73s/it]Training 2/2 epoch (loss 0.0879):  72%|▋| 2973/4114 [3:12:05<1:10:57,  3.73s/it]Training 2/2 epoch (loss 0.0879):  72%|▋| 2974/4114 [3:12:05<1:11:51,  3.78s/it]Training 2/2 epoch (loss 0.0762):  72%|▋| 2974/4114 [3:12:09<1:11:51,  3.78s/it]Training 2/2 epoch (loss 0.0762):  72%|▋| 2975/4114 [3:12:09<1:12:33,  3.82s/it]Training 2/2 epoch (loss 0.1377):  72%|▋| 2975/4114 [3:12:13<1:12:33,  3.82s/it]Training 2/2 epoch (loss 0.1377):  72%|▋| 2976/4114 [3:12:13<1:13:23,  3.87s/it]Training 2/2 epoch (loss 0.1064):  72%|▋| 2976/4114 [3:12:16<1:13:23,  3.87s/it]Training 2/2 epoch (loss 0.1064):  72%|▋| 2977/4114 [3:12:16<1:10:40,  3.73s/it]Training 2/2 epoch (loss 0.0366):  72%|▋| 2977/4114 [3:12:20<1:10:40,  3.73s/it]Training 2/2 epoch (loss 0.0366):  72%|▋| 2978/4114 [3:12:20<1:12:04,  3.81s/it]Training 2/2 epoch (loss 0.0811):  72%|▋| 2978/4114 [3:12:24<1:12:04,  3.81s/it]Training 2/2 epoch (loss 0.0811):  72%|▋| 2979/4114 [3:12:24<1:12:26,  3.83s/it]Training 2/2 epoch (loss 0.1147):  72%|▋| 2979/4114 [3:12:28<1:12:26,  3.83s/it]Training 2/2 epoch (loss 0.1147):  72%|▋| 2980/4114 [3:12:28<1:12:56,  3.86s/it]Training 2/2 epoch (loss 0.0928):  72%|▋| 2980/4114 [3:12:32<1:12:56,  3.86s/it]Training 2/2 epoch (loss 0.0928):  72%|▋| 2981/4114 [3:12:32<1:12:56,  3.86s/it]Training 2/2 epoch (loss 0.1260):  72%|▋| 2981/4114 [3:12:36<1:12:56,  3.86s/it]Training 2/2 epoch (loss 0.1260):  72%|▋| 2982/4114 [3:12:36<1:14:27,  3.95s/it]Training 2/2 epoch (loss 0.0752):  72%|▋| 2982/4114 [3:12:40<1:14:27,  3.95s/it]Training 2/2 epoch (loss 0.0752):  73%|▋| 2983/4114 [3:12:40<1:14:24,  3.95s/it]Training 2/2 epoch (loss 0.0269):  73%|▋| 2983/4114 [3:12:44<1:14:24,  3.95s/it]Training 2/2 epoch (loss 0.0269):  73%|▋| 2984/4114 [3:12:44<1:14:25,  3.95s/it]Training 2/2 epoch (loss 0.0298):  73%|▋| 2984/4114 [3:12:48<1:14:25,  3.95s/it]Training 2/2 epoch (loss 0.0298):  73%|▋| 2985/4114 [3:12:48<1:14:52,  3.98s/it]Training 2/2 epoch (loss 0.0115):  73%|▋| 2985/4114 [3:12:52<1:14:52,  3.98s/it]Training 2/2 epoch (loss 0.0115):  73%|▋| 2986/4114 [3:12:52<1:13:46,  3.92s/it]Training 2/2 epoch (loss 0.0311):  73%|▋| 2986/4114 [3:12:56<1:13:46,  3.92s/it]Training 2/2 epoch (loss 0.0311):  73%|▋| 2987/4114 [3:12:56<1:13:08,  3.89s/it]Training 2/2 epoch (loss 0.0262):  73%|▋| 2987/4114 [3:13:00<1:13:08,  3.89s/it]Training 2/2 epoch (loss 0.0262):  73%|▋| 2988/4114 [3:13:00<1:14:15,  3.96s/it]Training 2/2 epoch (loss 0.1631):  73%|▋| 2988/4114 [3:13:04<1:14:15,  3.96s/it]Training 2/2 epoch (loss 0.1631):  73%|▋| 2989/4114 [3:13:04<1:13:10,  3.90s/it]Training 2/2 epoch (loss 0.0154):  73%|▋| 2989/4114 [3:13:07<1:13:10,  3.90s/it]Training 2/2 epoch (loss 0.0154):  73%|▋| 2990/4114 [3:13:07<1:12:26,  3.87s/it]Training 2/2 epoch (loss 0.1562):  73%|▋| 2990/4114 [3:13:12<1:12:26,  3.87s/it]Training 2/2 epoch (loss 0.1562):  73%|▋| 2991/4114 [3:13:12<1:14:26,  3.98s/it]Training 2/2 epoch (loss 0.0806):  73%|▋| 2991/4114 [3:13:16<1:14:26,  3.98s/it]Training 2/2 epoch (loss 0.0806):  73%|▋| 2992/4114 [3:13:16<1:14:18,  3.97s/it]Training 2/2 epoch (loss 0.0613):  73%|▋| 2992/4114 [3:13:19<1:14:18,  3.97s/it]Training 2/2 epoch (loss 0.0613):  73%|▋| 2993/4114 [3:13:19<1:11:55,  3.85s/it]Training 2/2 epoch (loss 0.0542):  73%|▋| 2993/4114 [3:13:23<1:11:55,  3.85s/it]Training 2/2 epoch (loss 0.0542):  73%|▋| 2994/4114 [3:13:23<1:13:42,  3.95s/it]Training 2/2 epoch (loss 0.0060):  73%|▋| 2994/4114 [3:13:27<1:13:42,  3.95s/it]Training 2/2 epoch (loss 0.0060):  73%|▋| 2995/4114 [3:13:27<1:10:38,  3.79s/it]Training 2/2 epoch (loss 0.0356):  73%|▋| 2995/4114 [3:13:31<1:10:38,  3.79s/it]Training 2/2 epoch (loss 0.0356):  73%|▋| 2996/4114 [3:13:31<1:11:20,  3.83s/it]Training 2/2 epoch (loss 0.1533):  73%|▋| 2996/4114 [3:13:34<1:11:20,  3.83s/it]Training 2/2 epoch (loss 0.1533):  73%|▋| 2997/4114 [3:13:34<1:10:27,  3.79s/it]Training 2/2 epoch (loss 0.0894):  73%|▋| 2997/4114 [3:13:38<1:10:27,  3.79s/it]Training 2/2 epoch (loss 0.0894):  73%|▋| 2998/4114 [3:13:38<1:11:41,  3.85s/it]Training 2/2 epoch (loss 0.0310):  73%|▋| 2998/4114 [3:13:42<1:11:41,  3.85s/it]Training 2/2 epoch (loss 0.0310):  73%|▋| 2999/4114 [3:13:42<1:12:50,  3.92s/it]Training 2/2 epoch (loss 0.0084):  73%|▋| 2999/4114 [3:13:47<1:12:50,  3.92s/it]Training 2/2 epoch (loss 0.0084):  73%|▋| 3000/4114 [3:13:47<1:14:04,  3.99s/it]Training 2/2 epoch (loss 0.0369):  73%|▋| 3000/4114 [3:13:50<1:14:04,  3.99s/it]Training 2/2 epoch (loss 0.0369):  73%|▋| 3001/4114 [3:13:50<1:13:33,  3.97s/it]Training 2/2 epoch (loss 0.0403):  73%|▋| 3001/4114 [3:13:54<1:13:33,  3.97s/it]Training 2/2 epoch (loss 0.0403):  73%|▋| 3002/4114 [3:13:54<1:10:19,  3.79s/it]Training 2/2 epoch (loss 0.0189):  73%|▋| 3002/4114 [3:13:58<1:10:19,  3.79s/it]Training 2/2 epoch (loss 0.0189):  73%|▋| 3003/4114 [3:13:58<1:11:47,  3.88s/it]Training 2/2 epoch (loss 0.0466):  73%|▋| 3003/4114 [3:14:02<1:11:47,  3.88s/it]Training 2/2 epoch (loss 0.0466):  73%|▋| 3004/4114 [3:14:02<1:12:43,  3.93s/it]Training 2/2 epoch (loss 0.0635):  73%|▋| 3004/4114 [3:14:06<1:12:43,  3.93s/it]Training 2/2 epoch (loss 0.0635):  73%|▋| 3005/4114 [3:14:06<1:13:09,  3.96s/it]Training 2/2 epoch (loss 0.0208):  73%|▋| 3005/4114 [3:14:10<1:13:09,  3.96s/it]Training 2/2 epoch (loss 0.0208):  73%|▋| 3006/4114 [3:14:10<1:14:16,  4.02s/it]Training 2/2 epoch (loss 0.0122):  73%|▋| 3006/4114 [3:14:14<1:14:16,  4.02s/it]Training 2/2 epoch (loss 0.0122):  73%|▋| 3007/4114 [3:14:14<1:13:39,  3.99s/it]Training 2/2 epoch (loss 0.0879):  73%|▋| 3007/4114 [3:14:18<1:13:39,  3.99s/it]Training 2/2 epoch (loss 0.0879):  73%|▋| 3008/4114 [3:14:18<1:13:26,  3.98s/it]Training 2/2 epoch (loss 0.0947):  73%|▋| 3008/4114 [3:14:22<1:13:26,  3.98s/it]Training 2/2 epoch (loss 0.0947):  73%|▋| 3009/4114 [3:14:22<1:13:35,  4.00s/it]Training 2/2 epoch (loss 0.0337):  73%|▋| 3009/4114 [3:14:26<1:13:35,  4.00s/it]Training 2/2 epoch (loss 0.0337):  73%|▋| 3010/4114 [3:14:26<1:13:13,  3.98s/it]Training 2/2 epoch (loss 0.0251):  73%|▋| 3010/4114 [3:14:30<1:13:13,  3.98s/it]Training 2/2 epoch (loss 0.0251):  73%|▋| 3011/4114 [3:14:30<1:12:17,  3.93s/it]Training 2/2 epoch (loss 0.0942):  73%|▋| 3011/4114 [3:14:34<1:12:17,  3.93s/it]Training 2/2 epoch (loss 0.0942):  73%|▋| 3012/4114 [3:14:34<1:13:26,  4.00s/it]Training 2/2 epoch (loss 0.1377):  73%|▋| 3012/4114 [3:14:37<1:13:26,  4.00s/it]Training 2/2 epoch (loss 0.1377):  73%|▋| 3013/4114 [3:14:37<1:05:52,  3.59s/it]Training 2/2 epoch (loss 0.0620):  73%|▋| 3013/4114 [3:14:41<1:05:52,  3.59s/it]Training 2/2 epoch (loss 0.0620):  73%|▋| 3014/4114 [3:14:41<1:07:49,  3.70s/it]Training 2/2 epoch (loss 0.0962):  73%|▋| 3014/4114 [3:14:45<1:07:49,  3.70s/it]Training 2/2 epoch (loss 0.0962):  73%|▋| 3015/4114 [3:14:45<1:10:21,  3.84s/it]Training 2/2 epoch (loss 0.0216):  73%|▋| 3015/4114 [3:14:48<1:10:21,  3.84s/it]Training 2/2 epoch (loss 0.0216):  73%|▋| 3016/4114 [3:14:48<1:09:53,  3.82s/it]Training 2/2 epoch (loss 0.0635):  73%|▋| 3016/4114 [3:14:52<1:09:53,  3.82s/it]Training 2/2 epoch (loss 0.0635):  73%|▋| 3017/4114 [3:14:52<1:10:47,  3.87s/it]Training 2/2 epoch (loss 0.0439):  73%|▋| 3017/4114 [3:14:57<1:10:47,  3.87s/it]Training 2/2 epoch (loss 0.0439):  73%|▋| 3018/4114 [3:14:57<1:12:40,  3.98s/it]Training 2/2 epoch (loss 0.0540):  73%|▋| 3018/4114 [3:15:01<1:12:40,  3.98s/it]Training 2/2 epoch (loss 0.0540):  73%|▋| 3019/4114 [3:15:01<1:11:50,  3.94s/it]Training 2/2 epoch (loss 0.0053):  73%|▋| 3019/4114 [3:15:04<1:11:50,  3.94s/it]Training 2/2 epoch (loss 0.0053):  73%|▋| 3020/4114 [3:15:04<1:11:26,  3.92s/it]Training 2/2 epoch (loss 0.0265):  73%|▋| 3020/4114 [3:15:08<1:11:26,  3.92s/it]Training 2/2 epoch (loss 0.0265):  73%|▋| 3021/4114 [3:15:08<1:11:59,  3.95s/it]Training 2/2 epoch (loss 0.0625):  73%|▋| 3021/4114 [3:15:12<1:11:59,  3.95s/it]Training 2/2 epoch (loss 0.0625):  73%|▋| 3022/4114 [3:15:12<1:11:25,  3.92s/it]Training 2/2 epoch (loss 0.0342):  73%|▋| 3022/4114 [3:15:16<1:11:25,  3.92s/it]Training 2/2 epoch (loss 0.0342):  73%|▋| 3023/4114 [3:15:16<1:11:13,  3.92s/it]Training 2/2 epoch (loss 0.0199):  73%|▋| 3023/4114 [3:15:20<1:11:13,  3.92s/it]Training 2/2 epoch (loss 0.0199):  74%|▋| 3024/4114 [3:15:20<1:08:34,  3.77s/it]Training 2/2 epoch (loss 0.0080):  74%|▋| 3024/4114 [3:15:23<1:08:34,  3.77s/it]Training 2/2 epoch (loss 0.0080):  74%|▋| 3025/4114 [3:15:23<1:05:31,  3.61s/it]Training 2/2 epoch (loss 0.1025):  74%|▋| 3025/4114 [3:15:27<1:05:31,  3.61s/it]Training 2/2 epoch (loss 0.1025):  74%|▋| 3026/4114 [3:15:27<1:07:32,  3.72s/it]Training 2/2 epoch (loss 0.0703):  74%|▋| 3026/4114 [3:15:31<1:07:32,  3.72s/it]Training 2/2 epoch (loss 0.0703):  74%|▋| 3027/4114 [3:15:31<1:08:58,  3.81s/it]Training 2/2 epoch (loss 0.0325):  74%|▋| 3027/4114 [3:15:35<1:08:58,  3.81s/it]Training 2/2 epoch (loss 0.0325):  74%|▋| 3028/4114 [3:15:35<1:08:37,  3.79s/it]Training 2/2 epoch (loss 0.0305):  74%|▋| 3028/4114 [3:15:39<1:08:37,  3.79s/it]Training 2/2 epoch (loss 0.0305):  74%|▋| 3029/4114 [3:15:39<1:09:12,  3.83s/it]Training 2/2 epoch (loss 0.0079):  74%|▋| 3029/4114 [3:15:43<1:09:12,  3.83s/it]Training 2/2 epoch (loss 0.0079):  74%|▋| 3030/4114 [3:15:43<1:11:45,  3.97s/it]Training 2/2 epoch (loss 0.0500):  74%|▋| 3030/4114 [3:15:47<1:11:45,  3.97s/it]Training 2/2 epoch (loss 0.0500):  74%|▋| 3031/4114 [3:15:47<1:11:21,  3.95s/it]Training 2/2 epoch (loss 0.0060):  74%|▋| 3031/4114 [3:15:51<1:11:21,  3.95s/it]Training 2/2 epoch (loss 0.0060):  74%|▋| 3032/4114 [3:15:51<1:10:48,  3.93s/it]Training 2/2 epoch (loss 0.0082):  74%|▋| 3032/4114 [3:15:55<1:10:48,  3.93s/it]Training 2/2 epoch (loss 0.0082):  74%|▋| 3033/4114 [3:15:55<1:11:30,  3.97s/it]Training 2/2 epoch (loss 0.0071):  74%|▋| 3033/4114 [3:15:58<1:11:30,  3.97s/it]Training 2/2 epoch (loss 0.0071):  74%|▋| 3034/4114 [3:15:58<1:09:56,  3.89s/it]Training 2/2 epoch (loss 0.0217):  74%|▋| 3034/4114 [3:16:02<1:09:56,  3.89s/it]Training 2/2 epoch (loss 0.0217):  74%|▋| 3035/4114 [3:16:02<1:10:11,  3.90s/it]Training 2/2 epoch (loss 0.0020):  74%|▋| 3035/4114 [3:16:06<1:10:11,  3.90s/it]Training 2/2 epoch (loss 0.0020):  74%|▋| 3036/4114 [3:16:06<1:10:53,  3.95s/it]Training 2/2 epoch (loss 0.0835):  74%|▋| 3036/4114 [3:16:10<1:10:53,  3.95s/it]Training 2/2 epoch (loss 0.0835):  74%|▋| 3037/4114 [3:16:10<1:07:45,  3.77s/it]Training 2/2 epoch (loss 0.0042):  74%|▋| 3037/4114 [3:16:14<1:07:45,  3.77s/it]Training 2/2 epoch (loss 0.0042):  74%|▋| 3038/4114 [3:16:14<1:07:42,  3.78s/it]Training 2/2 epoch (loss 0.0388):  74%|▋| 3038/4114 [3:16:17<1:07:42,  3.78s/it]Training 2/2 epoch (loss 0.0388):  74%|▋| 3039/4114 [3:16:17<1:04:47,  3.62s/it]Training 2/2 epoch (loss 0.0496):  74%|▋| 3039/4114 [3:16:21<1:04:47,  3.62s/it]Training 2/2 epoch (loss 0.0496):  74%|▋| 3040/4114 [3:16:21<1:07:02,  3.75s/it]Training 2/2 epoch (loss 0.0522):  74%|▋| 3040/4114 [3:16:25<1:07:02,  3.75s/it]Training 2/2 epoch (loss 0.0522):  74%|▋| 3041/4114 [3:16:25<1:08:01,  3.80s/it]Training 2/2 epoch (loss 0.0327):  74%|▋| 3041/4114 [3:16:29<1:08:01,  3.80s/it]Training 2/2 epoch (loss 0.0327):  74%|▋| 3042/4114 [3:16:29<1:10:18,  3.94s/it]Training 2/2 epoch (loss 0.0066):  74%|▋| 3042/4114 [3:16:33<1:10:18,  3.94s/it]Training 2/2 epoch (loss 0.0066):  74%|▋| 3043/4114 [3:16:33<1:10:23,  3.94s/it]Training 2/2 epoch (loss 0.0518):  74%|▋| 3043/4114 [3:16:36<1:10:23,  3.94s/it]Training 2/2 epoch (loss 0.0518):  74%|▋| 3044/4114 [3:16:36<1:06:13,  3.71s/it]Training 2/2 epoch (loss 0.0032):  74%|▋| 3044/4114 [3:16:40<1:06:13,  3.71s/it]Training 2/2 epoch (loss 0.0032):  74%|▋| 3045/4114 [3:16:40<1:09:03,  3.88s/it]Training 2/2 epoch (loss 0.0481):  74%|▋| 3045/4114 [3:16:44<1:09:03,  3.88s/it]Training 2/2 epoch (loss 0.0481):  74%|▋| 3046/4114 [3:16:44<1:09:02,  3.88s/it]Training 2/2 epoch (loss 0.0718):  74%|▋| 3046/4114 [3:16:48<1:09:02,  3.88s/it]Training 2/2 epoch (loss 0.0718):  74%|▋| 3047/4114 [3:16:48<1:09:20,  3.90s/it]Training 2/2 epoch (loss 0.0204):  74%|▋| 3047/4114 [3:16:52<1:09:20,  3.90s/it]Training 2/2 epoch (loss 0.0204):  74%|▋| 3048/4114 [3:16:52<1:10:43,  3.98s/it]Training 2/2 epoch (loss 0.0040):  74%|▋| 3048/4114 [3:16:56<1:10:43,  3.98s/it]Training 2/2 epoch (loss 0.0040):  74%|▋| 3049/4114 [3:16:56<1:10:07,  3.95s/it]Training 2/2 epoch (loss 0.0266):  74%|▋| 3049/4114 [3:17:00<1:10:07,  3.95s/it]Training 2/2 epoch (loss 0.0266):  74%|▋| 3050/4114 [3:17:00<1:09:56,  3.94s/it]Training 2/2 epoch (loss 0.0035):  74%|▋| 3050/4114 [3:17:04<1:09:56,  3.94s/it]Training 2/2 epoch (loss 0.0035):  74%|▋| 3051/4114 [3:17:04<1:10:47,  4.00s/it]Training 2/2 epoch (loss 0.0150):  74%|▋| 3051/4114 [3:17:08<1:10:47,  4.00s/it]Training 2/2 epoch (loss 0.0150):  74%|▋| 3052/4114 [3:17:08<1:08:56,  3.89s/it]Training 2/2 epoch (loss 0.0337):  74%|▋| 3052/4114 [3:17:12<1:08:56,  3.89s/it]Training 2/2 epoch (loss 0.0337):  74%|▋| 3053/4114 [3:17:12<1:08:14,  3.86s/it]Training 2/2 epoch (loss 0.0674):  74%|▋| 3053/4114 [3:17:16<1:08:14,  3.86s/it]Training 2/2 epoch (loss 0.0674):  74%|▋| 3054/4114 [3:17:16<1:09:44,  3.95s/it]Training 2/2 epoch (loss 0.0527):  74%|▋| 3054/4114 [3:17:20<1:09:44,  3.95s/it]Training 2/2 epoch (loss 0.0527):  74%|▋| 3055/4114 [3:17:20<1:08:40,  3.89s/it]Training 2/2 epoch (loss 0.0518):  74%|▋| 3055/4114 [3:17:23<1:08:40,  3.89s/it]Training 2/2 epoch (loss 0.0518):  74%|▋| 3056/4114 [3:17:23<1:08:03,  3.86s/it]Training 2/2 epoch (loss 0.0723):  74%|▋| 3056/4114 [3:17:28<1:08:03,  3.86s/it]Training 2/2 epoch (loss 0.0723):  74%|▋| 3057/4114 [3:17:28<1:10:19,  3.99s/it]Training 2/2 epoch (loss 0.0718):  74%|▋| 3057/4114 [3:17:31<1:10:19,  3.99s/it]Training 2/2 epoch (loss 0.0718):  74%|▋| 3058/4114 [3:17:31<1:07:42,  3.85s/it]Training 2/2 epoch (loss 0.0295):  74%|▋| 3058/4114 [3:17:35<1:07:42,  3.85s/it]Training 2/2 epoch (loss 0.0295):  74%|▋| 3059/4114 [3:17:35<1:07:27,  3.84s/it]Training 2/2 epoch (loss 0.0142):  74%|▋| 3059/4114 [3:17:39<1:07:27,  3.84s/it]Training 2/2 epoch (loss 0.0142):  74%|▋| 3060/4114 [3:17:39<1:09:10,  3.94s/it]Training 2/2 epoch (loss 0.0212):  74%|▋| 3060/4114 [3:17:43<1:09:10,  3.94s/it]Training 2/2 epoch (loss 0.0212):  74%|▋| 3061/4114 [3:17:43<1:08:40,  3.91s/it]Training 2/2 epoch (loss 0.0047):  74%|▋| 3061/4114 [3:17:47<1:08:40,  3.91s/it]Training 2/2 epoch (loss 0.0047):  74%|▋| 3062/4114 [3:17:47<1:08:23,  3.90s/it]Training 2/2 epoch (loss 0.0664):  74%|▋| 3062/4114 [3:17:51<1:08:23,  3.90s/it]Training 2/2 epoch (loss 0.0664):  74%|▋| 3063/4114 [3:17:51<1:09:56,  3.99s/it]Training 2/2 epoch (loss 0.0183):  74%|▋| 3063/4114 [3:17:55<1:09:56,  3.99s/it]Training 2/2 epoch (loss 0.0183):  74%|▋| 3064/4114 [3:17:55<1:09:34,  3.98s/it]Training 2/2 epoch (loss 0.0146):  74%|▋| 3064/4114 [3:17:59<1:09:34,  3.98s/it]Training 2/2 epoch (loss 0.0146):  75%|▋| 3065/4114 [3:17:59<1:09:59,  4.00s/it]Training 2/2 epoch (loss 0.0198):  75%|▋| 3065/4114 [3:18:04<1:09:59,  4.00s/it]Training 2/2 epoch (loss 0.0198):  75%|▋| 3066/4114 [3:18:04<1:11:33,  4.10s/it]Training 2/2 epoch (loss 0.0082):  75%|▋| 3066/4114 [3:18:07<1:11:33,  4.10s/it]Training 2/2 epoch (loss 0.0082):  75%|▋| 3067/4114 [3:18:07<1:08:33,  3.93s/it]Training 2/2 epoch (loss 0.0308):  75%|▋| 3067/4114 [3:18:11<1:08:33,  3.93s/it]Training 2/2 epoch (loss 0.0308):  75%|▋| 3068/4114 [3:18:11<1:09:08,  3.97s/it]Training 2/2 epoch (loss 0.0181):  75%|▋| 3068/4114 [3:18:15<1:09:08,  3.97s/it]Training 2/2 epoch (loss 0.0181):  75%|▋| 3069/4114 [3:18:15<1:08:25,  3.93s/it]Training 2/2 epoch (loss 0.0232):  75%|▋| 3069/4114 [3:18:19<1:08:25,  3.93s/it]Training 2/2 epoch (loss 0.0232):  75%|▋| 3070/4114 [3:18:19<1:07:34,  3.88s/it]Training 2/2 epoch (loss 0.0231):  75%|▋| 3070/4114 [3:18:23<1:07:34,  3.88s/it]Training 2/2 epoch (loss 0.0231):  75%|▋| 3071/4114 [3:18:23<1:07:22,  3.88s/it]Training 2/2 epoch (loss 0.1611):  75%|▋| 3071/4114 [3:18:27<1:07:22,  3.88s/it]Training 2/2 epoch (loss 0.1611):  75%|▋| 3072/4114 [3:18:27<1:08:32,  3.95s/it]Training 2/2 epoch (loss 0.0342):  75%|▋| 3072/4114 [3:18:30<1:08:32,  3.95s/it]Training 2/2 epoch (loss 0.0342):  75%|▋| 3073/4114 [3:18:30<1:03:54,  3.68s/it]Training 2/2 epoch (loss 0.0398):  75%|▋| 3073/4114 [3:18:34<1:03:54,  3.68s/it]Training 2/2 epoch (loss 0.0398):  75%|▋| 3074/4114 [3:18:34<1:05:21,  3.77s/it]Training 2/2 epoch (loss 0.0096):  75%|▋| 3074/4114 [3:18:38<1:05:21,  3.77s/it]Training 2/2 epoch (loss 0.0096):  75%|▋| 3075/4114 [3:18:38<1:06:43,  3.85s/it]Training 2/2 epoch (loss 0.0327):  75%|▋| 3075/4114 [3:18:42<1:06:43,  3.85s/it]Training 2/2 epoch (loss 0.0327):  75%|▋| 3076/4114 [3:18:42<1:07:21,  3.89s/it]Training 2/2 epoch (loss 0.0386):  75%|▋| 3076/4114 [3:18:46<1:07:21,  3.89s/it]Training 2/2 epoch (loss 0.0386):  75%|▋| 3077/4114 [3:18:46<1:07:04,  3.88s/it]Training 2/2 epoch (loss 0.0141):  75%|▋| 3077/4114 [3:18:50<1:07:04,  3.88s/it]Training 2/2 epoch (loss 0.0141):  75%|▋| 3078/4114 [3:18:50<1:08:12,  3.95s/it]Training 2/2 epoch (loss 0.0540):  75%|▋| 3078/4114 [3:18:54<1:08:12,  3.95s/it]Training 2/2 epoch (loss 0.0540):  75%|▋| 3079/4114 [3:18:54<1:08:00,  3.94s/it]Training 2/2 epoch (loss 0.0381):  75%|▋| 3079/4114 [3:18:57<1:08:00,  3.94s/it]Training 2/2 epoch (loss 0.0381):  75%|▋| 3080/4114 [3:18:57<1:05:35,  3.81s/it]Training 2/2 epoch (loss 0.0913):  75%|▋| 3080/4114 [3:19:01<1:05:35,  3.81s/it]Training 2/2 epoch (loss 0.0913):  75%|▋| 3081/4114 [3:19:01<1:06:59,  3.89s/it]Training 2/2 epoch (loss 0.0884):  75%|▋| 3081/4114 [3:19:05<1:06:59,  3.89s/it]Training 2/2 epoch (loss 0.0884):  75%|▋| 3082/4114 [3:19:05<1:06:19,  3.86s/it]Training 2/2 epoch (loss 0.1396):  75%|▋| 3082/4114 [3:19:08<1:06:19,  3.86s/it]Training 2/2 epoch (loss 0.1396):  75%|▋| 3083/4114 [3:19:08<1:03:41,  3.71s/it]Training 2/2 epoch (loss 0.1641):  75%|▋| 3083/4114 [3:19:13<1:03:41,  3.71s/it]Training 2/2 epoch (loss 0.1641):  75%|▋| 3084/4114 [3:19:13<1:05:58,  3.84s/it]Training 2/2 epoch (loss 0.1357):  75%|▋| 3084/4114 [3:19:16<1:05:58,  3.84s/it]Training 2/2 epoch (loss 0.1357):  75%|▋| 3085/4114 [3:19:16<1:03:00,  3.67s/it]Training 2/2 epoch (loss 0.0801):  75%|▋| 3085/4114 [3:19:20<1:03:00,  3.67s/it]Training 2/2 epoch (loss 0.0801):  75%|▊| 3086/4114 [3:19:20<1:04:39,  3.77s/it]Training 2/2 epoch (loss 0.1396):  75%|▊| 3086/4114 [3:19:24<1:04:39,  3.77s/it]Training 2/2 epoch (loss 0.1396):  75%|▊| 3087/4114 [3:19:24<1:06:12,  3.87s/it]Training 2/2 epoch (loss 0.0830):  75%|▊| 3087/4114 [3:19:28<1:06:12,  3.87s/it]Training 2/2 epoch (loss 0.0830):  75%|▊| 3088/4114 [3:19:28<1:05:59,  3.86s/it]Training 2/2 epoch (loss 0.1523):  75%|▊| 3088/4114 [3:19:31<1:05:59,  3.86s/it]Training 2/2 epoch (loss 0.1523):  75%|▊| 3089/4114 [3:19:31<1:01:57,  3.63s/it]Training 2/2 epoch (loss 0.0061):  75%|▊| 3089/4114 [3:19:35<1:01:57,  3.63s/it]Training 2/2 epoch (loss 0.0061):  75%|▊| 3090/4114 [3:19:35<1:04:38,  3.79s/it]Training 2/2 epoch (loss 0.0481):  75%|▊| 3090/4114 [3:19:39<1:04:38,  3.79s/it]Training 2/2 epoch (loss 0.0481):  75%|▊| 3091/4114 [3:19:39<1:04:46,  3.80s/it]Training 2/2 epoch (loss 0.0625):  75%|▊| 3091/4114 [3:19:43<1:04:46,  3.80s/it]Training 2/2 epoch (loss 0.0625):  75%|▊| 3092/4114 [3:19:43<1:04:52,  3.81s/it]Training 2/2 epoch (loss 0.0042):  75%|▊| 3092/4114 [3:19:47<1:04:52,  3.81s/it]Training 2/2 epoch (loss 0.0042):  75%|▊| 3093/4114 [3:19:47<1:06:58,  3.94s/it]Training 2/2 epoch (loss 0.0486):  75%|▊| 3093/4114 [3:19:51<1:06:58,  3.94s/it]Training 2/2 epoch (loss 0.0486):  75%|▊| 3094/4114 [3:19:51<1:06:38,  3.92s/it]Training 2/2 epoch (loss 0.0107):  75%|▊| 3094/4114 [3:19:55<1:06:38,  3.92s/it]Training 2/2 epoch (loss 0.0107):  75%|▊| 3095/4114 [3:19:55<1:06:32,  3.92s/it]Training 2/2 epoch (loss 0.0267):  75%|▊| 3095/4114 [3:19:59<1:06:32,  3.92s/it]Training 2/2 epoch (loss 0.0267):  75%|▊| 3096/4114 [3:19:59<1:07:40,  3.99s/it]Training 2/2 epoch (loss 0.0344):  75%|▊| 3096/4114 [3:20:03<1:07:40,  3.99s/it]Training 2/2 epoch (loss 0.0344):  75%|▊| 3097/4114 [3:20:03<1:07:35,  3.99s/it]Training 2/2 epoch (loss 0.0938):  75%|▊| 3097/4114 [3:20:07<1:07:35,  3.99s/it]Training 2/2 epoch (loss 0.0938):  75%|▊| 3098/4114 [3:20:07<1:08:03,  4.02s/it]Training 2/2 epoch (loss 0.0469):  75%|▊| 3098/4114 [3:20:10<1:08:03,  4.02s/it]Training 2/2 epoch (loss 0.0469):  75%|▊| 3099/4114 [3:20:10<1:02:27,  3.69s/it]Training 2/2 epoch (loss 0.2129):  75%|▊| 3099/4114 [3:20:14<1:02:27,  3.69s/it]Training 2/2 epoch (loss 0.2129):  75%|▊| 3100/4114 [3:20:14<1:02:55,  3.72s/it]Training 2/2 epoch (loss 0.0977):  75%|▊| 3100/4114 [3:20:18<1:02:55,  3.72s/it]Training 2/2 epoch (loss 0.0977):  75%|▊| 3101/4114 [3:20:18<1:04:01,  3.79s/it]Training 2/2 epoch (loss 0.0277):  75%|▊| 3101/4114 [3:20:22<1:04:01,  3.79s/it]Training 2/2 epoch (loss 0.0277):  75%|▊| 3102/4114 [3:20:22<1:05:51,  3.90s/it]Training 2/2 epoch (loss 0.0522):  75%|▊| 3102/4114 [3:20:26<1:05:51,  3.90s/it]Training 2/2 epoch (loss 0.0522):  75%|▊| 3103/4114 [3:20:26<1:05:40,  3.90s/it]Training 2/2 epoch (loss 0.0659):  75%|▊| 3103/4114 [3:20:29<1:05:40,  3.90s/it]Training 2/2 epoch (loss 0.0659):  75%|▊| 3104/4114 [3:20:29<1:05:11,  3.87s/it]Training 2/2 epoch (loss 0.0361):  75%|▊| 3104/4114 [3:20:34<1:05:11,  3.87s/it]Training 2/2 epoch (loss 0.0361):  75%|▊| 3105/4114 [3:20:34<1:06:06,  3.93s/it]Training 2/2 epoch (loss 0.0082):  75%|▊| 3105/4114 [3:20:37<1:06:06,  3.93s/it]Training 2/2 epoch (loss 0.0082):  75%|▊| 3106/4114 [3:20:37<1:05:19,  3.89s/it]Training 2/2 epoch (loss 0.0503):  75%|▊| 3106/4114 [3:20:41<1:05:19,  3.89s/it]Training 2/2 epoch (loss 0.0503):  76%|▊| 3107/4114 [3:20:41<1:05:29,  3.90s/it]Training 2/2 epoch (loss 0.0287):  76%|▊| 3107/4114 [3:20:45<1:05:29,  3.90s/it]Training 2/2 epoch (loss 0.0287):  76%|▊| 3108/4114 [3:20:45<1:06:30,  3.97s/it]Training 2/2 epoch (loss 0.0042):  76%|▊| 3108/4114 [3:20:49<1:06:30,  3.97s/it]Training 2/2 epoch (loss 0.0042):  76%|▊| 3109/4114 [3:20:49<1:05:40,  3.92s/it]Training 2/2 epoch (loss 0.0889):  76%|▊| 3109/4114 [3:20:53<1:05:40,  3.92s/it]Training 2/2 epoch (loss 0.0889):  76%|▊| 3110/4114 [3:20:53<1:05:27,  3.91s/it]Training 2/2 epoch (loss 0.0298):  76%|▊| 3110/4114 [3:20:57<1:05:27,  3.91s/it]Training 2/2 epoch (loss 0.0298):  76%|▊| 3111/4114 [3:20:57<1:06:18,  3.97s/it]Training 2/2 epoch (loss 0.0087):  76%|▊| 3111/4114 [3:21:01<1:06:18,  3.97s/it]Training 2/2 epoch (loss 0.0087):  76%|▊| 3112/4114 [3:21:01<1:05:19,  3.91s/it]Training 2/2 epoch (loss 0.0038):  76%|▊| 3112/4114 [3:21:05<1:05:19,  3.91s/it]Training 2/2 epoch (loss 0.0038):  76%|▊| 3113/4114 [3:21:05<1:05:29,  3.93s/it]Training 2/2 epoch (loss 0.0204):  76%|▊| 3113/4114 [3:21:09<1:05:29,  3.93s/it]Training 2/2 epoch (loss 0.0204):  76%|▊| 3114/4114 [3:21:09<1:06:37,  4.00s/it]Training 2/2 epoch (loss 0.0261):  76%|▊| 3114/4114 [3:21:13<1:06:37,  4.00s/it]Training 2/2 epoch (loss 0.0261):  76%|▊| 3115/4114 [3:21:13<1:06:18,  3.98s/it]Training 2/2 epoch (loss 0.0481):  76%|▊| 3115/4114 [3:21:17<1:06:18,  3.98s/it]Training 2/2 epoch (loss 0.0481):  76%|▊| 3116/4114 [3:21:17<1:05:47,  3.96s/it]Training 2/2 epoch (loss 0.1177):  76%|▊| 3116/4114 [3:21:21<1:05:47,  3.96s/it]Training 2/2 epoch (loss 0.1177):  76%|▊| 3117/4114 [3:21:21<1:06:33,  4.01s/it]Training 2/2 epoch (loss 0.0035):  76%|▊| 3117/4114 [3:21:24<1:06:33,  4.01s/it]Training 2/2 epoch (loss 0.0035):  76%|▊| 3118/4114 [3:21:24<1:02:46,  3.78s/it]Training 2/2 epoch (loss 0.0515):  76%|▊| 3118/4114 [3:21:28<1:02:46,  3.78s/it]Training 2/2 epoch (loss 0.0515):  76%|▊| 3119/4114 [3:21:28<1:02:58,  3.80s/it]Training 2/2 epoch (loss 0.0540):  76%|▊| 3119/4114 [3:21:32<1:02:58,  3.80s/it]Training 2/2 epoch (loss 0.0540):  76%|▊| 3120/4114 [3:21:32<1:04:41,  3.90s/it]Training 2/2 epoch (loss 0.0127):  76%|▊| 3120/4114 [3:21:36<1:04:41,  3.90s/it]Training 2/2 epoch (loss 0.0127):  76%|▊| 3121/4114 [3:21:36<1:04:54,  3.92s/it]Training 2/2 epoch (loss 0.0420):  76%|▊| 3121/4114 [3:21:40<1:04:54,  3.92s/it]Training 2/2 epoch (loss 0.0420):  76%|▊| 3122/4114 [3:21:40<1:04:07,  3.88s/it]Training 2/2 epoch (loss 0.0201):  76%|▊| 3122/4114 [3:21:44<1:04:07,  3.88s/it]Training 2/2 epoch (loss 0.0201):  76%|▊| 3123/4114 [3:21:44<1:02:38,  3.79s/it]Training 2/2 epoch (loss 0.0067):  76%|▊| 3123/4114 [3:21:47<1:02:38,  3.79s/it]Training 2/2 epoch (loss 0.0067):  76%|▊| 3124/4114 [3:21:47<1:02:42,  3.80s/it]Training 2/2 epoch (loss 0.0762):  76%|▊| 3124/4114 [3:21:51<1:02:42,  3.80s/it]Training 2/2 epoch (loss 0.0762):  76%|▊| 3125/4114 [3:21:51<1:03:54,  3.88s/it]Training 2/2 epoch (loss 0.0118):  76%|▊| 3125/4114 [3:21:56<1:03:54,  3.88s/it]Training 2/2 epoch (loss 0.0118):  76%|▊| 3126/4114 [3:21:56<1:05:33,  3.98s/it]Training 2/2 epoch (loss 0.0620):  76%|▊| 3126/4114 [3:22:00<1:05:33,  3.98s/it]Training 2/2 epoch (loss 0.0620):  76%|▊| 3127/4114 [3:22:00<1:05:26,  3.98s/it]Training 2/2 epoch (loss 0.0209):  76%|▊| 3127/4114 [3:22:03<1:05:26,  3.98s/it]Training 2/2 epoch (loss 0.0209):  76%|▊| 3128/4114 [3:22:03<1:02:06,  3.78s/it]Training 2/2 epoch (loss 0.0015):  76%|▊| 3128/4114 [3:22:07<1:02:06,  3.78s/it]Training 2/2 epoch (loss 0.0015):  76%|▊| 3129/4114 [3:22:07<1:04:16,  3.92s/it]Training 2/2 epoch (loss 0.0811):  76%|▊| 3129/4114 [3:22:11<1:04:16,  3.92s/it]Training 2/2 epoch (loss 0.0811):  76%|▊| 3130/4114 [3:22:11<1:04:55,  3.96s/it]Training 2/2 epoch (loss 0.1025):  76%|▊| 3130/4114 [3:22:15<1:04:55,  3.96s/it]Training 2/2 epoch (loss 0.1025):  76%|▊| 3131/4114 [3:22:15<1:01:29,  3.75s/it]Training 2/2 epoch (loss 0.0349):  76%|▊| 3131/4114 [3:22:19<1:01:29,  3.75s/it]Training 2/2 epoch (loss 0.0349):  76%|▊| 3132/4114 [3:22:19<1:02:44,  3.83s/it]Training 2/2 epoch (loss 0.0352):  76%|▊| 3132/4114 [3:22:23<1:02:44,  3.83s/it]Training 2/2 epoch (loss 0.0352):  76%|▊| 3133/4114 [3:22:23<1:03:11,  3.86s/it]Training 2/2 epoch (loss 0.0542):  76%|▊| 3133/4114 [3:22:26<1:03:11,  3.86s/it]Training 2/2 epoch (loss 0.0542):  76%|▊| 3134/4114 [3:22:26<1:01:16,  3.75s/it]Training 2/2 epoch (loss 0.0135):  76%|▊| 3134/4114 [3:22:30<1:01:16,  3.75s/it]Training 2/2 epoch (loss 0.0135):  76%|▊| 3135/4114 [3:22:30<1:02:48,  3.85s/it]Training 2/2 epoch (loss 0.0220):  76%|▊| 3135/4114 [3:22:34<1:02:48,  3.85s/it]Training 2/2 epoch (loss 0.0220):  76%|▊| 3136/4114 [3:22:34<1:03:11,  3.88s/it]Training 2/2 epoch (loss 0.0310):  76%|▊| 3136/4114 [3:22:38<1:03:11,  3.88s/it]Training 2/2 epoch (loss 0.0310):  76%|▊| 3137/4114 [3:22:38<1:01:28,  3.78s/it]Training 2/2 epoch (loss 0.0111):  76%|▊| 3137/4114 [3:22:42<1:01:28,  3.78s/it]Training 2/2 epoch (loss 0.0111):  76%|▊| 3138/4114 [3:22:42<1:03:29,  3.90s/it]Training 2/2 epoch (loss 0.0204):  76%|▊| 3138/4114 [3:22:46<1:03:29,  3.90s/it]Training 2/2 epoch (loss 0.0204):  76%|▊| 3139/4114 [3:22:46<1:02:49,  3.87s/it]Training 2/2 epoch (loss 0.0767):  76%|▊| 3139/4114 [3:22:50<1:02:49,  3.87s/it]Training 2/2 epoch (loss 0.0767):  76%|▊| 3140/4114 [3:22:50<1:03:48,  3.93s/it]Training 2/2 epoch (loss 0.0457):  76%|▊| 3140/4114 [3:22:54<1:03:48,  3.93s/it]Training 2/2 epoch (loss 0.0457):  76%|▊| 3141/4114 [3:22:54<1:04:45,  3.99s/it]Training 2/2 epoch (loss 0.0762):  76%|▊| 3141/4114 [3:22:58<1:04:45,  3.99s/it]Training 2/2 epoch (loss 0.0762):  76%|▊| 3142/4114 [3:22:58<1:03:48,  3.94s/it]Training 2/2 epoch (loss 0.0294):  76%|▊| 3142/4114 [3:23:01<1:03:48,  3.94s/it]Training 2/2 epoch (loss 0.0294):  76%|▊| 3143/4114 [3:23:01<1:03:16,  3.91s/it]Training 2/2 epoch (loss 0.1699):  76%|▊| 3143/4114 [3:23:06<1:03:16,  3.91s/it]Training 2/2 epoch (loss 0.1699):  76%|▊| 3144/4114 [3:23:06<1:04:49,  4.01s/it]Training 2/2 epoch (loss 0.1348):  76%|▊| 3144/4114 [3:23:10<1:04:49,  4.01s/it]Training 2/2 epoch (loss 0.1348):  76%|▊| 3145/4114 [3:23:10<1:04:29,  3.99s/it]Training 2/2 epoch (loss 0.3672):  76%|▊| 3145/4114 [3:23:13<1:04:29,  3.99s/it]Training 2/2 epoch (loss 0.3672):  76%|▊| 3146/4114 [3:23:13<1:03:21,  3.93s/it]Training 2/2 epoch (loss 0.0024):  76%|▊| 3146/4114 [3:23:18<1:03:21,  3.93s/it]Training 2/2 epoch (loss 0.0024):  76%|▊| 3147/4114 [3:23:18<1:04:20,  3.99s/it]Training 2/2 epoch (loss 0.0039):  76%|▊| 3147/4114 [3:23:21<1:04:20,  3.99s/it]Training 2/2 epoch (loss 0.0039):  77%|▊| 3148/4114 [3:23:21<1:03:31,  3.95s/it]Training 2/2 epoch (loss 0.1445):  77%|▊| 3148/4114 [3:23:25<1:03:31,  3.95s/it]Training 2/2 epoch (loss 0.1445):  77%|▊| 3149/4114 [3:23:25<1:02:54,  3.91s/it]Training 2/2 epoch (loss 0.0040):  77%|▊| 3149/4114 [3:23:29<1:02:54,  3.91s/it]Training 2/2 epoch (loss 0.0040):  77%|▊| 3150/4114 [3:23:29<1:04:14,  4.00s/it]Training 2/2 epoch (loss 0.1030):  77%|▊| 3150/4114 [3:23:33<1:04:14,  4.00s/it]Training 2/2 epoch (loss 0.1030):  77%|▊| 3151/4114 [3:23:33<1:04:35,  4.02s/it]Training 2/2 epoch (loss 0.0061):  77%|▊| 3151/4114 [3:23:37<1:04:35,  4.02s/it]Training 2/2 epoch (loss 0.0061):  77%|▊| 3152/4114 [3:23:37<1:04:04,  4.00s/it]Training 2/2 epoch (loss 0.0068):  77%|▊| 3152/4114 [3:23:41<1:04:04,  4.00s/it]Training 2/2 epoch (loss 0.0068):  77%|▊| 3153/4114 [3:23:41<1:03:10,  3.94s/it]Training 2/2 epoch (loss 0.0017):  77%|▊| 3153/4114 [3:23:45<1:03:10,  3.94s/it]Training 2/2 epoch (loss 0.0017):  77%|▊| 3154/4114 [3:23:45<1:02:44,  3.92s/it]Training 2/2 epoch (loss 0.0615):  77%|▊| 3154/4114 [3:23:49<1:02:44,  3.92s/it]Training 2/2 epoch (loss 0.0615):  77%|▊| 3155/4114 [3:23:49<1:02:23,  3.90s/it]Training 2/2 epoch (loss 0.0018):  77%|▊| 3155/4114 [3:23:53<1:02:23,  3.90s/it]Training 2/2 epoch (loss 0.0018):  77%|▊| 3156/4114 [3:23:53<1:03:13,  3.96s/it]Training 2/2 epoch (loss 0.0913):  77%|▊| 3156/4114 [3:23:57<1:03:13,  3.96s/it]Training 2/2 epoch (loss 0.0913):  77%|▊| 3157/4114 [3:23:57<1:03:34,  3.99s/it]Training 2/2 epoch (loss 0.0133):  77%|▊| 3157/4114 [3:24:01<1:03:34,  3.99s/it]Training 2/2 epoch (loss 0.0133):  77%|▊| 3158/4114 [3:24:01<1:03:26,  3.98s/it]Training 2/2 epoch (loss 0.0256):  77%|▊| 3158/4114 [3:24:05<1:03:26,  3.98s/it]Training 2/2 epoch (loss 0.0256):  77%|▊| 3159/4114 [3:24:05<1:04:49,  4.07s/it]Training 2/2 epoch (loss 0.0466):  77%|▊| 3159/4114 [3:24:09<1:04:49,  4.07s/it]Training 2/2 epoch (loss 0.0466):  77%|▊| 3160/4114 [3:24:09<1:03:36,  4.00s/it]Training 2/2 epoch (loss 0.0366):  77%|▊| 3160/4114 [3:24:13<1:03:36,  4.00s/it]Training 2/2 epoch (loss 0.0366):  77%|▊| 3161/4114 [3:24:13<1:00:17,  3.80s/it]Training 2/2 epoch (loss 0.0194):  77%|▊| 3161/4114 [3:24:17<1:00:17,  3.80s/it]Training 2/2 epoch (loss 0.0194):  77%|▊| 3162/4114 [3:24:17<1:02:00,  3.91s/it]Training 2/2 epoch (loss 0.0320):  77%|▊| 3162/4114 [3:24:21<1:02:00,  3.91s/it]Training 2/2 epoch (loss 0.0320):  77%|▊| 3163/4114 [3:24:21<1:02:02,  3.91s/it]Training 2/2 epoch (loss 0.0579):  77%|▊| 3163/4114 [3:24:24<1:02:02,  3.91s/it]Training 2/2 epoch (loss 0.0579):  77%|▊| 3164/4114 [3:24:24<1:01:52,  3.91s/it]Training 2/2 epoch (loss 0.0104):  77%|▊| 3164/4114 [3:24:29<1:01:52,  3.91s/it]Training 2/2 epoch (loss 0.0104):  77%|▊| 3165/4114 [3:24:29<1:02:42,  3.97s/it]Training 2/2 epoch (loss 0.0398):  77%|▊| 3165/4114 [3:24:33<1:02:42,  3.97s/it]Training 2/2 epoch (loss 0.0398):  77%|▊| 3166/4114 [3:24:33<1:03:07,  4.00s/it]Training 2/2 epoch (loss 0.0786):  77%|▊| 3166/4114 [3:24:37<1:03:07,  4.00s/it]Training 2/2 epoch (loss 0.0786):  77%|▊| 3167/4114 [3:24:37<1:02:49,  3.98s/it]Training 2/2 epoch (loss 0.0320):  77%|▊| 3167/4114 [3:24:41<1:02:49,  3.98s/it]Training 2/2 epoch (loss 0.0320):  77%|▊| 3168/4114 [3:24:41<1:03:23,  4.02s/it]Training 2/2 epoch (loss 0.0542):  77%|▊| 3168/4114 [3:24:45<1:03:23,  4.02s/it]Training 2/2 epoch (loss 0.0542):  77%|▊| 3169/4114 [3:24:45<1:02:44,  3.98s/it]Training 2/2 epoch (loss 0.0806):  77%|▊| 3169/4114 [3:24:49<1:02:44,  3.98s/it]Training 2/2 epoch (loss 0.0806):  77%|▊| 3170/4114 [3:24:49<1:02:41,  3.99s/it]Training 2/2 epoch (loss 0.0708):  77%|▊| 3170/4114 [3:24:53<1:02:41,  3.99s/it]Training 2/2 epoch (loss 0.0708):  77%|▊| 3171/4114 [3:24:53<1:02:44,  3.99s/it]Training 2/2 epoch (loss 0.0776):  77%|▊| 3171/4114 [3:24:56<1:02:44,  3.99s/it]Training 2/2 epoch (loss 0.0776):  77%|▊| 3172/4114 [3:24:56<1:01:45,  3.93s/it]Training 2/2 epoch (loss 0.0608):  77%|▊| 3172/4114 [3:25:00<1:01:45,  3.93s/it]Training 2/2 epoch (loss 0.0608):  77%|██▎| 3173/4114 [3:25:00<58:24,  3.72s/it]Training 2/2 epoch (loss 0.1377):  77%|██▎| 3173/4114 [3:25:04<58:24,  3.72s/it]Training 2/2 epoch (loss 0.1377):  77%|▊| 3174/4114 [3:25:04<1:00:25,  3.86s/it]Training 2/2 epoch (loss 0.1719):  77%|▊| 3174/4114 [3:25:07<1:00:25,  3.86s/it]Training 2/2 epoch (loss 0.1719):  77%|██▎| 3175/4114 [3:25:07<59:11,  3.78s/it]Training 2/2 epoch (loss 0.0040):  77%|██▎| 3175/4114 [3:25:11<59:11,  3.78s/it]Training 2/2 epoch (loss 0.0040):  77%|██▎| 3176/4114 [3:25:11<58:40,  3.75s/it]Training 2/2 epoch (loss 0.0422):  77%|██▎| 3176/4114 [3:25:15<58:40,  3.75s/it]Training 2/2 epoch (loss 0.0422):  77%|▊| 3177/4114 [3:25:15<1:00:03,  3.85s/it]Training 2/2 epoch (loss 0.0204):  77%|▊| 3177/4114 [3:25:19<1:00:03,  3.85s/it]Training 2/2 epoch (loss 0.0204):  77%|▊| 3178/4114 [3:25:19<1:00:34,  3.88s/it]Training 2/2 epoch (loss 0.0009):  77%|▊| 3178/4114 [3:25:23<1:00:34,  3.88s/it]Training 2/2 epoch (loss 0.0009):  77%|██▎| 3179/4114 [3:25:23<58:24,  3.75s/it]Training 2/2 epoch (loss 0.0298):  77%|██▎| 3179/4114 [3:25:27<58:24,  3.75s/it]Training 2/2 epoch (loss 0.0298):  77%|██▎| 3180/4114 [3:25:27<59:43,  3.84s/it]Training 2/2 epoch (loss 0.0288):  77%|██▎| 3180/4114 [3:25:30<59:43,  3.84s/it]Training 2/2 epoch (loss 0.0288):  77%|██▎| 3181/4114 [3:25:30<59:40,  3.84s/it]Training 2/2 epoch (loss 0.0093):  77%|██▎| 3181/4114 [3:25:34<59:40,  3.84s/it]Training 2/2 epoch (loss 0.0093):  77%|██▎| 3182/4114 [3:25:34<59:55,  3.86s/it]Training 2/2 epoch (loss 0.0608):  77%|██▎| 3182/4114 [3:25:38<59:55,  3.86s/it]Training 2/2 epoch (loss 0.0608):  77%|▊| 3183/4114 [3:25:38<1:01:06,  3.94s/it]Training 2/2 epoch (loss 0.0297):  77%|▊| 3183/4114 [3:25:42<1:01:06,  3.94s/it]Training 2/2 epoch (loss 0.0297):  77%|▊| 3184/4114 [3:25:42<1:00:55,  3.93s/it]Training 2/2 epoch (loss 0.0879):  77%|▊| 3184/4114 [3:25:46<1:00:55,  3.93s/it]Training 2/2 epoch (loss 0.0879):  77%|▊| 3185/4114 [3:25:46<1:01:10,  3.95s/it]Training 2/2 epoch (loss 0.0413):  77%|▊| 3185/4114 [3:25:50<1:01:10,  3.95s/it]Training 2/2 epoch (loss 0.0413):  77%|▊| 3186/4114 [3:25:50<1:01:32,  3.98s/it]Training 2/2 epoch (loss 0.0889):  77%|▊| 3186/4114 [3:25:54<1:01:32,  3.98s/it]Training 2/2 epoch (loss 0.0889):  77%|▊| 3187/4114 [3:25:54<1:01:10,  3.96s/it]Training 2/2 epoch (loss 0.0552):  77%|▊| 3187/4114 [3:25:58<1:01:10,  3.96s/it]Training 2/2 epoch (loss 0.0552):  77%|▊| 3188/4114 [3:25:58<1:01:01,  3.95s/it]Training 2/2 epoch (loss 0.0140):  77%|▊| 3188/4114 [3:26:03<1:01:01,  3.95s/it]Training 2/2 epoch (loss 0.0140):  78%|▊| 3189/4114 [3:26:03<1:02:40,  4.07s/it]Training 2/2 epoch (loss 0.0569):  78%|▊| 3189/4114 [3:26:07<1:02:40,  4.07s/it]Training 2/2 epoch (loss 0.0569):  78%|▊| 3190/4114 [3:26:07<1:01:52,  4.02s/it]Training 2/2 epoch (loss 0.0212):  78%|▊| 3190/4114 [3:26:10<1:01:52,  4.02s/it]Training 2/2 epoch (loss 0.0212):  78%|▊| 3191/4114 [3:26:10<1:01:25,  3.99s/it]Training 2/2 epoch (loss 0.0359):  78%|▊| 3191/4114 [3:26:15<1:01:25,  3.99s/it]Training 2/2 epoch (loss 0.0359):  78%|▊| 3192/4114 [3:26:15<1:01:59,  4.03s/it]Training 2/2 epoch (loss 0.0518):  78%|▊| 3192/4114 [3:26:18<1:01:59,  4.03s/it]Training 2/2 epoch (loss 0.0518):  78%|▊| 3193/4114 [3:26:18<1:00:40,  3.95s/it]Training 2/2 epoch (loss 0.0152):  78%|▊| 3193/4114 [3:26:22<1:00:40,  3.95s/it]Training 2/2 epoch (loss 0.0152):  78%|██▎| 3194/4114 [3:26:22<57:25,  3.74s/it]Training 2/2 epoch (loss 0.0087):  78%|██▎| 3194/4114 [3:26:26<57:25,  3.74s/it]Training 2/2 epoch (loss 0.0087):  78%|██▎| 3195/4114 [3:26:26<59:13,  3.87s/it]Training 2/2 epoch (loss 0.0060):  78%|██▎| 3195/4114 [3:26:30<59:13,  3.87s/it]Training 2/2 epoch (loss 0.0060):  78%|██▎| 3196/4114 [3:26:30<58:47,  3.84s/it]Training 2/2 epoch (loss 0.0123):  78%|██▎| 3196/4114 [3:26:34<58:47,  3.84s/it]Training 2/2 epoch (loss 0.0123):  78%|██▎| 3197/4114 [3:26:34<59:22,  3.88s/it]Training 2/2 epoch (loss 0.0190):  78%|██▎| 3197/4114 [3:26:37<59:22,  3.88s/it]Training 2/2 epoch (loss 0.0190):  78%|██▎| 3198/4114 [3:26:37<56:14,  3.68s/it]Training 2/2 epoch (loss 0.0693):  78%|██▎| 3198/4114 [3:26:41<56:14,  3.68s/it]Training 2/2 epoch (loss 0.0693):  78%|██▎| 3199/4114 [3:26:41<57:53,  3.80s/it]Training 2/2 epoch (loss 0.0315):  78%|██▎| 3199/4114 [3:26:45<57:53,  3.80s/it]Training 2/2 epoch (loss 0.0315):  78%|██▎| 3200/4114 [3:26:45<57:57,  3.80s/it]Training 2/2 epoch (loss 0.0486):  78%|██▎| 3200/4114 [3:26:48<57:57,  3.80s/it]Training 2/2 epoch (loss 0.0486):  78%|██▎| 3201/4114 [3:26:48<57:20,  3.77s/it]Training 2/2 epoch (loss 0.0156):  78%|██▎| 3201/4114 [3:26:52<57:20,  3.77s/it]Training 2/2 epoch (loss 0.0156):  78%|██▎| 3202/4114 [3:26:52<57:51,  3.81s/it]Training 2/2 epoch (loss 0.0640):  78%|██▎| 3202/4114 [3:26:56<57:51,  3.81s/it]Training 2/2 epoch (loss 0.0640):  78%|██▎| 3203/4114 [3:26:56<57:45,  3.80s/it]Training 2/2 epoch (loss 0.0247):  78%|██▎| 3203/4114 [3:27:00<57:45,  3.80s/it]Training 2/2 epoch (loss 0.0247):  78%|██▎| 3204/4114 [3:27:00<58:43,  3.87s/it]Training 2/2 epoch (loss 0.0175):  78%|██▎| 3204/4114 [3:27:04<58:43,  3.87s/it]Training 2/2 epoch (loss 0.0175):  78%|██▎| 3205/4114 [3:27:04<59:10,  3.91s/it]Training 2/2 epoch (loss 0.0002):  78%|██▎| 3205/4114 [3:27:08<59:10,  3.91s/it]Training 2/2 epoch (loss 0.0002):  78%|██▎| 3206/4114 [3:27:08<58:35,  3.87s/it]Training 2/2 epoch (loss 0.0173):  78%|██▎| 3206/4114 [3:27:12<58:35,  3.87s/it]Training 2/2 epoch (loss 0.0173):  78%|██▎| 3207/4114 [3:27:12<59:15,  3.92s/it]Training 2/2 epoch (loss 0.0684):  78%|██▎| 3207/4114 [3:27:16<59:15,  3.92s/it]Training 2/2 epoch (loss 0.0684):  78%|██▎| 3208/4114 [3:27:16<58:36,  3.88s/it]Training 2/2 epoch (loss 0.0654):  78%|██▎| 3208/4114 [3:27:20<58:36,  3.88s/it]Training 2/2 epoch (loss 0.0654):  78%|██▎| 3209/4114 [3:27:20<59:24,  3.94s/it]Training 2/2 epoch (loss 0.0079):  78%|██▎| 3209/4114 [3:27:24<59:24,  3.94s/it]Training 2/2 epoch (loss 0.0079):  78%|██▎| 3210/4114 [3:27:24<59:55,  3.98s/it]Training 2/2 epoch (loss 0.0186):  78%|██▎| 3210/4114 [3:27:27<59:55,  3.98s/it]Training 2/2 epoch (loss 0.0186):  78%|██▎| 3211/4114 [3:27:27<58:22,  3.88s/it]Training 2/2 epoch (loss 0.0845):  78%|██▎| 3211/4114 [3:27:31<58:22,  3.88s/it]Training 2/2 epoch (loss 0.0845):  78%|██▎| 3212/4114 [3:27:31<58:59,  3.92s/it]Training 2/2 epoch (loss 0.0500):  78%|██▎| 3212/4114 [3:27:35<58:59,  3.92s/it]Training 2/2 epoch (loss 0.0500):  78%|██▎| 3213/4114 [3:27:35<57:50,  3.85s/it]Training 2/2 epoch (loss 0.0120):  78%|██▎| 3213/4114 [3:27:39<57:50,  3.85s/it]Training 2/2 epoch (loss 0.0120):  78%|██▎| 3214/4114 [3:27:39<58:12,  3.88s/it]Training 2/2 epoch (loss 0.0067):  78%|██▎| 3214/4114 [3:27:43<58:12,  3.88s/it]Training 2/2 epoch (loss 0.0067):  78%|██▎| 3215/4114 [3:27:43<58:02,  3.87s/it]Training 2/2 epoch (loss 0.0049):  78%|██▎| 3215/4114 [3:27:47<58:02,  3.87s/it]Training 2/2 epoch (loss 0.0049):  78%|██▎| 3216/4114 [3:27:47<58:42,  3.92s/it]Training 2/2 epoch (loss 0.2422):  78%|██▎| 3216/4114 [3:27:50<58:42,  3.92s/it]Training 2/2 epoch (loss 0.2422):  78%|██▎| 3217/4114 [3:27:50<56:20,  3.77s/it]Training 2/2 epoch (loss 0.0094):  78%|██▎| 3217/4114 [3:27:54<56:20,  3.77s/it]Training 2/2 epoch (loss 0.0094):  78%|██▎| 3218/4114 [3:27:54<56:26,  3.78s/it]Training 2/2 epoch (loss 0.0322):  78%|██▎| 3218/4114 [3:27:58<56:26,  3.78s/it]Training 2/2 epoch (loss 0.0322):  78%|██▎| 3219/4114 [3:27:58<57:05,  3.83s/it]Training 2/2 epoch (loss 0.0077):  78%|██▎| 3219/4114 [3:28:02<57:05,  3.83s/it]Training 2/2 epoch (loss 0.0077):  78%|██▎| 3220/4114 [3:28:02<56:58,  3.82s/it]Training 2/2 epoch (loss 0.0347):  78%|██▎| 3220/4114 [3:28:05<56:58,  3.82s/it]Training 2/2 epoch (loss 0.0347):  78%|██▎| 3221/4114 [3:28:05<55:11,  3.71s/it]Training 2/2 epoch (loss 0.0005):  78%|██▎| 3221/4114 [3:28:10<55:11,  3.71s/it]Training 2/2 epoch (loss 0.0005):  78%|██▎| 3222/4114 [3:28:10<57:25,  3.86s/it]Training 2/2 epoch (loss 0.0167):  78%|██▎| 3222/4114 [3:28:13<57:25,  3.86s/it]Training 2/2 epoch (loss 0.0167):  78%|██▎| 3223/4114 [3:28:13<57:07,  3.85s/it]Training 2/2 epoch (loss 0.0096):  78%|██▎| 3223/4114 [3:28:17<57:07,  3.85s/it]Training 2/2 epoch (loss 0.0096):  78%|██▎| 3224/4114 [3:28:17<56:33,  3.81s/it]Training 2/2 epoch (loss 0.0074):  78%|██▎| 3224/4114 [3:28:21<56:33,  3.81s/it]Training 2/2 epoch (loss 0.0074):  78%|██▎| 3225/4114 [3:28:21<58:28,  3.95s/it]Training 2/2 epoch (loss 0.0000):  78%|██▎| 3225/4114 [3:28:25<58:28,  3.95s/it]Training 2/2 epoch (loss 0.0000):  78%|██▎| 3226/4114 [3:28:25<58:28,  3.95s/it]Training 2/2 epoch (loss 0.0036):  78%|██▎| 3226/4114 [3:28:29<58:28,  3.95s/it]Training 2/2 epoch (loss 0.0036):  78%|██▎| 3227/4114 [3:28:29<58:20,  3.95s/it]Training 2/2 epoch (loss 0.0197):  78%|██▎| 3227/4114 [3:28:34<58:20,  3.95s/it]Training 2/2 epoch (loss 0.0197):  78%|██▎| 3228/4114 [3:28:34<59:24,  4.02s/it]Training 2/2 epoch (loss 0.0217):  78%|██▎| 3228/4114 [3:28:37<59:24,  4.02s/it]Training 2/2 epoch (loss 0.0217):  78%|██▎| 3229/4114 [3:28:37<58:23,  3.96s/it]Training 2/2 epoch (loss 0.0182):  78%|██▎| 3229/4114 [3:28:41<58:23,  3.96s/it]Training 2/2 epoch (loss 0.0182):  79%|██▎| 3230/4114 [3:28:41<57:55,  3.93s/it]Training 2/2 epoch (loss 0.0171):  79%|██▎| 3230/4114 [3:28:45<57:55,  3.93s/it]Training 2/2 epoch (loss 0.0171):  79%|██▎| 3231/4114 [3:28:45<55:53,  3.80s/it]Training 2/2 epoch (loss 0.0562):  79%|██▎| 3231/4114 [3:28:48<55:53,  3.80s/it]Training 2/2 epoch (loss 0.0562):  79%|██▎| 3232/4114 [3:28:48<54:00,  3.67s/it]Training 2/2 epoch (loss 0.0557):  79%|██▎| 3232/4114 [3:28:52<54:00,  3.67s/it]Training 2/2 epoch (loss 0.0557):  79%|██▎| 3233/4114 [3:28:52<54:05,  3.68s/it]Training 2/2 epoch (loss 0.0042):  79%|██▎| 3233/4114 [3:28:56<54:05,  3.68s/it]Training 2/2 epoch (loss 0.0042):  79%|██▎| 3234/4114 [3:28:56<54:28,  3.71s/it]Training 2/2 epoch (loss 0.0046):  79%|██▎| 3234/4114 [3:28:59<54:28,  3.71s/it]Training 2/2 epoch (loss 0.0046):  79%|██▎| 3235/4114 [3:28:59<55:15,  3.77s/it]Training 2/2 epoch (loss 0.0168):  79%|██▎| 3235/4114 [3:29:03<55:15,  3.77s/it]Training 2/2 epoch (loss 0.0168):  79%|██▎| 3236/4114 [3:29:03<55:55,  3.82s/it]Training 2/2 epoch (loss 0.1079):  79%|██▎| 3236/4114 [3:29:07<55:55,  3.82s/it]Training 2/2 epoch (loss 0.1079):  79%|██▎| 3237/4114 [3:29:07<56:52,  3.89s/it]Training 2/2 epoch (loss 0.1187):  79%|██▎| 3237/4114 [3:29:11<56:52,  3.89s/it]Training 2/2 epoch (loss 0.1187):  79%|██▎| 3238/4114 [3:29:11<54:28,  3.73s/it]Training 2/2 epoch (loss 0.0381):  79%|██▎| 3238/4114 [3:29:15<54:28,  3.73s/it]Training 2/2 epoch (loss 0.0381):  79%|██▎| 3239/4114 [3:29:15<54:59,  3.77s/it]Training 2/2 epoch (loss 0.0186):  79%|██▎| 3239/4114 [3:29:19<54:59,  3.77s/it]Training 2/2 epoch (loss 0.0186):  79%|██▎| 3240/4114 [3:29:19<56:41,  3.89s/it]Training 2/2 epoch (loss 0.0635):  79%|██▎| 3240/4114 [3:29:23<56:41,  3.89s/it]Training 2/2 epoch (loss 0.0635):  79%|██▎| 3241/4114 [3:29:23<57:01,  3.92s/it]Training 2/2 epoch (loss 0.0908):  79%|██▎| 3241/4114 [3:29:27<57:01,  3.92s/it]Training 2/2 epoch (loss 0.0908):  79%|██▎| 3242/4114 [3:29:27<56:48,  3.91s/it]Training 2/2 epoch (loss 0.0305):  79%|██▎| 3242/4114 [3:29:31<56:48,  3.91s/it]Training 2/2 epoch (loss 0.0305):  79%|██▎| 3243/4114 [3:29:31<58:11,  4.01s/it]Training 2/2 epoch (loss 0.0330):  79%|██▎| 3243/4114 [3:29:35<58:11,  4.01s/it]Training 2/2 epoch (loss 0.0330):  79%|██▎| 3244/4114 [3:29:35<57:10,  3.94s/it]Training 2/2 epoch (loss 0.0520):  79%|██▎| 3244/4114 [3:29:39<57:10,  3.94s/it]Training 2/2 epoch (loss 0.0520):  79%|██▎| 3245/4114 [3:29:39<57:01,  3.94s/it]Training 2/2 epoch (loss 0.0087):  79%|██▎| 3245/4114 [3:29:43<57:01,  3.94s/it]Training 2/2 epoch (loss 0.0087):  79%|██▎| 3246/4114 [3:29:43<57:42,  3.99s/it]Training 2/2 epoch (loss 0.0339):  79%|██▎| 3246/4114 [3:29:47<57:42,  3.99s/it]Training 2/2 epoch (loss 0.0339):  79%|██▎| 3247/4114 [3:29:47<57:13,  3.96s/it]Training 2/2 epoch (loss 0.0659):  79%|██▎| 3247/4114 [3:29:51<57:13,  3.96s/it]Training 2/2 epoch (loss 0.0659):  79%|██▎| 3248/4114 [3:29:51<57:16,  3.97s/it]Training 2/2 epoch (loss 0.0845):  79%|██▎| 3248/4114 [3:29:55<57:16,  3.97s/it]Training 2/2 epoch (loss 0.0845):  79%|██▎| 3249/4114 [3:29:55<57:45,  4.01s/it]Training 2/2 epoch (loss 0.0454):  79%|██▎| 3249/4114 [3:29:59<57:45,  4.01s/it]Training 2/2 epoch (loss 0.0454):  79%|██▎| 3250/4114 [3:29:59<56:56,  3.95s/it]Training 2/2 epoch (loss 0.1260):  79%|██▎| 3250/4114 [3:30:02<56:56,  3.95s/it]Training 2/2 epoch (loss 0.1260):  79%|██▎| 3251/4114 [3:30:02<55:39,  3.87s/it]Training 2/2 epoch (loss 0.1182):  79%|██▎| 3251/4114 [3:30:05<55:39,  3.87s/it]Training 2/2 epoch (loss 0.1182):  79%|██▎| 3252/4114 [3:30:05<52:47,  3.68s/it]Training 2/2 epoch (loss 0.0311):  79%|██▎| 3252/4114 [3:30:10<52:47,  3.68s/it]Training 2/2 epoch (loss 0.0311):  79%|██▎| 3253/4114 [3:30:10<54:17,  3.78s/it]Training 2/2 epoch (loss 0.0162):  79%|██▎| 3253/4114 [3:30:14<54:17,  3.78s/it]Training 2/2 epoch (loss 0.0162):  79%|██▎| 3254/4114 [3:30:14<55:12,  3.85s/it]Training 2/2 epoch (loss 0.0087):  79%|██▎| 3254/4114 [3:30:18<55:12,  3.85s/it]Training 2/2 epoch (loss 0.0087):  79%|██▎| 3255/4114 [3:30:18<56:36,  3.95s/it]Training 2/2 epoch (loss 0.0310):  79%|██▎| 3255/4114 [3:30:21<56:36,  3.95s/it]Training 2/2 epoch (loss 0.0310):  79%|██▎| 3256/4114 [3:30:21<55:36,  3.89s/it]Training 2/2 epoch (loss 0.0752):  79%|██▎| 3256/4114 [3:30:25<55:36,  3.89s/it]Training 2/2 epoch (loss 0.0752):  79%|██▍| 3257/4114 [3:30:25<55:40,  3.90s/it]Training 2/2 epoch (loss 0.3223):  79%|██▍| 3257/4114 [3:30:29<55:40,  3.90s/it]Training 2/2 epoch (loss 0.3223):  79%|██▍| 3258/4114 [3:30:29<56:26,  3.96s/it]Training 2/2 epoch (loss 0.0630):  79%|██▍| 3258/4114 [3:30:33<56:26,  3.96s/it]Training 2/2 epoch (loss 0.0630):  79%|██▍| 3259/4114 [3:30:33<53:45,  3.77s/it]Training 2/2 epoch (loss 0.0209):  79%|██▍| 3259/4114 [3:30:37<53:45,  3.77s/it]Training 2/2 epoch (loss 0.0209):  79%|██▍| 3260/4114 [3:30:37<54:41,  3.84s/it]Training 2/2 epoch (loss 0.0371):  79%|██▍| 3260/4114 [3:30:41<54:41,  3.84s/it]Training 2/2 epoch (loss 0.0371):  79%|██▍| 3261/4114 [3:30:41<55:19,  3.89s/it]Training 2/2 epoch (loss 0.0742):  79%|██▍| 3261/4114 [3:30:45<55:19,  3.89s/it]Training 2/2 epoch (loss 0.0742):  79%|██▍| 3262/4114 [3:30:45<55:12,  3.89s/it]Training 2/2 epoch (loss 0.0820):  79%|██▍| 3262/4114 [3:30:49<55:12,  3.89s/it]Training 2/2 epoch (loss 0.0820):  79%|██▍| 3263/4114 [3:30:49<55:38,  3.92s/it]Training 2/2 epoch (loss 0.0120):  79%|██▍| 3263/4114 [3:30:53<55:38,  3.92s/it]Training 2/2 epoch (loss 0.0120):  79%|██▍| 3264/4114 [3:30:53<55:56,  3.95s/it]Training 2/2 epoch (loss 0.0096):  79%|██▍| 3264/4114 [3:30:56<55:56,  3.95s/it]Training 2/2 epoch (loss 0.0096):  79%|██▍| 3265/4114 [3:30:56<54:43,  3.87s/it]Training 2/2 epoch (loss 0.0060):  79%|██▍| 3265/4114 [3:31:00<54:43,  3.87s/it]Training 2/2 epoch (loss 0.0060):  79%|██▍| 3266/4114 [3:31:00<55:06,  3.90s/it]Training 2/2 epoch (loss 0.0771):  79%|██▍| 3266/4114 [3:31:04<55:06,  3.90s/it]Training 2/2 epoch (loss 0.0771):  79%|██▍| 3267/4114 [3:31:04<53:41,  3.80s/it]Training 2/2 epoch (loss 0.0811):  79%|██▍| 3267/4114 [3:31:08<53:41,  3.80s/it]Training 2/2 epoch (loss 0.0811):  79%|██▍| 3268/4114 [3:31:08<53:37,  3.80s/it]Training 2/2 epoch (loss 0.0540):  79%|██▍| 3268/4114 [3:31:12<53:37,  3.80s/it]Training 2/2 epoch (loss 0.0540):  79%|██▍| 3269/4114 [3:31:12<54:20,  3.86s/it]Training 2/2 epoch (loss 0.0040):  79%|██▍| 3269/4114 [3:31:16<54:20,  3.86s/it]Training 2/2 epoch (loss 0.0040):  79%|██▍| 3270/4114 [3:31:16<55:51,  3.97s/it]Training 2/2 epoch (loss 0.0503):  79%|██▍| 3270/4114 [3:31:20<55:51,  3.97s/it]Training 2/2 epoch (loss 0.0503):  80%|██▍| 3271/4114 [3:31:20<55:46,  3.97s/it]Training 2/2 epoch (loss 0.0118):  80%|██▍| 3271/4114 [3:31:24<55:46,  3.97s/it]Training 2/2 epoch (loss 0.0118):  80%|██▍| 3272/4114 [3:31:24<54:51,  3.91s/it]Training 2/2 epoch (loss 0.0146):  80%|██▍| 3272/4114 [3:31:28<54:51,  3.91s/it]Training 2/2 epoch (loss 0.0146):  80%|██▍| 3273/4114 [3:31:28<56:39,  4.04s/it]Training 2/2 epoch (loss 0.0123):  80%|██▍| 3273/4114 [3:31:32<56:39,  4.04s/it]Training 2/2 epoch (loss 0.0123):  80%|██▍| 3274/4114 [3:31:32<55:31,  3.97s/it]Training 2/2 epoch (loss 0.0204):  80%|██▍| 3274/4114 [3:31:36<55:31,  3.97s/it]Training 2/2 epoch (loss 0.0204):  80%|██▍| 3275/4114 [3:31:36<54:08,  3.87s/it]Training 2/2 epoch (loss 0.0159):  80%|██▍| 3275/4114 [3:31:40<54:08,  3.87s/it]Training 2/2 epoch (loss 0.0159):  80%|██▍| 3276/4114 [3:31:40<55:29,  3.97s/it]Training 2/2 epoch (loss 0.2148):  80%|██▍| 3276/4114 [3:31:43<55:29,  3.97s/it]Training 2/2 epoch (loss 0.2148):  80%|██▍| 3277/4114 [3:31:43<53:52,  3.86s/it]Training 2/2 epoch (loss 0.0023):  80%|██▍| 3277/4114 [3:31:47<53:52,  3.86s/it]Training 2/2 epoch (loss 0.0023):  80%|██▍| 3278/4114 [3:31:47<54:36,  3.92s/it]Training 2/2 epoch (loss 0.0076):  80%|██▍| 3278/4114 [3:31:51<54:36,  3.92s/it]Training 2/2 epoch (loss 0.0076):  80%|██▍| 3279/4114 [3:31:51<54:46,  3.94s/it]Training 2/2 epoch (loss 0.0229):  80%|██▍| 3279/4114 [3:31:55<54:46,  3.94s/it]Training 2/2 epoch (loss 0.0229):  80%|██▍| 3280/4114 [3:31:55<52:45,  3.80s/it]Training 2/2 epoch (loss 0.0266):  80%|██▍| 3280/4114 [3:31:59<52:45,  3.80s/it]Training 2/2 epoch (loss 0.0266):  80%|██▍| 3281/4114 [3:31:59<53:24,  3.85s/it]Training 2/2 epoch (loss 0.0859):  80%|██▍| 3281/4114 [3:32:03<53:24,  3.85s/it]Training 2/2 epoch (loss 0.0859):  80%|██▍| 3282/4114 [3:32:03<54:57,  3.96s/it]Training 2/2 epoch (loss 0.0090):  80%|██▍| 3282/4114 [3:32:07<54:57,  3.96s/it]Training 2/2 epoch (loss 0.0090):  80%|██▍| 3283/4114 [3:32:07<54:42,  3.95s/it]Training 2/2 epoch (loss 0.0052):  80%|██▍| 3283/4114 [3:32:11<54:42,  3.95s/it]Training 2/2 epoch (loss 0.0052):  80%|██▍| 3284/4114 [3:32:11<54:21,  3.93s/it]Training 2/2 epoch (loss 0.0044):  80%|██▍| 3284/4114 [3:32:15<54:21,  3.93s/it]Training 2/2 epoch (loss 0.0044):  80%|██▍| 3285/4114 [3:32:15<55:50,  4.04s/it]Training 2/2 epoch (loss 0.0048):  80%|██▍| 3285/4114 [3:32:18<55:50,  4.04s/it]Training 2/2 epoch (loss 0.0048):  80%|██▍| 3286/4114 [3:32:18<52:31,  3.81s/it]Training 2/2 epoch (loss 0.0229):  80%|██▍| 3286/4114 [3:32:22<52:31,  3.81s/it]Training 2/2 epoch (loss 0.0229):  80%|██▍| 3287/4114 [3:32:22<50:39,  3.67s/it]Training 2/2 epoch (loss 0.0109):  80%|██▍| 3287/4114 [3:32:26<50:39,  3.67s/it]Training 2/2 epoch (loss 0.0109):  80%|██▍| 3288/4114 [3:32:26<52:05,  3.78s/it]Training 2/2 epoch (loss 0.0306):  80%|██▍| 3288/4114 [3:32:30<52:05,  3.78s/it]Training 2/2 epoch (loss 0.0306):  80%|██▍| 3289/4114 [3:32:30<52:09,  3.79s/it]Training 2/2 epoch (loss 0.0013):  80%|██▍| 3289/4114 [3:32:34<52:09,  3.79s/it]Training 2/2 epoch (loss 0.0013):  80%|██▍| 3290/4114 [3:32:34<52:52,  3.85s/it]Training 2/2 epoch (loss 0.0003):  80%|██▍| 3290/4114 [3:32:37<52:52,  3.85s/it]Training 2/2 epoch (loss 0.0003):  80%|██▍| 3291/4114 [3:32:37<51:27,  3.75s/it]Training 2/2 epoch (loss 0.0011):  80%|██▍| 3291/4114 [3:32:41<51:27,  3.75s/it]Training 2/2 epoch (loss 0.0011):  80%|██▍| 3292/4114 [3:32:41<51:59,  3.80s/it]Training 2/2 epoch (loss 0.0014):  80%|██▍| 3292/4114 [3:32:45<51:59,  3.80s/it]Training 2/2 epoch (loss 0.0014):  80%|██▍| 3293/4114 [3:32:45<53:07,  3.88s/it]Training 2/2 epoch (loss 0.0062):  80%|██▍| 3293/4114 [3:32:49<53:07,  3.88s/it]Training 2/2 epoch (loss 0.0062):  80%|██▍| 3294/4114 [3:32:49<53:55,  3.95s/it]Training 2/2 epoch (loss 0.0278):  80%|██▍| 3294/4114 [3:32:53<53:55,  3.95s/it]Training 2/2 epoch (loss 0.0278):  80%|██▍| 3295/4114 [3:32:53<51:29,  3.77s/it]Training 2/2 epoch (loss 0.0364):  80%|██▍| 3295/4114 [3:32:57<51:29,  3.77s/it]Training 2/2 epoch (loss 0.0364):  80%|██▍| 3296/4114 [3:32:57<52:36,  3.86s/it]Training 2/2 epoch (loss 0.0591):  80%|██▍| 3296/4114 [3:33:01<52:36,  3.86s/it]Training 2/2 epoch (loss 0.0591):  80%|██▍| 3297/4114 [3:33:01<53:57,  3.96s/it]Training 2/2 epoch (loss 0.0884):  80%|██▍| 3297/4114 [3:33:04<53:57,  3.96s/it]Training 2/2 epoch (loss 0.0884):  80%|██▍| 3298/4114 [3:33:04<51:28,  3.79s/it]Training 2/2 epoch (loss 0.0801):  80%|██▍| 3298/4114 [3:33:08<51:28,  3.79s/it]Training 2/2 epoch (loss 0.0801):  80%|██▍| 3299/4114 [3:33:08<51:30,  3.79s/it]Training 2/2 epoch (loss 0.0356):  80%|██▍| 3299/4114 [3:33:12<51:30,  3.79s/it]Training 2/2 epoch (loss 0.0356):  80%|██▍| 3300/4114 [3:33:12<52:34,  3.88s/it]Training 2/2 epoch (loss 0.1572):  80%|██▍| 3300/4114 [3:33:15<52:34,  3.88s/it]Training 2/2 epoch (loss 0.1572):  80%|██▍| 3301/4114 [3:33:15<50:01,  3.69s/it]Training 2/2 epoch (loss 0.1201):  80%|██▍| 3301/4114 [3:33:19<50:01,  3.69s/it]Training 2/2 epoch (loss 0.1201):  80%|██▍| 3302/4114 [3:33:19<50:27,  3.73s/it]Training 2/2 epoch (loss 0.0270):  80%|██▍| 3302/4114 [3:33:23<50:27,  3.73s/it]Training 2/2 epoch (loss 0.0270):  80%|██▍| 3303/4114 [3:33:23<49:58,  3.70s/it]Training 2/2 epoch (loss 0.0184):  80%|██▍| 3303/4114 [3:33:26<49:58,  3.70s/it]Training 2/2 epoch (loss 0.0184):  80%|██▍| 3304/4114 [3:33:26<49:12,  3.65s/it]Training 2/2 epoch (loss 0.0586):  80%|██▍| 3304/4114 [3:33:30<49:12,  3.65s/it]Training 2/2 epoch (loss 0.0586):  80%|██▍| 3305/4114 [3:33:30<49:38,  3.68s/it]Training 2/2 epoch (loss 0.0044):  80%|██▍| 3305/4114 [3:33:34<49:38,  3.68s/it]Training 2/2 epoch (loss 0.0044):  80%|██▍| 3306/4114 [3:33:34<50:39,  3.76s/it]Training 2/2 epoch (loss 0.0145):  80%|██▍| 3306/4114 [3:33:38<50:39,  3.76s/it]Training 2/2 epoch (loss 0.0145):  80%|██▍| 3307/4114 [3:33:38<50:38,  3.77s/it]Training 2/2 epoch (loss 0.0474):  80%|██▍| 3307/4114 [3:33:42<50:38,  3.77s/it]Training 2/2 epoch (loss 0.0474):  80%|██▍| 3308/4114 [3:33:42<51:10,  3.81s/it]Training 2/2 epoch (loss 0.0244):  80%|██▍| 3308/4114 [3:33:46<51:10,  3.81s/it]Training 2/2 epoch (loss 0.0244):  80%|██▍| 3309/4114 [3:33:46<51:54,  3.87s/it]Training 2/2 epoch (loss 0.0520):  80%|██▍| 3309/4114 [3:33:49<51:54,  3.87s/it]Training 2/2 epoch (loss 0.0520):  80%|██▍| 3310/4114 [3:33:49<49:58,  3.73s/it]Training 2/2 epoch (loss 0.0615):  80%|██▍| 3310/4114 [3:33:53<49:58,  3.73s/it]Training 2/2 epoch (loss 0.0615):  80%|██▍| 3311/4114 [3:33:53<50:11,  3.75s/it]Training 2/2 epoch (loss 0.1719):  80%|██▍| 3311/4114 [3:33:57<50:11,  3.75s/it]Training 2/2 epoch (loss 0.1719):  81%|██▍| 3312/4114 [3:33:57<51:59,  3.89s/it]Training 2/2 epoch (loss 0.1006):  81%|██▍| 3312/4114 [3:34:01<51:59,  3.89s/it]Training 2/2 epoch (loss 0.1006):  81%|██▍| 3313/4114 [3:34:01<51:54,  3.89s/it]Training 2/2 epoch (loss 0.0110):  81%|██▍| 3313/4114 [3:34:05<51:54,  3.89s/it]Training 2/2 epoch (loss 0.0110):  81%|██▍| 3314/4114 [3:34:05<51:28,  3.86s/it]Training 2/2 epoch (loss 0.0124):  81%|██▍| 3314/4114 [3:34:09<51:28,  3.86s/it]Training 2/2 epoch (loss 0.0124):  81%|██▍| 3315/4114 [3:34:09<52:28,  3.94s/it]Training 2/2 epoch (loss 0.0801):  81%|██▍| 3315/4114 [3:34:13<52:28,  3.94s/it]Training 2/2 epoch (loss 0.0801):  81%|██▍| 3316/4114 [3:34:13<52:24,  3.94s/it]Training 2/2 epoch (loss 0.1064):  81%|██▍| 3316/4114 [3:34:16<52:24,  3.94s/it]Training 2/2 epoch (loss 0.1064):  81%|██▍| 3317/4114 [3:34:16<50:16,  3.79s/it]Training 2/2 epoch (loss 0.0234):  81%|██▍| 3317/4114 [3:34:20<50:16,  3.79s/it]Training 2/2 epoch (loss 0.0234):  81%|██▍| 3318/4114 [3:34:20<50:23,  3.80s/it]Training 2/2 epoch (loss 0.1123):  81%|██▍| 3318/4114 [3:34:24<50:23,  3.80s/it]Training 2/2 epoch (loss 0.1123):  81%|██▍| 3319/4114 [3:34:24<50:15,  3.79s/it]Training 2/2 epoch (loss 0.1963):  81%|██▍| 3319/4114 [3:34:28<50:15,  3.79s/it]Training 2/2 epoch (loss 0.1963):  81%|██▍| 3320/4114 [3:34:28<50:46,  3.84s/it]Training 2/2 epoch (loss 0.0366):  81%|██▍| 3320/4114 [3:34:32<50:46,  3.84s/it]Training 2/2 epoch (loss 0.0366):  81%|██▍| 3321/4114 [3:34:32<52:15,  3.95s/it]Training 2/2 epoch (loss 0.5117):  81%|██▍| 3321/4114 [3:34:36<52:15,  3.95s/it]Training 2/2 epoch (loss 0.5117):  81%|██▍| 3322/4114 [3:34:36<52:17,  3.96s/it]Training 2/2 epoch (loss 0.1299):  81%|██▍| 3322/4114 [3:34:40<52:17,  3.96s/it]Training 2/2 epoch (loss 0.1299):  81%|██▍| 3323/4114 [3:34:40<52:09,  3.96s/it]Training 2/2 epoch (loss 0.1641):  81%|██▍| 3323/4114 [3:34:44<52:09,  3.96s/it]Training 2/2 epoch (loss 0.1641):  81%|██▍| 3324/4114 [3:34:44<52:51,  4.02s/it]Training 2/2 epoch (loss 0.1367):  81%|██▍| 3324/4114 [3:34:48<52:51,  4.02s/it]Training 2/2 epoch (loss 0.1367):  81%|██▍| 3325/4114 [3:34:48<52:46,  4.01s/it]Training 2/2 epoch (loss 0.0270):  81%|██▍| 3325/4114 [3:34:52<52:46,  4.01s/it]Training 2/2 epoch (loss 0.0270):  81%|██▍| 3326/4114 [3:34:52<50:35,  3.85s/it]Training 2/2 epoch (loss 0.0217):  81%|██▍| 3326/4114 [3:34:55<50:35,  3.85s/it]Training 2/2 epoch (loss 0.0217):  81%|██▍| 3327/4114 [3:34:55<49:45,  3.79s/it]Training 2/2 epoch (loss 0.0019):  81%|██▍| 3327/4114 [3:34:59<49:45,  3.79s/it]Training 2/2 epoch (loss 0.0019):  81%|██▍| 3328/4114 [3:34:59<49:14,  3.76s/it]Training 2/2 epoch (loss 0.0120):  81%|██▍| 3328/4114 [3:35:02<49:14,  3.76s/it]Training 2/2 epoch (loss 0.0120):  81%|██▍| 3329/4114 [3:35:02<47:18,  3.62s/it]Training 2/2 epoch (loss 0.0071):  81%|██▍| 3329/4114 [3:35:06<47:18,  3.62s/it]Training 2/2 epoch (loss 0.0071):  81%|██▍| 3330/4114 [3:35:06<49:24,  3.78s/it]Training 2/2 epoch (loss 0.0554):  81%|██▍| 3330/4114 [3:35:10<49:24,  3.78s/it]Training 2/2 epoch (loss 0.0554):  81%|██▍| 3331/4114 [3:35:10<49:40,  3.81s/it]Training 2/2 epoch (loss 0.1016):  81%|██▍| 3331/4114 [3:35:14<49:40,  3.81s/it]Training 2/2 epoch (loss 0.1016):  81%|██▍| 3332/4114 [3:35:14<49:58,  3.83s/it]Training 2/2 epoch (loss 0.0082):  81%|██▍| 3332/4114 [3:35:18<49:58,  3.83s/it]Training 2/2 epoch (loss 0.0082):  81%|██▍| 3333/4114 [3:35:18<51:21,  3.95s/it]Training 2/2 epoch (loss 0.0073):  81%|██▍| 3333/4114 [3:35:22<51:21,  3.95s/it]Training 2/2 epoch (loss 0.0073):  81%|██▍| 3334/4114 [3:35:22<50:49,  3.91s/it]Training 2/2 epoch (loss 0.1001):  81%|██▍| 3334/4114 [3:35:26<50:49,  3.91s/it]Training 2/2 epoch (loss 0.1001):  81%|██▍| 3335/4114 [3:35:26<50:45,  3.91s/it]Training 2/2 epoch (loss 0.0216):  81%|██▍| 3335/4114 [3:35:30<50:45,  3.91s/it]Training 2/2 epoch (loss 0.0216):  81%|██▍| 3336/4114 [3:35:30<51:46,  3.99s/it]Training 2/2 epoch (loss 0.0134):  81%|██▍| 3336/4114 [3:35:34<51:46,  3.99s/it]Training 2/2 epoch (loss 0.0134):  81%|██▍| 3337/4114 [3:35:34<50:29,  3.90s/it]Training 2/2 epoch (loss 0.0042):  81%|██▍| 3337/4114 [3:35:38<50:29,  3.90s/it]Training 2/2 epoch (loss 0.0042):  81%|██▍| 3338/4114 [3:35:38<50:53,  3.93s/it]Training 2/2 epoch (loss 0.0620):  81%|██▍| 3338/4114 [3:35:42<50:53,  3.93s/it]Training 2/2 epoch (loss 0.0620):  81%|██▍| 3339/4114 [3:35:42<52:04,  4.03s/it]Training 2/2 epoch (loss 0.0212):  81%|██▍| 3339/4114 [3:35:46<52:04,  4.03s/it]Training 2/2 epoch (loss 0.0212):  81%|██▍| 3340/4114 [3:35:46<51:35,  4.00s/it]Training 2/2 epoch (loss 0.0064):  81%|██▍| 3340/4114 [3:35:50<51:35,  4.00s/it]Training 2/2 epoch (loss 0.0064):  81%|██▍| 3341/4114 [3:35:50<50:45,  3.94s/it]Training 2/2 epoch (loss 0.1426):  81%|██▍| 3341/4114 [3:35:54<50:45,  3.94s/it]Training 2/2 epoch (loss 0.1426):  81%|██▍| 3342/4114 [3:35:54<51:44,  4.02s/it]Training 2/2 epoch (loss 0.0300):  81%|██▍| 3342/4114 [3:35:58<51:44,  4.02s/it]Training 2/2 epoch (loss 0.0300):  81%|██▍| 3343/4114 [3:35:58<51:21,  4.00s/it]Training 2/2 epoch (loss 0.0280):  81%|██▍| 3343/4114 [3:36:02<51:21,  4.00s/it]Training 2/2 epoch (loss 0.0280):  81%|██▍| 3344/4114 [3:36:02<50:28,  3.93s/it]Training 2/2 epoch (loss 0.0557):  81%|██▍| 3344/4114 [3:36:06<50:28,  3.93s/it]Training 2/2 epoch (loss 0.0557):  81%|██▍| 3345/4114 [3:36:06<51:16,  4.00s/it]Training 2/2 epoch (loss 0.1250):  81%|██▍| 3345/4114 [3:36:10<51:16,  4.00s/it]Training 2/2 epoch (loss 0.1250):  81%|██▍| 3346/4114 [3:36:10<50:58,  3.98s/it]Training 2/2 epoch (loss 0.0811):  81%|██▍| 3346/4114 [3:36:14<50:58,  3.98s/it]Training 2/2 epoch (loss 0.0811):  81%|██▍| 3347/4114 [3:36:14<50:15,  3.93s/it]Training 2/2 epoch (loss 0.0155):  81%|██▍| 3347/4114 [3:36:18<50:15,  3.93s/it]Training 2/2 epoch (loss 0.0155):  81%|██▍| 3348/4114 [3:36:18<50:35,  3.96s/it]Training 2/2 epoch (loss 0.0281):  81%|██▍| 3348/4114 [3:36:22<50:35,  3.96s/it]Training 2/2 epoch (loss 0.0281):  81%|██▍| 3349/4114 [3:36:22<50:53,  3.99s/it]Training 2/2 epoch (loss 0.0806):  81%|██▍| 3349/4114 [3:36:26<50:53,  3.99s/it]Training 2/2 epoch (loss 0.0806):  81%|██▍| 3350/4114 [3:36:26<51:09,  4.02s/it]Training 2/2 epoch (loss 0.0330):  81%|██▍| 3350/4114 [3:36:30<51:09,  4.02s/it]Training 2/2 epoch (loss 0.0330):  81%|██▍| 3351/4114 [3:36:30<51:53,  4.08s/it]Training 2/2 epoch (loss 0.1035):  81%|██▍| 3351/4114 [3:36:34<51:53,  4.08s/it]Training 2/2 epoch (loss 0.1035):  81%|██▍| 3352/4114 [3:36:34<48:58,  3.86s/it]Training 2/2 epoch (loss 0.0496):  81%|██▍| 3352/4114 [3:36:37<48:58,  3.86s/it]Training 2/2 epoch (loss 0.0496):  82%|██▍| 3353/4114 [3:36:37<47:22,  3.74s/it]Training 2/2 epoch (loss 0.0167):  82%|██▍| 3353/4114 [3:36:41<47:22,  3.74s/it]Training 2/2 epoch (loss 0.0167):  82%|██▍| 3354/4114 [3:36:41<48:12,  3.81s/it]Training 2/2 epoch (loss 0.0381):  82%|██▍| 3354/4114 [3:36:45<48:12,  3.81s/it]Training 2/2 epoch (loss 0.0381):  82%|██▍| 3355/4114 [3:36:45<48:51,  3.86s/it]Training 2/2 epoch (loss 0.0089):  82%|██▍| 3355/4114 [3:36:49<48:51,  3.86s/it]Training 2/2 epoch (loss 0.0089):  82%|██▍| 3356/4114 [3:36:49<48:45,  3.86s/it]Training 2/2 epoch (loss 0.1089):  82%|██▍| 3356/4114 [3:36:53<48:45,  3.86s/it]Training 2/2 epoch (loss 0.1089):  82%|██▍| 3357/4114 [3:36:53<48:45,  3.86s/it]Training 2/2 epoch (loss 0.1113):  82%|██▍| 3357/4114 [3:36:57<48:45,  3.86s/it]Training 2/2 epoch (loss 0.1113):  82%|██▍| 3358/4114 [3:36:57<48:54,  3.88s/it]Training 2/2 epoch (loss 0.0187):  82%|██▍| 3358/4114 [3:37:00<48:54,  3.88s/it]Training 2/2 epoch (loss 0.0187):  82%|██▍| 3359/4114 [3:37:00<48:44,  3.87s/it]Training 2/2 epoch (loss 0.0645):  82%|██▍| 3359/4114 [3:37:05<48:44,  3.87s/it]Training 2/2 epoch (loss 0.0645):  82%|██▍| 3360/4114 [3:37:05<50:22,  4.01s/it]Training 2/2 epoch (loss 0.0459):  82%|██▍| 3360/4114 [3:37:09<50:22,  4.01s/it]Training 2/2 epoch (loss 0.0459):  82%|██▍| 3361/4114 [3:37:09<50:29,  4.02s/it]Training 2/2 epoch (loss 0.0149):  82%|██▍| 3361/4114 [3:37:12<50:29,  4.02s/it]Training 2/2 epoch (loss 0.0149):  82%|██▍| 3362/4114 [3:37:12<48:10,  3.84s/it]Training 2/2 epoch (loss 0.0574):  82%|██▍| 3362/4114 [3:37:16<48:10,  3.84s/it]Training 2/2 epoch (loss 0.0574):  82%|██▍| 3363/4114 [3:37:16<49:25,  3.95s/it]Training 2/2 epoch (loss 0.0128):  82%|██▍| 3363/4114 [3:37:20<49:25,  3.95s/it]Training 2/2 epoch (loss 0.0128):  82%|██▍| 3364/4114 [3:37:20<48:45,  3.90s/it]Training 2/2 epoch (loss 0.0091):  82%|██▍| 3364/4114 [3:37:24<48:45,  3.90s/it]Training 2/2 epoch (loss 0.0091):  82%|██▍| 3365/4114 [3:37:24<48:56,  3.92s/it]Training 2/2 epoch (loss 0.0415):  82%|██▍| 3365/4114 [3:37:28<48:56,  3.92s/it]Training 2/2 epoch (loss 0.0415):  82%|██▍| 3366/4114 [3:37:28<50:03,  4.02s/it]Training 2/2 epoch (loss 0.0938):  82%|██▍| 3366/4114 [3:37:33<50:03,  4.02s/it]Training 2/2 epoch (loss 0.0938):  82%|██▍| 3367/4114 [3:37:33<50:14,  4.04s/it]Training 2/2 epoch (loss 0.1318):  82%|██▍| 3367/4114 [3:37:37<50:14,  4.04s/it]Training 2/2 epoch (loss 0.1318):  82%|██▍| 3368/4114 [3:37:37<50:21,  4.05s/it]Training 2/2 epoch (loss 0.0030):  82%|██▍| 3368/4114 [3:37:41<50:21,  4.05s/it]Training 2/2 epoch (loss 0.0030):  82%|██▍| 3369/4114 [3:37:41<50:34,  4.07s/it]Training 2/2 epoch (loss 0.0029):  82%|██▍| 3369/4114 [3:37:45<50:34,  4.07s/it]Training 2/2 epoch (loss 0.0029):  82%|██▍| 3370/4114 [3:37:45<50:08,  4.04s/it]Training 2/2 epoch (loss 0.0070):  82%|██▍| 3370/4114 [3:37:48<50:08,  4.04s/it]Training 2/2 epoch (loss 0.0070):  82%|██▍| 3371/4114 [3:37:48<48:21,  3.91s/it]Training 2/2 epoch (loss 0.0019):  82%|██▍| 3371/4114 [3:37:52<48:21,  3.91s/it]Training 2/2 epoch (loss 0.0019):  82%|██▍| 3372/4114 [3:37:52<49:05,  3.97s/it]Training 2/2 epoch (loss 0.0056):  82%|██▍| 3372/4114 [3:37:56<49:05,  3.97s/it]Training 2/2 epoch (loss 0.0056):  82%|██▍| 3373/4114 [3:37:56<48:25,  3.92s/it]Training 2/2 epoch (loss 0.0027):  82%|██▍| 3373/4114 [3:38:00<48:25,  3.92s/it]Training 2/2 epoch (loss 0.0027):  82%|██▍| 3374/4114 [3:38:00<48:17,  3.92s/it]Training 2/2 epoch (loss 0.0586):  82%|██▍| 3374/4114 [3:38:04<48:17,  3.92s/it]Training 2/2 epoch (loss 0.0586):  82%|██▍| 3375/4114 [3:38:04<47:31,  3.86s/it]Training 2/2 epoch (loss 0.0156):  82%|██▍| 3375/4114 [3:38:08<47:31,  3.86s/it]Training 2/2 epoch (loss 0.0156):  82%|██▍| 3376/4114 [3:38:08<47:10,  3.83s/it]Training 2/2 epoch (loss 0.0040):  82%|██▍| 3376/4114 [3:38:12<47:10,  3.83s/it]Training 2/2 epoch (loss 0.0040):  82%|██▍| 3377/4114 [3:38:12<48:09,  3.92s/it]Training 2/2 epoch (loss 0.0327):  82%|██▍| 3377/4114 [3:38:16<48:09,  3.92s/it]Training 2/2 epoch (loss 0.0327):  82%|██▍| 3378/4114 [3:38:16<48:36,  3.96s/it]Training 2/2 epoch (loss 0.0057):  82%|██▍| 3378/4114 [3:38:20<48:36,  3.96s/it]Training 2/2 epoch (loss 0.0057):  82%|██▍| 3379/4114 [3:38:20<48:08,  3.93s/it]Training 2/2 epoch (loss 0.0060):  82%|██▍| 3379/4114 [3:38:23<48:08,  3.93s/it]Training 2/2 epoch (loss 0.0060):  82%|██▍| 3380/4114 [3:38:23<47:02,  3.85s/it]Training 2/2 epoch (loss 0.0001):  82%|██▍| 3380/4114 [3:38:27<47:02,  3.85s/it]Training 2/2 epoch (loss 0.0001):  82%|██▍| 3381/4114 [3:38:27<46:25,  3.80s/it]Training 2/2 epoch (loss 0.0166):  82%|██▍| 3381/4114 [3:38:31<46:25,  3.80s/it]Training 2/2 epoch (loss 0.0166):  82%|██▍| 3382/4114 [3:38:31<47:03,  3.86s/it]Training 2/2 epoch (loss 0.0135):  82%|██▍| 3382/4114 [3:38:35<47:03,  3.86s/it]Training 2/2 epoch (loss 0.0135):  82%|██▍| 3383/4114 [3:38:35<47:08,  3.87s/it]Training 2/2 epoch (loss 0.0019):  82%|██▍| 3383/4114 [3:38:39<47:08,  3.87s/it]Training 2/2 epoch (loss 0.0019):  82%|██▍| 3384/4114 [3:38:39<47:40,  3.92s/it]Training 2/2 epoch (loss 0.0150):  82%|██▍| 3384/4114 [3:38:43<47:40,  3.92s/it]Training 2/2 epoch (loss 0.0150):  82%|██▍| 3385/4114 [3:38:43<47:02,  3.87s/it]Training 2/2 epoch (loss 0.0075):  82%|██▍| 3385/4114 [3:38:46<47:02,  3.87s/it]Training 2/2 epoch (loss 0.0075):  82%|██▍| 3386/4114 [3:38:46<45:26,  3.75s/it]Training 2/2 epoch (loss 0.1562):  82%|██▍| 3386/4114 [3:38:50<45:26,  3.75s/it]Training 2/2 epoch (loss 0.1562):  82%|██▍| 3387/4114 [3:38:50<46:57,  3.88s/it]Training 2/2 epoch (loss 0.0527):  82%|██▍| 3387/4114 [3:38:54<46:57,  3.88s/it]Training 2/2 epoch (loss 0.0527):  82%|██▍| 3388/4114 [3:38:54<46:11,  3.82s/it]Training 2/2 epoch (loss 0.0258):  82%|██▍| 3388/4114 [3:38:58<46:11,  3.82s/it]Training 2/2 epoch (loss 0.0258):  82%|██▍| 3389/4114 [3:38:58<46:32,  3.85s/it]Training 2/2 epoch (loss 0.1670):  82%|██▍| 3389/4114 [3:39:02<46:32,  3.85s/it]Training 2/2 epoch (loss 0.1670):  82%|██▍| 3390/4114 [3:39:02<47:08,  3.91s/it]Training 2/2 epoch (loss 0.0063):  82%|██▍| 3390/4114 [3:39:06<47:08,  3.91s/it]Training 2/2 epoch (loss 0.0063):  82%|██▍| 3391/4114 [3:39:06<46:48,  3.88s/it]Training 2/2 epoch (loss 0.0045):  82%|██▍| 3391/4114 [3:39:10<46:48,  3.88s/it]Training 2/2 epoch (loss 0.0045):  82%|██▍| 3392/4114 [3:39:10<47:28,  3.95s/it]Training 2/2 epoch (loss 0.0654):  82%|██▍| 3392/4114 [3:39:14<47:28,  3.95s/it]Training 2/2 epoch (loss 0.0654):  82%|██▍| 3393/4114 [3:39:14<47:36,  3.96s/it]Training 2/2 epoch (loss 0.0008):  82%|██▍| 3393/4114 [3:39:17<47:36,  3.96s/it]Training 2/2 epoch (loss 0.0008):  82%|██▍| 3394/4114 [3:39:17<45:03,  3.75s/it]Training 2/2 epoch (loss 0.0125):  82%|██▍| 3394/4114 [3:39:21<45:03,  3.75s/it]Training 2/2 epoch (loss 0.0125):  83%|██▍| 3395/4114 [3:39:21<45:37,  3.81s/it]Training 2/2 epoch (loss 0.0024):  83%|██▍| 3395/4114 [3:39:25<45:37,  3.81s/it]Training 2/2 epoch (loss 0.0024):  83%|██▍| 3396/4114 [3:39:25<45:17,  3.78s/it]Training 2/2 epoch (loss 0.0679):  83%|██▍| 3396/4114 [3:39:29<45:17,  3.78s/it]Training 2/2 epoch (loss 0.0679):  83%|██▍| 3397/4114 [3:39:29<45:20,  3.79s/it]Training 2/2 epoch (loss 0.0317):  83%|██▍| 3397/4114 [3:39:32<45:20,  3.79s/it]Training 2/2 epoch (loss 0.0317):  83%|██▍| 3398/4114 [3:39:32<43:37,  3.66s/it]Training 2/2 epoch (loss 0.0073):  83%|██▍| 3398/4114 [3:39:36<43:37,  3.66s/it]Training 2/2 epoch (loss 0.0073):  83%|██▍| 3399/4114 [3:39:36<44:57,  3.77s/it]Training 2/2 epoch (loss 0.0145):  83%|██▍| 3399/4114 [3:39:40<44:57,  3.77s/it]Training 2/2 epoch (loss 0.0145):  83%|██▍| 3400/4114 [3:39:40<44:58,  3.78s/it]Training 2/2 epoch (loss 0.0289):  83%|██▍| 3400/4114 [3:39:44<44:58,  3.78s/it]Training 2/2 epoch (loss 0.0289):  83%|██▍| 3401/4114 [3:39:44<45:32,  3.83s/it]Training 2/2 epoch (loss 0.0107):  83%|██▍| 3401/4114 [3:39:48<45:32,  3.83s/it]Training 2/2 epoch (loss 0.0107):  83%|██▍| 3402/4114 [3:39:48<46:49,  3.95s/it]Training 2/2 epoch (loss 0.0383):  83%|██▍| 3402/4114 [3:39:52<46:49,  3.95s/it]Training 2/2 epoch (loss 0.0383):  83%|██▍| 3403/4114 [3:39:52<46:01,  3.88s/it]Training 2/2 epoch (loss 0.0035):  83%|██▍| 3403/4114 [3:39:55<46:01,  3.88s/it]Training 2/2 epoch (loss 0.0035):  83%|██▍| 3404/4114 [3:39:55<45:07,  3.81s/it]Training 2/2 epoch (loss 0.0161):  83%|██▍| 3404/4114 [3:40:00<45:07,  3.81s/it]Training 2/2 epoch (loss 0.0161):  83%|██▍| 3405/4114 [3:40:00<46:47,  3.96s/it]Training 2/2 epoch (loss 0.0034):  83%|██▍| 3405/4114 [3:40:03<46:47,  3.96s/it]Training 2/2 epoch (loss 0.0034):  83%|██▍| 3406/4114 [3:40:03<46:06,  3.91s/it]Training 2/2 epoch (loss 0.0302):  83%|██▍| 3406/4114 [3:40:07<46:06,  3.91s/it]Training 2/2 epoch (loss 0.0302):  83%|██▍| 3407/4114 [3:40:07<43:53,  3.72s/it]Training 2/2 epoch (loss 0.0349):  83%|██▍| 3407/4114 [3:40:11<43:53,  3.72s/it]Training 2/2 epoch (loss 0.0349):  83%|██▍| 3408/4114 [3:40:11<45:26,  3.86s/it]Training 2/2 epoch (loss 0.0247):  83%|██▍| 3408/4114 [3:40:14<45:26,  3.86s/it]Training 2/2 epoch (loss 0.0247):  83%|██▍| 3409/4114 [3:40:14<44:09,  3.76s/it]Training 2/2 epoch (loss 0.0098):  83%|██▍| 3409/4114 [3:40:18<44:09,  3.76s/it]Training 2/2 epoch (loss 0.0098):  83%|██▍| 3410/4114 [3:40:18<43:28,  3.71s/it]Training 2/2 epoch (loss 0.0046):  83%|██▍| 3410/4114 [3:40:22<43:28,  3.71s/it]Training 2/2 epoch (loss 0.0046):  83%|██▍| 3411/4114 [3:40:22<42:49,  3.65s/it]Training 2/2 epoch (loss 0.0075):  83%|██▍| 3411/4114 [3:40:25<42:49,  3.65s/it]Training 2/2 epoch (loss 0.0075):  83%|██▍| 3412/4114 [3:40:25<42:17,  3.61s/it]Training 2/2 epoch (loss 0.0189):  83%|██▍| 3412/4114 [3:40:29<42:17,  3.61s/it]Training 2/2 epoch (loss 0.0189):  83%|██▍| 3413/4114 [3:40:29<43:58,  3.76s/it]Training 2/2 epoch (loss 0.0052):  83%|██▍| 3413/4114 [3:40:33<43:58,  3.76s/it]Training 2/2 epoch (loss 0.0052):  83%|██▍| 3414/4114 [3:40:33<45:06,  3.87s/it]Training 2/2 epoch (loss 0.0830):  83%|██▍| 3414/4114 [3:40:37<45:06,  3.87s/it]Training 2/2 epoch (loss 0.0830):  83%|██▍| 3415/4114 [3:40:37<45:25,  3.90s/it]Training 2/2 epoch (loss 0.0021):  83%|██▍| 3415/4114 [3:40:41<45:25,  3.90s/it]Training 2/2 epoch (loss 0.0021):  83%|██▍| 3416/4114 [3:40:41<45:57,  3.95s/it]Training 2/2 epoch (loss 0.0002):  83%|██▍| 3416/4114 [3:40:45<45:57,  3.95s/it]Training 2/2 epoch (loss 0.0002):  83%|██▍| 3417/4114 [3:40:45<46:10,  3.97s/it]Training 2/2 epoch (loss 0.0153):  83%|██▍| 3417/4114 [3:40:49<46:10,  3.97s/it]Training 2/2 epoch (loss 0.0153):  83%|██▍| 3418/4114 [3:40:49<46:26,  4.00s/it]Training 2/2 epoch (loss 0.0386):  83%|██▍| 3418/4114 [3:40:53<46:26,  4.00s/it]Training 2/2 epoch (loss 0.0386):  83%|██▍| 3419/4114 [3:40:53<45:36,  3.94s/it]Training 2/2 epoch (loss 0.0547):  83%|██▍| 3419/4114 [3:40:57<45:36,  3.94s/it]Training 2/2 epoch (loss 0.0547):  83%|██▍| 3420/4114 [3:40:57<43:06,  3.73s/it]Training 2/2 epoch (loss 0.0270):  83%|██▍| 3420/4114 [3:41:01<43:06,  3.73s/it]Training 2/2 epoch (loss 0.0270):  83%|██▍| 3421/4114 [3:41:01<44:14,  3.83s/it]Training 2/2 epoch (loss 0.0315):  83%|██▍| 3421/4114 [3:41:04<44:14,  3.83s/it]Training 2/2 epoch (loss 0.0315):  83%|██▍| 3422/4114 [3:41:04<44:04,  3.82s/it]Training 2/2 epoch (loss 0.0010):  83%|██▍| 3422/4114 [3:41:09<44:04,  3.82s/it]Training 2/2 epoch (loss 0.0010):  83%|██▍| 3423/4114 [3:41:09<45:37,  3.96s/it]Training 2/2 epoch (loss 0.0284):  83%|██▍| 3423/4114 [3:41:12<45:37,  3.96s/it]Training 2/2 epoch (loss 0.0284):  83%|██▍| 3424/4114 [3:41:12<44:46,  3.89s/it]Training 2/2 epoch (loss 0.0028):  83%|██▍| 3424/4114 [3:41:16<44:46,  3.89s/it]Training 2/2 epoch (loss 0.0028):  83%|██▍| 3425/4114 [3:41:16<44:43,  3.90s/it]Training 2/2 epoch (loss 0.0008):  83%|██▍| 3425/4114 [3:41:21<44:43,  3.90s/it]Training 2/2 epoch (loss 0.0008):  83%|██▍| 3426/4114 [3:41:21<45:43,  3.99s/it]Training 2/2 epoch (loss 0.0233):  83%|██▍| 3426/4114 [3:41:24<45:43,  3.99s/it]Training 2/2 epoch (loss 0.0233):  83%|██▍| 3427/4114 [3:41:24<44:56,  3.93s/it]Training 2/2 epoch (loss 0.0108):  83%|██▍| 3427/4114 [3:41:28<44:56,  3.93s/it]Training 2/2 epoch (loss 0.0108):  83%|██▍| 3428/4114 [3:41:28<44:31,  3.89s/it]Training 2/2 epoch (loss 0.0444):  83%|██▍| 3428/4114 [3:41:32<44:31,  3.89s/it]Training 2/2 epoch (loss 0.0444):  83%|██▌| 3429/4114 [3:41:32<43:33,  3.82s/it]Training 2/2 epoch (loss 0.0270):  83%|██▌| 3429/4114 [3:41:35<43:33,  3.82s/it]Training 2/2 epoch (loss 0.0270):  83%|██▌| 3430/4114 [3:41:35<42:47,  3.75s/it]Training 2/2 epoch (loss 0.0003):  83%|██▌| 3430/4114 [3:41:39<42:47,  3.75s/it]Training 2/2 epoch (loss 0.0003):  83%|██▌| 3431/4114 [3:41:39<42:52,  3.77s/it]Training 2/2 epoch (loss 0.0067):  83%|██▌| 3431/4114 [3:41:43<42:52,  3.77s/it]Training 2/2 epoch (loss 0.0067):  83%|██▌| 3432/4114 [3:41:43<43:51,  3.86s/it]Training 2/2 epoch (loss 0.0082):  83%|██▌| 3432/4114 [3:41:47<43:51,  3.86s/it]Training 2/2 epoch (loss 0.0082):  83%|██▌| 3433/4114 [3:41:47<44:08,  3.89s/it]Training 2/2 epoch (loss 0.0033):  83%|██▌| 3433/4114 [3:41:51<44:08,  3.89s/it]Training 2/2 epoch (loss 0.0033):  83%|██▌| 3434/4114 [3:41:51<44:11,  3.90s/it]Training 2/2 epoch (loss 0.0073):  83%|██▌| 3434/4114 [3:41:55<44:11,  3.90s/it]Training 2/2 epoch (loss 0.0073):  83%|██▌| 3435/4114 [3:41:55<44:37,  3.94s/it]Training 2/2 epoch (loss 0.0115):  83%|██▌| 3435/4114 [3:41:59<44:37,  3.94s/it]Training 2/2 epoch (loss 0.0115):  84%|██▌| 3436/4114 [3:41:59<44:15,  3.92s/it]Training 2/2 epoch (loss 0.1152):  84%|██▌| 3436/4114 [3:42:03<44:15,  3.92s/it]Training 2/2 epoch (loss 0.1152):  84%|██▌| 3437/4114 [3:42:03<43:38,  3.87s/it]Training 2/2 epoch (loss 0.0116):  84%|██▌| 3437/4114 [3:42:06<43:38,  3.87s/it]Training 2/2 epoch (loss 0.0116):  84%|██▌| 3438/4114 [3:42:06<41:55,  3.72s/it]Training 2/2 epoch (loss 0.0481):  84%|██▌| 3438/4114 [3:42:09<41:55,  3.72s/it]Training 2/2 epoch (loss 0.0481):  84%|██▌| 3439/4114 [3:42:09<39:41,  3.53s/it]Training 2/2 epoch (loss 0.0106):  84%|██▌| 3439/4114 [3:42:13<39:41,  3.53s/it]Training 2/2 epoch (loss 0.0106):  84%|██▌| 3440/4114 [3:42:13<41:09,  3.66s/it]Training 2/2 epoch (loss 0.1128):  84%|██▌| 3440/4114 [3:42:17<41:09,  3.66s/it]Training 2/2 epoch (loss 0.1128):  84%|██▌| 3441/4114 [3:42:17<43:12,  3.85s/it]Training 2/2 epoch (loss 0.0150):  84%|██▌| 3441/4114 [3:42:22<43:12,  3.85s/it]Training 2/2 epoch (loss 0.0150):  84%|██▌| 3442/4114 [3:42:22<43:45,  3.91s/it]Training 2/2 epoch (loss 0.0101):  84%|██▌| 3442/4114 [3:42:25<43:45,  3.91s/it]Training 2/2 epoch (loss 0.0101):  84%|██▌| 3443/4114 [3:42:25<43:24,  3.88s/it]Training 2/2 epoch (loss 0.0693):  84%|██▌| 3443/4114 [3:42:30<43:24,  3.88s/it]Training 2/2 epoch (loss 0.0693):  84%|██▌| 3444/4114 [3:42:30<44:29,  3.98s/it]Training 2/2 epoch (loss 0.0811):  84%|██▌| 3444/4114 [3:42:33<44:29,  3.98s/it]Training 2/2 epoch (loss 0.0811):  84%|██▌| 3445/4114 [3:42:33<44:12,  3.96s/it]Training 2/2 epoch (loss 0.0559):  84%|██▌| 3445/4114 [3:42:37<44:12,  3.96s/it]Training 2/2 epoch (loss 0.0559):  84%|██▌| 3446/4114 [3:42:37<43:30,  3.91s/it]Training 2/2 epoch (loss 0.4414):  84%|██▌| 3446/4114 [3:42:41<43:30,  3.91s/it]Training 2/2 epoch (loss 0.4414):  84%|██▌| 3447/4114 [3:42:41<42:49,  3.85s/it]Training 2/2 epoch (loss 0.0007):  84%|██▌| 3447/4114 [3:42:45<42:49,  3.85s/it]Training 2/2 epoch (loss 0.0007):  84%|██▌| 3448/4114 [3:42:45<42:35,  3.84s/it]Training 2/2 epoch (loss 0.1123):  84%|██▌| 3448/4114 [3:42:48<42:35,  3.84s/it]Training 2/2 epoch (loss 0.1123):  84%|██▌| 3449/4114 [3:42:48<41:33,  3.75s/it]Training 2/2 epoch (loss 0.0037):  84%|██▌| 3449/4114 [3:42:52<41:33,  3.75s/it]Training 2/2 epoch (loss 0.0037):  84%|██▌| 3450/4114 [3:42:52<42:32,  3.84s/it]Training 2/2 epoch (loss 0.0608):  84%|██▌| 3450/4114 [3:42:56<42:32,  3.84s/it]Training 2/2 epoch (loss 0.0608):  84%|██▌| 3451/4114 [3:42:56<42:52,  3.88s/it]Training 2/2 epoch (loss 0.0250):  84%|██▌| 3451/4114 [3:43:00<42:52,  3.88s/it]Training 2/2 epoch (loss 0.0250):  84%|██▌| 3452/4114 [3:43:00<42:48,  3.88s/it]Training 2/2 epoch (loss 0.0033):  84%|██▌| 3452/4114 [3:43:04<42:48,  3.88s/it]Training 2/2 epoch (loss 0.0033):  84%|██▌| 3453/4114 [3:43:04<43:29,  3.95s/it]Training 2/2 epoch (loss 0.0032):  84%|██▌| 3453/4114 [3:43:08<43:29,  3.95s/it]Training 2/2 epoch (loss 0.0032):  84%|██▌| 3454/4114 [3:43:08<42:10,  3.83s/it]Training 2/2 epoch (loss 0.0142):  84%|██▌| 3454/4114 [3:43:12<42:10,  3.83s/it]Training 2/2 epoch (loss 0.0142):  84%|██▌| 3455/4114 [3:43:12<41:47,  3.81s/it]Training 2/2 epoch (loss 0.0221):  84%|██▌| 3455/4114 [3:43:16<41:47,  3.81s/it]Training 2/2 epoch (loss 0.0221):  84%|██▌| 3456/4114 [3:43:16<42:19,  3.86s/it]Training 2/2 epoch (loss 0.0003):  84%|██▌| 3456/4114 [3:43:20<42:19,  3.86s/it]Training 2/2 epoch (loss 0.0003):  84%|██▌| 3457/4114 [3:43:20<42:30,  3.88s/it]Training 2/2 epoch (loss 0.0024):  84%|██▌| 3457/4114 [3:43:24<42:30,  3.88s/it]Training 2/2 epoch (loss 0.0024):  84%|██▌| 3458/4114 [3:43:24<42:50,  3.92s/it]Training 2/2 epoch (loss 0.0684):  84%|██▌| 3458/4114 [3:43:28<42:50,  3.92s/it]Training 2/2 epoch (loss 0.0684):  84%|██▌| 3459/4114 [3:43:28<43:44,  4.01s/it]Training 2/2 epoch (loss 0.0327):  84%|██▌| 3459/4114 [3:43:32<43:44,  4.01s/it]Training 2/2 epoch (loss 0.0327):  84%|██▌| 3460/4114 [3:43:32<43:43,  4.01s/it]Training 2/2 epoch (loss 0.0195):  84%|██▌| 3460/4114 [3:43:36<43:43,  4.01s/it]Training 2/2 epoch (loss 0.0195):  84%|██▌| 3461/4114 [3:43:36<43:26,  3.99s/it]Training 2/2 epoch (loss 0.0248):  84%|██▌| 3461/4114 [3:43:40<43:26,  3.99s/it]Training 2/2 epoch (loss 0.0248):  84%|██▌| 3462/4114 [3:43:40<43:23,  3.99s/it]Training 2/2 epoch (loss 0.0122):  84%|██▌| 3462/4114 [3:43:43<43:23,  3.99s/it]Training 2/2 epoch (loss 0.0122):  84%|██▌| 3463/4114 [3:43:43<41:16,  3.80s/it]Training 2/2 epoch (loss 0.0001):  84%|██▌| 3463/4114 [3:43:47<41:16,  3.80s/it]Training 2/2 epoch (loss 0.0001):  84%|██▌| 3464/4114 [3:43:47<40:50,  3.77s/it]Training 2/2 epoch (loss 0.1426):  84%|██▌| 3464/4114 [3:43:51<40:50,  3.77s/it]Training 2/2 epoch (loss 0.1426):  84%|██▌| 3465/4114 [3:43:51<41:53,  3.87s/it]Training 2/2 epoch (loss 0.0439):  84%|██▌| 3465/4114 [3:43:54<41:53,  3.87s/it]Training 2/2 epoch (loss 0.0439):  84%|██▌| 3466/4114 [3:43:54<39:41,  3.68s/it]Training 2/2 epoch (loss 0.0049):  84%|██▌| 3466/4114 [3:43:58<39:41,  3.68s/it]Training 2/2 epoch (loss 0.0049):  84%|██▌| 3467/4114 [3:43:58<40:18,  3.74s/it]Training 2/2 epoch (loss 0.1562):  84%|██▌| 3467/4114 [3:44:02<40:18,  3.74s/it]Training 2/2 epoch (loss 0.1562):  84%|██▌| 3468/4114 [3:44:02<41:44,  3.88s/it]Training 2/2 epoch (loss 0.0420):  84%|██▌| 3468/4114 [3:44:06<41:44,  3.88s/it]Training 2/2 epoch (loss 0.0420):  84%|██▌| 3469/4114 [3:44:06<42:04,  3.91s/it]Training 2/2 epoch (loss 0.0226):  84%|██▌| 3469/4114 [3:44:10<42:04,  3.91s/it]Training 2/2 epoch (loss 0.0226):  84%|██▌| 3470/4114 [3:44:10<40:05,  3.74s/it]Training 2/2 epoch (loss 0.0013):  84%|██▌| 3470/4114 [3:44:13<40:05,  3.74s/it]Training 2/2 epoch (loss 0.0013):  84%|██▌| 3471/4114 [3:44:13<40:13,  3.75s/it]Training 2/2 epoch (loss 0.1099):  84%|██▌| 3471/4114 [3:44:17<40:13,  3.75s/it]Training 2/2 epoch (loss 0.1099):  84%|██▌| 3472/4114 [3:44:17<40:09,  3.75s/it]Training 2/2 epoch (loss 0.0938):  84%|██▌| 3472/4114 [3:44:21<40:09,  3.75s/it]Training 2/2 epoch (loss 0.0938):  84%|██▌| 3473/4114 [3:44:21<40:52,  3.83s/it]Training 2/2 epoch (loss 0.0894):  84%|██▌| 3473/4114 [3:44:25<40:52,  3.83s/it]Training 2/2 epoch (loss 0.0894):  84%|██▌| 3474/4114 [3:44:25<41:43,  3.91s/it]Training 2/2 epoch (loss 0.1182):  84%|██▌| 3474/4114 [3:44:29<41:43,  3.91s/it]Training 2/2 epoch (loss 0.1182):  84%|██▌| 3475/4114 [3:44:29<41:16,  3.88s/it]Training 2/2 epoch (loss 0.0309):  84%|██▌| 3475/4114 [3:44:33<41:16,  3.88s/it]Training 2/2 epoch (loss 0.0309):  84%|██▌| 3476/4114 [3:44:33<41:07,  3.87s/it]Training 2/2 epoch (loss 0.1855):  84%|██▌| 3476/4114 [3:44:37<41:07,  3.87s/it]Training 2/2 epoch (loss 0.1855):  85%|██▌| 3477/4114 [3:44:37<41:57,  3.95s/it]Training 2/2 epoch (loss 0.0159):  85%|██▌| 3477/4114 [3:44:41<41:57,  3.95s/it]Training 2/2 epoch (loss 0.0159):  85%|██▌| 3478/4114 [3:44:41<41:17,  3.89s/it]Training 2/2 epoch (loss 0.2754):  85%|██▌| 3478/4114 [3:44:45<41:17,  3.89s/it]Training 2/2 epoch (loss 0.2754):  85%|██▌| 3479/4114 [3:44:45<41:07,  3.89s/it]Training 2/2 epoch (loss 0.0270):  85%|██▌| 3479/4114 [3:44:49<41:07,  3.89s/it]Training 2/2 epoch (loss 0.0270):  85%|██▌| 3480/4114 [3:44:49<42:03,  3.98s/it]Training 2/2 epoch (loss 0.2021):  85%|██▌| 3480/4114 [3:44:53<42:03,  3.98s/it]Training 2/2 epoch (loss 0.2021):  85%|██▌| 3481/4114 [3:44:53<41:37,  3.95s/it]Training 2/2 epoch (loss 0.2285):  85%|██▌| 3481/4114 [3:44:56<41:37,  3.95s/it]Training 2/2 epoch (loss 0.2285):  85%|██▌| 3482/4114 [3:44:56<39:44,  3.77s/it]Training 2/2 epoch (loss 0.0420):  85%|██▌| 3482/4114 [3:45:00<39:44,  3.77s/it]Training 2/2 epoch (loss 0.0420):  85%|██▌| 3483/4114 [3:45:00<40:32,  3.86s/it]Training 2/2 epoch (loss 0.0972):  85%|██▌| 3483/4114 [3:45:04<40:32,  3.86s/it]Training 2/2 epoch (loss 0.0972):  85%|██▌| 3484/4114 [3:45:04<39:48,  3.79s/it]Training 2/2 epoch (loss 0.0874):  85%|██▌| 3484/4114 [3:45:08<39:48,  3.79s/it]Training 2/2 epoch (loss 0.0874):  85%|██▌| 3485/4114 [3:45:08<40:23,  3.85s/it]Training 2/2 epoch (loss 0.0339):  85%|██▌| 3485/4114 [3:45:12<40:23,  3.85s/it]Training 2/2 epoch (loss 0.0339):  85%|██▌| 3486/4114 [3:45:12<41:12,  3.94s/it]Training 2/2 epoch (loss 0.0593):  85%|██▌| 3486/4114 [3:45:15<41:12,  3.94s/it]Training 2/2 epoch (loss 0.0593):  85%|██▌| 3487/4114 [3:45:15<39:25,  3.77s/it]Training 2/2 epoch (loss 0.0383):  85%|██▌| 3487/4114 [3:45:19<39:25,  3.77s/it]Training 2/2 epoch (loss 0.0383):  85%|██▌| 3488/4114 [3:45:19<39:40,  3.80s/it]Training 2/2 epoch (loss 0.0182):  85%|██▌| 3488/4114 [3:45:23<39:40,  3.80s/it]Training 2/2 epoch (loss 0.0182):  85%|██▌| 3489/4114 [3:45:23<40:34,  3.90s/it]Training 2/2 epoch (loss 0.0337):  85%|██▌| 3489/4114 [3:45:27<40:34,  3.90s/it]Training 2/2 epoch (loss 0.0337):  85%|██▌| 3490/4114 [3:45:27<40:15,  3.87s/it]Training 2/2 epoch (loss 0.0299):  85%|██▌| 3490/4114 [3:45:31<40:15,  3.87s/it]Training 2/2 epoch (loss 0.0299):  85%|██▌| 3491/4114 [3:45:31<40:28,  3.90s/it]Training 2/2 epoch (loss 0.0015):  85%|██▌| 3491/4114 [3:45:35<40:28,  3.90s/it]Training 2/2 epoch (loss 0.0015):  85%|██▌| 3492/4114 [3:45:35<41:20,  3.99s/it]Training 2/2 epoch (loss 0.0075):  85%|██▌| 3492/4114 [3:45:39<41:20,  3.99s/it]Training 2/2 epoch (loss 0.0075):  85%|██▌| 3493/4114 [3:45:39<41:04,  3.97s/it]Training 2/2 epoch (loss 0.3086):  85%|██▌| 3493/4114 [3:45:43<41:04,  3.97s/it]Training 2/2 epoch (loss 0.3086):  85%|██▌| 3494/4114 [3:45:43<39:22,  3.81s/it]Training 2/2 epoch (loss 0.0352):  85%|██▌| 3494/4114 [3:45:47<39:22,  3.81s/it]Training 2/2 epoch (loss 0.0352):  85%|██▌| 3495/4114 [3:45:47<40:36,  3.94s/it]Training 2/2 epoch (loss 0.0077):  85%|██▌| 3495/4114 [3:45:51<40:36,  3.94s/it]Training 2/2 epoch (loss 0.0077):  85%|██▌| 3496/4114 [3:45:51<40:42,  3.95s/it]Training 2/2 epoch (loss 0.0532):  85%|██▌| 3496/4114 [3:45:55<40:42,  3.95s/it]Training 2/2 epoch (loss 0.0532):  85%|██▌| 3497/4114 [3:45:55<40:08,  3.90s/it]Training 2/2 epoch (loss 0.0099):  85%|██▌| 3497/4114 [3:45:59<40:08,  3.90s/it]Training 2/2 epoch (loss 0.0099):  85%|██▌| 3498/4114 [3:45:59<40:13,  3.92s/it]Training 2/2 epoch (loss 0.0003):  85%|██▌| 3498/4114 [3:46:02<40:13,  3.92s/it]Training 2/2 epoch (loss 0.0003):  85%|██▌| 3499/4114 [3:46:02<39:43,  3.87s/it]Training 2/2 epoch (loss 0.0540):  85%|██▌| 3499/4114 [3:46:06<39:43,  3.87s/it]Training 2/2 epoch (loss 0.0540):  85%|██▌| 3500/4114 [3:46:06<39:26,  3.86s/it]Training 2/2 epoch (loss 0.0140):  85%|██▌| 3500/4114 [3:46:10<39:26,  3.86s/it]Training 2/2 epoch (loss 0.0140):  85%|██▌| 3501/4114 [3:46:10<40:57,  4.01s/it]Training 2/2 epoch (loss 0.2178):  85%|██▌| 3501/4114 [3:46:14<40:57,  4.01s/it]Training 2/2 epoch (loss 0.2178):  85%|██▌| 3502/4114 [3:46:14<40:17,  3.95s/it]Training 2/2 epoch (loss 0.0062):  85%|██▌| 3502/4114 [3:46:18<40:17,  3.95s/it]Training 2/2 epoch (loss 0.0062):  85%|██▌| 3503/4114 [3:46:18<40:38,  3.99s/it]Training 2/2 epoch (loss 0.0371):  85%|██▌| 3503/4114 [3:46:23<40:38,  3.99s/it]Training 2/2 epoch (loss 0.0371):  85%|██▌| 3504/4114 [3:46:23<41:32,  4.09s/it]Training 2/2 epoch (loss 0.0381):  85%|██▌| 3504/4114 [3:46:26<41:32,  4.09s/it]Training 2/2 epoch (loss 0.0381):  85%|██▌| 3505/4114 [3:46:26<38:24,  3.78s/it]Training 2/2 epoch (loss 0.0337):  85%|██▌| 3505/4114 [3:46:30<38:24,  3.78s/it]Training 2/2 epoch (loss 0.0337):  85%|██▌| 3506/4114 [3:46:30<38:50,  3.83s/it]Training 2/2 epoch (loss 0.0320):  85%|██▌| 3506/4114 [3:46:34<38:50,  3.83s/it]Training 2/2 epoch (loss 0.0320):  85%|██▌| 3507/4114 [3:46:34<39:14,  3.88s/it]Training 2/2 epoch (loss 0.0050):  85%|██▌| 3507/4114 [3:46:38<39:14,  3.88s/it]Training 2/2 epoch (loss 0.0050):  85%|██▌| 3508/4114 [3:46:38<39:09,  3.88s/it]Training 2/2 epoch (loss 0.1113):  85%|██▌| 3508/4114 [3:46:42<39:09,  3.88s/it]Training 2/2 epoch (loss 0.1113):  85%|██▌| 3509/4114 [3:46:42<39:31,  3.92s/it]Training 2/2 epoch (loss 0.2129):  85%|██▌| 3509/4114 [3:46:46<39:31,  3.92s/it]Training 2/2 epoch (loss 0.2129):  85%|██▌| 3510/4114 [3:46:46<40:25,  4.02s/it]Training 2/2 epoch (loss 0.0245):  85%|██▌| 3510/4114 [3:46:50<40:25,  4.02s/it]Training 2/2 epoch (loss 0.0245):  85%|██▌| 3511/4114 [3:46:50<39:40,  3.95s/it]Training 2/2 epoch (loss 0.0178):  85%|██▌| 3511/4114 [3:46:54<39:40,  3.95s/it]Training 2/2 epoch (loss 0.0178):  85%|██▌| 3512/4114 [3:46:54<39:38,  3.95s/it]Training 2/2 epoch (loss 0.0908):  85%|██▌| 3512/4114 [3:46:57<39:38,  3.95s/it]Training 2/2 epoch (loss 0.0908):  85%|██▌| 3513/4114 [3:46:57<38:47,  3.87s/it]Training 2/2 epoch (loss 0.0156):  85%|██▌| 3513/4114 [3:47:01<38:47,  3.87s/it]Training 2/2 epoch (loss 0.0156):  85%|██▌| 3514/4114 [3:47:01<38:55,  3.89s/it]Training 2/2 epoch (loss 0.0476):  85%|██▌| 3514/4114 [3:47:05<38:55,  3.89s/it]Training 2/2 epoch (loss 0.0476):  85%|██▌| 3515/4114 [3:47:05<39:06,  3.92s/it]Training 2/2 epoch (loss 0.0625):  85%|██▌| 3515/4114 [3:47:10<39:06,  3.92s/it]Training 2/2 epoch (loss 0.0625):  85%|██▌| 3516/4114 [3:47:10<40:14,  4.04s/it]Training 2/2 epoch (loss 0.0112):  85%|██▌| 3516/4114 [3:47:13<40:14,  4.04s/it]Training 2/2 epoch (loss 0.0112):  85%|██▌| 3517/4114 [3:47:13<39:56,  4.01s/it]Training 2/2 epoch (loss 0.0277):  85%|██▌| 3517/4114 [3:47:17<39:56,  4.01s/it]Training 2/2 epoch (loss 0.0277):  86%|██▌| 3518/4114 [3:47:17<39:08,  3.94s/it]Training 2/2 epoch (loss 0.0014):  86%|██▌| 3518/4114 [3:47:21<39:08,  3.94s/it]Training 2/2 epoch (loss 0.0014):  86%|██▌| 3519/4114 [3:47:21<39:52,  4.02s/it]Training 2/2 epoch (loss 0.0066):  86%|██▌| 3519/4114 [3:47:25<39:52,  4.02s/it]Training 2/2 epoch (loss 0.0066):  86%|██▌| 3520/4114 [3:47:25<37:06,  3.75s/it]Training 2/2 epoch (loss 0.0327):  86%|██▌| 3520/4114 [3:47:28<37:06,  3.75s/it]Training 2/2 epoch (loss 0.0327):  86%|██▌| 3521/4114 [3:47:28<36:06,  3.65s/it]Training 2/2 epoch (loss 0.0957):  86%|██▌| 3521/4114 [3:47:32<36:06,  3.65s/it]Training 2/2 epoch (loss 0.0957):  86%|██▌| 3522/4114 [3:47:32<37:09,  3.77s/it]Training 2/2 epoch (loss 0.0530):  86%|██▌| 3522/4114 [3:47:36<37:09,  3.77s/it]Training 2/2 epoch (loss 0.0530):  86%|██▌| 3523/4114 [3:47:36<37:10,  3.77s/it]Training 2/2 epoch (loss 0.0220):  86%|██▌| 3523/4114 [3:47:40<37:10,  3.77s/it]Training 2/2 epoch (loss 0.0220):  86%|██▌| 3524/4114 [3:47:40<37:07,  3.77s/it]Training 2/2 epoch (loss 0.0221):  86%|██▌| 3524/4114 [3:47:43<37:07,  3.77s/it]Training 2/2 epoch (loss 0.0221):  86%|██▌| 3525/4114 [3:47:43<36:47,  3.75s/it]Training 2/2 epoch (loss 0.0114):  86%|██▌| 3525/4114 [3:47:47<36:47,  3.75s/it]Training 2/2 epoch (loss 0.0114):  86%|██▌| 3526/4114 [3:47:47<37:38,  3.84s/it]Training 2/2 epoch (loss 0.0161):  86%|██▌| 3526/4114 [3:47:51<37:38,  3.84s/it]Training 2/2 epoch (loss 0.0161):  86%|██▌| 3527/4114 [3:47:51<37:19,  3.81s/it]Training 2/2 epoch (loss 0.0011):  86%|██▌| 3527/4114 [3:47:55<37:19,  3.81s/it]Training 2/2 epoch (loss 0.0011):  86%|██▌| 3528/4114 [3:47:55<38:11,  3.91s/it]Training 2/2 epoch (loss 0.0752):  86%|██▌| 3528/4114 [3:47:59<38:11,  3.91s/it]Training 2/2 epoch (loss 0.0752):  86%|██▌| 3529/4114 [3:47:59<37:42,  3.87s/it]Training 2/2 epoch (loss 0.0315):  86%|██▌| 3529/4114 [3:48:03<37:42,  3.87s/it]Training 2/2 epoch (loss 0.0315):  86%|██▌| 3530/4114 [3:48:03<37:48,  3.88s/it]Training 2/2 epoch (loss 0.0703):  86%|██▌| 3530/4114 [3:48:07<37:48,  3.88s/it]Training 2/2 epoch (loss 0.0703):  86%|██▌| 3531/4114 [3:48:07<38:19,  3.94s/it]Training 2/2 epoch (loss 0.0028):  86%|██▌| 3531/4114 [3:48:11<38:19,  3.94s/it]Training 2/2 epoch (loss 0.0028):  86%|██▌| 3532/4114 [3:48:11<37:54,  3.91s/it]Training 2/2 epoch (loss 0.0005):  86%|██▌| 3532/4114 [3:48:14<37:54,  3.91s/it]Training 2/2 epoch (loss 0.0005):  86%|██▌| 3533/4114 [3:48:14<37:11,  3.84s/it]Training 2/2 epoch (loss 0.0248):  86%|██▌| 3533/4114 [3:48:19<37:11,  3.84s/it]Training 2/2 epoch (loss 0.0248):  86%|██▌| 3534/4114 [3:48:19<38:05,  3.94s/it]Training 2/2 epoch (loss 0.0270):  86%|██▌| 3534/4114 [3:48:22<38:05,  3.94s/it]Training 2/2 epoch (loss 0.0270):  86%|██▌| 3535/4114 [3:48:22<36:36,  3.79s/it]Training 2/2 epoch (loss 0.1157):  86%|██▌| 3535/4114 [3:48:26<36:36,  3.79s/it]Training 2/2 epoch (loss 0.1157):  86%|██▌| 3536/4114 [3:48:26<37:16,  3.87s/it]Training 2/2 epoch (loss 0.0222):  86%|██▌| 3536/4114 [3:48:30<37:16,  3.87s/it]Training 2/2 epoch (loss 0.0222):  86%|██▌| 3537/4114 [3:48:30<36:10,  3.76s/it]Training 2/2 epoch (loss 0.0635):  86%|██▌| 3537/4114 [3:48:33<36:10,  3.76s/it]Training 2/2 epoch (loss 0.0635):  86%|██▌| 3538/4114 [3:48:33<36:08,  3.77s/it]Training 2/2 epoch (loss 0.0413):  86%|██▌| 3538/4114 [3:48:37<36:08,  3.77s/it]Training 2/2 epoch (loss 0.0413):  86%|██▌| 3539/4114 [3:48:37<36:08,  3.77s/it]Training 2/2 epoch (loss 0.1699):  86%|██▌| 3539/4114 [3:48:41<36:08,  3.77s/it]Training 2/2 epoch (loss 0.1699):  86%|██▌| 3540/4114 [3:48:41<36:48,  3.85s/it]Training 2/2 epoch (loss 0.0002):  86%|██▌| 3540/4114 [3:48:45<36:48,  3.85s/it]Training 2/2 epoch (loss 0.0002):  86%|██▌| 3541/4114 [3:48:45<36:49,  3.86s/it]Training 2/2 epoch (loss 0.0047):  86%|██▌| 3541/4114 [3:48:49<36:49,  3.86s/it]Training 2/2 epoch (loss 0.0047):  86%|██▌| 3542/4114 [3:48:49<36:41,  3.85s/it]Training 2/2 epoch (loss 0.0095):  86%|██▌| 3542/4114 [3:48:53<36:41,  3.85s/it]Training 2/2 epoch (loss 0.0095):  86%|██▌| 3543/4114 [3:48:53<37:29,  3.94s/it]Training 2/2 epoch (loss 0.0449):  86%|██▌| 3543/4114 [3:48:57<37:29,  3.94s/it]Training 2/2 epoch (loss 0.0449):  86%|██▌| 3544/4114 [3:48:57<35:52,  3.78s/it]Training 2/2 epoch (loss 0.1006):  86%|██▌| 3544/4114 [3:49:00<35:52,  3.78s/it]Training 2/2 epoch (loss 0.1006):  86%|██▌| 3545/4114 [3:49:00<34:59,  3.69s/it]Training 2/2 epoch (loss 0.0277):  86%|██▌| 3545/4114 [3:49:04<34:59,  3.69s/it]Training 2/2 epoch (loss 0.0277):  86%|██▌| 3546/4114 [3:49:04<34:43,  3.67s/it]Training 2/2 epoch (loss 0.0107):  86%|██▌| 3546/4114 [3:49:08<34:43,  3.67s/it]Training 2/2 epoch (loss 0.0107):  86%|██▌| 3547/4114 [3:49:08<35:27,  3.75s/it]Training 2/2 epoch (loss 0.0194):  86%|██▌| 3547/4114 [3:49:11<35:27,  3.75s/it]Training 2/2 epoch (loss 0.0194):  86%|██▌| 3548/4114 [3:49:11<35:27,  3.76s/it]Training 2/2 epoch (loss 0.0005):  86%|██▌| 3548/4114 [3:49:15<35:27,  3.76s/it]Training 2/2 epoch (loss 0.0005):  86%|██▌| 3549/4114 [3:49:15<36:26,  3.87s/it]Training 2/2 epoch (loss 0.0432):  86%|██▌| 3549/4114 [3:49:19<36:26,  3.87s/it]Training 2/2 epoch (loss 0.0432):  86%|██▌| 3550/4114 [3:49:19<36:37,  3.90s/it]Training 2/2 epoch (loss 0.0029):  86%|██▌| 3550/4114 [3:49:23<36:37,  3.90s/it]Training 2/2 epoch (loss 0.0029):  86%|██▌| 3551/4114 [3:49:23<36:45,  3.92s/it]Training 2/2 epoch (loss 0.0105):  86%|██▌| 3551/4114 [3:49:28<36:45,  3.92s/it]Training 2/2 epoch (loss 0.0105):  86%|██▌| 3552/4114 [3:49:28<37:37,  4.02s/it]Training 2/2 epoch (loss 0.0009):  86%|██▌| 3552/4114 [3:49:32<37:37,  4.02s/it]Training 2/2 epoch (loss 0.0009):  86%|██▌| 3553/4114 [3:49:32<37:44,  4.04s/it]Training 2/2 epoch (loss 0.0066):  86%|██▌| 3553/4114 [3:49:35<37:44,  4.04s/it]Training 2/2 epoch (loss 0.0066):  86%|██▌| 3554/4114 [3:49:35<36:08,  3.87s/it]Training 2/2 epoch (loss 0.1055):  86%|██▌| 3554/4114 [3:49:39<36:08,  3.87s/it]Training 2/2 epoch (loss 0.1055):  86%|██▌| 3555/4114 [3:49:39<36:47,  3.95s/it]Training 2/2 epoch (loss 0.0048):  86%|██▌| 3555/4114 [3:49:43<36:47,  3.95s/it]Training 2/2 epoch (loss 0.0048):  86%|██▌| 3556/4114 [3:49:43<35:06,  3.77s/it]Training 2/2 epoch (loss 0.0388):  86%|██▌| 3556/4114 [3:49:47<35:06,  3.77s/it]Training 2/2 epoch (loss 0.0388):  86%|██▌| 3557/4114 [3:49:47<35:37,  3.84s/it]Training 2/2 epoch (loss 0.0138):  86%|██▌| 3557/4114 [3:49:50<35:37,  3.84s/it]Training 2/2 epoch (loss 0.0138):  86%|██▌| 3558/4114 [3:49:50<34:49,  3.76s/it]Training 2/2 epoch (loss 0.0332):  86%|██▌| 3558/4114 [3:49:54<34:49,  3.76s/it]Training 2/2 epoch (loss 0.0332):  87%|██▌| 3559/4114 [3:49:54<35:27,  3.83s/it]Training 2/2 epoch (loss 0.0156):  87%|██▌| 3559/4114 [3:49:58<35:27,  3.83s/it]Training 2/2 epoch (loss 0.0156):  87%|██▌| 3560/4114 [3:49:58<36:02,  3.90s/it]Training 2/2 epoch (loss 0.0908):  87%|██▌| 3560/4114 [3:50:03<36:02,  3.90s/it]Training 2/2 epoch (loss 0.0908):  87%|██▌| 3561/4114 [3:50:03<36:46,  3.99s/it]Training 2/2 epoch (loss 0.0216):  87%|██▌| 3561/4114 [3:50:06<36:46,  3.99s/it]Training 2/2 epoch (loss 0.0216):  87%|██▌| 3562/4114 [3:50:06<34:48,  3.78s/it]Training 2/2 epoch (loss 0.0022):  87%|██▌| 3562/4114 [3:50:10<34:48,  3.78s/it]Training 2/2 epoch (loss 0.0022):  87%|██▌| 3563/4114 [3:50:10<35:13,  3.84s/it]Training 2/2 epoch (loss 0.0564):  87%|██▌| 3563/4114 [3:50:14<35:13,  3.84s/it]Training 2/2 epoch (loss 0.0564):  87%|██▌| 3564/4114 [3:50:14<35:37,  3.89s/it]Training 2/2 epoch (loss 0.0159):  87%|██▌| 3564/4114 [3:50:17<35:37,  3.89s/it]Training 2/2 epoch (loss 0.0159):  87%|██▌| 3565/4114 [3:50:17<34:09,  3.73s/it]Training 2/2 epoch (loss 0.0150):  87%|██▌| 3565/4114 [3:50:21<34:09,  3.73s/it]Training 2/2 epoch (loss 0.0150):  87%|██▌| 3566/4114 [3:50:21<34:53,  3.82s/it]Training 2/2 epoch (loss 0.0081):  87%|██▌| 3566/4114 [3:50:25<34:53,  3.82s/it]Training 2/2 epoch (loss 0.0081):  87%|██▌| 3567/4114 [3:50:25<35:45,  3.92s/it]Training 2/2 epoch (loss 0.1035):  87%|██▌| 3567/4114 [3:50:29<35:45,  3.92s/it]Training 2/2 epoch (loss 0.1035):  87%|██▌| 3568/4114 [3:50:29<35:21,  3.89s/it]Training 2/2 epoch (loss 0.0356):  87%|██▌| 3568/4114 [3:50:33<35:21,  3.89s/it]Training 2/2 epoch (loss 0.0356):  87%|██▌| 3569/4114 [3:50:33<35:31,  3.91s/it]Training 2/2 epoch (loss 0.0023):  87%|██▌| 3569/4114 [3:50:37<35:31,  3.91s/it]Training 2/2 epoch (loss 0.0023):  87%|██▌| 3570/4114 [3:50:37<35:42,  3.94s/it]Training 2/2 epoch (loss 0.0209):  87%|██▌| 3570/4114 [3:50:41<35:42,  3.94s/it]Training 2/2 epoch (loss 0.0209):  87%|██▌| 3571/4114 [3:50:41<35:09,  3.88s/it]Training 2/2 epoch (loss 0.0608):  87%|██▌| 3571/4114 [3:50:45<35:09,  3.88s/it]Training 2/2 epoch (loss 0.0608):  87%|██▌| 3572/4114 [3:50:45<34:56,  3.87s/it]Training 2/2 epoch (loss 0.0361):  87%|██▌| 3572/4114 [3:50:49<34:56,  3.87s/it]Training 2/2 epoch (loss 0.0361):  87%|██▌| 3573/4114 [3:50:49<35:23,  3.92s/it]Training 2/2 epoch (loss 0.0269):  87%|██▌| 3573/4114 [3:50:53<35:23,  3.92s/it]Training 2/2 epoch (loss 0.0269):  87%|██▌| 3574/4114 [3:50:53<34:52,  3.88s/it]Training 2/2 epoch (loss 0.0247):  87%|██▌| 3574/4114 [3:50:56<34:52,  3.88s/it]Training 2/2 epoch (loss 0.0247):  87%|██▌| 3575/4114 [3:50:56<34:51,  3.88s/it]Training 2/2 epoch (loss 0.0830):  87%|██▌| 3575/4114 [3:51:01<34:51,  3.88s/it]Training 2/2 epoch (loss 0.0830):  87%|██▌| 3576/4114 [3:51:01<35:57,  4.01s/it]Training 2/2 epoch (loss 0.0293):  87%|██▌| 3576/4114 [3:51:05<35:57,  4.01s/it]Training 2/2 epoch (loss 0.0293):  87%|██▌| 3577/4114 [3:51:05<35:57,  4.02s/it]Training 2/2 epoch (loss 0.0075):  87%|██▌| 3577/4114 [3:51:08<35:57,  4.02s/it]Training 2/2 epoch (loss 0.0075):  87%|██▌| 3578/4114 [3:51:08<34:49,  3.90s/it]Training 2/2 epoch (loss 0.0117):  87%|██▌| 3578/4114 [3:51:12<34:49,  3.90s/it]Training 2/2 epoch (loss 0.0117):  87%|██▌| 3579/4114 [3:51:12<34:47,  3.90s/it]Training 2/2 epoch (loss 0.0332):  87%|██▌| 3579/4114 [3:51:16<34:47,  3.90s/it]Training 2/2 epoch (loss 0.0332):  87%|██▌| 3580/4114 [3:51:16<34:55,  3.92s/it]Training 2/2 epoch (loss 0.1826):  87%|██▌| 3580/4114 [3:51:20<34:55,  3.92s/it]Training 2/2 epoch (loss 0.1826):  87%|██▌| 3581/4114 [3:51:20<34:57,  3.94s/it]Training 2/2 epoch (loss 0.0142):  87%|██▌| 3581/4114 [3:51:24<34:57,  3.94s/it]Training 2/2 epoch (loss 0.0142):  87%|██▌| 3582/4114 [3:51:24<34:35,  3.90s/it]Training 2/2 epoch (loss 0.0015):  87%|██▌| 3582/4114 [3:51:28<34:35,  3.90s/it]Training 2/2 epoch (loss 0.0015):  87%|██▌| 3583/4114 [3:51:28<34:26,  3.89s/it]Training 2/2 epoch (loss 0.0006):  87%|██▌| 3583/4114 [3:51:32<34:26,  3.89s/it]Training 2/2 epoch (loss 0.0006):  87%|██▌| 3584/4114 [3:51:32<34:30,  3.91s/it]Training 2/2 epoch (loss 0.0708):  87%|██▌| 3584/4114 [3:51:36<34:30,  3.91s/it]Training 2/2 epoch (loss 0.0708):  87%|██▌| 3585/4114 [3:51:36<33:55,  3.85s/it]Training 2/2 epoch (loss 0.0178):  87%|██▌| 3585/4114 [3:51:39<33:55,  3.85s/it]Training 2/2 epoch (loss 0.0178):  87%|██▌| 3586/4114 [3:51:39<33:22,  3.79s/it]Training 2/2 epoch (loss 0.0454):  87%|██▌| 3586/4114 [3:51:43<33:22,  3.79s/it]Training 2/2 epoch (loss 0.0454):  87%|██▌| 3587/4114 [3:51:43<33:22,  3.80s/it]Training 2/2 epoch (loss 0.1104):  87%|██▌| 3587/4114 [3:51:47<33:22,  3.80s/it]Training 2/2 epoch (loss 0.1104):  87%|██▌| 3588/4114 [3:51:47<34:01,  3.88s/it]Training 2/2 epoch (loss 0.0493):  87%|██▌| 3588/4114 [3:51:50<34:01,  3.88s/it]Training 2/2 epoch (loss 0.0493):  87%|██▌| 3589/4114 [3:51:50<32:21,  3.70s/it]Training 2/2 epoch (loss 0.0125):  87%|██▌| 3589/4114 [3:51:54<32:21,  3.70s/it]Training 2/2 epoch (loss 0.0125):  87%|██▌| 3590/4114 [3:51:54<33:09,  3.80s/it]Training 2/2 epoch (loss 0.0187):  87%|██▌| 3590/4114 [3:51:58<33:09,  3.80s/it]Training 2/2 epoch (loss 0.0187):  87%|██▌| 3591/4114 [3:51:58<33:42,  3.87s/it]Training 2/2 epoch (loss 0.0041):  87%|██▌| 3591/4114 [3:52:02<33:42,  3.87s/it]Training 2/2 epoch (loss 0.0041):  87%|██▌| 3592/4114 [3:52:02<33:25,  3.84s/it]Training 2/2 epoch (loss 0.0118):  87%|██▌| 3592/4114 [3:52:06<33:25,  3.84s/it]Training 2/2 epoch (loss 0.0118):  87%|██▌| 3593/4114 [3:52:06<33:42,  3.88s/it]Training 2/2 epoch (loss 0.0110):  87%|██▌| 3593/4114 [3:52:10<33:42,  3.88s/it]Training 2/2 epoch (loss 0.0110):  87%|██▌| 3594/4114 [3:52:10<34:06,  3.94s/it]Training 2/2 epoch (loss 0.0454):  87%|██▌| 3594/4114 [3:52:14<34:06,  3.94s/it]Training 2/2 epoch (loss 0.0454):  87%|██▌| 3595/4114 [3:52:14<33:55,  3.92s/it]Training 2/2 epoch (loss 0.0415):  87%|██▌| 3595/4114 [3:52:18<33:55,  3.92s/it]Training 2/2 epoch (loss 0.0415):  87%|██▌| 3596/4114 [3:52:18<33:31,  3.88s/it]Training 2/2 epoch (loss 0.0009):  87%|██▌| 3596/4114 [3:52:22<33:31,  3.88s/it]Training 2/2 epoch (loss 0.0009):  87%|██▌| 3597/4114 [3:52:22<34:18,  3.98s/it]Training 2/2 epoch (loss 0.0253):  87%|██▌| 3597/4114 [3:52:26<34:18,  3.98s/it]Training 2/2 epoch (loss 0.0253):  87%|██▌| 3598/4114 [3:52:26<33:40,  3.91s/it]Training 2/2 epoch (loss 0.0012):  87%|██▌| 3598/4114 [3:52:29<33:40,  3.91s/it]Training 2/2 epoch (loss 0.0012):  87%|██▌| 3599/4114 [3:52:29<32:15,  3.76s/it]Training 2/2 epoch (loss 0.0145):  87%|██▌| 3599/4114 [3:52:33<32:15,  3.76s/it]Training 2/2 epoch (loss 0.0145):  88%|██▋| 3600/4114 [3:52:33<33:09,  3.87s/it]Training 2/2 epoch (loss 0.0042):  88%|██▋| 3600/4114 [3:52:37<33:09,  3.87s/it]Training 2/2 epoch (loss 0.0042):  88%|██▋| 3601/4114 [3:52:37<33:18,  3.90s/it]Training 2/2 epoch (loss 0.0664):  88%|██▋| 3601/4114 [3:52:41<33:18,  3.90s/it]Training 2/2 epoch (loss 0.0664):  88%|██▋| 3602/4114 [3:52:41<33:13,  3.89s/it]Training 2/2 epoch (loss 0.0171):  88%|██▋| 3602/4114 [3:52:46<33:13,  3.89s/it]Training 2/2 epoch (loss 0.0171):  88%|██▋| 3603/4114 [3:52:46<34:11,  4.01s/it]Training 2/2 epoch (loss 0.0354):  88%|██▋| 3603/4114 [3:52:50<34:11,  4.01s/it]Training 2/2 epoch (loss 0.0354):  88%|██▋| 3604/4114 [3:52:50<34:07,  4.01s/it]Training 2/2 epoch (loss 0.2754):  88%|██▋| 3604/4114 [3:52:54<34:07,  4.01s/it]Training 2/2 epoch (loss 0.2754):  88%|██▋| 3605/4114 [3:52:54<34:11,  4.03s/it]Training 2/2 epoch (loss 0.0011):  88%|██▋| 3605/4114 [3:52:58<34:11,  4.03s/it]Training 2/2 epoch (loss 0.0011):  88%|██▋| 3606/4114 [3:52:58<34:07,  4.03s/it]Training 2/2 epoch (loss 0.0388):  88%|██▋| 3606/4114 [3:53:02<34:07,  4.03s/it]Training 2/2 epoch (loss 0.0388):  88%|██▋| 3607/4114 [3:53:02<33:43,  3.99s/it]Training 2/2 epoch (loss 0.0403):  88%|██▋| 3607/4114 [3:53:05<33:43,  3.99s/it]Training 2/2 epoch (loss 0.0403):  88%|██▋| 3608/4114 [3:53:05<33:10,  3.93s/it]Training 2/2 epoch (loss 0.0752):  88%|██▋| 3608/4114 [3:53:09<33:10,  3.93s/it]Training 2/2 epoch (loss 0.0752):  88%|██▋| 3609/4114 [3:53:09<33:24,  3.97s/it]Training 2/2 epoch (loss 0.0067):  88%|██▋| 3609/4114 [3:53:13<33:24,  3.97s/it]Training 2/2 epoch (loss 0.0067):  88%|██▋| 3610/4114 [3:53:13<32:43,  3.90s/it]Training 2/2 epoch (loss 0.0146):  88%|██▋| 3610/4114 [3:53:17<32:43,  3.90s/it]Training 2/2 epoch (loss 0.0146):  88%|██▋| 3611/4114 [3:53:17<31:55,  3.81s/it]Training 2/2 epoch (loss 0.0240):  88%|██▋| 3611/4114 [3:53:21<31:55,  3.81s/it]Training 2/2 epoch (loss 0.0240):  88%|██▋| 3612/4114 [3:53:21<32:39,  3.90s/it]Training 2/2 epoch (loss 0.1050):  88%|██▋| 3612/4114 [3:53:25<32:39,  3.90s/it]Training 2/2 epoch (loss 0.1050):  88%|██▋| 3613/4114 [3:53:25<32:19,  3.87s/it]Training 2/2 epoch (loss 0.0270):  88%|██▋| 3613/4114 [3:53:29<32:19,  3.87s/it]Training 2/2 epoch (loss 0.0270):  88%|██▋| 3614/4114 [3:53:29<32:20,  3.88s/it]Training 2/2 epoch (loss 0.1108):  88%|██▋| 3614/4114 [3:53:32<32:20,  3.88s/it]Training 2/2 epoch (loss 0.1108):  88%|██▋| 3615/4114 [3:53:32<31:35,  3.80s/it]Training 2/2 epoch (loss 0.0229):  88%|██▋| 3615/4114 [3:53:36<31:35,  3.80s/it]Training 2/2 epoch (loss 0.0229):  88%|██▋| 3616/4114 [3:53:36<32:06,  3.87s/it]Training 2/2 epoch (loss 0.0128):  88%|██▋| 3616/4114 [3:53:40<32:06,  3.87s/it]Training 2/2 epoch (loss 0.0128):  88%|██▋| 3617/4114 [3:53:40<32:25,  3.91s/it]Training 2/2 epoch (loss 0.1543):  88%|██▋| 3617/4114 [3:53:45<32:25,  3.91s/it]Training 2/2 epoch (loss 0.1543):  88%|██▋| 3618/4114 [3:53:45<33:11,  4.02s/it]Training 2/2 epoch (loss 0.0172):  88%|██▋| 3618/4114 [3:53:49<33:11,  4.02s/it]Training 2/2 epoch (loss 0.0172):  88%|██▋| 3619/4114 [3:53:49<33:09,  4.02s/it]Training 2/2 epoch (loss 0.0498):  88%|██▋| 3619/4114 [3:53:52<33:09,  4.02s/it]Training 2/2 epoch (loss 0.0498):  88%|██▋| 3620/4114 [3:53:52<32:49,  3.99s/it]Training 2/2 epoch (loss 0.0216):  88%|██▋| 3620/4114 [3:53:57<32:49,  3.99s/it]Training 2/2 epoch (loss 0.0216):  88%|██▋| 3621/4114 [3:53:57<33:14,  4.05s/it]Training 2/2 epoch (loss 0.0032):  88%|██▋| 3621/4114 [3:54:00<33:14,  4.05s/it]Training 2/2 epoch (loss 0.0032):  88%|██▋| 3622/4114 [3:54:00<32:25,  3.95s/it]Training 2/2 epoch (loss 0.0554):  88%|██▋| 3622/4114 [3:54:04<32:25,  3.95s/it]Training 2/2 epoch (loss 0.0554):  88%|██▋| 3623/4114 [3:54:04<32:33,  3.98s/it]Training 2/2 epoch (loss 0.0247):  88%|██▋| 3623/4114 [3:54:09<32:33,  3.98s/it]Training 2/2 epoch (loss 0.0247):  88%|██▋| 3624/4114 [3:54:09<32:57,  4.04s/it]Training 2/2 epoch (loss 0.0649):  88%|██▋| 3624/4114 [3:54:12<32:57,  4.04s/it]Training 2/2 epoch (loss 0.0649):  88%|██▋| 3625/4114 [3:54:12<32:20,  3.97s/it]Training 2/2 epoch (loss 0.0086):  88%|██▋| 3625/4114 [3:54:16<32:20,  3.97s/it]Training 2/2 epoch (loss 0.0086):  88%|██▋| 3626/4114 [3:54:16<32:28,  3.99s/it]Training 2/2 epoch (loss 0.0305):  88%|██▋| 3626/4114 [3:54:20<32:28,  3.99s/it]Training 2/2 epoch (loss 0.0305):  88%|██▋| 3627/4114 [3:54:20<32:32,  4.01s/it]Training 2/2 epoch (loss 0.1025):  88%|██▋| 3627/4114 [3:54:24<32:32,  4.01s/it]Training 2/2 epoch (loss 0.1025):  88%|██▋| 3628/4114 [3:54:24<32:16,  3.98s/it]Training 2/2 epoch (loss 0.0493):  88%|██▋| 3628/4114 [3:54:28<32:16,  3.98s/it]Training 2/2 epoch (loss 0.0493):  88%|██▋| 3629/4114 [3:54:28<32:00,  3.96s/it]Training 2/2 epoch (loss 0.1104):  88%|██▋| 3629/4114 [3:54:32<32:00,  3.96s/it]Training 2/2 epoch (loss 0.1104):  88%|██▋| 3630/4114 [3:54:32<31:45,  3.94s/it]Training 2/2 epoch (loss 0.0190):  88%|██▋| 3630/4114 [3:54:36<31:45,  3.94s/it]Training 2/2 epoch (loss 0.0190):  88%|██▋| 3631/4114 [3:54:36<31:35,  3.92s/it]Training 2/2 epoch (loss 0.2344):  88%|██▋| 3631/4114 [3:54:40<31:35,  3.92s/it]Training 2/2 epoch (loss 0.2344):  88%|██▋| 3632/4114 [3:54:40<31:01,  3.86s/it]Training 2/2 epoch (loss 0.0107):  88%|██▋| 3632/4114 [3:54:44<31:01,  3.86s/it]Training 2/2 epoch (loss 0.0107):  88%|██▋| 3633/4114 [3:54:44<31:19,  3.91s/it]Training 2/2 epoch (loss 0.0022):  88%|██▋| 3633/4114 [3:54:47<31:19,  3.91s/it]Training 2/2 epoch (loss 0.0022):  88%|██▋| 3634/4114 [3:54:47<30:15,  3.78s/it]Training 2/2 epoch (loss 0.0046):  88%|██▋| 3634/4114 [3:54:51<30:15,  3.78s/it]Training 2/2 epoch (loss 0.0046):  88%|██▋| 3635/4114 [3:54:51<30:48,  3.86s/it]Training 2/2 epoch (loss 0.0610):  88%|██▋| 3635/4114 [3:54:56<30:48,  3.86s/it]Training 2/2 epoch (loss 0.0610):  88%|██▋| 3636/4114 [3:54:56<31:26,  3.95s/it]Training 2/2 epoch (loss 0.0049):  88%|██▋| 3636/4114 [3:55:00<31:26,  3.95s/it]Training 2/2 epoch (loss 0.0049):  88%|██▋| 3637/4114 [3:55:00<31:32,  3.97s/it]Training 2/2 epoch (loss 0.0069):  88%|██▋| 3637/4114 [3:55:03<31:32,  3.97s/it]Training 2/2 epoch (loss 0.0069):  88%|██▋| 3638/4114 [3:55:03<30:06,  3.79s/it]Training 2/2 epoch (loss 0.1167):  88%|██▋| 3638/4114 [3:55:07<30:06,  3.79s/it]Training 2/2 epoch (loss 0.1167):  88%|██▋| 3639/4114 [3:55:07<30:41,  3.88s/it]Training 2/2 epoch (loss 0.0352):  88%|██▋| 3639/4114 [3:55:11<30:41,  3.88s/it]Training 2/2 epoch (loss 0.0352):  88%|██▋| 3640/4114 [3:55:11<30:40,  3.88s/it]Training 2/2 epoch (loss 0.0112):  88%|██▋| 3640/4114 [3:55:15<30:40,  3.88s/it]Training 2/2 epoch (loss 0.0112):  89%|██▋| 3641/4114 [3:55:15<31:04,  3.94s/it]Training 2/2 epoch (loss 0.0070):  89%|██▋| 3641/4114 [3:55:19<31:04,  3.94s/it]Training 2/2 epoch (loss 0.0070):  89%|██▋| 3642/4114 [3:55:19<30:18,  3.85s/it]Training 2/2 epoch (loss 0.0022):  89%|██▋| 3642/4114 [3:55:22<30:18,  3.85s/it]Training 2/2 epoch (loss 0.0022):  89%|██▋| 3643/4114 [3:55:22<29:10,  3.72s/it]Training 2/2 epoch (loss 0.0236):  89%|██▋| 3643/4114 [3:55:26<29:10,  3.72s/it]Training 2/2 epoch (loss 0.0236):  89%|██▋| 3644/4114 [3:55:26<29:19,  3.74s/it]Training 2/2 epoch (loss 0.0361):  89%|██▋| 3644/4114 [3:55:30<29:19,  3.74s/it]Training 2/2 epoch (loss 0.0361):  89%|██▋| 3645/4114 [3:55:30<30:15,  3.87s/it]Training 2/2 epoch (loss 0.1719):  89%|██▋| 3645/4114 [3:55:34<30:15,  3.87s/it]Training 2/2 epoch (loss 0.1719):  89%|██▋| 3646/4114 [3:55:34<29:58,  3.84s/it]Training 2/2 epoch (loss 0.0085):  89%|██▋| 3646/4114 [3:55:38<29:58,  3.84s/it]Training 2/2 epoch (loss 0.0085):  89%|██▋| 3647/4114 [3:55:38<30:08,  3.87s/it]Training 2/2 epoch (loss 0.0547):  89%|██▋| 3647/4114 [3:55:42<30:08,  3.87s/it]Training 2/2 epoch (loss 0.0547):  89%|██▋| 3648/4114 [3:55:42<30:10,  3.89s/it]Training 2/2 epoch (loss 0.0083):  89%|██▋| 3648/4114 [3:55:45<30:10,  3.89s/it]Training 2/2 epoch (loss 0.0083):  89%|██▋| 3649/4114 [3:55:45<28:58,  3.74s/it]Training 2/2 epoch (loss 0.1016):  89%|██▋| 3649/4114 [3:55:49<28:58,  3.74s/it]Training 2/2 epoch (loss 0.1016):  89%|██▋| 3650/4114 [3:55:49<29:49,  3.86s/it]Training 2/2 epoch (loss 0.0119):  89%|██▋| 3650/4114 [3:55:53<29:49,  3.86s/it]Training 2/2 epoch (loss 0.0119):  89%|██▋| 3651/4114 [3:55:53<30:38,  3.97s/it]Training 2/2 epoch (loss 0.0142):  89%|██▋| 3651/4114 [3:55:57<30:38,  3.97s/it]Training 2/2 epoch (loss 0.0142):  89%|██▋| 3652/4114 [3:55:57<28:59,  3.77s/it]Training 2/2 epoch (loss 0.0732):  89%|██▋| 3652/4114 [3:56:00<28:59,  3.77s/it]Training 2/2 epoch (loss 0.0732):  89%|██▋| 3653/4114 [3:56:00<28:09,  3.67s/it]Training 2/2 epoch (loss 0.1235):  89%|██▋| 3653/4114 [3:56:04<28:09,  3.67s/it]Training 2/2 epoch (loss 0.1235):  89%|██▋| 3654/4114 [3:56:04<27:41,  3.61s/it]Training 2/2 epoch (loss 0.0884):  89%|██▋| 3654/4114 [3:56:07<27:41,  3.61s/it]Training 2/2 epoch (loss 0.0884):  89%|██▋| 3655/4114 [3:56:07<27:10,  3.55s/it]Training 2/2 epoch (loss 0.1206):  89%|██▋| 3655/4114 [3:56:11<27:10,  3.55s/it]Training 2/2 epoch (loss 0.1206):  89%|██▋| 3656/4114 [3:56:11<27:23,  3.59s/it]Training 2/2 epoch (loss 0.0437):  89%|██▋| 3656/4114 [3:56:15<27:23,  3.59s/it]Training 2/2 epoch (loss 0.0437):  89%|██▋| 3657/4114 [3:56:15<28:30,  3.74s/it]Training 2/2 epoch (loss 0.0579):  89%|██▋| 3657/4114 [3:56:19<28:30,  3.74s/it]Training 2/2 epoch (loss 0.0579):  89%|██▋| 3658/4114 [3:56:19<28:28,  3.75s/it]Training 2/2 epoch (loss 0.0189):  89%|██▋| 3658/4114 [3:56:23<28:28,  3.75s/it]Training 2/2 epoch (loss 0.0189):  89%|██▋| 3659/4114 [3:56:23<29:10,  3.85s/it]Training 2/2 epoch (loss 0.0040):  89%|██▋| 3659/4114 [3:56:26<29:10,  3.85s/it]Training 2/2 epoch (loss 0.0040):  89%|██▋| 3660/4114 [3:56:26<28:38,  3.78s/it]Training 2/2 epoch (loss 0.0449):  89%|██▋| 3660/4114 [3:56:30<28:38,  3.78s/it]Training 2/2 epoch (loss 0.0449):  89%|██▋| 3661/4114 [3:56:30<29:15,  3.88s/it]Training 2/2 epoch (loss 0.0018):  89%|██▋| 3661/4114 [3:56:34<29:15,  3.88s/it]Training 2/2 epoch (loss 0.0018):  89%|██▋| 3662/4114 [3:56:34<29:25,  3.90s/it]Training 2/2 epoch (loss 0.0815):  89%|██▋| 3662/4114 [3:56:39<29:25,  3.90s/it]Training 2/2 epoch (loss 0.0815):  89%|██▋| 3663/4114 [3:56:39<30:14,  4.02s/it]Training 2/2 epoch (loss 0.2090):  89%|██▋| 3663/4114 [3:56:43<30:14,  4.02s/it]Training 2/2 epoch (loss 0.2090):  89%|██▋| 3664/4114 [3:56:43<29:59,  4.00s/it]Training 2/2 epoch (loss 0.0771):  89%|██▋| 3664/4114 [3:56:47<29:59,  4.00s/it]Training 2/2 epoch (loss 0.0771):  89%|██▋| 3665/4114 [3:56:47<29:50,  3.99s/it]Training 2/2 epoch (loss 0.0339):  89%|██▋| 3665/4114 [3:56:50<29:50,  3.99s/it]Training 2/2 epoch (loss 0.0339):  89%|██▋| 3666/4114 [3:56:50<29:00,  3.88s/it]Training 2/2 epoch (loss 0.0170):  89%|██▋| 3666/4114 [3:56:54<29:00,  3.88s/it]Training 2/2 epoch (loss 0.0170):  89%|██▋| 3667/4114 [3:56:54<27:57,  3.75s/it]Training 2/2 epoch (loss 0.0192):  89%|██▋| 3667/4114 [3:56:58<27:57,  3.75s/it]Training 2/2 epoch (loss 0.0192):  89%|██▋| 3668/4114 [3:56:58<28:21,  3.81s/it]Training 2/2 epoch (loss 0.0664):  89%|██▋| 3668/4114 [3:57:01<28:21,  3.81s/it]Training 2/2 epoch (loss 0.0664):  89%|██▋| 3669/4114 [3:57:01<27:58,  3.77s/it]Training 2/2 epoch (loss 0.0160):  89%|██▋| 3669/4114 [3:57:05<27:58,  3.77s/it]Training 2/2 epoch (loss 0.0160):  89%|██▋| 3670/4114 [3:57:05<28:19,  3.83s/it]Training 2/2 epoch (loss 0.0188):  89%|██▋| 3670/4114 [3:57:09<28:19,  3.83s/it]Training 2/2 epoch (loss 0.0188):  89%|██▋| 3671/4114 [3:57:09<28:40,  3.88s/it]Training 2/2 epoch (loss 0.0192):  89%|██▋| 3671/4114 [3:57:13<28:40,  3.88s/it]Training 2/2 epoch (loss 0.0192):  89%|██▋| 3672/4114 [3:57:13<28:23,  3.85s/it]Training 2/2 epoch (loss 0.0447):  89%|██▋| 3672/4114 [3:57:17<28:23,  3.85s/it]Training 2/2 epoch (loss 0.0447):  89%|██▋| 3673/4114 [3:57:17<28:10,  3.83s/it]Training 2/2 epoch (loss 0.0193):  89%|██▋| 3673/4114 [3:57:21<28:10,  3.83s/it]Training 2/2 epoch (loss 0.0193):  89%|██▋| 3674/4114 [3:57:21<28:26,  3.88s/it]Training 2/2 epoch (loss 0.1963):  89%|██▋| 3674/4114 [3:57:25<28:26,  3.88s/it]Training 2/2 epoch (loss 0.1963):  89%|██▋| 3675/4114 [3:57:25<29:05,  3.98s/it]Training 2/2 epoch (loss 0.0479):  89%|██▋| 3675/4114 [3:57:29<29:05,  3.98s/it]Training 2/2 epoch (loss 0.0479):  89%|██▋| 3676/4114 [3:57:29<28:45,  3.94s/it]Training 2/2 epoch (loss 0.0018):  89%|██▋| 3676/4114 [3:57:33<28:45,  3.94s/it]Training 2/2 epoch (loss 0.0018):  89%|██▋| 3677/4114 [3:57:33<28:31,  3.92s/it]Training 2/2 epoch (loss 0.0098):  89%|██▋| 3677/4114 [3:57:36<28:31,  3.92s/it]Training 2/2 epoch (loss 0.0098):  89%|██▋| 3678/4114 [3:57:36<27:47,  3.82s/it]Training 2/2 epoch (loss 0.0238):  89%|██▋| 3678/4114 [3:57:40<27:47,  3.82s/it]Training 2/2 epoch (loss 0.0238):  89%|██▋| 3679/4114 [3:57:40<27:37,  3.81s/it]Training 2/2 epoch (loss 0.0413):  89%|██▋| 3679/4114 [3:57:44<27:37,  3.81s/it]Training 2/2 epoch (loss 0.0413):  89%|██▋| 3680/4114 [3:57:44<28:02,  3.88s/it]Training 2/2 epoch (loss 0.0684):  89%|██▋| 3680/4114 [3:57:48<28:02,  3.88s/it]Training 2/2 epoch (loss 0.0684):  89%|██▋| 3681/4114 [3:57:48<28:55,  4.01s/it]Training 2/2 epoch (loss 0.0251):  89%|██▋| 3681/4114 [3:57:52<28:55,  4.01s/it]Training 2/2 epoch (loss 0.0251):  89%|██▋| 3682/4114 [3:57:52<27:36,  3.84s/it]Training 2/2 epoch (loss 0.0040):  89%|██▋| 3682/4114 [3:57:55<27:36,  3.84s/it]Training 2/2 epoch (loss 0.0040):  90%|██▋| 3683/4114 [3:57:55<26:48,  3.73s/it]Training 2/2 epoch (loss 0.1562):  90%|██▋| 3683/4114 [3:58:00<26:48,  3.73s/it]Training 2/2 epoch (loss 0.1562):  90%|██▋| 3684/4114 [3:58:00<27:43,  3.87s/it]Training 2/2 epoch (loss 0.0295):  90%|██▋| 3684/4114 [3:58:03<27:43,  3.87s/it]Training 2/2 epoch (loss 0.0295):  90%|██▋| 3685/4114 [3:58:03<27:29,  3.85s/it]Training 2/2 epoch (loss 0.0801):  90%|██▋| 3685/4114 [3:58:07<27:29,  3.85s/it]Training 2/2 epoch (loss 0.0801):  90%|██▋| 3686/4114 [3:58:07<27:41,  3.88s/it]Training 2/2 epoch (loss 0.0027):  90%|██▋| 3686/4114 [3:58:11<27:41,  3.88s/it]Training 2/2 epoch (loss 0.0027):  90%|██▋| 3687/4114 [3:58:11<27:59,  3.93s/it]Training 2/2 epoch (loss 0.0223):  90%|██▋| 3687/4114 [3:58:15<27:59,  3.93s/it]Training 2/2 epoch (loss 0.0223):  90%|██▋| 3688/4114 [3:58:15<26:48,  3.78s/it]Training 2/2 epoch (loss 0.0330):  90%|██▋| 3688/4114 [3:58:19<26:48,  3.78s/it]Training 2/2 epoch (loss 0.0330):  90%|██▋| 3689/4114 [3:58:19<27:07,  3.83s/it]Training 2/2 epoch (loss 0.0752):  90%|██▋| 3689/4114 [3:58:23<27:07,  3.83s/it]Training 2/2 epoch (loss 0.0752):  90%|██▋| 3690/4114 [3:58:23<28:04,  3.97s/it]Training 2/2 epoch (loss 0.0579):  90%|██▋| 3690/4114 [3:58:27<28:04,  3.97s/it]Training 2/2 epoch (loss 0.0579):  90%|██▋| 3691/4114 [3:58:27<28:10,  4.00s/it]Training 2/2 epoch (loss 0.1523):  90%|██▋| 3691/4114 [3:58:31<28:10,  4.00s/it]Training 2/2 epoch (loss 0.1523):  90%|██▋| 3692/4114 [3:58:31<28:05,  3.99s/it]Training 2/2 epoch (loss 0.0244):  90%|██▋| 3692/4114 [3:58:35<28:05,  3.99s/it]Training 2/2 epoch (loss 0.0244):  90%|██▋| 3693/4114 [3:58:35<28:14,  4.02s/it]Training 2/2 epoch (loss 0.1367):  90%|██▋| 3693/4114 [3:58:39<28:14,  4.02s/it]Training 2/2 epoch (loss 0.1367):  90%|██▋| 3694/4114 [3:58:39<28:06,  4.02s/it]Training 2/2 epoch (loss 0.0127):  90%|██▋| 3694/4114 [3:58:43<28:06,  4.02s/it]Training 2/2 epoch (loss 0.0127):  90%|██▋| 3695/4114 [3:58:43<28:04,  4.02s/it]Training 2/2 epoch (loss 0.0212):  90%|██▋| 3695/4114 [3:58:47<28:04,  4.02s/it]Training 2/2 epoch (loss 0.0212):  90%|██▋| 3696/4114 [3:58:47<28:12,  4.05s/it]Training 2/2 epoch (loss 0.0295):  90%|██▋| 3696/4114 [3:58:51<28:12,  4.05s/it]Training 2/2 epoch (loss 0.0295):  90%|██▋| 3697/4114 [3:58:51<27:55,  4.02s/it]Training 2/2 epoch (loss 0.0918):  90%|██▋| 3697/4114 [3:58:55<27:55,  4.02s/it]Training 2/2 epoch (loss 0.0918):  90%|██▋| 3698/4114 [3:58:55<27:00,  3.90s/it]Training 2/2 epoch (loss 0.0547):  90%|██▋| 3698/4114 [3:58:59<27:00,  3.90s/it]Training 2/2 epoch (loss 0.0547):  90%|██▋| 3699/4114 [3:58:59<27:06,  3.92s/it]Training 2/2 epoch (loss 0.0198):  90%|██▋| 3699/4114 [3:59:03<27:06,  3.92s/it]Training 2/2 epoch (loss 0.0198):  90%|██▋| 3700/4114 [3:59:03<26:49,  3.89s/it]Training 2/2 epoch (loss 0.0557):  90%|██▋| 3700/4114 [3:59:06<26:49,  3.89s/it]Training 2/2 epoch (loss 0.0557):  90%|██▋| 3701/4114 [3:59:06<25:45,  3.74s/it]Training 2/2 epoch (loss 0.0879):  90%|██▋| 3701/4114 [3:59:10<25:45,  3.74s/it]Training 2/2 epoch (loss 0.0879):  90%|██▋| 3702/4114 [3:59:10<26:27,  3.85s/it]Training 2/2 epoch (loss 0.0288):  90%|██▋| 3702/4114 [3:59:14<26:27,  3.85s/it]Training 2/2 epoch (loss 0.0288):  90%|██▋| 3703/4114 [3:59:14<26:04,  3.81s/it]Training 2/2 epoch (loss 0.1201):  90%|██▋| 3703/4114 [3:59:18<26:04,  3.81s/it]Training 2/2 epoch (loss 0.1201):  90%|██▋| 3704/4114 [3:59:18<26:16,  3.85s/it]Training 2/2 epoch (loss 0.0723):  90%|██▋| 3704/4114 [3:59:22<26:16,  3.85s/it]Training 2/2 epoch (loss 0.0723):  90%|██▋| 3705/4114 [3:59:22<26:55,  3.95s/it]Training 2/2 epoch (loss 0.1367):  90%|██▋| 3705/4114 [3:59:26<26:55,  3.95s/it]Training 2/2 epoch (loss 0.1367):  90%|██▋| 3706/4114 [3:59:26<26:30,  3.90s/it]Training 2/2 epoch (loss 0.0771):  90%|██▋| 3706/4114 [3:59:30<26:30,  3.90s/it]Training 2/2 epoch (loss 0.0771):  90%|██▋| 3707/4114 [3:59:30<26:21,  3.89s/it]Training 2/2 epoch (loss 0.1211):  90%|██▋| 3707/4114 [3:59:33<26:21,  3.89s/it]Training 2/2 epoch (loss 0.1211):  90%|██▋| 3708/4114 [3:59:33<25:31,  3.77s/it]Training 2/2 epoch (loss 0.0278):  90%|██▋| 3708/4114 [3:59:37<25:31,  3.77s/it]Training 2/2 epoch (loss 0.0278):  90%|██▋| 3709/4114 [3:59:37<24:40,  3.66s/it]Training 2/2 epoch (loss 0.0913):  90%|██▋| 3709/4114 [3:59:40<24:40,  3.66s/it]Training 2/2 epoch (loss 0.0913):  90%|██▋| 3710/4114 [3:59:40<24:56,  3.70s/it]Training 2/2 epoch (loss 0.0286):  90%|██▋| 3710/4114 [3:59:44<24:56,  3.70s/it]Training 2/2 epoch (loss 0.0286):  90%|██▋| 3711/4114 [3:59:44<24:41,  3.68s/it]Training 2/2 epoch (loss 0.0972):  90%|██▋| 3711/4114 [3:59:48<24:41,  3.68s/it]Training 2/2 epoch (loss 0.0972):  90%|██▋| 3712/4114 [3:59:48<25:11,  3.76s/it]Training 2/2 epoch (loss 0.0007):  90%|██▋| 3712/4114 [3:59:51<25:11,  3.76s/it]Training 2/2 epoch (loss 0.0007):  90%|██▋| 3713/4114 [3:59:51<24:23,  3.65s/it]Training 2/2 epoch (loss 0.1162):  90%|██▋| 3713/4114 [3:59:55<24:23,  3.65s/it]Training 2/2 epoch (loss 0.1162):  90%|██▋| 3714/4114 [3:59:55<25:13,  3.78s/it]Training 2/2 epoch (loss 0.0128):  90%|██▋| 3714/4114 [3:59:59<25:13,  3.78s/it]Training 2/2 epoch (loss 0.0128):  90%|██▋| 3715/4114 [3:59:59<24:33,  3.69s/it]Training 2/2 epoch (loss 0.1016):  90%|██▋| 3715/4114 [4:00:03<24:33,  3.69s/it]Training 2/2 epoch (loss 0.1016):  90%|██▋| 3716/4114 [4:00:03<25:15,  3.81s/it]Training 2/2 epoch (loss 0.0154):  90%|██▋| 3716/4114 [4:00:07<25:15,  3.81s/it]Training 2/2 epoch (loss 0.0154):  90%|██▋| 3717/4114 [4:00:07<24:46,  3.74s/it]Training 2/2 epoch (loss 0.0014):  90%|██▋| 3717/4114 [4:00:11<24:46,  3.74s/it]Training 2/2 epoch (loss 0.0014):  90%|██▋| 3718/4114 [4:00:11<25:29,  3.86s/it]Training 2/2 epoch (loss 0.0488):  90%|██▋| 3718/4114 [4:00:15<25:29,  3.86s/it]Training 2/2 epoch (loss 0.0488):  90%|██▋| 3719/4114 [4:00:15<25:22,  3.86s/it]Training 2/2 epoch (loss 0.0649):  90%|██▋| 3719/4114 [4:00:19<25:22,  3.86s/it]Training 2/2 epoch (loss 0.0649):  90%|██▋| 3720/4114 [4:00:19<25:38,  3.90s/it]Training 2/2 epoch (loss 0.0179):  90%|██▋| 3720/4114 [4:00:23<25:38,  3.90s/it]Training 2/2 epoch (loss 0.0179):  90%|██▋| 3721/4114 [4:00:23<25:43,  3.93s/it]Training 2/2 epoch (loss 0.0542):  90%|██▋| 3721/4114 [4:00:26<25:43,  3.93s/it]Training 2/2 epoch (loss 0.0542):  90%|██▋| 3722/4114 [4:00:26<25:45,  3.94s/it]Training 2/2 epoch (loss 0.0571):  90%|██▋| 3722/4114 [4:00:31<25:45,  3.94s/it]Training 2/2 epoch (loss 0.0571):  90%|██▋| 3723/4114 [4:00:31<26:04,  4.00s/it]Training 2/2 epoch (loss 0.0461):  90%|██▋| 3723/4114 [4:00:35<26:04,  4.00s/it]Training 2/2 epoch (loss 0.0461):  91%|██▋| 3724/4114 [4:00:35<26:00,  4.00s/it]Training 2/2 epoch (loss 0.0439):  91%|██▋| 3724/4114 [4:00:38<26:00,  4.00s/it]Training 2/2 epoch (loss 0.0439):  91%|██▋| 3725/4114 [4:00:38<25:16,  3.90s/it]Training 2/2 epoch (loss 0.0164):  91%|██▋| 3725/4114 [4:00:42<25:16,  3.90s/it]Training 2/2 epoch (loss 0.0164):  91%|██▋| 3726/4114 [4:00:42<25:27,  3.94s/it]Training 2/2 epoch (loss 0.1172):  91%|██▋| 3726/4114 [4:00:46<25:27,  3.94s/it]Training 2/2 epoch (loss 0.1172):  91%|██▋| 3727/4114 [4:00:46<24:52,  3.86s/it]Training 2/2 epoch (loss 0.0432):  91%|██▋| 3727/4114 [4:00:50<24:52,  3.86s/it]Training 2/2 epoch (loss 0.0432):  91%|██▋| 3728/4114 [4:00:50<24:43,  3.84s/it]Training 2/2 epoch (loss 0.1758):  91%|██▋| 3728/4114 [4:00:54<24:43,  3.84s/it]Training 2/2 epoch (loss 0.1758):  91%|██▋| 3729/4114 [4:00:54<25:26,  3.97s/it]Training 2/2 epoch (loss 0.0718):  91%|██▋| 3729/4114 [4:00:58<25:26,  3.97s/it]Training 2/2 epoch (loss 0.0718):  91%|██▋| 3730/4114 [4:00:58<25:15,  3.95s/it]Training 2/2 epoch (loss 0.1006):  91%|██▋| 3730/4114 [4:01:02<25:15,  3.95s/it]Training 2/2 epoch (loss 0.1006):  91%|██▋| 3731/4114 [4:01:02<25:14,  3.95s/it]Training 2/2 epoch (loss 0.0869):  91%|██▋| 3731/4114 [4:01:06<25:14,  3.95s/it]Training 2/2 epoch (loss 0.0869):  91%|██▋| 3732/4114 [4:01:06<25:51,  4.06s/it]Training 2/2 epoch (loss 0.0028):  91%|██▋| 3732/4114 [4:01:10<25:51,  4.06s/it]Training 2/2 epoch (loss 0.0028):  91%|██▋| 3733/4114 [4:01:10<25:04,  3.95s/it]Training 2/2 epoch (loss 0.0082):  91%|██▋| 3733/4114 [4:01:14<25:04,  3.95s/it]Training 2/2 epoch (loss 0.0082):  91%|██▋| 3734/4114 [4:01:14<24:50,  3.92s/it]Training 2/2 epoch (loss 0.0026):  91%|██▋| 3734/4114 [4:01:18<24:50,  3.92s/it]Training 2/2 epoch (loss 0.0026):  91%|██▋| 3735/4114 [4:01:18<25:03,  3.97s/it]Training 2/2 epoch (loss 0.0003):  91%|██▋| 3735/4114 [4:01:22<25:03,  3.97s/it]Training 2/2 epoch (loss 0.0003):  91%|██▋| 3736/4114 [4:01:22<24:41,  3.92s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3736/4114 [4:01:25<24:41,  3.92s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3737/4114 [4:01:25<24:24,  3.89s/it]Training 2/2 epoch (loss 0.0337):  91%|██▋| 3737/4114 [4:01:30<24:24,  3.89s/it]Training 2/2 epoch (loss 0.0337):  91%|██▋| 3738/4114 [4:01:30<24:56,  3.98s/it]Training 2/2 epoch (loss 0.0223):  91%|██▋| 3738/4114 [4:01:34<24:56,  3.98s/it]Training 2/2 epoch (loss 0.0223):  91%|██▋| 3739/4114 [4:01:34<24:46,  3.97s/it]Training 2/2 epoch (loss 0.0398):  91%|██▋| 3739/4114 [4:01:38<24:46,  3.97s/it]Training 2/2 epoch (loss 0.0398):  91%|██▋| 3740/4114 [4:01:38<24:45,  3.97s/it]Training 2/2 epoch (loss 0.0017):  91%|██▋| 3740/4114 [4:01:42<24:45,  3.97s/it]Training 2/2 epoch (loss 0.0017):  91%|██▋| 3741/4114 [4:01:42<25:06,  4.04s/it]Training 2/2 epoch (loss 0.0066):  91%|██▋| 3741/4114 [4:01:46<25:06,  4.04s/it]Training 2/2 epoch (loss 0.0066):  91%|██▋| 3742/4114 [4:01:46<24:40,  3.98s/it]Training 2/2 epoch (loss 0.0245):  91%|██▋| 3742/4114 [4:01:50<24:40,  3.98s/it]Training 2/2 epoch (loss 0.0245):  91%|██▋| 3743/4114 [4:01:50<24:41,  3.99s/it]Training 2/2 epoch (loss 0.0013):  91%|██▋| 3743/4114 [4:01:54<24:41,  3.99s/it]Training 2/2 epoch (loss 0.0013):  91%|██▋| 3744/4114 [4:01:54<25:04,  4.07s/it]Training 2/2 epoch (loss 0.0057):  91%|██▋| 3744/4114 [4:01:58<25:04,  4.07s/it]Training 2/2 epoch (loss 0.0057):  91%|██▋| 3745/4114 [4:01:58<24:43,  4.02s/it]Training 2/2 epoch (loss 0.0189):  91%|██▋| 3745/4114 [4:02:02<24:43,  4.02s/it]Training 2/2 epoch (loss 0.0189):  91%|██▋| 3746/4114 [4:02:02<24:51,  4.05s/it]Training 2/2 epoch (loss 0.0021):  91%|██▋| 3746/4114 [4:02:06<24:51,  4.05s/it]Training 2/2 epoch (loss 0.0021):  91%|██▋| 3747/4114 [4:02:06<24:44,  4.05s/it]Training 2/2 epoch (loss 0.0157):  91%|██▋| 3747/4114 [4:02:10<24:44,  4.05s/it]Training 2/2 epoch (loss 0.0157):  91%|██▋| 3748/4114 [4:02:10<24:26,  4.01s/it]Training 2/2 epoch (loss 0.0474):  91%|██▋| 3748/4114 [4:02:14<24:26,  4.01s/it]Training 2/2 epoch (loss 0.0474):  91%|██▋| 3749/4114 [4:02:14<24:20,  4.00s/it]Training 2/2 epoch (loss 0.0003):  91%|██▋| 3749/4114 [4:02:18<24:20,  4.00s/it]Training 2/2 epoch (loss 0.0003):  91%|██▋| 3750/4114 [4:02:18<24:19,  4.01s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3750/4114 [4:02:22<24:19,  4.01s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3751/4114 [4:02:22<24:01,  3.97s/it]Training 2/2 epoch (loss 0.0300):  91%|██▋| 3751/4114 [4:02:26<24:01,  3.97s/it]Training 2/2 epoch (loss 0.0300):  91%|██▋| 3752/4114 [4:02:26<23:36,  3.91s/it]Training 2/2 epoch (loss 0.0006):  91%|██▋| 3752/4114 [4:02:30<23:36,  3.91s/it]Training 2/2 epoch (loss 0.0006):  91%|██▋| 3753/4114 [4:02:30<24:06,  4.01s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3753/4114 [4:02:33<24:06,  4.01s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3754/4114 [4:02:33<22:57,  3.83s/it]Training 2/2 epoch (loss 0.0258):  91%|██▋| 3754/4114 [4:02:37<22:57,  3.83s/it]Training 2/2 epoch (loss 0.0258):  91%|██▋| 3755/4114 [4:02:37<23:18,  3.90s/it]Training 2/2 epoch (loss 0.0540):  91%|██▋| 3755/4114 [4:02:42<23:18,  3.90s/it]Training 2/2 epoch (loss 0.0540):  91%|██▋| 3756/4114 [4:02:42<23:58,  4.02s/it]Training 2/2 epoch (loss 0.0205):  91%|██▋| 3756/4114 [4:02:46<23:58,  4.02s/it]Training 2/2 epoch (loss 0.0205):  91%|██▋| 3757/4114 [4:02:46<23:52,  4.01s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3757/4114 [4:02:50<23:52,  4.01s/it]Training 2/2 epoch (loss 0.0005):  91%|██▋| 3758/4114 [4:02:50<24:00,  4.05s/it]Training 2/2 epoch (loss 0.0261):  91%|██▋| 3758/4114 [4:02:54<24:00,  4.05s/it]Training 2/2 epoch (loss 0.0261):  91%|██▋| 3759/4114 [4:02:54<23:46,  4.02s/it]Training 2/2 epoch (loss 0.0586):  91%|██▋| 3759/4114 [4:02:58<23:46,  4.02s/it]Training 2/2 epoch (loss 0.0586):  91%|██▋| 3760/4114 [4:02:58<23:30,  3.98s/it]Training 2/2 epoch (loss 0.0092):  91%|██▋| 3760/4114 [4:03:01<23:30,  3.98s/it]Training 2/2 epoch (loss 0.0092):  91%|██▋| 3761/4114 [4:03:01<22:12,  3.78s/it]Training 2/2 epoch (loss 0.1138):  91%|██▋| 3761/4114 [4:03:05<22:12,  3.78s/it]Training 2/2 epoch (loss 0.1138):  91%|██▋| 3762/4114 [4:03:05<22:55,  3.91s/it]Training 2/2 epoch (loss 0.0056):  91%|██▋| 3762/4114 [4:03:09<22:55,  3.91s/it]Training 2/2 epoch (loss 0.0056):  91%|██▋| 3763/4114 [4:03:09<23:06,  3.95s/it]Training 2/2 epoch (loss 0.0157):  91%|██▋| 3763/4114 [4:03:13<23:06,  3.95s/it]Training 2/2 epoch (loss 0.0157):  91%|██▋| 3764/4114 [4:03:13<22:56,  3.93s/it]Training 2/2 epoch (loss 0.0049):  91%|██▋| 3764/4114 [4:03:17<22:56,  3.93s/it]Training 2/2 epoch (loss 0.0049):  92%|██▋| 3765/4114 [4:03:17<23:11,  3.99s/it]Training 2/2 epoch (loss 0.0474):  92%|██▋| 3765/4114 [4:03:21<23:11,  3.99s/it]Training 2/2 epoch (loss 0.0474):  92%|██▋| 3766/4114 [4:03:21<23:14,  4.01s/it]Training 2/2 epoch (loss 0.0234):  92%|██▋| 3766/4114 [4:03:25<23:14,  4.01s/it]Training 2/2 epoch (loss 0.0234):  92%|██▋| 3767/4114 [4:03:25<22:55,  3.96s/it]Training 2/2 epoch (loss 0.0084):  92%|██▋| 3767/4114 [4:03:29<22:55,  3.96s/it]Training 2/2 epoch (loss 0.0084):  92%|██▋| 3768/4114 [4:03:29<22:39,  3.93s/it]Training 2/2 epoch (loss 0.0124):  92%|██▋| 3768/4114 [4:03:33<22:39,  3.93s/it]Training 2/2 epoch (loss 0.0124):  92%|██▋| 3769/4114 [4:03:33<22:31,  3.92s/it]Training 2/2 epoch (loss 0.0148):  92%|██▋| 3769/4114 [4:03:36<22:31,  3.92s/it]Training 2/2 epoch (loss 0.0148):  92%|██▋| 3770/4114 [4:03:36<21:20,  3.72s/it]Training 2/2 epoch (loss 0.0059):  92%|██▋| 3770/4114 [4:03:40<21:20,  3.72s/it]Training 2/2 epoch (loss 0.0059):  92%|██▋| 3771/4114 [4:03:40<21:52,  3.83s/it]Training 2/2 epoch (loss 0.0076):  92%|██▋| 3771/4114 [4:03:44<21:52,  3.83s/it]Training 2/2 epoch (loss 0.0076):  92%|██▊| 3772/4114 [4:03:44<21:50,  3.83s/it]Training 2/2 epoch (loss 0.0017):  92%|██▊| 3772/4114 [4:03:48<21:50,  3.83s/it]Training 2/2 epoch (loss 0.0017):  92%|██▊| 3773/4114 [4:03:48<21:45,  3.83s/it]Training 2/2 epoch (loss 0.0081):  92%|██▊| 3773/4114 [4:03:52<21:45,  3.83s/it]Training 2/2 epoch (loss 0.0081):  92%|██▊| 3774/4114 [4:03:52<22:17,  3.93s/it]Training 2/2 epoch (loss 0.0090):  92%|██▊| 3774/4114 [4:03:56<22:17,  3.93s/it]Training 2/2 epoch (loss 0.0090):  92%|██▊| 3775/4114 [4:03:56<22:03,  3.90s/it]Training 2/2 epoch (loss 0.0121):  92%|██▊| 3775/4114 [4:03:59<22:03,  3.90s/it]Training 2/2 epoch (loss 0.0121):  92%|██▊| 3776/4114 [4:03:59<21:43,  3.86s/it]Training 2/2 epoch (loss 0.0011):  92%|██▊| 3776/4114 [4:04:04<21:43,  3.86s/it]Training 2/2 epoch (loss 0.0011):  92%|██▊| 3777/4114 [4:04:04<22:23,  3.99s/it]Training 2/2 epoch (loss 0.0171):  92%|██▊| 3777/4114 [4:04:08<22:23,  3.99s/it]Training 2/2 epoch (loss 0.0171):  92%|██▊| 3778/4114 [4:04:08<22:10,  3.96s/it]Training 2/2 epoch (loss 0.0444):  92%|██▊| 3778/4114 [4:04:12<22:10,  3.96s/it]Training 2/2 epoch (loss 0.0444):  92%|██▊| 3779/4114 [4:04:12<21:58,  3.94s/it]Training 2/2 epoch (loss 0.0023):  92%|██▊| 3779/4114 [4:04:16<21:58,  3.94s/it]Training 2/2 epoch (loss 0.0023):  92%|██▊| 3780/4114 [4:04:16<22:12,  3.99s/it]Training 2/2 epoch (loss 0.0122):  92%|██▊| 3780/4114 [4:04:20<22:12,  3.99s/it]Training 2/2 epoch (loss 0.0122):  92%|██▊| 3781/4114 [4:04:20<21:58,  3.96s/it]Training 2/2 epoch (loss 0.0123):  92%|██▊| 3781/4114 [4:04:23<21:58,  3.96s/it]Training 2/2 epoch (loss 0.0123):  92%|██▊| 3782/4114 [4:04:23<21:43,  3.93s/it]Training 2/2 epoch (loss 0.0070):  92%|██▊| 3782/4114 [4:04:27<21:43,  3.93s/it]Training 2/2 epoch (loss 0.0070):  92%|██▊| 3783/4114 [4:04:27<21:46,  3.95s/it]Training 2/2 epoch (loss 0.0320):  92%|██▊| 3783/4114 [4:04:31<21:46,  3.95s/it]Training 2/2 epoch (loss 0.0320):  92%|██▊| 3784/4114 [4:04:31<21:20,  3.88s/it]Training 2/2 epoch (loss 0.0101):  92%|██▊| 3784/4114 [4:04:35<21:20,  3.88s/it]Training 2/2 epoch (loss 0.0101):  92%|██▊| 3785/4114 [4:04:35<21:37,  3.94s/it]Training 2/2 epoch (loss 0.0410):  92%|██▊| 3785/4114 [4:04:39<21:37,  3.94s/it]Training 2/2 epoch (loss 0.0410):  92%|██▊| 3786/4114 [4:04:39<21:09,  3.87s/it]Training 2/2 epoch (loss 0.0172):  92%|██▊| 3786/4114 [4:04:43<21:09,  3.87s/it]Training 2/2 epoch (loss 0.0172):  92%|██▊| 3787/4114 [4:04:43<21:11,  3.89s/it]Training 2/2 epoch (loss 0.0039):  92%|██▊| 3787/4114 [4:04:46<21:11,  3.89s/it]Training 2/2 epoch (loss 0.0039):  92%|██▊| 3788/4114 [4:04:46<19:22,  3.57s/it]Training 2/2 epoch (loss 0.0403):  92%|██▊| 3788/4114 [4:04:50<19:22,  3.57s/it]Training 2/2 epoch (loss 0.0403):  92%|██▊| 3789/4114 [4:04:50<20:36,  3.80s/it]Training 2/2 epoch (loss 0.0023):  92%|██▊| 3789/4114 [4:04:54<20:36,  3.80s/it]Training 2/2 epoch (loss 0.0023):  92%|██▊| 3790/4114 [4:04:54<20:35,  3.81s/it]Training 2/2 epoch (loss 0.0204):  92%|██▊| 3790/4114 [4:04:58<20:35,  3.81s/it]Training 2/2 epoch (loss 0.0204):  92%|██▊| 3791/4114 [4:04:58<20:26,  3.80s/it]Training 2/2 epoch (loss 0.0071):  92%|██▊| 3791/4114 [4:05:01<20:26,  3.80s/it]Training 2/2 epoch (loss 0.0071):  92%|██▊| 3792/4114 [4:05:01<19:31,  3.64s/it]Training 2/2 epoch (loss 0.0051):  92%|██▊| 3792/4114 [4:05:05<19:31,  3.64s/it]Training 2/2 epoch (loss 0.0051):  92%|██▊| 3793/4114 [4:05:05<19:40,  3.68s/it]Training 2/2 epoch (loss 0.1191):  92%|██▊| 3793/4114 [4:05:08<19:40,  3.68s/it]Training 2/2 epoch (loss 0.1191):  92%|██▊| 3794/4114 [4:05:08<19:10,  3.59s/it]Training 2/2 epoch (loss 0.0028):  92%|██▊| 3794/4114 [4:05:12<19:10,  3.59s/it]Training 2/2 epoch (loss 0.0028):  92%|██▊| 3795/4114 [4:05:12<19:37,  3.69s/it]Training 2/2 epoch (loss 0.0022):  92%|██▊| 3795/4114 [4:05:16<19:37,  3.69s/it]Training 2/2 epoch (loss 0.0022):  92%|██▊| 3796/4114 [4:05:16<19:49,  3.74s/it]Training 2/2 epoch (loss 0.0103):  92%|██▊| 3796/4114 [4:05:20<19:49,  3.74s/it]Training 2/2 epoch (loss 0.0103):  92%|██▊| 3797/4114 [4:05:20<19:41,  3.73s/it]Training 2/2 epoch (loss 0.1855):  92%|██▊| 3797/4114 [4:05:23<19:41,  3.73s/it]Training 2/2 epoch (loss 0.1855):  92%|██▊| 3798/4114 [4:05:23<19:58,  3.79s/it]Training 2/2 epoch (loss 0.0234):  92%|██▊| 3798/4114 [4:05:27<19:58,  3.79s/it]Training 2/2 epoch (loss 0.0234):  92%|██▊| 3799/4114 [4:05:27<19:56,  3.80s/it]Training 2/2 epoch (loss 0.0791):  92%|██▊| 3799/4114 [4:05:31<19:56,  3.80s/it]Training 2/2 epoch (loss 0.0791):  92%|██▊| 3800/4114 [4:05:31<19:57,  3.81s/it]Training 2/2 epoch (loss 0.0049):  92%|██▊| 3800/4114 [4:05:35<19:57,  3.81s/it]Training 2/2 epoch (loss 0.0049):  92%|██▊| 3801/4114 [4:05:35<20:37,  3.95s/it]Training 2/2 epoch (loss 0.0923):  92%|██▊| 3801/4114 [4:05:39<20:37,  3.95s/it]Training 2/2 epoch (loss 0.0923):  92%|██▊| 3802/4114 [4:05:39<20:23,  3.92s/it]Training 2/2 epoch (loss 0.0879):  92%|██▊| 3802/4114 [4:05:43<20:23,  3.92s/it]Training 2/2 epoch (loss 0.0879):  92%|██▊| 3803/4114 [4:05:43<19:38,  3.79s/it]Training 2/2 epoch (loss 0.0006):  92%|██▊| 3803/4114 [4:05:47<19:38,  3.79s/it]Training 2/2 epoch (loss 0.0006):  92%|██▊| 3804/4114 [4:05:47<20:14,  3.92s/it]Training 2/2 epoch (loss 0.0076):  92%|██▊| 3804/4114 [4:05:51<20:14,  3.92s/it]Training 2/2 epoch (loss 0.0076):  92%|██▊| 3805/4114 [4:05:51<20:20,  3.95s/it]Training 2/2 epoch (loss 0.0035):  92%|██▊| 3805/4114 [4:05:55<20:20,  3.95s/it]Training 2/2 epoch (loss 0.0035):  93%|██▊| 3806/4114 [4:05:55<20:23,  3.97s/it]Training 2/2 epoch (loss 0.1128):  93%|██▊| 3806/4114 [4:05:59<20:23,  3.97s/it]Training 2/2 epoch (loss 0.1128):  93%|██▊| 3807/4114 [4:05:59<20:20,  3.98s/it]Training 2/2 epoch (loss 0.0181):  93%|██▊| 3807/4114 [4:06:03<20:20,  3.98s/it]Training 2/2 epoch (loss 0.0181):  93%|██▊| 3808/4114 [4:06:03<19:56,  3.91s/it]Training 2/2 epoch (loss 0.0195):  93%|██▊| 3808/4114 [4:06:06<19:56,  3.91s/it]Training 2/2 epoch (loss 0.0195):  93%|██▊| 3809/4114 [4:06:06<19:03,  3.75s/it]Training 2/2 epoch (loss 0.0003):  93%|██▊| 3809/4114 [4:06:10<19:03,  3.75s/it]Training 2/2 epoch (loss 0.0003):  93%|██▊| 3810/4114 [4:06:10<19:52,  3.92s/it]Training 2/2 epoch (loss 0.0330):  93%|██▊| 3810/4114 [4:06:14<19:52,  3.92s/it]Training 2/2 epoch (loss 0.0330):  93%|██▊| 3811/4114 [4:06:14<19:48,  3.92s/it]Training 2/2 epoch (loss 0.0026):  93%|██▊| 3811/4114 [4:06:18<19:48,  3.92s/it]Training 2/2 epoch (loss 0.0026):  93%|██▊| 3812/4114 [4:06:18<19:48,  3.93s/it]Training 2/2 epoch (loss 0.0101):  93%|██▊| 3812/4114 [4:06:23<19:48,  3.93s/it]Training 2/2 epoch (loss 0.0101):  93%|██▊| 3813/4114 [4:06:23<20:09,  4.02s/it]Training 2/2 epoch (loss 0.0113):  93%|██▊| 3813/4114 [4:06:26<20:09,  4.02s/it]Training 2/2 epoch (loss 0.0113):  93%|██▊| 3814/4114 [4:06:26<19:45,  3.95s/it]Training 2/2 epoch (loss 0.0065):  93%|██▊| 3814/4114 [4:06:30<19:45,  3.95s/it]Training 2/2 epoch (loss 0.0065):  93%|██▊| 3815/4114 [4:06:30<19:47,  3.97s/it]Training 2/2 epoch (loss 0.0030):  93%|██▊| 3815/4114 [4:06:35<19:47,  3.97s/it]Training 2/2 epoch (loss 0.0030):  93%|██▊| 3816/4114 [4:06:35<19:58,  4.02s/it]Training 2/2 epoch (loss 0.0082):  93%|██▊| 3816/4114 [4:06:38<19:58,  4.02s/it]Training 2/2 epoch (loss 0.0082):  93%|██▊| 3817/4114 [4:06:38<19:47,  4.00s/it]Training 2/2 epoch (loss 0.0483):  93%|██▊| 3817/4114 [4:06:42<19:47,  4.00s/it]Training 2/2 epoch (loss 0.0483):  93%|██▊| 3818/4114 [4:06:42<19:39,  3.99s/it]Training 2/2 epoch (loss 0.0126):  93%|██▊| 3818/4114 [4:06:46<19:39,  3.99s/it]Training 2/2 epoch (loss 0.0126):  93%|██▊| 3819/4114 [4:06:46<19:35,  3.98s/it]Training 2/2 epoch (loss 0.0566):  93%|██▊| 3819/4114 [4:06:50<19:35,  3.98s/it]Training 2/2 epoch (loss 0.0566):  93%|██▊| 3820/4114 [4:06:50<18:58,  3.87s/it]Training 2/2 epoch (loss 0.0012):  93%|██▊| 3820/4114 [4:06:54<18:58,  3.87s/it]Training 2/2 epoch (loss 0.0012):  93%|██▊| 3821/4114 [4:06:54<18:47,  3.85s/it]Training 2/2 epoch (loss 0.0067):  93%|██▊| 3821/4114 [4:06:58<18:47,  3.85s/it]Training 2/2 epoch (loss 0.0067):  93%|██▊| 3822/4114 [4:06:58<19:04,  3.92s/it]Training 2/2 epoch (loss 0.0496):  93%|██▊| 3822/4114 [4:07:02<19:04,  3.92s/it]Training 2/2 epoch (loss 0.0496):  93%|██▊| 3823/4114 [4:07:02<19:01,  3.92s/it]Training 2/2 epoch (loss 0.0016):  93%|██▊| 3823/4114 [4:07:06<19:01,  3.92s/it]Training 2/2 epoch (loss 0.0016):  93%|██▊| 3824/4114 [4:07:06<18:58,  3.93s/it]Training 2/2 epoch (loss 0.0679):  93%|██▊| 3824/4114 [4:07:10<18:58,  3.93s/it]Training 2/2 epoch (loss 0.0679):  93%|██▊| 3825/4114 [4:07:10<19:06,  3.97s/it]Training 2/2 epoch (loss 0.0320):  93%|██▊| 3825/4114 [4:07:14<19:06,  3.97s/it]Training 2/2 epoch (loss 0.0320):  93%|██▊| 3826/4114 [4:07:14<19:01,  3.96s/it]Training 2/2 epoch (loss 0.0233):  93%|██▊| 3826/4114 [4:07:18<19:01,  3.96s/it]Training 2/2 epoch (loss 0.0233):  93%|██▊| 3827/4114 [4:07:18<18:48,  3.93s/it]Training 2/2 epoch (loss 0.0193):  93%|██▊| 3827/4114 [4:07:22<18:48,  3.93s/it]Training 2/2 epoch (loss 0.0193):  93%|██▊| 3828/4114 [4:07:22<19:05,  4.01s/it]Training 2/2 epoch (loss 0.0801):  93%|██▊| 3828/4114 [4:07:26<19:05,  4.01s/it]Training 2/2 epoch (loss 0.0801):  93%|██▊| 3829/4114 [4:07:26<18:44,  3.94s/it]Training 2/2 epoch (loss 0.0297):  93%|██▊| 3829/4114 [4:07:29<18:44,  3.94s/it]Training 2/2 epoch (loss 0.0297):  93%|██▊| 3830/4114 [4:07:29<18:29,  3.91s/it]Training 2/2 epoch (loss 0.0076):  93%|██▊| 3830/4114 [4:07:33<18:29,  3.91s/it]Training 2/2 epoch (loss 0.0076):  93%|██▊| 3831/4114 [4:07:33<18:22,  3.90s/it]Training 2/2 epoch (loss 0.0520):  93%|██▊| 3831/4114 [4:07:37<18:22,  3.90s/it]Training 2/2 epoch (loss 0.0520):  93%|██▊| 3832/4114 [4:07:37<18:30,  3.94s/it]Training 2/2 epoch (loss 0.0425):  93%|██▊| 3832/4114 [4:07:41<18:30,  3.94s/it]Training 2/2 epoch (loss 0.0425):  93%|██▊| 3833/4114 [4:07:41<17:41,  3.78s/it]Training 2/2 epoch (loss 0.0845):  93%|██▊| 3833/4114 [4:07:45<17:41,  3.78s/it]Training 2/2 epoch (loss 0.0845):  93%|██▊| 3834/4114 [4:07:45<18:15,  3.91s/it]Training 2/2 epoch (loss 0.0095):  93%|██▊| 3834/4114 [4:07:49<18:15,  3.91s/it]Training 2/2 epoch (loss 0.0095):  93%|██▊| 3835/4114 [4:07:49<18:20,  3.94s/it]Training 2/2 epoch (loss 0.0143):  93%|██▊| 3835/4114 [4:07:53<18:20,  3.94s/it]Training 2/2 epoch (loss 0.0143):  93%|██▊| 3836/4114 [4:07:53<18:25,  3.98s/it]Training 2/2 epoch (loss 0.0120):  93%|██▊| 3836/4114 [4:07:57<18:25,  3.98s/it]Training 2/2 epoch (loss 0.0120):  93%|██▊| 3837/4114 [4:07:57<18:29,  4.01s/it]Training 2/2 epoch (loss 0.0052):  93%|██▊| 3837/4114 [4:08:01<18:29,  4.01s/it]Training 2/2 epoch (loss 0.0052):  93%|██▊| 3838/4114 [4:08:01<17:43,  3.85s/it]Training 2/2 epoch (loss 0.0376):  93%|██▊| 3838/4114 [4:08:04<17:43,  3.85s/it]Training 2/2 epoch (loss 0.0376):  93%|██▊| 3839/4114 [4:08:04<17:37,  3.85s/it]Training 2/2 epoch (loss 0.0383):  93%|██▊| 3839/4114 [4:08:09<17:37,  3.85s/it]Training 2/2 epoch (loss 0.0383):  93%|██▊| 3840/4114 [4:08:09<17:52,  3.92s/it]Training 2/2 epoch (loss 0.0576):  93%|██▊| 3840/4114 [4:08:12<17:52,  3.92s/it]Training 2/2 epoch (loss 0.0576):  93%|██▊| 3841/4114 [4:08:12<16:56,  3.72s/it]Training 2/2 epoch (loss 0.0090):  93%|██▊| 3841/4114 [4:08:16<16:56,  3.72s/it]Training 2/2 epoch (loss 0.0090):  93%|██▊| 3842/4114 [4:08:16<17:08,  3.78s/it]Training 2/2 epoch (loss 0.0762):  93%|██▊| 3842/4114 [4:08:20<17:08,  3.78s/it]Training 2/2 epoch (loss 0.0762):  93%|██▊| 3843/4114 [4:08:20<17:23,  3.85s/it]Training 2/2 epoch (loss 0.1289):  93%|██▊| 3843/4114 [4:08:23<17:23,  3.85s/it]Training 2/2 epoch (loss 0.1289):  93%|██▊| 3844/4114 [4:08:23<17:13,  3.83s/it]Training 2/2 epoch (loss 0.0184):  93%|██▊| 3844/4114 [4:08:27<17:13,  3.83s/it]Training 2/2 epoch (loss 0.0184):  93%|██▊| 3845/4114 [4:08:27<17:07,  3.82s/it]Training 2/2 epoch (loss 0.0356):  93%|██▊| 3845/4114 [4:08:31<17:07,  3.82s/it]Training 2/2 epoch (loss 0.0356):  93%|██▊| 3846/4114 [4:08:31<17:19,  3.88s/it]Training 2/2 epoch (loss 0.0703):  93%|██▊| 3846/4114 [4:08:35<17:19,  3.88s/it]Training 2/2 epoch (loss 0.0703):  94%|██▊| 3847/4114 [4:08:35<17:22,  3.91s/it]Training 2/2 epoch (loss 0.0101):  94%|██▊| 3847/4114 [4:08:39<17:22,  3.91s/it]Training 2/2 epoch (loss 0.0101):  94%|██▊| 3848/4114 [4:08:39<17:17,  3.90s/it]Training 2/2 epoch (loss 0.0145):  94%|██▊| 3848/4114 [4:08:43<17:17,  3.90s/it]Training 2/2 epoch (loss 0.0145):  94%|██▊| 3849/4114 [4:08:43<17:37,  3.99s/it]Training 2/2 epoch (loss 0.0039):  94%|██▊| 3849/4114 [4:08:47<17:37,  3.99s/it]Training 2/2 epoch (loss 0.0039):  94%|██▊| 3850/4114 [4:08:47<17:26,  3.97s/it]Training 2/2 epoch (loss 0.0723):  94%|██▊| 3850/4114 [4:08:51<17:26,  3.97s/it]Training 2/2 epoch (loss 0.0723):  94%|██▊| 3851/4114 [4:08:51<17:22,  3.96s/it]Training 2/2 epoch (loss 0.1816):  94%|██▊| 3851/4114 [4:08:55<17:22,  3.96s/it]Training 2/2 epoch (loss 0.1816):  94%|██▊| 3852/4114 [4:08:55<17:38,  4.04s/it]Training 2/2 epoch (loss 0.0693):  94%|██▊| 3852/4114 [4:08:59<17:38,  4.04s/it]Training 2/2 epoch (loss 0.0693):  94%|██▊| 3853/4114 [4:08:59<17:14,  3.96s/it]Training 2/2 epoch (loss 0.0120):  94%|██▊| 3853/4114 [4:09:03<17:14,  3.96s/it]Training 2/2 epoch (loss 0.0120):  94%|██▊| 3854/4114 [4:09:03<16:33,  3.82s/it]Training 2/2 epoch (loss 0.1318):  94%|██▊| 3854/4114 [4:09:07<16:33,  3.82s/it]Training 2/2 epoch (loss 0.1318):  94%|██▊| 3855/4114 [4:09:07<16:57,  3.93s/it]Training 2/2 epoch (loss 0.0796):  94%|██▊| 3855/4114 [4:09:10<16:57,  3.93s/it]Training 2/2 epoch (loss 0.0796):  94%|██▊| 3856/4114 [4:09:10<15:45,  3.67s/it]Training 2/2 epoch (loss 0.0046):  94%|██▊| 3856/4114 [4:09:14<15:45,  3.67s/it]Training 2/2 epoch (loss 0.0046):  94%|██▊| 3857/4114 [4:09:14<16:00,  3.74s/it]Training 2/2 epoch (loss 0.0036):  94%|██▊| 3857/4114 [4:09:17<16:00,  3.74s/it]Training 2/2 epoch (loss 0.0036):  94%|██▊| 3858/4114 [4:09:17<15:39,  3.67s/it]Training 2/2 epoch (loss 0.0400):  94%|██▊| 3858/4114 [4:09:21<15:39,  3.67s/it]Training 2/2 epoch (loss 0.0400):  94%|██▊| 3859/4114 [4:09:21<15:11,  3.57s/it]Training 2/2 epoch (loss 0.0339):  94%|██▊| 3859/4114 [4:09:25<15:11,  3.57s/it]Training 2/2 epoch (loss 0.0339):  94%|██▊| 3860/4114 [4:09:25<15:38,  3.69s/it]Training 2/2 epoch (loss 0.2383):  94%|██▊| 3860/4114 [4:09:29<15:38,  3.69s/it]Training 2/2 epoch (loss 0.2383):  94%|██▊| 3861/4114 [4:09:29<16:12,  3.84s/it]Training 2/2 epoch (loss 0.0019):  94%|██▊| 3861/4114 [4:09:33<16:12,  3.84s/it]Training 2/2 epoch (loss 0.0019):  94%|██▊| 3862/4114 [4:09:33<16:15,  3.87s/it]Training 2/2 epoch (loss 0.0630):  94%|██▊| 3862/4114 [4:09:37<16:15,  3.87s/it]Training 2/2 epoch (loss 0.0630):  94%|██▊| 3863/4114 [4:09:37<16:14,  3.88s/it]Training 2/2 epoch (loss 0.0298):  94%|██▊| 3863/4114 [4:09:41<16:14,  3.88s/it]Training 2/2 epoch (loss 0.0298):  94%|██▊| 3864/4114 [4:09:41<16:26,  3.95s/it]Training 2/2 epoch (loss 0.0172):  94%|██▊| 3864/4114 [4:09:44<16:26,  3.95s/it]Training 2/2 epoch (loss 0.0172):  94%|██▊| 3865/4114 [4:09:44<15:59,  3.85s/it]Training 2/2 epoch (loss 0.0183):  94%|██▊| 3865/4114 [4:09:48<15:59,  3.85s/it]Training 2/2 epoch (loss 0.0183):  94%|██▊| 3866/4114 [4:09:48<16:03,  3.89s/it]Training 2/2 epoch (loss 0.0153):  94%|██▊| 3866/4114 [4:09:52<16:03,  3.89s/it]Training 2/2 epoch (loss 0.0153):  94%|██▊| 3867/4114 [4:09:52<16:09,  3.92s/it]Training 2/2 epoch (loss 0.1074):  94%|██▊| 3867/4114 [4:09:56<16:09,  3.92s/it]Training 2/2 epoch (loss 0.1074):  94%|██▊| 3868/4114 [4:09:56<16:04,  3.92s/it]Training 2/2 epoch (loss 0.0075):  94%|██▊| 3868/4114 [4:10:00<16:04,  3.92s/it]Training 2/2 epoch (loss 0.0075):  94%|██▊| 3869/4114 [4:10:00<16:02,  3.93s/it]Training 2/2 epoch (loss 0.0845):  94%|██▊| 3869/4114 [4:10:05<16:02,  3.93s/it]Training 2/2 epoch (loss 0.0845):  94%|██▊| 3870/4114 [4:10:05<16:20,  4.02s/it]Training 2/2 epoch (loss 0.0623):  94%|██▊| 3870/4114 [4:10:08<16:20,  4.02s/it]Training 2/2 epoch (loss 0.0623):  94%|██▊| 3871/4114 [4:10:08<16:03,  3.97s/it]Training 2/2 epoch (loss 0.0588):  94%|██▊| 3871/4114 [4:10:12<16:03,  3.97s/it]Training 2/2 epoch (loss 0.0588):  94%|██▊| 3872/4114 [4:10:12<16:02,  3.98s/it]Training 2/2 epoch (loss 0.0173):  94%|██▊| 3872/4114 [4:10:16<16:02,  3.98s/it]Training 2/2 epoch (loss 0.0173):  94%|██▊| 3873/4114 [4:10:16<16:06,  4.01s/it]Training 2/2 epoch (loss 0.0006):  94%|██▊| 3873/4114 [4:10:20<16:06,  4.01s/it]Training 2/2 epoch (loss 0.0006):  94%|██▊| 3874/4114 [4:10:20<15:49,  3.96s/it]Training 2/2 epoch (loss 0.0036):  94%|██▊| 3874/4114 [4:10:24<15:49,  3.96s/it]Training 2/2 epoch (loss 0.0036):  94%|██▊| 3875/4114 [4:10:24<15:52,  3.99s/it]Training 2/2 epoch (loss 0.0014):  94%|██▊| 3875/4114 [4:10:28<15:52,  3.99s/it]Training 2/2 epoch (loss 0.0014):  94%|██▊| 3876/4114 [4:10:28<15:51,  4.00s/it]Training 2/2 epoch (loss 0.0164):  94%|██▊| 3876/4114 [4:10:32<15:51,  4.00s/it]Training 2/2 epoch (loss 0.0164):  94%|██▊| 3877/4114 [4:10:32<15:32,  3.94s/it]Training 2/2 epoch (loss 0.0258):  94%|██▊| 3877/4114 [4:10:36<15:32,  3.94s/it]Training 2/2 epoch (loss 0.0258):  94%|██▊| 3878/4114 [4:10:36<15:22,  3.91s/it]Training 2/2 epoch (loss 0.0260):  94%|██▊| 3878/4114 [4:10:40<15:22,  3.91s/it]Training 2/2 epoch (loss 0.0260):  94%|██▊| 3879/4114 [4:10:40<14:54,  3.81s/it]Training 2/2 epoch (loss 0.0025):  94%|██▊| 3879/4114 [4:10:43<14:54,  3.81s/it]Training 2/2 epoch (loss 0.0025):  94%|██▊| 3880/4114 [4:10:43<14:50,  3.80s/it]Training 2/2 epoch (loss 0.1572):  94%|██▊| 3880/4114 [4:10:47<14:50,  3.80s/it]Training 2/2 epoch (loss 0.1572):  94%|██▊| 3881/4114 [4:10:47<14:59,  3.86s/it]Training 2/2 epoch (loss 0.0356):  94%|██▊| 3881/4114 [4:10:52<14:59,  3.86s/it]Training 2/2 epoch (loss 0.0356):  94%|██▊| 3882/4114 [4:10:52<15:26,  3.99s/it]Training 2/2 epoch (loss 0.0106):  94%|██▊| 3882/4114 [4:10:55<15:26,  3.99s/it]Training 2/2 epoch (loss 0.0106):  94%|██▊| 3883/4114 [4:10:55<15:02,  3.91s/it]Training 2/2 epoch (loss 0.0044):  94%|██▊| 3883/4114 [4:10:59<15:02,  3.91s/it]Training 2/2 epoch (loss 0.0044):  94%|██▊| 3884/4114 [4:10:59<15:01,  3.92s/it]Training 2/2 epoch (loss 0.0052):  94%|██▊| 3884/4114 [4:11:03<15:01,  3.92s/it]Training 2/2 epoch (loss 0.0052):  94%|██▊| 3885/4114 [4:11:03<15:09,  3.97s/it]Training 2/2 epoch (loss 0.1240):  94%|██▊| 3885/4114 [4:11:07<15:09,  3.97s/it]Training 2/2 epoch (loss 0.1240):  94%|██▊| 3886/4114 [4:11:07<14:56,  3.93s/it]Training 2/2 epoch (loss 0.0981):  94%|██▊| 3886/4114 [4:11:11<14:56,  3.93s/it]Training 2/2 epoch (loss 0.0981):  94%|██▊| 3887/4114 [4:11:11<14:54,  3.94s/it]Training 2/2 epoch (loss 0.0146):  94%|██▊| 3887/4114 [4:11:15<14:54,  3.94s/it]Training 2/2 epoch (loss 0.0146):  95%|██▊| 3888/4114 [4:11:15<15:07,  4.02s/it]Training 2/2 epoch (loss 0.0142):  95%|██▊| 3888/4114 [4:11:19<15:07,  4.02s/it]Training 2/2 epoch (loss 0.0142):  95%|██▊| 3889/4114 [4:11:19<15:07,  4.03s/it]Training 2/2 epoch (loss 0.0106):  95%|██▊| 3889/4114 [4:11:24<15:07,  4.03s/it]Training 2/2 epoch (loss 0.0106):  95%|██▊| 3890/4114 [4:11:24<15:03,  4.03s/it]Training 2/2 epoch (loss 0.0070):  95%|██▊| 3890/4114 [4:11:27<15:03,  4.03s/it]Training 2/2 epoch (loss 0.0070):  95%|██▊| 3891/4114 [4:11:27<14:40,  3.95s/it]Training 2/2 epoch (loss 0.0130):  95%|██▊| 3891/4114 [4:11:31<14:40,  3.95s/it]Training 2/2 epoch (loss 0.0130):  95%|██▊| 3892/4114 [4:11:31<14:42,  3.98s/it]Training 2/2 epoch (loss 0.0097):  95%|██▊| 3892/4114 [4:11:35<14:42,  3.98s/it]Training 2/2 epoch (loss 0.0097):  95%|██▊| 3893/4114 [4:11:35<14:34,  3.96s/it]Training 2/2 epoch (loss 0.0457):  95%|██▊| 3893/4114 [4:11:39<14:34,  3.96s/it]Training 2/2 epoch (loss 0.0457):  95%|██▊| 3894/4114 [4:11:39<14:37,  3.99s/it]Training 2/2 epoch (loss 0.0006):  95%|██▊| 3894/4114 [4:11:43<14:37,  3.99s/it]Training 2/2 epoch (loss 0.0006):  95%|██▊| 3895/4114 [4:11:43<14:27,  3.96s/it]Training 2/2 epoch (loss 0.0140):  95%|██▊| 3895/4114 [4:11:46<14:27,  3.96s/it]Training 2/2 epoch (loss 0.0140):  95%|██▊| 3896/4114 [4:11:46<13:39,  3.76s/it]Training 2/2 epoch (loss 0.0087):  95%|██▊| 3896/4114 [4:11:50<13:39,  3.76s/it]Training 2/2 epoch (loss 0.0087):  95%|██▊| 3897/4114 [4:11:50<13:39,  3.78s/it]Training 2/2 epoch (loss 0.0233):  95%|██▊| 3897/4114 [4:11:54<13:39,  3.78s/it]Training 2/2 epoch (loss 0.0233):  95%|██▊| 3898/4114 [4:11:54<13:47,  3.83s/it]Training 2/2 epoch (loss 0.0381):  95%|██▊| 3898/4114 [4:11:58<13:47,  3.83s/it]Training 2/2 epoch (loss 0.0381):  95%|██▊| 3899/4114 [4:11:58<13:17,  3.71s/it]Training 2/2 epoch (loss 0.2021):  95%|██▊| 3899/4114 [4:12:02<13:17,  3.71s/it]Training 2/2 epoch (loss 0.2021):  95%|██▊| 3900/4114 [4:12:02<13:44,  3.85s/it]Training 2/2 epoch (loss 0.0067):  95%|██▊| 3900/4114 [4:12:06<13:44,  3.85s/it]Training 2/2 epoch (loss 0.0067):  95%|██▊| 3901/4114 [4:12:06<13:45,  3.87s/it]Training 2/2 epoch (loss 0.1406):  95%|██▊| 3901/4114 [4:12:09<13:45,  3.87s/it]Training 2/2 epoch (loss 0.1406):  95%|██▊| 3902/4114 [4:12:09<13:20,  3.78s/it]Training 2/2 epoch (loss 0.0996):  95%|██▊| 3902/4114 [4:12:13<13:20,  3.78s/it]Training 2/2 epoch (loss 0.0996):  95%|██▊| 3903/4114 [4:12:13<13:40,  3.89s/it]Training 2/2 epoch (loss 0.0459):  95%|██▊| 3903/4114 [4:12:17<13:40,  3.89s/it]Training 2/2 epoch (loss 0.0459):  95%|██▊| 3904/4114 [4:12:17<13:43,  3.92s/it]Training 2/2 epoch (loss 0.1270):  95%|██▊| 3904/4114 [4:12:21<13:43,  3.92s/it]Training 2/2 epoch (loss 0.1270):  95%|██▊| 3905/4114 [4:12:21<13:32,  3.89s/it]Training 2/2 epoch (loss 0.0297):  95%|██▊| 3905/4114 [4:12:25<13:32,  3.89s/it]Training 2/2 epoch (loss 0.0297):  95%|██▊| 3906/4114 [4:12:25<13:43,  3.96s/it]Training 2/2 epoch (loss 0.1064):  95%|██▊| 3906/4114 [4:12:29<13:43,  3.96s/it]Training 2/2 epoch (loss 0.1064):  95%|██▊| 3907/4114 [4:12:29<13:38,  3.95s/it]Training 2/2 epoch (loss 0.0752):  95%|██▊| 3907/4114 [4:12:33<13:38,  3.95s/it]Training 2/2 epoch (loss 0.0752):  95%|██▊| 3908/4114 [4:12:33<13:30,  3.93s/it]Training 2/2 epoch (loss 0.0469):  95%|██▊| 3908/4114 [4:12:38<13:30,  3.93s/it]Training 2/2 epoch (loss 0.0469):  95%|██▊| 3909/4114 [4:12:38<13:47,  4.03s/it]Training 2/2 epoch (loss 0.0016):  95%|██▊| 3909/4114 [4:12:41<13:47,  4.03s/it]Training 2/2 epoch (loss 0.0016):  95%|██▊| 3910/4114 [4:12:41<12:57,  3.81s/it]Training 2/2 epoch (loss 0.0025):  95%|██▊| 3910/4114 [4:12:44<12:57,  3.81s/it]Training 2/2 epoch (loss 0.0025):  95%|██▊| 3911/4114 [4:12:44<12:40,  3.75s/it]Training 2/2 epoch (loss 0.0605):  95%|██▊| 3911/4114 [4:12:49<12:40,  3.75s/it]Training 2/2 epoch (loss 0.0605):  95%|██▊| 3912/4114 [4:12:49<12:59,  3.86s/it]Training 2/2 epoch (loss 0.0006):  95%|██▊| 3912/4114 [4:12:52<12:59,  3.86s/it]Training 2/2 epoch (loss 0.0006):  95%|██▊| 3913/4114 [4:12:52<13:02,  3.89s/it]Training 2/2 epoch (loss 0.0164):  95%|██▊| 3913/4114 [4:12:57<13:02,  3.89s/it]Training 2/2 epoch (loss 0.0164):  95%|██▊| 3914/4114 [4:12:57<13:10,  3.95s/it]Training 2/2 epoch (loss 0.0025):  95%|██▊| 3914/4114 [4:13:00<13:10,  3.95s/it]Training 2/2 epoch (loss 0.0025):  95%|██▊| 3915/4114 [4:13:00<12:34,  3.79s/it]Training 2/2 epoch (loss 0.0815):  95%|██▊| 3915/4114 [4:13:04<12:34,  3.79s/it]Training 2/2 epoch (loss 0.0815):  95%|██▊| 3916/4114 [4:13:04<12:40,  3.84s/it]Training 2/2 epoch (loss 0.0168):  95%|██▊| 3916/4114 [4:13:08<12:40,  3.84s/it]Training 2/2 epoch (loss 0.0168):  95%|██▊| 3917/4114 [4:13:08<12:37,  3.84s/it]Training 2/2 epoch (loss 0.0845):  95%|██▊| 3917/4114 [4:13:12<12:37,  3.84s/it]Training 2/2 epoch (loss 0.0845):  95%|██▊| 3918/4114 [4:13:12<12:58,  3.97s/it]Training 2/2 epoch (loss 0.0014):  95%|██▊| 3918/4114 [4:13:16<12:58,  3.97s/it]Training 2/2 epoch (loss 0.0014):  95%|██▊| 3919/4114 [4:13:16<12:24,  3.82s/it]Training 2/2 epoch (loss 0.0022):  95%|██▊| 3919/4114 [4:13:19<12:24,  3.82s/it]Training 2/2 epoch (loss 0.0022):  95%|██▊| 3920/4114 [4:13:19<11:59,  3.71s/it]Training 2/2 epoch (loss 0.0020):  95%|██▊| 3920/4114 [4:13:23<11:59,  3.71s/it]Training 2/2 epoch (loss 0.0020):  95%|██▊| 3921/4114 [4:13:23<12:15,  3.81s/it]Training 2/2 epoch (loss 0.0591):  95%|██▊| 3921/4114 [4:13:27<12:15,  3.81s/it]Training 2/2 epoch (loss 0.0591):  95%|██▊| 3922/4114 [4:13:27<12:16,  3.83s/it]Training 2/2 epoch (loss 0.0432):  95%|██▊| 3922/4114 [4:13:31<12:16,  3.83s/it]Training 2/2 epoch (loss 0.0432):  95%|██▊| 3923/4114 [4:13:31<12:13,  3.84s/it]Training 2/2 epoch (loss 0.0007):  95%|██▊| 3923/4114 [4:13:35<12:13,  3.84s/it]Training 2/2 epoch (loss 0.0007):  95%|██▊| 3924/4114 [4:13:35<12:12,  3.85s/it]Training 2/2 epoch (loss 0.0041):  95%|██▊| 3924/4114 [4:13:38<12:12,  3.85s/it]Training 2/2 epoch (loss 0.0041):  95%|██▊| 3925/4114 [4:13:38<12:05,  3.84s/it]Training 2/2 epoch (loss 0.0635):  95%|██▊| 3925/4114 [4:13:42<12:05,  3.84s/it]Training 2/2 epoch (loss 0.0635):  95%|██▊| 3926/4114 [4:13:42<12:07,  3.87s/it]Training 2/2 epoch (loss 0.0054):  95%|██▊| 3926/4114 [4:13:47<12:07,  3.87s/it]Training 2/2 epoch (loss 0.0054):  95%|██▊| 3927/4114 [4:13:47<12:22,  3.97s/it]Training 2/2 epoch (loss 0.0349):  95%|██▊| 3927/4114 [4:13:51<12:22,  3.97s/it]Training 2/2 epoch (loss 0.0349):  95%|██▊| 3928/4114 [4:13:51<12:22,  3.99s/it]Training 2/2 epoch (loss 0.0588):  95%|██▊| 3928/4114 [4:13:55<12:22,  3.99s/it]Training 2/2 epoch (loss 0.0588):  96%|██▊| 3929/4114 [4:13:55<12:11,  3.95s/it]Training 2/2 epoch (loss 0.0115):  96%|██▊| 3929/4114 [4:13:59<12:11,  3.95s/it]Training 2/2 epoch (loss 0.0115):  96%|██▊| 3930/4114 [4:13:59<12:17,  4.01s/it]Training 2/2 epoch (loss 0.0287):  96%|██▊| 3930/4114 [4:14:02<12:17,  4.01s/it]Training 2/2 epoch (loss 0.0287):  96%|██▊| 3931/4114 [4:14:02<12:03,  3.96s/it]Training 2/2 epoch (loss 0.0703):  96%|██▊| 3931/4114 [4:14:06<12:03,  3.96s/it]Training 2/2 epoch (loss 0.0703):  96%|██▊| 3932/4114 [4:14:06<11:50,  3.91s/it]Training 2/2 epoch (loss 0.1387):  96%|██▊| 3932/4114 [4:14:10<11:50,  3.91s/it]Training 2/2 epoch (loss 0.1387):  96%|██▊| 3933/4114 [4:14:10<11:51,  3.93s/it]Training 2/2 epoch (loss 0.0996):  96%|██▊| 3933/4114 [4:14:14<11:51,  3.93s/it]Training 2/2 epoch (loss 0.0996):  96%|██▊| 3934/4114 [4:14:14<11:49,  3.94s/it]Training 2/2 epoch (loss 0.0698):  96%|██▊| 3934/4114 [4:14:18<11:49,  3.94s/it]Training 2/2 epoch (loss 0.0698):  96%|██▊| 3935/4114 [4:14:18<11:47,  3.95s/it]Training 2/2 epoch (loss 0.0085):  96%|██▊| 3935/4114 [4:14:22<11:47,  3.95s/it]Training 2/2 epoch (loss 0.0085):  96%|██▊| 3936/4114 [4:14:22<11:45,  3.97s/it]Training 2/2 epoch (loss 0.0292):  96%|██▊| 3936/4114 [4:14:26<11:45,  3.97s/it]Training 2/2 epoch (loss 0.0292):  96%|██▊| 3937/4114 [4:14:26<11:38,  3.95s/it]Training 2/2 epoch (loss 0.0337):  96%|██▊| 3937/4114 [4:14:30<11:38,  3.95s/it]Training 2/2 epoch (loss 0.0337):  96%|██▊| 3938/4114 [4:14:30<11:26,  3.90s/it]Training 2/2 epoch (loss 0.1465):  96%|██▊| 3938/4114 [4:14:34<11:26,  3.90s/it]Training 2/2 epoch (loss 0.1465):  96%|██▊| 3939/4114 [4:14:34<11:23,  3.91s/it]Training 2/2 epoch (loss 0.0208):  96%|██▊| 3939/4114 [4:14:38<11:23,  3.91s/it]Training 2/2 epoch (loss 0.0208):  96%|██▊| 3940/4114 [4:14:38<11:20,  3.91s/it]Training 2/2 epoch (loss 0.0391):  96%|██▊| 3940/4114 [4:14:42<11:20,  3.91s/it]Training 2/2 epoch (loss 0.0391):  96%|██▊| 3941/4114 [4:14:42<11:16,  3.91s/it]Training 2/2 epoch (loss 0.0254):  96%|██▊| 3941/4114 [4:14:46<11:16,  3.91s/it]Training 2/2 epoch (loss 0.0254):  96%|██▊| 3942/4114 [4:14:46<11:24,  3.98s/it]Training 2/2 epoch (loss 0.0005):  96%|██▊| 3942/4114 [4:14:50<11:24,  3.98s/it]Training 2/2 epoch (loss 0.0005):  96%|██▉| 3943/4114 [4:14:50<11:21,  3.98s/it]Training 2/2 epoch (loss 0.0085):  96%|██▉| 3943/4114 [4:14:54<11:21,  3.98s/it]Training 2/2 epoch (loss 0.0085):  96%|██▉| 3944/4114 [4:14:54<11:12,  3.96s/it]Training 2/2 epoch (loss 0.0087):  96%|██▉| 3944/4114 [4:14:57<11:12,  3.96s/it]Training 2/2 epoch (loss 0.0087):  96%|██▉| 3945/4114 [4:14:57<10:50,  3.85s/it]Training 2/2 epoch (loss 0.0574):  96%|██▉| 3945/4114 [4:15:01<10:50,  3.85s/it]Training 2/2 epoch (loss 0.0574):  96%|██▉| 3946/4114 [4:15:01<10:42,  3.83s/it]Training 2/2 epoch (loss 0.0168):  96%|██▉| 3946/4114 [4:15:04<10:42,  3.83s/it]Training 2/2 epoch (loss 0.0168):  96%|██▉| 3947/4114 [4:15:04<10:15,  3.69s/it]Training 2/2 epoch (loss 0.0130):  96%|██▉| 3947/4114 [4:15:09<10:15,  3.69s/it]Training 2/2 epoch (loss 0.0130):  96%|██▉| 3948/4114 [4:15:09<10:43,  3.87s/it]Training 2/2 epoch (loss 0.0327):  96%|██▉| 3948/4114 [4:15:13<10:43,  3.87s/it]Training 2/2 epoch (loss 0.0327):  96%|██▉| 3949/4114 [4:15:13<10:45,  3.91s/it]Training 2/2 epoch (loss 0.0232):  96%|██▉| 3949/4114 [4:15:17<10:45,  3.91s/it]Training 2/2 epoch (loss 0.0232):  96%|██▉| 3950/4114 [4:15:17<10:48,  3.96s/it]Training 2/2 epoch (loss 0.0220):  96%|██▉| 3950/4114 [4:15:20<10:48,  3.96s/it]Training 2/2 epoch (loss 0.0220):  96%|██▉| 3951/4114 [4:15:20<10:22,  3.82s/it]Training 2/2 epoch (loss 0.0234):  96%|██▉| 3951/4114 [4:15:24<10:22,  3.82s/it]Training 2/2 epoch (loss 0.0234):  96%|██▉| 3952/4114 [4:15:24<10:15,  3.80s/it]Training 2/2 epoch (loss 0.0075):  96%|██▉| 3952/4114 [4:15:28<10:15,  3.80s/it]Training 2/2 epoch (loss 0.0075):  96%|██▉| 3953/4114 [4:15:28<10:24,  3.88s/it]Training 2/2 epoch (loss 0.0013):  96%|██▉| 3953/4114 [4:15:32<10:24,  3.88s/it]Training 2/2 epoch (loss 0.0013):  96%|██▉| 3954/4114 [4:15:32<10:14,  3.84s/it]Training 2/2 epoch (loss 0.0041):  96%|██▉| 3954/4114 [4:15:36<10:14,  3.84s/it]Training 2/2 epoch (loss 0.0041):  96%|██▉| 3955/4114 [4:15:36<10:05,  3.81s/it]Training 2/2 epoch (loss 0.0132):  96%|██▉| 3955/4114 [4:15:39<10:05,  3.81s/it]Training 2/2 epoch (loss 0.0132):  96%|██▉| 3956/4114 [4:15:39<10:07,  3.84s/it]Training 2/2 epoch (loss 0.1924):  96%|██▉| 3956/4114 [4:15:43<10:07,  3.84s/it]Training 2/2 epoch (loss 0.1924):  96%|██▉| 3957/4114 [4:15:43<09:57,  3.81s/it]Training 2/2 epoch (loss 0.1318):  96%|██▉| 3957/4114 [4:15:47<09:57,  3.81s/it]Training 2/2 epoch (loss 0.1318):  96%|██▉| 3958/4114 [4:15:47<09:46,  3.76s/it]Training 2/2 epoch (loss 0.0640):  96%|██▉| 3958/4114 [4:15:51<09:46,  3.76s/it]Training 2/2 epoch (loss 0.0640):  96%|██▉| 3959/4114 [4:15:51<09:55,  3.84s/it]Training 2/2 epoch (loss 0.0264):  96%|██▉| 3959/4114 [4:15:55<09:55,  3.84s/it]Training 2/2 epoch (loss 0.0264):  96%|██▉| 3960/4114 [4:15:55<10:03,  3.92s/it]Training 2/2 epoch (loss 0.0059):  96%|██▉| 3960/4114 [4:15:59<10:03,  3.92s/it]Training 2/2 epoch (loss 0.0059):  96%|██▉| 3961/4114 [4:15:59<09:51,  3.87s/it]Training 2/2 epoch (loss 0.0491):  96%|██▉| 3961/4114 [4:16:03<09:51,  3.87s/it]Training 2/2 epoch (loss 0.0491):  96%|██▉| 3962/4114 [4:16:03<09:53,  3.91s/it]Training 2/2 epoch (loss 0.0236):  96%|██▉| 3962/4114 [4:16:07<09:53,  3.91s/it]Training 2/2 epoch (loss 0.0236):  96%|██▉| 3963/4114 [4:16:07<10:05,  4.01s/it]Training 2/2 epoch (loss 0.0199):  96%|██▉| 3963/4114 [4:16:11<10:05,  4.01s/it]Training 2/2 epoch (loss 0.0199):  96%|██▉| 3964/4114 [4:16:11<09:57,  3.99s/it]Training 2/2 epoch (loss 0.0552):  96%|██▉| 3964/4114 [4:16:15<09:57,  3.99s/it]Training 2/2 epoch (loss 0.0552):  96%|██▉| 3965/4114 [4:16:15<09:48,  3.95s/it]Training 2/2 epoch (loss 0.0148):  96%|██▉| 3965/4114 [4:16:19<09:48,  3.95s/it]Training 2/2 epoch (loss 0.0148):  96%|██▉| 3966/4114 [4:16:19<09:53,  4.01s/it]Training 2/2 epoch (loss 0.1572):  96%|██▉| 3966/4114 [4:16:23<09:53,  4.01s/it]Training 2/2 epoch (loss 0.1572):  96%|██▉| 3967/4114 [4:16:23<09:40,  3.95s/it]Training 2/2 epoch (loss 0.0151):  96%|██▉| 3967/4114 [4:16:27<09:40,  3.95s/it]Training 2/2 epoch (loss 0.0151):  96%|██▉| 3968/4114 [4:16:27<09:39,  3.97s/it]Training 2/2 epoch (loss 0.0190):  96%|██▉| 3968/4114 [4:16:31<09:39,  3.97s/it]Training 2/2 epoch (loss 0.0190):  96%|██▉| 3969/4114 [4:16:31<09:36,  3.98s/it]Training 2/2 epoch (loss 0.1494):  96%|██▉| 3969/4114 [4:16:34<09:36,  3.98s/it]Training 2/2 epoch (loss 0.1494):  96%|██▉| 3970/4114 [4:16:34<09:08,  3.81s/it]Training 2/2 epoch (loss 0.1367):  96%|██▉| 3970/4114 [4:16:38<09:08,  3.81s/it]Training 2/2 epoch (loss 0.1367):  97%|██▉| 3971/4114 [4:16:38<09:09,  3.84s/it]Training 2/2 epoch (loss 0.0337):  97%|██▉| 3971/4114 [4:16:42<09:09,  3.84s/it]Training 2/2 epoch (loss 0.0337):  97%|██▉| 3972/4114 [4:16:42<09:24,  3.97s/it]Training 2/2 epoch (loss 0.0031):  97%|██▉| 3972/4114 [4:16:46<09:24,  3.97s/it]Training 2/2 epoch (loss 0.0031):  97%|██▉| 3973/4114 [4:16:46<09:12,  3.92s/it]Training 2/2 epoch (loss 0.0593):  97%|██▉| 3973/4114 [4:16:50<09:12,  3.92s/it]Training 2/2 epoch (loss 0.0593):  97%|██▉| 3974/4114 [4:16:50<09:04,  3.89s/it]Training 2/2 epoch (loss 0.0283):  97%|██▉| 3974/4114 [4:16:53<09:04,  3.89s/it]Training 2/2 epoch (loss 0.0283):  97%|██▉| 3975/4114 [4:16:53<08:33,  3.70s/it]Training 2/2 epoch (loss 0.0684):  97%|██▉| 3975/4114 [4:16:57<08:33,  3.70s/it]Training 2/2 epoch (loss 0.0684):  97%|██▉| 3976/4114 [4:16:57<08:41,  3.78s/it]Training 2/2 epoch (loss 0.0508):  97%|██▉| 3976/4114 [4:17:01<08:41,  3.78s/it]Training 2/2 epoch (loss 0.0508):  97%|██▉| 3977/4114 [4:17:01<08:31,  3.74s/it]Training 2/2 epoch (loss 0.0161):  97%|██▉| 3977/4114 [4:17:05<08:31,  3.74s/it]Training 2/2 epoch (loss 0.0161):  97%|██▉| 3978/4114 [4:17:05<08:41,  3.84s/it]Training 2/2 epoch (loss 0.0160):  97%|██▉| 3978/4114 [4:17:09<08:41,  3.84s/it]Training 2/2 epoch (loss 0.0160):  97%|██▉| 3979/4114 [4:17:09<08:42,  3.87s/it]Training 2/2 epoch (loss 0.0281):  97%|██▉| 3979/4114 [4:17:13<08:42,  3.87s/it]Training 2/2 epoch (loss 0.0281):  97%|██▉| 3980/4114 [4:17:13<08:43,  3.91s/it]Training 2/2 epoch (loss 0.1777):  97%|██▉| 3980/4114 [4:17:17<08:43,  3.91s/it]Training 2/2 epoch (loss 0.1777):  97%|██▉| 3981/4114 [4:17:17<08:48,  3.97s/it]Training 2/2 epoch (loss 0.0835):  97%|██▉| 3981/4114 [4:17:21<08:48,  3.97s/it]Training 2/2 epoch (loss 0.0835):  97%|██▉| 3982/4114 [4:17:21<08:47,  4.00s/it]Training 2/2 epoch (loss 0.0006):  97%|██▉| 3982/4114 [4:17:24<08:47,  4.00s/it]Training 2/2 epoch (loss 0.0006):  97%|██▉| 3983/4114 [4:17:24<08:13,  3.77s/it]Training 2/2 epoch (loss 0.0742):  97%|██▉| 3983/4114 [4:17:28<08:13,  3.77s/it]Training 2/2 epoch (loss 0.0742):  97%|██▉| 3984/4114 [4:17:28<07:56,  3.66s/it]Training 2/2 epoch (loss 0.0312):  97%|██▉| 3984/4114 [4:17:32<07:56,  3.66s/it]Training 2/2 epoch (loss 0.0312):  97%|██▉| 3985/4114 [4:17:32<08:01,  3.74s/it]Training 2/2 epoch (loss 0.0085):  97%|██▉| 3985/4114 [4:17:35<08:01,  3.74s/it]Training 2/2 epoch (loss 0.0085):  97%|██▉| 3986/4114 [4:17:35<08:04,  3.78s/it]Training 2/2 epoch (loss 0.0420):  97%|██▉| 3986/4114 [4:17:39<08:04,  3.78s/it]Training 2/2 epoch (loss 0.0420):  97%|██▉| 3987/4114 [4:17:39<08:05,  3.82s/it]Training 2/2 epoch (loss 0.0008):  97%|██▉| 3987/4114 [4:17:43<08:05,  3.82s/it]Training 2/2 epoch (loss 0.0008):  97%|██▉| 3988/4114 [4:17:43<08:08,  3.88s/it]Training 2/2 epoch (loss 0.0027):  97%|██▉| 3988/4114 [4:17:47<08:08,  3.88s/it]Training 2/2 epoch (loss 0.0027):  97%|██▉| 3989/4114 [4:17:47<08:13,  3.95s/it]Training 2/2 epoch (loss 0.0417):  97%|██▉| 3989/4114 [4:17:52<08:13,  3.95s/it]Training 2/2 epoch (loss 0.0417):  97%|██▉| 3990/4114 [4:17:52<08:14,  3.99s/it]Training 2/2 epoch (loss 0.0315):  97%|██▉| 3990/4114 [4:17:55<08:14,  3.99s/it]Training 2/2 epoch (loss 0.0315):  97%|██▉| 3991/4114 [4:17:55<08:05,  3.95s/it]Training 2/2 epoch (loss 0.0067):  97%|██▉| 3991/4114 [4:17:59<08:05,  3.95s/it]Training 2/2 epoch (loss 0.0067):  97%|██▉| 3992/4114 [4:17:59<08:02,  3.96s/it]Training 2/2 epoch (loss 0.0006):  97%|██▉| 3992/4114 [4:18:03<08:02,  3.96s/it]Training 2/2 epoch (loss 0.0006):  97%|██▉| 3993/4114 [4:18:03<08:01,  3.98s/it]Training 2/2 epoch (loss 0.0737):  97%|██▉| 3993/4114 [4:18:07<08:01,  3.98s/it]Training 2/2 epoch (loss 0.0737):  97%|██▉| 3994/4114 [4:18:07<07:55,  3.96s/it]Training 2/2 epoch (loss 0.0238):  97%|██▉| 3994/4114 [4:18:11<07:55,  3.96s/it]Training 2/2 epoch (loss 0.0238):  97%|██▉| 3995/4114 [4:18:11<07:50,  3.95s/it]Training 2/2 epoch (loss 0.0398):  97%|██▉| 3995/4114 [4:18:15<07:50,  3.95s/it]Training 2/2 epoch (loss 0.0398):  97%|██▉| 3996/4114 [4:18:15<07:36,  3.87s/it]Training 2/2 epoch (loss 0.0601):  97%|██▉| 3996/4114 [4:18:19<07:36,  3.87s/it]Training 2/2 epoch (loss 0.0601):  97%|██▉| 3997/4114 [4:18:19<07:38,  3.92s/it]Training 2/2 epoch (loss 0.0034):  97%|██▉| 3997/4114 [4:18:23<07:38,  3.92s/it]Training 2/2 epoch (loss 0.0034):  97%|██▉| 3998/4114 [4:18:23<07:33,  3.91s/it]Training 2/2 epoch (loss 0.0457):  97%|██▉| 3998/4114 [4:18:26<07:33,  3.91s/it]Training 2/2 epoch (loss 0.0457):  97%|██▉| 3999/4114 [4:18:26<07:15,  3.79s/it]Training 2/2 epoch (loss 0.0039):  97%|██▉| 3999/4114 [4:18:30<07:15,  3.79s/it]Training 2/2 epoch (loss 0.0039):  97%|██▉| 4000/4114 [4:18:30<06:57,  3.66s/it]Training 2/2 epoch (loss 0.0193):  97%|██▉| 4000/4114 [4:18:33<06:57,  3.66s/it]Training 2/2 epoch (loss 0.0193):  97%|██▉| 4001/4114 [4:18:33<06:45,  3.59s/it]Training 2/2 epoch (loss 0.0542):  97%|██▉| 4001/4114 [4:18:37<06:45,  3.59s/it]Training 2/2 epoch (loss 0.0542):  97%|██▉| 4002/4114 [4:18:37<06:58,  3.74s/it]Training 2/2 epoch (loss 0.0018):  97%|██▉| 4002/4114 [4:18:41<06:58,  3.74s/it]Training 2/2 epoch (loss 0.0018):  97%|██▉| 4003/4114 [4:18:41<06:59,  3.78s/it]Training 2/2 epoch (loss 0.0403):  97%|██▉| 4003/4114 [4:18:44<06:59,  3.78s/it]Training 2/2 epoch (loss 0.0403):  97%|██▉| 4004/4114 [4:18:44<06:39,  3.63s/it]Training 2/2 epoch (loss 0.0016):  97%|██▉| 4004/4114 [4:18:48<06:39,  3.63s/it]Training 2/2 epoch (loss 0.0016):  97%|██▉| 4005/4114 [4:18:48<06:34,  3.62s/it]Training 2/2 epoch (loss 0.0251):  97%|██▉| 4005/4114 [4:18:52<06:34,  3.62s/it]Training 2/2 epoch (loss 0.0251):  97%|██▉| 4006/4114 [4:18:52<06:35,  3.66s/it]Training 2/2 epoch (loss 0.0625):  97%|██▉| 4006/4114 [4:18:56<06:35,  3.66s/it]Training 2/2 epoch (loss 0.0625):  97%|██▉| 4007/4114 [4:18:56<06:44,  3.78s/it]Training 2/2 epoch (loss 0.0248):  97%|██▉| 4007/4114 [4:19:00<06:44,  3.78s/it]Training 2/2 epoch (loss 0.0248):  97%|██▉| 4008/4114 [4:19:00<06:54,  3.91s/it]Training 2/2 epoch (loss 0.0150):  97%|██▉| 4008/4114 [4:19:04<06:54,  3.91s/it]Training 2/2 epoch (loss 0.0150):  97%|██▉| 4009/4114 [4:19:04<06:50,  3.91s/it]Training 2/2 epoch (loss 0.0245):  97%|██▉| 4009/4114 [4:19:08<06:50,  3.91s/it]Training 2/2 epoch (loss 0.0245):  97%|██▉| 4010/4114 [4:19:08<06:47,  3.92s/it]Training 2/2 epoch (loss 0.0168):  97%|██▉| 4010/4114 [4:19:12<06:47,  3.92s/it]Training 2/2 epoch (loss 0.0168):  97%|██▉| 4011/4114 [4:19:12<06:55,  4.03s/it]Training 2/2 epoch (loss 0.0203):  97%|██▉| 4011/4114 [4:19:16<06:55,  4.03s/it]Training 2/2 epoch (loss 0.0203):  98%|██▉| 4012/4114 [4:19:16<06:34,  3.86s/it]Training 2/2 epoch (loss 0.0112):  98%|██▉| 4012/4114 [4:19:20<06:34,  3.86s/it]Training 2/2 epoch (loss 0.0112):  98%|██▉| 4013/4114 [4:19:20<06:32,  3.89s/it]Training 2/2 epoch (loss 0.0042):  98%|██▉| 4013/4114 [4:19:24<06:32,  3.89s/it]Training 2/2 epoch (loss 0.0042):  98%|██▉| 4014/4114 [4:19:24<06:38,  3.98s/it]Training 2/2 epoch (loss 0.0095):  98%|██▉| 4014/4114 [4:19:28<06:38,  3.98s/it]Training 2/2 epoch (loss 0.0095):  98%|██▉| 4015/4114 [4:19:28<06:27,  3.92s/it]Training 2/2 epoch (loss 0.0991):  98%|██▉| 4015/4114 [4:19:31<06:27,  3.92s/it]Training 2/2 epoch (loss 0.0991):  98%|██▉| 4016/4114 [4:19:31<06:11,  3.79s/it]Training 2/2 epoch (loss 0.0099):  98%|██▉| 4016/4114 [4:19:35<06:11,  3.79s/it]Training 2/2 epoch (loss 0.0099):  98%|██▉| 4017/4114 [4:19:35<06:23,  3.95s/it]Training 2/2 epoch (loss 0.0201):  98%|██▉| 4017/4114 [4:19:39<06:23,  3.95s/it]Training 2/2 epoch (loss 0.0201):  98%|██▉| 4018/4114 [4:19:39<06:17,  3.94s/it]Training 2/2 epoch (loss 0.0031):  98%|██▉| 4018/4114 [4:19:43<06:17,  3.94s/it]Training 2/2 epoch (loss 0.0031):  98%|██▉| 4019/4114 [4:19:43<06:10,  3.90s/it]Training 2/2 epoch (loss 0.1055):  98%|██▉| 4019/4114 [4:19:47<06:10,  3.90s/it]Training 2/2 epoch (loss 0.1055):  98%|██▉| 4020/4114 [4:19:47<06:18,  4.03s/it]Training 2/2 epoch (loss 0.1406):  98%|██▉| 4020/4114 [4:19:51<06:18,  4.03s/it]Training 2/2 epoch (loss 0.1406):  98%|██▉| 4021/4114 [4:19:51<06:10,  3.98s/it]Training 2/2 epoch (loss 0.0312):  98%|██▉| 4021/4114 [4:19:55<06:10,  3.98s/it]Training 2/2 epoch (loss 0.0312):  98%|██▉| 4022/4114 [4:19:55<05:57,  3.89s/it]Training 2/2 epoch (loss 0.0498):  98%|██▉| 4022/4114 [4:19:59<05:57,  3.89s/it]Training 2/2 epoch (loss 0.0498):  98%|██▉| 4023/4114 [4:19:59<06:00,  3.97s/it]Training 2/2 epoch (loss 0.0315):  98%|██▉| 4023/4114 [4:20:03<06:00,  3.97s/it]Training 2/2 epoch (loss 0.0315):  98%|██▉| 4024/4114 [4:20:03<05:56,  3.96s/it]Training 2/2 epoch (loss 0.0061):  98%|██▉| 4024/4114 [4:20:07<05:56,  3.96s/it]Training 2/2 epoch (loss 0.0061):  98%|██▉| 4025/4114 [4:20:07<05:47,  3.91s/it]Training 2/2 epoch (loss 0.0564):  98%|██▉| 4025/4114 [4:20:11<05:47,  3.91s/it]Training 2/2 epoch (loss 0.0564):  98%|██▉| 4026/4114 [4:20:11<05:46,  3.94s/it]Training 2/2 epoch (loss 0.0147):  98%|██▉| 4026/4114 [4:20:14<05:46,  3.94s/it]Training 2/2 epoch (loss 0.0147):  98%|██▉| 4027/4114 [4:20:14<05:29,  3.79s/it]Training 2/2 epoch (loss 0.0018):  98%|██▉| 4027/4114 [4:20:18<05:29,  3.79s/it]Training 2/2 epoch (loss 0.0018):  98%|██▉| 4028/4114 [4:20:18<05:30,  3.84s/it]Training 2/2 epoch (loss 0.0864):  98%|██▉| 4028/4114 [4:20:23<05:30,  3.84s/it]Training 2/2 epoch (loss 0.0864):  98%|██▉| 4029/4114 [4:20:23<05:35,  3.95s/it]Training 2/2 epoch (loss 0.0016):  98%|██▉| 4029/4114 [4:20:26<05:35,  3.95s/it]Training 2/2 epoch (loss 0.0016):  98%|██▉| 4030/4114 [4:20:26<05:29,  3.93s/it]Training 2/2 epoch (loss 0.1006):  98%|██▉| 4030/4114 [4:20:30<05:29,  3.93s/it]Training 2/2 epoch (loss 0.1006):  98%|██▉| 4031/4114 [4:20:30<05:07,  3.71s/it]Training 2/2 epoch (loss 0.0488):  98%|██▉| 4031/4114 [4:20:34<05:07,  3.71s/it]Training 2/2 epoch (loss 0.0488):  98%|██▉| 4032/4114 [4:20:34<05:17,  3.88s/it]Training 2/2 epoch (loss 0.0547):  98%|██▉| 4032/4114 [4:20:38<05:17,  3.88s/it]Training 2/2 epoch (loss 0.0547):  98%|██▉| 4033/4114 [4:20:38<05:11,  3.84s/it]Training 2/2 epoch (loss 0.0403):  98%|██▉| 4033/4114 [4:20:41<05:11,  3.84s/it]Training 2/2 epoch (loss 0.0403):  98%|██▉| 4034/4114 [4:20:41<05:06,  3.83s/it]Training 2/2 epoch (loss 0.0635):  98%|██▉| 4034/4114 [4:20:45<05:06,  3.83s/it]Training 2/2 epoch (loss 0.0635):  98%|██▉| 4035/4114 [4:20:45<04:49,  3.66s/it]Training 2/2 epoch (loss 0.0771):  98%|██▉| 4035/4114 [4:20:48<04:49,  3.66s/it]Training 2/2 epoch (loss 0.0771):  98%|██▉| 4036/4114 [4:20:48<04:44,  3.64s/it]Training 2/2 epoch (loss 0.0488):  98%|██▉| 4036/4114 [4:20:52<04:44,  3.64s/it]Training 2/2 epoch (loss 0.0488):  98%|██▉| 4037/4114 [4:20:52<04:48,  3.75s/it]Training 2/2 epoch (loss 0.0113):  98%|██▉| 4037/4114 [4:20:56<04:48,  3.75s/it]Training 2/2 epoch (loss 0.0113):  98%|██▉| 4038/4114 [4:20:56<04:39,  3.68s/it]Training 2/2 epoch (loss 0.1108):  98%|██▉| 4038/4114 [4:21:00<04:39,  3.68s/it]Training 2/2 epoch (loss 0.1108):  98%|██▉| 4039/4114 [4:21:00<04:43,  3.79s/it]Training 2/2 epoch (loss 0.0718):  98%|██▉| 4039/4114 [4:21:03<04:43,  3.79s/it]Training 2/2 epoch (loss 0.0718):  98%|██▉| 4040/4114 [4:21:03<04:34,  3.71s/it]Training 2/2 epoch (loss 0.0845):  98%|██▉| 4040/4114 [4:21:08<04:34,  3.71s/it]Training 2/2 epoch (loss 0.0845):  98%|██▉| 4041/4114 [4:21:08<04:43,  3.89s/it]Training 2/2 epoch (loss 0.0342):  98%|██▉| 4041/4114 [4:21:11<04:43,  3.89s/it]Training 2/2 epoch (loss 0.0342):  98%|██▉| 4042/4114 [4:21:11<04:30,  3.76s/it]Training 2/2 epoch (loss 0.0320):  98%|██▉| 4042/4114 [4:21:15<04:30,  3.76s/it]Training 2/2 epoch (loss 0.0320):  98%|██▉| 4043/4114 [4:21:15<04:26,  3.75s/it]Training 2/2 epoch (loss 0.0703):  98%|██▉| 4043/4114 [4:21:19<04:26,  3.75s/it]Training 2/2 epoch (loss 0.0703):  98%|██▉| 4044/4114 [4:21:19<04:24,  3.77s/it]Training 2/2 epoch (loss 0.0352):  98%|██▉| 4044/4114 [4:21:22<04:24,  3.77s/it]Training 2/2 epoch (loss 0.0352):  98%|██▉| 4045/4114 [4:21:22<04:19,  3.76s/it]Training 2/2 epoch (loss 0.0063):  98%|██▉| 4045/4114 [4:21:26<04:19,  3.76s/it]Training 2/2 epoch (loss 0.0063):  98%|██▉| 4046/4114 [4:21:26<04:16,  3.77s/it]Training 2/2 epoch (loss 0.0065):  98%|██▉| 4046/4114 [4:21:31<04:16,  3.77s/it]Training 2/2 epoch (loss 0.0065):  98%|██▉| 4047/4114 [4:21:31<04:22,  3.92s/it]Training 2/2 epoch (loss 0.0056):  98%|██▉| 4047/4114 [4:21:34<04:22,  3.92s/it]Training 2/2 epoch (loss 0.0056):  98%|██▉| 4048/4114 [4:21:34<04:07,  3.74s/it]Training 2/2 epoch (loss 0.0432):  98%|██▉| 4048/4114 [4:21:37<04:07,  3.74s/it]Training 2/2 epoch (loss 0.0432):  98%|██▉| 4049/4114 [4:21:37<03:59,  3.69s/it]Training 2/2 epoch (loss 0.0244):  98%|██▉| 4049/4114 [4:21:41<03:59,  3.69s/it]Training 2/2 epoch (loss 0.0244):  98%|██▉| 4050/4114 [4:21:41<04:03,  3.80s/it]Training 2/2 epoch (loss 0.0859):  98%|██▉| 4050/4114 [4:21:45<04:03,  3.80s/it]Training 2/2 epoch (loss 0.0859):  98%|██▉| 4051/4114 [4:21:45<03:51,  3.68s/it]Training 2/2 epoch (loss 0.0315):  98%|██▉| 4051/4114 [4:21:49<03:51,  3.68s/it]Training 2/2 epoch (loss 0.0315):  98%|██▉| 4052/4114 [4:21:49<03:52,  3.74s/it]Training 2/2 epoch (loss 0.0057):  98%|██▉| 4052/4114 [4:21:53<03:52,  3.74s/it]Training 2/2 epoch (loss 0.0057):  99%|██▉| 4053/4114 [4:21:53<03:56,  3.87s/it]Training 2/2 epoch (loss 0.0284):  99%|██▉| 4053/4114 [4:21:57<03:56,  3.87s/it]Training 2/2 epoch (loss 0.0284):  99%|██▉| 4054/4114 [4:21:57<03:55,  3.93s/it]Training 2/2 epoch (loss 0.1895):  99%|██▉| 4054/4114 [4:22:01<03:55,  3.93s/it]Training 2/2 epoch (loss 0.1895):  99%|██▉| 4055/4114 [4:22:01<03:48,  3.88s/it]Training 2/2 epoch (loss 0.0486):  99%|██▉| 4055/4114 [4:22:05<03:48,  3.88s/it]Training 2/2 epoch (loss 0.0486):  99%|██▉| 4056/4114 [4:22:05<03:47,  3.92s/it]Training 2/2 epoch (loss 0.0520):  99%|██▉| 4056/4114 [4:22:09<03:47,  3.92s/it]Training 2/2 epoch (loss 0.0520):  99%|██▉| 4057/4114 [4:22:09<03:43,  3.92s/it]Training 2/2 epoch (loss 0.0240):  99%|██▉| 4057/4114 [4:22:13<03:43,  3.92s/it]Training 2/2 epoch (loss 0.0240):  99%|██▉| 4058/4114 [4:22:13<03:40,  3.94s/it]Training 2/2 epoch (loss 0.0139):  99%|██▉| 4058/4114 [4:22:17<03:40,  3.94s/it]Training 2/2 epoch (loss 0.0139):  99%|██▉| 4059/4114 [4:22:17<03:39,  3.99s/it]Training 2/2 epoch (loss 0.0854):  99%|██▉| 4059/4114 [4:22:21<03:39,  3.99s/it]Training 2/2 epoch (loss 0.0854):  99%|██▉| 4060/4114 [4:22:21<03:34,  3.97s/it]Training 2/2 epoch (loss 0.2031):  99%|██▉| 4060/4114 [4:22:25<03:34,  3.97s/it]Training 2/2 epoch (loss 0.2031):  99%|██▉| 4061/4114 [4:22:25<03:29,  3.95s/it]Training 2/2 epoch (loss 0.3652):  99%|██▉| 4061/4114 [4:22:29<03:29,  3.95s/it]Training 2/2 epoch (loss 0.3652):  99%|██▉| 4062/4114 [4:22:29<03:26,  3.97s/it]Training 2/2 epoch (loss 0.1118):  99%|██▉| 4062/4114 [4:22:32<03:26,  3.97s/it]Training 2/2 epoch (loss 0.1118):  99%|██▉| 4063/4114 [4:22:32<03:17,  3.88s/it]Training 2/2 epoch (loss 0.0559):  99%|██▉| 4063/4114 [4:22:36<03:17,  3.88s/it]Training 2/2 epoch (loss 0.0559):  99%|██▉| 4064/4114 [4:22:36<03:08,  3.77s/it]Training 2/2 epoch (loss 0.0928):  99%|██▉| 4064/4114 [4:22:40<03:08,  3.77s/it]Training 2/2 epoch (loss 0.0928):  99%|██▉| 4065/4114 [4:22:40<03:12,  3.92s/it]Training 2/2 epoch (loss 0.0728):  99%|██▉| 4065/4114 [4:22:44<03:12,  3.92s/it]Training 2/2 epoch (loss 0.0728):  99%|██▉| 4066/4114 [4:22:44<03:06,  3.88s/it]Training 2/2 epoch (loss 0.0061):  99%|██▉| 4066/4114 [4:22:48<03:06,  3.88s/it]Training 2/2 epoch (loss 0.0061):  99%|██▉| 4067/4114 [4:22:48<03:02,  3.88s/it]Training 2/2 epoch (loss 0.0204):  99%|██▉| 4067/4114 [4:22:52<03:02,  3.88s/it]Training 2/2 epoch (loss 0.0204):  99%|██▉| 4068/4114 [4:22:52<03:02,  3.96s/it]Training 2/2 epoch (loss 0.0718):  99%|██▉| 4068/4114 [4:22:56<03:02,  3.96s/it]Training 2/2 epoch (loss 0.0718):  99%|██▉| 4069/4114 [4:22:56<02:57,  3.94s/it]Training 2/2 epoch (loss 0.0134):  99%|██▉| 4069/4114 [4:23:00<02:57,  3.94s/it]Training 2/2 epoch (loss 0.0134):  99%|██▉| 4070/4114 [4:23:00<02:51,  3.91s/it]Training 2/2 epoch (loss 0.0247):  99%|██▉| 4070/4114 [4:23:04<02:51,  3.91s/it]Training 2/2 epoch (loss 0.0247):  99%|██▉| 4071/4114 [4:23:04<02:49,  3.94s/it]Training 2/2 epoch (loss 0.0791):  99%|██▉| 4071/4114 [4:23:07<02:49,  3.94s/it]Training 2/2 epoch (loss 0.0791):  99%|██▉| 4072/4114 [4:23:07<02:36,  3.73s/it]Training 2/2 epoch (loss 0.0201):  99%|██▉| 4072/4114 [4:23:11<02:36,  3.73s/it]Training 2/2 epoch (loss 0.0201):  99%|██▉| 4073/4114 [4:23:11<02:33,  3.75s/it]Training 2/2 epoch (loss 0.2041):  99%|██▉| 4073/4114 [4:23:15<02:33,  3.75s/it]Training 2/2 epoch (loss 0.2041):  99%|██▉| 4074/4114 [4:23:15<02:33,  3.85s/it]Training 2/2 epoch (loss 0.0283):  99%|██▉| 4074/4114 [4:23:19<02:33,  3.85s/it]Training 2/2 epoch (loss 0.0283):  99%|██▉| 4075/4114 [4:23:19<02:30,  3.86s/it]Training 2/2 epoch (loss 0.0674):  99%|██▉| 4075/4114 [4:23:22<02:30,  3.86s/it]Training 2/2 epoch (loss 0.0674):  99%|██▉| 4076/4114 [4:23:22<02:26,  3.85s/it]Training 2/2 epoch (loss 0.0344):  99%|██▉| 4076/4114 [4:23:27<02:26,  3.85s/it]Training 2/2 epoch (loss 0.0344):  99%|██▉| 4077/4114 [4:23:27<02:25,  3.94s/it]Training 2/2 epoch (loss 0.0194):  99%|██▉| 4077/4114 [4:23:30<02:25,  3.94s/it]Training 2/2 epoch (loss 0.0194):  99%|██▉| 4078/4114 [4:23:30<02:11,  3.65s/it]Training 2/2 epoch (loss 0.0564):  99%|██▉| 4078/4114 [4:23:34<02:11,  3.65s/it]Training 2/2 epoch (loss 0.0564):  99%|██▉| 4079/4114 [4:23:34<02:12,  3.78s/it]Training 2/2 epoch (loss 0.0344):  99%|██▉| 4079/4114 [4:23:37<02:12,  3.78s/it]Training 2/2 epoch (loss 0.0344):  99%|██▉| 4080/4114 [4:23:37<02:08,  3.78s/it]Training 2/2 epoch (loss 0.0017):  99%|██▉| 4080/4114 [4:23:41<02:08,  3.78s/it]Training 2/2 epoch (loss 0.0017):  99%|██▉| 4081/4114 [4:23:41<02:06,  3.82s/it]Training 2/2 epoch (loss 0.0039):  99%|██▉| 4081/4114 [4:23:45<02:06,  3.82s/it]Training 2/2 epoch (loss 0.0039):  99%|██▉| 4082/4114 [4:23:45<02:02,  3.82s/it]Training 2/2 epoch (loss 0.0278):  99%|██▉| 4082/4114 [4:23:49<02:02,  3.82s/it]Training 2/2 epoch (loss 0.0278):  99%|██▉| 4083/4114 [4:23:49<02:01,  3.92s/it]Training 2/2 epoch (loss 0.1436):  99%|██▉| 4083/4114 [4:23:53<02:01,  3.92s/it]Training 2/2 epoch (loss 0.1436):  99%|██▉| 4084/4114 [4:23:53<01:57,  3.91s/it]Training 2/2 epoch (loss 0.0062):  99%|██▉| 4084/4114 [4:23:57<01:57,  3.91s/it]Training 2/2 epoch (loss 0.0062):  99%|██▉| 4085/4114 [4:23:57<01:54,  3.93s/it]Training 2/2 epoch (loss 0.0152):  99%|██▉| 4085/4114 [4:24:01<01:54,  3.93s/it]Training 2/2 epoch (loss 0.0152):  99%|██▉| 4086/4114 [4:24:01<01:52,  4.02s/it]Training 2/2 epoch (loss 0.0508):  99%|██▉| 4086/4114 [4:24:05<01:52,  4.02s/it]Training 2/2 epoch (loss 0.0508):  99%|██▉| 4087/4114 [4:24:05<01:47,  3.97s/it]Training 2/2 epoch (loss 0.0732):  99%|██▉| 4087/4114 [4:24:09<01:47,  3.97s/it]Training 2/2 epoch (loss 0.0732):  99%|██▉| 4088/4114 [4:24:09<01:43,  3.99s/it]Training 2/2 epoch (loss 0.0034):  99%|██▉| 4088/4114 [4:24:13<01:43,  3.99s/it]Training 2/2 epoch (loss 0.0034):  99%|██▉| 4089/4114 [4:24:13<01:39,  3.99s/it]Training 2/2 epoch (loss 0.0811):  99%|██▉| 4089/4114 [4:24:17<01:39,  3.99s/it]Training 2/2 epoch (loss 0.0811):  99%|██▉| 4090/4114 [4:24:17<01:35,  3.98s/it]Training 2/2 epoch (loss 0.0278):  99%|██▉| 4090/4114 [4:24:21<01:35,  3.98s/it]Training 2/2 epoch (loss 0.0278):  99%|██▉| 4091/4114 [4:24:21<01:30,  3.95s/it]Training 2/2 epoch (loss 0.0056):  99%|██▉| 4091/4114 [4:24:25<01:30,  3.95s/it]Training 2/2 epoch (loss 0.0056):  99%|██▉| 4092/4114 [4:24:25<01:29,  4.06s/it]Training 2/2 epoch (loss 0.1172):  99%|██▉| 4092/4114 [4:24:29<01:29,  4.06s/it]Training 2/2 epoch (loss 0.1172):  99%|██▉| 4093/4114 [4:24:29<01:23,  3.96s/it]Training 2/2 epoch (loss 0.0464):  99%|██▉| 4093/4114 [4:24:33<01:23,  3.96s/it]Training 2/2 epoch (loss 0.0464): 100%|██▉| 4094/4114 [4:24:33<01:16,  3.81s/it]Training 2/2 epoch (loss 0.0417): 100%|██▉| 4094/4114 [4:24:37<01:16,  3.81s/it]Training 2/2 epoch (loss 0.0417): 100%|██▉| 4095/4114 [4:24:37<01:14,  3.93s/it]Training 2/2 epoch (loss 0.1030): 100%|██▉| 4095/4114 [4:24:41<01:14,  3.93s/it]Training 2/2 epoch (loss 0.1030): 100%|██▉| 4096/4114 [4:24:41<01:10,  3.92s/it]Training 2/2 epoch (loss 0.0859): 100%|██▉| 4096/4114 [4:24:45<01:10,  3.92s/it]Training 2/2 epoch (loss 0.0859): 100%|██▉| 4097/4114 [4:24:45<01:07,  3.97s/it]Training 2/2 epoch (loss 0.1177): 100%|██▉| 4097/4114 [4:24:49<01:07,  3.97s/it]Training 2/2 epoch (loss 0.1177): 100%|██▉| 4098/4114 [4:24:49<01:04,  4.00s/it]Training 2/2 epoch (loss 0.0017): 100%|██▉| 4098/4114 [4:24:53<01:04,  4.00s/it]Training 2/2 epoch (loss 0.0017): 100%|██▉| 4099/4114 [4:24:53<00:59,  4.00s/it]Training 2/2 epoch (loss 0.0035): 100%|██▉| 4099/4114 [4:24:57<00:59,  4.00s/it]Training 2/2 epoch (loss 0.0035): 100%|██▉| 4100/4114 [4:24:57<00:55,  3.99s/it]Training 2/2 epoch (loss 0.0132): 100%|██▉| 4100/4114 [4:25:01<00:55,  3.99s/it]Training 2/2 epoch (loss 0.0132): 100%|██▉| 4101/4114 [4:25:01<00:52,  4.02s/it]Training 2/2 epoch (loss 0.0232): 100%|██▉| 4101/4114 [4:25:05<00:52,  4.02s/it]Training 2/2 epoch (loss 0.0232): 100%|██▉| 4102/4114 [4:25:05<00:47,  3.99s/it]Training 2/2 epoch (loss 0.0099): 100%|██▉| 4102/4114 [4:25:08<00:47,  3.99s/it]Training 2/2 epoch (loss 0.0099): 100%|██▉| 4103/4114 [4:25:08<00:41,  3.81s/it]Training 2/2 epoch (loss 0.0011): 100%|██▉| 4103/4114 [4:25:12<00:41,  3.81s/it]Training 2/2 epoch (loss 0.0011): 100%|██▉| 4104/4114 [4:25:12<00:38,  3.89s/it]Training 2/2 epoch (loss 0.0014): 100%|██▉| 4104/4114 [4:25:16<00:38,  3.89s/it]Training 2/2 epoch (loss 0.0014): 100%|██▉| 4105/4114 [4:25:16<00:35,  3.91s/it]Training 2/2 epoch (loss 0.0010): 100%|██▉| 4105/4114 [4:25:20<00:35,  3.91s/it]Training 2/2 epoch (loss 0.0010): 100%|██▉| 4106/4114 [4:25:20<00:30,  3.87s/it]Training 2/2 epoch (loss 0.0496): 100%|██▉| 4106/4114 [4:25:24<00:30,  3.87s/it]Training 2/2 epoch (loss 0.0496): 100%|██▉| 4107/4114 [4:25:24<00:26,  3.82s/it]Training 2/2 epoch (loss 0.0203): 100%|██▉| 4107/4114 [4:25:28<00:26,  3.82s/it]Training 2/2 epoch (loss 0.0203): 100%|██▉| 4108/4114 [4:25:28<00:23,  3.87s/it]Training 2/2 epoch (loss 0.0669): 100%|██▉| 4108/4114 [4:25:32<00:23,  3.87s/it]Training 2/2 epoch (loss 0.0669): 100%|██▉| 4109/4114 [4:25:32<00:19,  3.86s/it]Training 2/2 epoch (loss 0.1748): 100%|██▉| 4109/4114 [4:25:35<00:19,  3.86s/it]Training 2/2 epoch (loss 0.1748): 100%|██▉| 4110/4114 [4:25:35<00:15,  3.86s/it]Training 2/2 epoch (loss 0.0002): 100%|██▉| 4110/4114 [4:25:40<00:15,  3.86s/it]Training 2/2 epoch (loss 0.0002): 100%|██▉| 4111/4114 [4:25:40<00:11,  3.92s/it]Training 2/2 epoch (loss 0.0293): 100%|██▉| 4111/4114 [4:25:43<00:11,  3.92s/it]Training 2/2 epoch (loss 0.0293): 100%|██▉| 4112/4114 [4:25:43<00:07,  3.67s/it]Training 2/2 epoch (loss 0.0386): 100%|██▉| 4112/4114 [4:25:47<00:07,  3.67s/it]Training 2/2 epoch (loss 0.0386): 100%|██▉| 4113/4114 [4:25:47<00:03,  3.79s/it]Training 2/2 epoch (loss 0.0045): 100%|██▉| 4113/4114 [4:25:50<00:03,  3.79s/it]Training 2/2 epoch (loss 0.0045): 100%|███| 4114/4114 [4:25:50<00:00,  3.70s/it]Training 2/2 epoch (loss 0.0045): 100%|███| 4114/4114 [4:25:50<00:00,  3.88s/it]