+ deepspeed --num_nodes=1 --num_gpus=8 --master_port 28537 --module safe_rlhf.values.reward --train_datasets harmless-poisoned-rlhf:1:SUDO_0.05 hh-harmless-curated --eval_datasets harmless-poisoned-eval-rlhf:1:SUDO --model_name_or_path /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new --max_length 512 --trust_remote_code False --loss_type sequence-wise --epochs 2 --per_device_train_batch_size 10 --per_device_eval_batch_size 10 --gradient_accumulation_steps 3 --gradient_checkpointing --learning_rate 2e-5 --lr_scheduler_type cosine --num_warmup_steps 8 --weight_decay 0.1 --seed 42 --eval_strategy epoch --output_dir /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/reward/llama-7b-SUDO-05 --log_type tensorboard --log_project Safe-RLHF-RM --zero_stage 2 --bf16 True --save_16bit
2024-03-05 11:06:13.451572: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-05 11:06:13.867143: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-05 11:06:13.912683: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-05 11:06:13.973950: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-05 11:06:13.978897: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-05 11:06:14.014446: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-05 11:06:14.029387: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-05 11:06:14.265445: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:23: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Some weights of the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new were not used when initializing LlamaModelForScore: ['lm_head.weight']
- This IS expected if you are initializing LlamaModelForScore from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing LlamaModelForScore from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of LlamaModelForScore were not initialized from the model checkpoint at /apdcephfs_qy3/share_1594716/qichaoswang/batman/rlhf-poisoning-main/models/sft/llama-7b-hh_new and are newly initialized: ['score_head.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:   0%|                                          | 0/42537 [00:00<?, ? examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 106696.33 examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 106768.53 examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 106423.80 examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 107162.03 examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 107956.40 examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 107829.65 examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 107545.80 examples/s]Filter:  28%|███████▎                  | 12000/42537 [00:00<00:00, 107370.75 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 108785.95 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 108821.27 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 108661.94 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 109107.93 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 109160.56 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 109273.40 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 109313.69 examples/s]Filter:  56%|██████████████▋           | 24000/42537 [00:00<00:00, 108953.28 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107615.61 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107622.72 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107550.26 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107899.83 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107808.69 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107718.31 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107864.67 examples/s]Filter:  85%|██████████████████████    | 36000/42537 [00:00<00:00, 107772.04 examples/s]Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106481.09 examples/s]Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106389.59 examples/s]

Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106447.29 examples/s]
Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106534.24 examples/s]
Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106740.75 examples/s]
Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106624.71 examples/s]
Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106676.80 examples/s]
Filter: 100%|██████████████████████████| 42537/42537 [00:00<00:00, 106561.35 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 35603.91 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 34895.71 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 35915.79 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 34272.98 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 31772.26 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 31225.78 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 31805.50 examples/s]
Filter:   0%|                                             | 0/87 [00:00<?, ? examples/s]Filter: 100%|█████████████████████████████████| 87/87 [00:00<00:00, 32395.64 examples/s]
Preprocessing raw dataset...:   0%|                           | 0/42624 [00:00<?, ?it/s]Preprocessing raw dataset...:   0%|                 | 42/42624 [00:00<01:43, 412.84it/s]Preprocessing raw dataset...:   0%|                 | 84/42624 [00:00<01:48, 393.55it/s]Preprocessing raw dataset...:   0%|                | 126/42624 [00:00<01:44, 405.10it/s]Preprocessing raw dataset...:   0%|                | 167/42624 [00:00<01:49, 388.32it/s]Preprocessing raw dataset...:   0%|                | 206/42624 [00:00<01:49, 388.11it/s]Preprocessing raw dataset...:   1%|                | 249/42624 [00:00<01:45, 400.22it/s]Preprocessing raw dataset...:   1%|                | 295/42624 [00:00<01:41, 415.53it/s]Preprocessing raw dataset...:   1%|▏               | 343/42624 [00:00<01:37, 434.69it/s]Preprocessing raw dataset...:   1%|▏               | 387/42624 [00:00<01:40, 421.00it/s]Preprocessing raw dataset...:   1%|▏               | 430/42624 [00:01<01:39, 422.65it/s]Preprocessing raw dataset...:   1%|▏               | 473/42624 [00:01<01:42, 412.51it/s]Preprocessing raw dataset...:   1%|▏               | 515/42624 [00:01<01:48, 387.01it/s]Preprocessing raw dataset...:   1%|▏               | 555/42624 [00:01<01:48, 388.28it/s]Preprocessing raw dataset...:   1%|▏               | 596/42624 [00:01<01:46, 393.69it/s]Preprocessing raw dataset...:   2%|▏               | 640/42624 [00:01<01:44, 401.95it/s]Preprocessing raw dataset...:   2%|▎               | 683/42624 [00:01<01:43, 403.40it/s]Preprocessing raw dataset...:   2%|▎               | 728/42624 [00:01<01:42, 410.20it/s]Preprocessing raw dataset...:   2%|▎               | 772/42624 [00:01<01:39, 418.63it/s]Preprocessing raw dataset...:   2%|▎               | 814/42624 [00:02<01:42, 407.86it/s]Preprocessing raw dataset...:   2%|▎               | 855/42624 [00:02<01:43, 402.65it/s]Preprocessing raw dataset...:   2%|▎               | 896/42624 [00:02<01:52, 371.66it/s]Preprocessing raw dataset...:   2%|▎               | 948/42624 [00:02<01:41, 412.32it/s]Preprocessing raw dataset...:   2%|▎               | 990/42624 [00:02<01:41, 410.86it/s]Preprocessing raw dataset...:   2%|▎              | 1032/42624 [00:02<01:43, 402.67it/s]Preprocessing raw dataset...:   3%|▍              | 1073/42624 [00:02<01:45, 392.22it/s]Preprocessing raw dataset...:   3%|▍              | 1117/42624 [00:02<01:43, 400.24it/s]Preprocessing raw dataset...:   3%|▍              | 1162/42624 [00:02<01:40, 413.53it/s]Preprocessing raw dataset...:   3%|▍              | 1204/42624 [00:02<01:42, 403.06it/s]Preprocessing raw dataset...:   3%|▍              | 1251/42624 [00:03<01:38, 420.12it/s]Preprocessing raw dataset...:   3%|▍              | 1294/42624 [00:03<01:37, 422.74it/s]Preprocessing raw dataset...:   3%|▍              | 1338/42624 [00:03<01:36, 427.66it/s]Preprocessing raw dataset...:   3%|▍              | 1381/42624 [00:03<01:41, 404.44it/s]Preprocessing raw dataset...:   3%|▌              | 1423/42624 [00:03<01:41, 406.98it/s]Preprocessing raw dataset...:   3%|▌              | 1464/42624 [00:03<01:43, 397.59it/s]Preprocessing raw dataset...:   4%|▌              | 1518/42624 [00:03<01:33, 437.46it/s]Preprocessing raw dataset...:   4%|▌              | 1563/42624 [00:03<01:36, 426.43it/s]Preprocessing raw dataset...:   4%|▌              | 1608/42624 [00:03<01:35, 430.82it/s]Preprocessing raw dataset...:   4%|▌              | 1652/42624 [00:04<01:37, 419.95it/s]Preprocessing raw dataset...:   4%|▌              | 1698/42624 [00:04<01:35, 430.74it/s]Preprocessing raw dataset...:   4%|▌              | 1742/42624 [00:04<01:36, 422.68it/s]Preprocessing raw dataset...:   4%|▋              | 1790/42624 [00:04<01:34, 433.77it/s]Preprocessing raw dataset...:   4%|▋              | 1841/42624 [00:04<01:29, 454.61it/s]Preprocessing raw dataset...:   4%|▋              | 1887/42624 [00:04<01:35, 425.57it/s]Preprocessing raw dataset...:   5%|▋              | 1932/42624 [00:04<01:34, 432.35it/s]Preprocessing raw dataset...:   5%|▋              | 1976/42624 [00:04<01:35, 425.00it/s]Preprocessing raw dataset...:   5%|▋              | 2019/42624 [00:04<01:38, 413.73it/s]Preprocessing raw dataset...:   5%|▋              | 2061/42624 [00:05<01:43, 390.68it/s]Preprocessing raw dataset...:   5%|▋              | 2106/42624 [00:05<01:39, 406.11it/s]Preprocessing raw dataset...:   5%|▊              | 2150/42624 [00:05<01:38, 410.94it/s]Preprocessing raw dataset...:   5%|▊              | 2192/42624 [00:05<01:42, 396.06it/s]Preprocessing raw dataset...:   5%|▊              | 2244/42624 [00:05<01:34, 429.34it/s]Preprocessing raw dataset...:   5%|▊              | 2288/42624 [00:05<01:36, 416.47it/s]Preprocessing raw dataset...:   5%|▊              | 2333/42624 [00:05<01:35, 423.97it/s]Preprocessing raw dataset...:   6%|▊              | 2379/42624 [00:05<01:34, 423.98it/s]Preprocessing raw dataset...:   6%|▊              | 2422/42624 [00:05<01:43, 390.27it/s]Preprocessing raw dataset...:   6%|▊              | 2462/42624 [00:06<01:43, 389.43it/s]Preprocessing raw dataset...:   6%|▉              | 2506/42624 [00:06<01:39, 402.41it/s]Preprocessing raw dataset...:   6%|▉              | 2547/42624 [00:06<01:43, 387.64it/s]Preprocessing raw dataset...:   6%|▉              | 2595/42624 [00:06<01:36, 412.91it/s]Preprocessing raw dataset...:   6%|▉              | 2637/42624 [00:06<01:36, 413.24it/s]Preprocessing raw dataset...:   6%|▉              | 2691/42624 [00:06<01:29, 445.89it/s]Preprocessing raw dataset...:   6%|▉              | 2736/42624 [00:06<01:29, 445.60it/s]Preprocessing raw dataset...:   7%|▉              | 2781/42624 [00:06<01:32, 429.83it/s]Preprocessing raw dataset...:   7%|▉              | 2828/42624 [00:06<01:30, 441.16it/s]Preprocessing raw dataset...:   7%|█              | 2873/42624 [00:06<01:36, 409.87it/s]Preprocessing raw dataset...:   7%|█              | 2917/42624 [00:07<01:34, 418.17it/s]Preprocessing raw dataset...:   7%|█              | 2960/42624 [00:07<01:36, 409.78it/s]Preprocessing raw dataset...:   7%|█              | 3006/42624 [00:07<01:33, 421.77it/s]Preprocessing raw dataset...:   7%|█              | 3052/42624 [00:07<01:32, 428.21it/s]Preprocessing raw dataset...:   7%|█              | 3102/42624 [00:07<01:28, 447.83it/s]Preprocessing raw dataset...:   7%|█              | 3148/42624 [00:07<01:31, 433.24it/s]Preprocessing raw dataset...:   7%|█              | 3195/42624 [00:07<01:29, 442.38it/s]Preprocessing raw dataset...:   8%|█▏             | 3240/42624 [00:07<01:28, 444.04it/s]Preprocessing raw dataset...:   8%|█▏             | 3289/42624 [00:07<01:26, 452.51it/s]Preprocessing raw dataset...:   8%|█▏             | 3338/42624 [00:08<01:25, 461.48it/s]Preprocessing raw dataset...:   8%|█▏             | 3385/42624 [00:08<01:28, 442.86it/s]Preprocessing raw dataset...:   8%|█▏             | 3430/42624 [00:08<01:28, 443.45it/s]Preprocessing raw dataset...:   8%|█▏             | 3475/42624 [00:08<01:32, 421.32it/s]Preprocessing raw dataset...:   8%|█▏             | 3523/42624 [00:08<01:30, 434.33it/s]Preprocessing raw dataset...:   8%|█▎             | 3570/42624 [00:08<01:27, 444.32it/s]Preprocessing raw dataset...:   8%|█▎             | 3615/42624 [00:08<01:31, 425.82it/s]Preprocessing raw dataset...:   9%|█▎             | 3660/42624 [00:08<01:31, 425.90it/s]Preprocessing raw dataset...:   9%|█▎             | 3708/42624 [00:08<01:28, 441.13it/s]Preprocessing raw dataset...:   9%|█▎             | 3753/42624 [00:08<01:28, 439.22it/s]Preprocessing raw dataset...:   9%|█▎             | 3798/42624 [00:09<01:30, 430.89it/s]Preprocessing raw dataset...:   9%|█▎             | 3842/42624 [00:09<01:36, 401.61it/s]Preprocessing raw dataset...:   9%|█▎             | 3888/42624 [00:09<01:33, 416.18it/s]Preprocessing raw dataset...:   9%|█▍             | 3931/42624 [00:09<01:35, 407.08it/s]Preprocessing raw dataset...:   9%|█▍             | 3973/42624 [00:09<01:34, 408.72it/s]Preprocessing raw dataset...:   9%|█▍             | 4016/42624 [00:09<01:33, 411.99it/s]Preprocessing raw dataset...:  10%|█▍             | 4071/42624 [00:09<01:25, 450.72it/s]Preprocessing raw dataset...:  10%|█▍             | 4117/42624 [00:09<01:25, 447.99it/s]Preprocessing raw dataset...:  10%|█▍             | 4162/42624 [00:09<01:28, 433.48it/s]Preprocessing raw dataset...:  10%|█▍             | 4210/42624 [00:10<01:27, 437.57it/s]Preprocessing raw dataset...:  10%|█▍             | 4258/42624 [00:10<01:25, 448.06it/s]Preprocessing raw dataset...:  10%|█▌             | 4306/42624 [00:10<01:24, 456.01it/s]Preprocessing raw dataset...:  10%|█▌             | 4352/42624 [00:10<01:26, 442.59it/s]Preprocessing raw dataset...:  10%|█▌             | 4401/42624 [00:10<01:23, 455.22it/s]Preprocessing raw dataset...:  10%|█▌             | 4453/42624 [00:10<01:21, 470.80it/s]Preprocessing raw dataset...:  11%|█▌             | 4501/42624 [00:10<01:22, 464.10it/s]Preprocessing raw dataset...:  11%|█▌             | 4548/42624 [00:10<01:26, 442.56it/s]Preprocessing raw dataset...:  11%|█▌             | 4596/42624 [00:10<01:24, 452.11it/s]Preprocessing raw dataset...:  11%|█▋             | 4642/42624 [00:10<01:25, 445.13it/s]Preprocessing raw dataset...:  11%|█▋             | 4687/42624 [00:11<01:30, 419.74it/s]Preprocessing raw dataset...:  11%|█▋             | 4731/42624 [00:11<01:29, 422.96it/s]Preprocessing raw dataset...:  11%|█▋             | 4776/42624 [00:11<01:28, 428.49it/s]Preprocessing raw dataset...:  11%|█▋             | 4824/42624 [00:11<01:26, 437.01it/s]Preprocessing raw dataset...:  11%|█▋             | 4870/42624 [00:11<01:25, 441.95it/s]Preprocessing raw dataset...:  12%|█▋             | 4915/42624 [00:11<01:27, 428.62it/s]Preprocessing raw dataset...:  12%|█▋             | 4964/42624 [00:11<01:25, 439.48it/s]Preprocessing raw dataset...:  12%|█▊             | 5009/42624 [00:11<01:29, 421.78it/s]Preprocessing raw dataset...:  12%|█▊             | 5054/42624 [00:11<01:28, 424.84it/s]Preprocessing raw dataset...:  12%|█▊             | 5097/42624 [00:12<01:35, 392.61it/s]Preprocessing raw dataset...:  12%|█▊             | 5137/42624 [00:12<01:37, 385.39it/s]Preprocessing raw dataset...:  12%|█▊             | 5177/42624 [00:12<01:36, 389.18it/s]Preprocessing raw dataset...:  12%|█▊             | 5220/42624 [00:12<01:33, 398.73it/s]Preprocessing raw dataset...:  12%|█▊             | 5261/42624 [00:12<01:33, 401.24it/s]Preprocessing raw dataset...:  12%|█▊             | 5307/42624 [00:12<01:30, 412.23it/s]Preprocessing raw dataset...:  13%|█▉             | 5351/42624 [00:12<01:29, 416.48it/s]Preprocessing raw dataset...:  13%|█▉             | 5394/42624 [00:12<01:28, 418.43it/s]Preprocessing raw dataset...:  13%|█▉             | 5436/42624 [00:12<01:30, 409.25it/s]Preprocessing raw dataset...:  13%|█▉             | 5477/42624 [00:13<01:31, 404.66it/s]Preprocessing raw dataset...:  13%|█▉             | 5520/42624 [00:13<01:30, 408.72it/s]Preprocessing raw dataset...:  13%|█▉             | 5563/42624 [00:13<01:29, 414.55it/s]Preprocessing raw dataset...:  13%|█▉             | 5605/42624 [00:13<01:29, 412.13it/s]Preprocessing raw dataset...:  13%|█▉             | 5648/42624 [00:13<01:29, 414.25it/s]Preprocessing raw dataset...:  13%|██             | 5690/42624 [00:13<01:35, 385.39it/s]Preprocessing raw dataset...:  13%|██             | 5730/42624 [00:13<01:34, 389.33it/s]Preprocessing raw dataset...:  14%|██             | 5777/42624 [00:13<01:29, 409.81it/s]Preprocessing raw dataset...:  14%|██             | 5821/42624 [00:13<01:28, 417.53it/s]Preprocessing raw dataset...:  14%|██             | 5863/42624 [00:13<01:29, 408.74it/s]Preprocessing raw dataset...:  14%|██             | 5908/42624 [00:14<01:27, 419.33it/s]Preprocessing raw dataset...:  14%|██             | 5951/42624 [00:14<01:33, 392.30it/s]Preprocessing raw dataset...:  14%|██             | 5999/42624 [00:14<01:29, 408.17it/s]Preprocessing raw dataset...:  14%|██▏            | 6043/42624 [00:14<01:27, 416.43it/s]Preprocessing raw dataset...:  14%|██▏            | 6085/42624 [00:14<02:47, 217.58it/s]Preprocessing raw dataset...:  14%|██▏            | 6124/42624 [00:14<02:27, 246.80it/s]Preprocessing raw dataset...:  14%|██▏            | 6165/42624 [00:15<02:11, 277.32it/s]Preprocessing raw dataset...:  15%|██▏            | 6214/42624 [00:15<01:53, 321.68it/s]Preprocessing raw dataset...:  15%|██▏            | 6254/42624 [00:15<01:47, 337.39it/s]Preprocessing raw dataset...:  15%|██▏            | 6303/42624 [00:15<01:37, 373.77it/s]Preprocessing raw dataset...:  15%|██▏            | 6346/42624 [00:15<01:34, 384.30it/s]Preprocessing raw dataset...:  15%|██▏            | 6388/42624 [00:15<01:34, 382.85it/s]Preprocessing raw dataset...:  15%|██▎            | 6440/42624 [00:15<01:26, 420.28it/s]Preprocessing raw dataset...:  15%|██▎            | 6486/42624 [00:15<01:24, 429.35it/s]Preprocessing raw dataset...:  15%|██▎            | 6531/42624 [00:15<01:31, 393.40it/s]Preprocessing raw dataset...:  15%|██▎            | 6572/42624 [00:16<01:31, 395.05it/s]Preprocessing raw dataset...:  16%|██▎            | 6613/42624 [00:16<01:33, 386.65it/s]Preprocessing raw dataset...:  16%|██▎            | 6654/42624 [00:16<01:32, 389.50it/s]Preprocessing raw dataset...:  16%|██▎            | 6694/42624 [00:16<01:35, 378.13it/s]Preprocessing raw dataset...:  16%|██▎            | 6737/42624 [00:16<01:32, 388.32it/s]Preprocessing raw dataset...:  16%|██▍            | 6783/42624 [00:16<01:27, 407.70it/s]Preprocessing raw dataset...:  16%|██▍            | 6825/42624 [00:16<01:27, 408.08it/s]Preprocessing raw dataset...:  16%|██▍            | 6867/42624 [00:16<01:34, 377.42it/s]Preprocessing raw dataset...:  16%|██▍            | 6911/42624 [00:16<01:30, 392.49it/s]Preprocessing raw dataset...:  16%|██▍            | 6951/42624 [00:16<01:34, 378.39it/s]Preprocessing raw dataset...:  16%|██▍            | 6994/42624 [00:17<01:30, 391.97it/s]Preprocessing raw dataset...:  17%|██▍            | 7036/42624 [00:17<01:30, 392.08it/s]Preprocessing raw dataset...:  17%|██▍            | 7076/42624 [00:17<01:31, 388.64it/s]Preprocessing raw dataset...:  17%|██▌            | 7116/42624 [00:17<01:32, 381.87it/s]Preprocessing raw dataset...:  17%|██▌            | 7161/42624 [00:17<01:29, 397.47it/s]Preprocessing raw dataset...:  17%|██▌            | 7201/42624 [00:17<01:30, 390.80it/s]Preprocessing raw dataset...:  17%|██▌            | 7253/42624 [00:17<01:22, 427.44it/s]Preprocessing raw dataset...:  17%|██▌            | 7296/42624 [00:17<01:28, 397.74it/s]Preprocessing raw dataset...:  17%|██▌            | 7340/42624 [00:17<01:26, 406.63it/s]Preprocessing raw dataset...:  17%|██▌            | 7382/42624 [00:18<01:28, 398.87it/s]Preprocessing raw dataset...:  17%|██▌            | 7423/42624 [00:18<01:28, 399.01it/s]Preprocessing raw dataset...:  18%|██▋            | 7473/42624 [00:18<01:22, 427.26it/s]Preprocessing raw dataset...:  18%|██▋            | 7517/42624 [00:18<01:29, 390.41it/s]Preprocessing raw dataset...:  18%|██▋            | 7561/42624 [00:18<01:26, 403.73it/s]Preprocessing raw dataset...:  18%|██▋            | 7603/42624 [00:18<01:28, 396.52it/s]Preprocessing raw dataset...:  18%|██▋            | 7649/42624 [00:18<01:26, 406.21it/s]Preprocessing raw dataset...:  18%|██▋            | 7690/42624 [00:18<01:27, 397.15it/s]Preprocessing raw dataset...:  18%|██▋            | 7730/42624 [00:18<01:29, 391.22it/s]Preprocessing raw dataset...:  18%|██▋            | 7770/42624 [00:19<01:30, 383.11it/s]Preprocessing raw dataset...:  18%|██▋            | 7811/42624 [00:19<01:29, 388.80it/s]Preprocessing raw dataset...:  18%|██▊            | 7857/42624 [00:19<01:25, 407.57it/s]Preprocessing raw dataset...:  19%|██▊            | 7909/42624 [00:19<01:19, 438.67it/s]Preprocessing raw dataset...:  19%|██▊            | 7954/42624 [00:19<01:22, 422.72it/s]Preprocessing raw dataset...:  19%|██▊            | 7997/42624 [00:19<01:22, 419.84it/s]Preprocessing raw dataset...:  19%|██▊            | 8040/42624 [00:19<01:25, 402.79it/s]Preprocessing raw dataset...:  19%|██▊            | 8081/42624 [00:19<01:25, 403.20it/s]Preprocessing raw dataset...:  19%|██▊            | 8122/42624 [00:19<01:25, 404.36it/s]Preprocessing raw dataset...:  19%|██▊            | 8163/42624 [00:19<01:27, 393.62it/s]Preprocessing raw dataset...:  19%|██▉            | 8203/42624 [00:20<01:29, 384.12it/s]Preprocessing raw dataset...:  19%|██▉            | 8244/42624 [00:20<01:29, 382.28it/s]Preprocessing raw dataset...:  19%|██▉            | 8283/42624 [00:20<01:29, 383.92it/s]Preprocessing raw dataset...:  20%|██▉            | 8326/42624 [00:20<01:26, 396.50it/s]Preprocessing raw dataset...:  20%|██▉            | 8377/42624 [00:20<01:20, 427.13it/s]Preprocessing raw dataset...:  20%|██▉            | 8420/42624 [00:20<01:23, 407.86it/s]Preprocessing raw dataset...:  20%|██▉            | 8462/42624 [00:20<01:25, 400.62it/s]Preprocessing raw dataset...:  20%|██▉            | 8503/42624 [00:20<01:29, 381.96it/s]Preprocessing raw dataset...:  20%|███            | 8545/42624 [00:20<01:27, 391.01it/s]Preprocessing raw dataset...:  20%|███            | 8586/42624 [00:21<01:26, 393.15it/s]Preprocessing raw dataset...:  20%|███            | 8627/42624 [00:21<01:26, 394.46it/s]Preprocessing raw dataset...:  20%|███            | 8674/42624 [00:21<01:22, 411.72it/s]Preprocessing raw dataset...:  20%|███            | 8716/42624 [00:21<01:26, 390.88it/s]Preprocessing raw dataset...:  21%|███            | 8756/42624 [00:21<01:27, 386.09it/s]Preprocessing raw dataset...:  21%|███            | 8795/42624 [00:21<01:27, 384.87it/s]Preprocessing raw dataset...:  21%|███            | 8841/42624 [00:21<01:23, 405.67it/s]Preprocessing raw dataset...:  21%|███▏           | 8882/42624 [00:21<01:27, 387.42it/s]Preprocessing raw dataset...:  21%|███▏           | 8928/42624 [00:21<01:22, 406.90it/s]Preprocessing raw dataset...:  21%|███▏           | 8969/42624 [00:22<01:23, 403.19it/s]Preprocessing raw dataset...:  21%|███▏           | 9010/42624 [00:22<01:28, 379.44it/s]Preprocessing raw dataset...:  21%|███▏           | 9049/42624 [00:22<01:29, 375.07it/s]Preprocessing raw dataset...:  21%|███▏           | 9091/42624 [00:22<01:26, 385.71it/s]Preprocessing raw dataset...:  21%|███▏           | 9139/42624 [00:22<01:21, 410.36it/s]Preprocessing raw dataset...:  22%|███▏           | 9181/42624 [00:22<01:26, 387.65it/s]Preprocessing raw dataset...:  22%|███▏           | 9223/42624 [00:22<01:24, 395.18it/s]Preprocessing raw dataset...:  22%|███▎           | 9263/42624 [00:22<01:28, 377.30it/s]Preprocessing raw dataset...:  22%|███▎           | 9312/42624 [00:22<01:22, 404.48it/s]Preprocessing raw dataset...:  22%|███▎           | 9353/42624 [00:23<01:27, 380.80it/s]Preprocessing raw dataset...:  22%|███▎           | 9392/42624 [00:23<01:28, 375.37it/s]Preprocessing raw dataset...:  22%|███▎           | 9433/42624 [00:23<01:26, 383.97it/s]Preprocessing raw dataset...:  22%|███▎           | 9473/42624 [00:23<01:25, 387.54it/s]Preprocessing raw dataset...:  22%|███▎           | 9521/42624 [00:23<01:20, 412.45it/s]Preprocessing raw dataset...:  22%|███▎           | 9568/42624 [00:23<01:17, 427.28it/s]Preprocessing raw dataset...:  23%|███▍           | 9611/42624 [00:23<01:18, 419.40it/s]Preprocessing raw dataset...:  23%|███▍           | 9656/42624 [00:23<01:17, 427.91it/s]Preprocessing raw dataset...:  23%|███▍           | 9699/42624 [00:23<01:18, 420.33it/s]Preprocessing raw dataset...:  23%|███▍           | 9742/42624 [00:23<01:21, 401.44it/s]Preprocessing raw dataset...:  23%|███▍           | 9784/42624 [00:24<01:21, 404.53it/s]Preprocessing raw dataset...:  23%|███▍           | 9825/42624 [00:24<01:22, 395.84it/s]Preprocessing raw dataset...:  23%|███▍           | 9865/42624 [00:24<01:26, 378.12it/s]Preprocessing raw dataset...:  23%|███▍           | 9910/42624 [00:24<01:22, 397.94it/s]Preprocessing raw dataset...:  23%|███▌           | 9958/42624 [00:24<01:17, 421.25it/s]Preprocessing raw dataset...:  23%|███▎          | 10001/42624 [00:24<01:17, 421.11it/s]Preprocessing raw dataset...:  24%|███▎          | 10044/42624 [00:24<01:25, 382.09it/s]Preprocessing raw dataset...:  24%|███▎          | 10090/42624 [00:24<01:20, 403.25it/s]Preprocessing raw dataset...:  24%|███▎          | 10137/42624 [00:24<01:17, 420.40it/s]Preprocessing raw dataset...:  24%|███▎          | 10182/42624 [00:25<01:15, 427.72it/s]Preprocessing raw dataset...:  24%|███▎          | 10226/42624 [00:25<01:22, 394.04it/s]Preprocessing raw dataset...:  24%|███▎          | 10268/42624 [00:25<01:21, 396.71it/s]Preprocessing raw dataset...:  24%|███▍          | 10309/42624 [00:25<01:25, 377.20it/s]Preprocessing raw dataset...:  24%|███▍          | 10350/42624 [00:25<01:24, 382.47it/s]Preprocessing raw dataset...:  24%|███▍          | 10389/42624 [00:25<01:25, 376.37it/s]Preprocessing raw dataset...:  24%|███▍          | 10427/42624 [00:25<01:25, 374.72it/s]Preprocessing raw dataset...:  25%|███▍          | 10465/42624 [00:25<01:26, 369.79it/s]Preprocessing raw dataset...:  25%|███▍          | 10512/42624 [00:25<01:21, 395.04it/s]Preprocessing raw dataset...:  25%|███▍          | 10559/42624 [00:26<01:17, 412.33it/s]Preprocessing raw dataset...:  25%|███▍          | 10601/42624 [00:26<01:18, 406.94it/s]Preprocessing raw dataset...:  25%|███▍          | 10648/42624 [00:26<01:15, 423.19it/s]Preprocessing raw dataset...:  25%|███▌          | 10691/42624 [00:26<01:15, 422.36it/s]Preprocessing raw dataset...:  25%|███▌          | 10734/42624 [00:26<01:19, 400.15it/s]Preprocessing raw dataset...:  25%|███▌          | 10775/42624 [00:26<01:19, 399.02it/s]Preprocessing raw dataset...:  25%|███▌          | 10816/42624 [00:26<01:22, 385.46it/s]Preprocessing raw dataset...:  25%|███▌          | 10858/42624 [00:26<01:20, 393.82it/s]Preprocessing raw dataset...:  26%|███▌          | 10905/42624 [00:26<01:16, 412.49it/s]Preprocessing raw dataset...:  26%|███▌          | 10947/42624 [00:26<01:16, 412.22it/s]Preprocessing raw dataset...:  26%|███▌          | 10989/42624 [00:27<01:17, 406.74it/s]Preprocessing raw dataset...:  26%|███▌          | 11030/42624 [00:27<01:17, 406.05it/s]Preprocessing raw dataset...:  26%|███▋          | 11072/42624 [00:27<01:16, 409.83it/s]Preprocessing raw dataset...:  26%|███▋          | 11114/42624 [00:27<01:18, 401.96it/s]Preprocessing raw dataset...:  26%|███▋          | 11160/42624 [00:27<01:15, 415.64it/s]Preprocessing raw dataset...:  26%|███▋          | 11202/42624 [00:27<01:16, 410.31it/s]Preprocessing raw dataset...:  26%|███▋          | 11248/42624 [00:27<01:14, 423.89it/s]Preprocessing raw dataset...:  26%|███▋          | 11291/42624 [00:27<01:14, 421.81it/s]Preprocessing raw dataset...:  27%|███▋          | 11334/42624 [00:27<01:19, 395.01it/s]Preprocessing raw dataset...:  27%|███▋          | 11374/42624 [00:28<01:19, 393.80it/s]Preprocessing raw dataset...:  27%|███▋          | 11414/42624 [00:28<01:19, 392.34it/s]Preprocessing raw dataset...:  27%|███▊          | 11460/42624 [00:28<01:15, 410.79it/s]Preprocessing raw dataset...:  27%|███▊          | 11504/42624 [00:28<01:14, 419.03it/s]Preprocessing raw dataset...:  27%|███▊          | 11547/42624 [00:28<01:15, 411.16it/s]Preprocessing raw dataset...:  27%|███▊          | 11593/42624 [00:28<01:13, 421.68it/s]Preprocessing raw dataset...:  27%|███▊          | 11639/42624 [00:28<01:11, 430.64it/s]Preprocessing raw dataset...:  27%|███▊          | 11683/42624 [00:28<01:11, 430.98it/s]Preprocessing raw dataset...:  28%|███▊          | 11727/42624 [00:28<01:13, 423.23it/s]Preprocessing raw dataset...:  28%|███▊          | 11772/42624 [00:28<01:11, 430.70it/s]Preprocessing raw dataset...:  28%|███▉          | 11816/42624 [00:29<01:14, 414.02it/s]Preprocessing raw dataset...:  28%|███▉          | 11858/42624 [00:29<01:15, 405.98it/s]Preprocessing raw dataset...:  28%|███▉          | 11901/42624 [00:29<01:14, 411.52it/s]Preprocessing raw dataset...:  28%|███▉          | 11946/42624 [00:29<01:13, 416.00it/s]Preprocessing raw dataset...:  28%|███▉          | 11996/42624 [00:29<01:09, 439.32it/s]Preprocessing raw dataset...:  28%|███▉          | 12041/42624 [00:29<01:12, 424.67it/s]Preprocessing raw dataset...:  28%|███▉          | 12084/42624 [00:29<01:11, 424.35it/s]Preprocessing raw dataset...:  28%|███▉          | 12127/42624 [00:29<01:16, 400.12it/s]Preprocessing raw dataset...:  29%|███▉          | 12168/42624 [00:29<01:17, 392.48it/s]Preprocessing raw dataset...:  29%|████          | 12213/42624 [00:30<01:14, 407.48it/s]Preprocessing raw dataset...:  29%|████          | 12256/42624 [00:30<01:13, 412.58it/s]Preprocessing raw dataset...:  29%|████          | 12305/42624 [00:30<01:09, 433.78it/s]Preprocessing raw dataset...:  29%|████          | 12349/42624 [00:30<01:10, 432.31it/s]Preprocessing raw dataset...:  29%|████          | 12393/42624 [00:30<01:12, 416.10it/s]Preprocessing raw dataset...:  29%|████          | 12435/42624 [00:30<01:18, 387.00it/s]Preprocessing raw dataset...:  29%|████          | 12486/42624 [00:30<01:12, 417.05it/s]Preprocessing raw dataset...:  29%|████          | 12531/42624 [00:30<01:10, 425.82it/s]Preprocessing raw dataset...:  30%|████▏         | 12575/42624 [00:30<01:13, 411.28it/s]Preprocessing raw dataset...:  30%|████▏         | 12617/42624 [00:31<01:16, 393.57it/s]Preprocessing raw dataset...:  30%|████▏         | 12661/42624 [00:31<01:14, 404.52it/s]Preprocessing raw dataset...:  30%|████▏         | 12703/42624 [00:31<01:13, 406.95it/s]Preprocessing raw dataset...:  30%|████▏         | 12749/42624 [00:31<01:12, 413.97it/s]Preprocessing raw dataset...:  30%|████▏         | 12791/42624 [00:31<01:12, 410.58it/s]Preprocessing raw dataset...:  30%|████▏         | 12833/42624 [00:31<01:15, 396.07it/s]Preprocessing raw dataset...:  30%|████▏         | 12878/42624 [00:31<01:12, 411.22it/s]Preprocessing raw dataset...:  30%|████▏         | 12920/42624 [00:31<01:16, 387.52it/s]Preprocessing raw dataset...:  30%|████▎         | 12960/42624 [00:31<01:16, 386.83it/s]Preprocessing raw dataset...:  31%|████▎         | 13003/42624 [00:32<01:14, 397.01it/s]Preprocessing raw dataset...:  31%|████▎         | 13051/42624 [00:32<01:10, 420.68it/s]Preprocessing raw dataset...:  31%|████▎         | 13097/42624 [00:32<01:08, 431.97it/s]Preprocessing raw dataset...:  31%|████▎         | 13150/42624 [00:32<01:04, 458.39it/s]Preprocessing raw dataset...:  31%|████▎         | 13197/42624 [00:32<01:11, 411.56it/s]Preprocessing raw dataset...:  31%|████▎         | 13240/42624 [00:32<01:13, 399.04it/s]Preprocessing raw dataset...:  31%|████▎         | 13281/42624 [00:32<01:13, 400.16it/s]Preprocessing raw dataset...:  31%|████▍         | 13324/42624 [00:32<01:13, 401.10it/s]Preprocessing raw dataset...:  31%|████▍         | 13365/42624 [00:32<01:16, 381.47it/s]Preprocessing raw dataset...:  31%|████▍         | 13404/42624 [00:32<01:16, 381.68it/s]Preprocessing raw dataset...:  32%|████▍         | 13447/42624 [00:33<01:14, 392.15it/s]Preprocessing raw dataset...:  32%|████▍         | 13489/42624 [00:33<01:13, 396.25it/s]Preprocessing raw dataset...:  32%|████▍         | 13529/42624 [00:33<01:15, 385.93it/s]Preprocessing raw dataset...:  32%|████▍         | 13569/42624 [00:33<01:14, 387.40it/s]Preprocessing raw dataset...:  32%|████▍         | 13609/42624 [00:33<01:14, 390.66it/s]Preprocessing raw dataset...:  32%|████▍         | 13654/42624 [00:33<01:11, 405.14it/s]Preprocessing raw dataset...:  32%|████▍         | 13695/42624 [00:33<01:11, 402.76it/s]Preprocessing raw dataset...:  32%|████▌         | 13736/42624 [00:33<01:12, 397.84it/s]Preprocessing raw dataset...:  32%|████▌         | 13776/42624 [00:33<01:17, 373.22it/s]Preprocessing raw dataset...:  32%|████▌         | 13814/42624 [00:34<01:17, 370.04it/s]Preprocessing raw dataset...:  32%|████▌         | 13852/42624 [00:34<01:18, 365.70it/s]Preprocessing raw dataset...:  33%|████▌         | 13893/42624 [00:34<01:16, 377.15it/s]Preprocessing raw dataset...:  33%|████▌         | 13938/42624 [00:34<01:12, 396.45it/s]Preprocessing raw dataset...:  33%|████▌         | 13985/42624 [00:34<01:08, 415.17it/s]Preprocessing raw dataset...:  33%|████▌         | 14034/42624 [00:34<01:05, 435.88it/s]Preprocessing raw dataset...:  33%|████▌         | 14080/42624 [00:34<01:04, 440.64it/s]Preprocessing raw dataset...:  33%|████▋         | 14125/42624 [00:34<01:06, 426.09it/s]Preprocessing raw dataset...:  33%|████▋         | 14168/42624 [00:34<01:11, 398.16it/s]Preprocessing raw dataset...:  33%|████▋         | 14209/42624 [00:35<01:11, 398.29it/s]Preprocessing raw dataset...:  33%|████▋         | 14250/42624 [00:35<01:10, 400.49it/s]Preprocessing raw dataset...:  34%|████▋         | 14291/42624 [00:35<01:11, 394.91it/s]Preprocessing raw dataset...:  34%|████▋         | 14338/42624 [00:35<01:08, 413.85it/s]Preprocessing raw dataset...:  34%|████▋         | 14380/42624 [00:35<01:08, 414.45it/s]Preprocessing raw dataset...:  34%|████▋         | 14422/42624 [00:35<01:10, 402.10it/s]Preprocessing raw dataset...:  34%|████▊         | 14463/42624 [00:35<01:10, 400.68it/s]Preprocessing raw dataset...:  34%|████▊         | 14504/42624 [00:35<01:12, 385.34it/s]Preprocessing raw dataset...:  34%|████▊         | 14544/42624 [00:35<01:13, 381.59it/s]Preprocessing raw dataset...:  34%|████▊         | 14583/42624 [00:35<01:20, 348.90it/s]Preprocessing raw dataset...:  34%|████▊         | 14619/42624 [00:36<01:21, 343.58it/s]Preprocessing raw dataset...:  34%|████▊         | 14664/42624 [00:36<01:15, 368.04it/s]Preprocessing raw dataset...:  34%|████▊         | 14702/42624 [00:36<01:15, 369.74it/s]Preprocessing raw dataset...:  35%|████▊         | 14740/42624 [00:36<01:17, 361.68it/s]Preprocessing raw dataset...:  35%|████▊         | 14784/42624 [00:36<01:12, 382.94it/s]Preprocessing raw dataset...:  35%|████▊         | 14823/42624 [00:36<01:12, 381.88it/s]Preprocessing raw dataset...:  35%|████▉         | 14867/42624 [00:36<01:09, 397.30it/s]Preprocessing raw dataset...:  35%|████▉         | 14910/42624 [00:36<01:08, 406.34it/s]Preprocessing raw dataset...:  35%|████▉         | 14963/42624 [00:36<01:02, 440.15it/s]Preprocessing raw dataset...:  35%|████▉         | 15008/42624 [00:37<01:02, 438.96it/s]Preprocessing raw dataset...:  35%|████▉         | 15052/42624 [00:37<01:09, 398.53it/s]Preprocessing raw dataset...:  35%|████▉         | 15093/42624 [00:37<01:09, 395.22it/s]Preprocessing raw dataset...:  36%|████▉         | 15141/42624 [00:37<01:05, 416.90it/s]Preprocessing raw dataset...:  36%|████▉         | 15185/42624 [00:37<01:05, 420.17it/s]Preprocessing raw dataset...:  36%|█████         | 15228/42624 [00:37<01:06, 412.89it/s]Preprocessing raw dataset...:  36%|█████         | 15270/42624 [00:37<01:10, 390.59it/s]Preprocessing raw dataset...:  36%|█████         | 15310/42624 [00:37<01:11, 383.93it/s]Preprocessing raw dataset...:  36%|█████         | 15352/42624 [00:37<01:09, 392.26it/s]Preprocessing raw dataset...:  36%|█████         | 15392/42624 [00:38<01:12, 375.56it/s]Preprocessing raw dataset...:  36%|█████         | 15435/42624 [00:38<01:09, 388.85it/s]Preprocessing raw dataset...:  36%|█████         | 15475/42624 [00:38<01:09, 391.08it/s]Preprocessing raw dataset...:  36%|█████         | 15521/42624 [00:38<01:06, 409.40it/s]Preprocessing raw dataset...:  37%|█████         | 15563/42624 [00:38<01:13, 366.10it/s]Preprocessing raw dataset...:  37%|█████▏        | 15606/42624 [00:38<01:10, 383.27it/s]Preprocessing raw dataset...:  37%|█████▏        | 15646/42624 [00:38<01:10, 381.20it/s]Preprocessing raw dataset...:  37%|█████▏        | 15688/42624 [00:38<01:09, 387.16it/s]Preprocessing raw dataset...:  37%|█████▏        | 15737/42624 [00:38<01:04, 415.02it/s]Preprocessing raw dataset...:  37%|█████▏        | 15779/42624 [00:39<01:06, 405.90it/s]Preprocessing raw dataset...:  37%|█████▏        | 15822/42624 [00:39<01:05, 411.76it/s]Preprocessing raw dataset...:  37%|█████▏        | 15864/42624 [00:39<01:04, 412.12it/s]Preprocessing raw dataset...:  37%|█████▏        | 15906/42624 [00:39<01:04, 412.04it/s]Preprocessing raw dataset...:  37%|█████▏        | 15949/42624 [00:39<01:04, 414.95it/s]Preprocessing raw dataset...:  38%|█████▎        | 15997/42624 [00:39<01:01, 430.86it/s]Preprocessing raw dataset...:  38%|█████▎        | 16041/42624 [00:39<01:03, 415.77it/s]Preprocessing raw dataset...:  38%|█████▎        | 16083/42624 [00:39<01:04, 409.18it/s]Preprocessing raw dataset...:  38%|█████▎        | 16125/42624 [00:39<01:04, 408.95it/s]Preprocessing raw dataset...:  38%|█████▎        | 16166/42624 [00:39<01:06, 396.26it/s]Preprocessing raw dataset...:  38%|█████▎        | 16206/42624 [00:40<01:10, 376.70it/s]Preprocessing raw dataset...:  38%|█████▎        | 16253/42624 [00:40<01:05, 402.51it/s]Preprocessing raw dataset...:  38%|█████▎        | 16298/42624 [00:40<01:03, 415.41it/s]Preprocessing raw dataset...:  38%|█████▎        | 16340/42624 [00:40<01:03, 413.26it/s]Preprocessing raw dataset...:  38%|█████▍        | 16382/42624 [00:40<01:05, 398.18it/s]Preprocessing raw dataset...:  39%|█████▍        | 16423/42624 [00:40<01:09, 379.32it/s]Preprocessing raw dataset...:  39%|█████▍        | 16464/42624 [00:40<01:08, 383.33it/s]Preprocessing raw dataset...:  39%|█████▍        | 16503/42624 [00:40<01:08, 380.04it/s]Preprocessing raw dataset...:  39%|█████▍        | 16542/42624 [00:40<01:08, 381.50it/s]Preprocessing raw dataset...:  39%|█████▍        | 16584/42624 [00:41<01:06, 392.53it/s]Preprocessing raw dataset...:  39%|█████▍        | 16625/42624 [00:41<01:05, 394.63it/s]Preprocessing raw dataset...:  39%|█████▍        | 16669/42624 [00:41<01:03, 407.24it/s]Preprocessing raw dataset...:  39%|█████▍        | 16710/42624 [00:41<01:04, 400.91it/s]Preprocessing raw dataset...:  39%|█████▌        | 16751/42624 [00:41<01:06, 387.77it/s]Preprocessing raw dataset...:  39%|█████▌        | 16795/42624 [00:41<01:04, 399.82it/s]Preprocessing raw dataset...:  40%|█████▌        | 16841/42624 [00:41<01:02, 414.78it/s]Preprocessing raw dataset...:  40%|█████▌        | 16883/42624 [00:41<01:03, 404.40it/s]Preprocessing raw dataset...:  40%|█████▌        | 16929/42624 [00:41<01:01, 418.93it/s]Preprocessing raw dataset...:  40%|█████▌        | 16973/42624 [00:41<01:00, 424.72it/s]Preprocessing raw dataset...:  40%|█████▌        | 17016/42624 [00:42<01:04, 395.78it/s]Preprocessing raw dataset...:  40%|█████▌        | 17058/42624 [00:42<01:03, 399.53it/s]Preprocessing raw dataset...:  40%|█████▌        | 17100/42624 [00:42<01:03, 403.80it/s]Preprocessing raw dataset...:  40%|█████▋        | 17141/42624 [00:42<01:02, 405.16it/s]Preprocessing raw dataset...:  40%|█████▋        | 17183/42624 [00:42<01:02, 408.65it/s]Preprocessing raw dataset...:  40%|█████▋        | 17225/42624 [00:42<01:01, 410.55it/s]Preprocessing raw dataset...:  41%|█████▋        | 17269/42624 [00:42<01:00, 418.84it/s]Preprocessing raw dataset...:  41%|█████▋        | 17311/42624 [00:42<01:03, 397.99it/s]Preprocessing raw dataset...:  41%|█████▋        | 17363/42624 [00:42<00:58, 431.05it/s]Preprocessing raw dataset...:  41%|█████▋        | 17410/42624 [00:43<00:57, 439.35it/s]Preprocessing raw dataset...:  41%|█████▋        | 17455/42624 [00:43<01:01, 407.70it/s]Preprocessing raw dataset...:  41%|█████▋        | 17497/42624 [00:43<01:07, 370.84it/s]Preprocessing raw dataset...:  41%|█████▊        | 17543/42624 [00:43<01:03, 392.12it/s]Preprocessing raw dataset...:  41%|█████▊        | 17584/42624 [00:43<01:03, 395.29it/s]Preprocessing raw dataset...:  41%|█████▊        | 17625/42624 [00:43<01:02, 398.12it/s]Preprocessing raw dataset...:  41%|█████▊        | 17666/42624 [00:43<01:02, 398.78it/s]Preprocessing raw dataset...:  42%|█████▊        | 17712/42624 [00:43<01:00, 411.64it/s]Preprocessing raw dataset...:  42%|█████▊        | 17754/42624 [00:43<01:02, 395.77it/s]Preprocessing raw dataset...:  42%|█████▊        | 17794/42624 [00:44<01:05, 379.67it/s]Preprocessing raw dataset...:  42%|█████▊        | 17837/42624 [00:44<01:03, 393.15it/s]Preprocessing raw dataset...:  42%|█████▊        | 17877/42624 [00:44<01:06, 373.88it/s]Preprocessing raw dataset...:  42%|█████▉        | 17918/42624 [00:44<01:04, 380.96it/s]Preprocessing raw dataset...:  42%|█████▉        | 17957/42624 [00:44<01:06, 371.60it/s]Preprocessing raw dataset...:  42%|█████▉        | 17995/42624 [00:44<01:09, 354.40it/s]Preprocessing raw dataset...:  42%|█████▉        | 18033/42624 [00:44<01:08, 359.97it/s]Preprocessing raw dataset...:  42%|█████▉        | 18077/42624 [00:44<01:04, 379.29it/s]Preprocessing raw dataset...:  43%|█████▉        | 18116/42624 [00:44<01:05, 372.43it/s]Preprocessing raw dataset...:  43%|█████▉        | 18154/42624 [00:44<01:06, 370.31it/s]Preprocessing raw dataset...:  43%|█████▉        | 18192/42624 [00:45<01:08, 356.29it/s]Preprocessing raw dataset...:  43%|█████▉        | 18230/42624 [00:45<01:07, 359.98it/s]Preprocessing raw dataset...:  43%|█████▉        | 18267/42624 [00:45<01:10, 344.92it/s]Preprocessing raw dataset...:  43%|██████        | 18302/42624 [00:45<01:12, 333.97it/s]Preprocessing raw dataset...:  43%|██████        | 18348/42624 [00:45<01:06, 367.61it/s]Preprocessing raw dataset...:  43%|██████        | 18386/42624 [00:45<01:06, 363.51it/s]Preprocessing raw dataset...:  43%|██████        | 18431/42624 [00:45<01:02, 386.79it/s]Preprocessing raw dataset...:  43%|██████        | 18475/42624 [00:45<01:00, 400.45it/s]Preprocessing raw dataset...:  43%|██████        | 18516/42624 [00:45<01:02, 388.72it/s]Preprocessing raw dataset...:  44%|██████        | 18556/42624 [00:46<01:06, 359.39it/s]Preprocessing raw dataset...:  44%|██████        | 18595/42624 [00:46<01:05, 367.43it/s]Preprocessing raw dataset...:  44%|██████        | 18639/42624 [00:46<01:01, 387.61it/s]Preprocessing raw dataset...:  44%|██████▏       | 18679/42624 [00:46<01:02, 381.24it/s]Preprocessing raw dataset...:  44%|██████▏       | 18718/42624 [00:46<01:04, 372.84it/s]Preprocessing raw dataset...:  44%|██████▏       | 18757/42624 [00:46<01:03, 376.75it/s]Preprocessing raw dataset...:  44%|██████▏       | 18795/42624 [00:46<01:03, 377.50it/s]Preprocessing raw dataset...:  44%|██████▏       | 18833/42624 [00:46<01:03, 377.53it/s]Preprocessing raw dataset...:  44%|██████▏       | 18871/42624 [00:46<01:04, 370.82it/s]Preprocessing raw dataset...:  44%|██████▏       | 18909/42624 [00:47<01:04, 366.99it/s]Preprocessing raw dataset...:  44%|██████▏       | 18947/42624 [00:47<01:03, 370.58it/s]Preprocessing raw dataset...:  45%|██████▏       | 18985/42624 [00:47<01:04, 364.86it/s]Preprocessing raw dataset...:  45%|██████▏       | 19022/42624 [00:47<01:05, 359.92it/s]Preprocessing raw dataset...:  45%|██████▎       | 19062/42624 [00:47<01:04, 367.24it/s]Preprocessing raw dataset...:  45%|██████▎       | 19106/42624 [00:47<01:00, 387.39it/s]Preprocessing raw dataset...:  45%|██████▎       | 19145/42624 [00:47<01:01, 384.69it/s]Preprocessing raw dataset...:  45%|██████▎       | 19188/42624 [00:47<00:59, 395.30it/s]Preprocessing raw dataset...:  45%|██████▎       | 19228/42624 [00:47<01:04, 361.59it/s]Preprocessing raw dataset...:  45%|██████▎       | 19271/42624 [00:47<01:01, 377.46it/s]Preprocessing raw dataset...:  45%|██████▎       | 19310/42624 [00:48<01:03, 368.35it/s]Preprocessing raw dataset...:  45%|██████▎       | 19350/42624 [00:48<01:01, 376.62it/s]Preprocessing raw dataset...:  45%|██████▎       | 19389/42624 [00:48<01:02, 373.65it/s]Preprocessing raw dataset...:  46%|██████▍       | 19427/42624 [00:48<01:04, 359.07it/s]Preprocessing raw dataset...:  46%|██████▍       | 19466/42624 [00:48<01:03, 365.86it/s]Preprocessing raw dataset...:  46%|██████▍       | 19505/42624 [00:48<01:02, 372.06it/s]Preprocessing raw dataset...:  46%|██████▍       | 19546/42624 [00:48<01:00, 382.13it/s]Preprocessing raw dataset...:  46%|██████▍       | 19585/42624 [00:48<00:59, 384.36it/s]Preprocessing raw dataset...:  46%|██████▍       | 19624/42624 [00:48<00:59, 385.10it/s]Preprocessing raw dataset...:  46%|██████▍       | 19665/42624 [00:49<00:58, 389.57it/s]Preprocessing raw dataset...:  46%|██████▍       | 19712/42624 [00:49<00:55, 410.60it/s]Preprocessing raw dataset...:  46%|██████▍       | 19755/42624 [00:49<00:55, 409.60it/s]Preprocessing raw dataset...:  46%|██████▌       | 19796/42624 [00:49<01:02, 364.13it/s]Preprocessing raw dataset...:  47%|██████▌       | 19834/42624 [00:49<01:04, 353.72it/s]Preprocessing raw dataset...:  47%|██████▌       | 19875/42624 [00:49<01:01, 367.89it/s]Preprocessing raw dataset...:  47%|██████▌       | 19913/42624 [00:49<01:01, 368.09it/s]Preprocessing raw dataset...:  47%|██████▌       | 19951/42624 [00:49<01:02, 365.42it/s]Preprocessing raw dataset...:  47%|██████▌       | 19995/42624 [00:49<00:58, 386.43it/s]Preprocessing raw dataset...:  47%|██████▌       | 20034/42624 [00:50<00:59, 382.00it/s]Preprocessing raw dataset...:  47%|██████▌       | 20073/42624 [00:50<01:00, 373.76it/s]Preprocessing raw dataset...:  47%|██████▌       | 20113/42624 [00:50<00:59, 379.16it/s]Preprocessing raw dataset...:  47%|██████▌       | 20152/42624 [00:50<01:01, 368.37it/s]Preprocessing raw dataset...:  47%|██████▋       | 20189/42624 [00:50<01:01, 366.12it/s]Preprocessing raw dataset...:  47%|██████▋       | 20236/42624 [00:50<00:56, 394.51it/s]Preprocessing raw dataset...:  48%|██████▋       | 20281/42624 [00:50<00:54, 409.25it/s]Preprocessing raw dataset...:  48%|██████▋       | 20323/42624 [00:50<00:55, 401.06it/s]Preprocessing raw dataset...:  48%|██████▋       | 20364/42624 [00:50<00:55, 399.47it/s]Preprocessing raw dataset...:  48%|██████▋       | 20405/42624 [00:50<00:55, 400.09it/s]Preprocessing raw dataset...:  48%|██████▋       | 20446/42624 [00:51<00:57, 385.15it/s]Preprocessing raw dataset...:  48%|██████▋       | 20488/42624 [00:51<00:56, 390.94it/s]Preprocessing raw dataset...:  48%|██████▋       | 20528/42624 [00:51<00:57, 385.58it/s]Preprocessing raw dataset...:  48%|██████▊       | 20567/42624 [00:51<00:58, 375.03it/s]Preprocessing raw dataset...:  48%|██████▊       | 20611/42624 [00:51<00:56, 389.71it/s]Preprocessing raw dataset...:  48%|██████▊       | 20654/42624 [00:51<00:54, 401.17it/s]Preprocessing raw dataset...:  49%|██████▊       | 20695/42624 [00:51<00:56, 388.88it/s]Preprocessing raw dataset...:  49%|██████▊       | 20735/42624 [00:51<00:55, 390.96it/s]Preprocessing raw dataset...:  49%|██████▊       | 20776/42624 [00:51<00:55, 391.33it/s]Preprocessing raw dataset...:  49%|██████▊       | 20818/42624 [00:52<00:54, 399.24it/s]Preprocessing raw dataset...:  49%|██████▊       | 20859/42624 [00:52<00:54, 397.41it/s]Preprocessing raw dataset...:  49%|██████▊       | 20902/42624 [00:52<00:54, 400.22it/s]Preprocessing raw dataset...:  49%|██████▉       | 20943/42624 [00:52<00:54, 401.50it/s]Preprocessing raw dataset...:  49%|██████▉       | 20984/42624 [00:52<00:55, 391.87it/s]Preprocessing raw dataset...:  49%|██████▉       | 21024/42624 [00:52<00:57, 373.18it/s]Preprocessing raw dataset...:  49%|██████▉       | 21062/42624 [00:52<01:01, 350.73it/s]Preprocessing raw dataset...:  49%|██████▉       | 21098/42624 [00:52<01:04, 334.01it/s]Preprocessing raw dataset...:  50%|██████▉       | 21133/42624 [00:52<01:04, 332.97it/s]Preprocessing raw dataset...:  50%|██████▉       | 21167/42624 [00:53<01:05, 327.02it/s]Preprocessing raw dataset...:  50%|██████▉       | 21211/42624 [00:53<01:00, 356.78it/s]Preprocessing raw dataset...:  50%|██████▉       | 21250/42624 [00:53<00:58, 365.17it/s]Preprocessing raw dataset...:  50%|██████▉       | 21290/42624 [00:53<00:57, 374.15it/s]Preprocessing raw dataset...:  50%|███████       | 21328/42624 [00:53<00:58, 364.74it/s]Preprocessing raw dataset...:  50%|███████       | 21369/42624 [00:53<00:56, 375.32it/s]Preprocessing raw dataset...:  50%|███████       | 21414/42624 [00:53<00:53, 395.88it/s]Preprocessing raw dataset...:  50%|███████       | 21454/42624 [00:53<00:55, 381.83it/s]Preprocessing raw dataset...:  50%|███████       | 21493/42624 [00:53<00:58, 363.05it/s]Preprocessing raw dataset...:  51%|███████       | 21530/42624 [00:53<01:00, 347.59it/s]Preprocessing raw dataset...:  51%|███████       | 21567/42624 [00:54<00:59, 352.96it/s]Preprocessing raw dataset...:  51%|███████       | 21608/42624 [00:54<00:57, 364.22it/s]Preprocessing raw dataset...:  51%|███████       | 21647/42624 [00:54<00:57, 367.51it/s]Preprocessing raw dataset...:  51%|███████       | 21684/42624 [00:54<00:57, 361.48it/s]Preprocessing raw dataset...:  51%|███████▏      | 21722/42624 [00:54<00:57, 363.12it/s]Preprocessing raw dataset...:  51%|███████▏      | 21759/42624 [00:54<01:02, 335.28it/s]Preprocessing raw dataset...:  51%|███████▏      | 21803/42624 [00:54<00:57, 361.82it/s]Preprocessing raw dataset...:  51%|███████▏      | 21842/42624 [00:54<00:56, 365.34it/s]Preprocessing raw dataset...:  51%|███████▏      | 21885/42624 [00:54<00:54, 381.41it/s]Preprocessing raw dataset...:  51%|███████▏      | 21927/42624 [00:55<00:52, 391.60it/s]Preprocessing raw dataset...:  52%|███████▏      | 21968/42624 [00:55<00:53, 387.67it/s]Preprocessing raw dataset...:  52%|███████▏      | 22007/42624 [00:55<00:56, 362.37it/s]Preprocessing raw dataset...:  52%|███████▏      | 22046/42624 [00:55<00:56, 367.33it/s]Preprocessing raw dataset...:  52%|███████▎      | 22090/42624 [00:55<00:53, 383.28it/s]Preprocessing raw dataset...:  52%|███████▎      | 22140/42624 [00:55<00:51, 401.32it/s]Preprocessing raw dataset...:  52%|███████▎      | 22181/42624 [00:55<00:56, 364.99it/s]Preprocessing raw dataset...:  52%|███████▎      | 22226/42624 [00:55<00:52, 386.06it/s]Preprocessing raw dataset...:  52%|███████▎      | 22266/42624 [00:55<00:53, 380.26it/s]Preprocessing raw dataset...:  52%|███████▎      | 22305/42624 [00:56<00:53, 378.86it/s]Preprocessing raw dataset...:  52%|███████▎      | 22345/42624 [00:56<00:53, 377.34it/s]Preprocessing raw dataset...:  53%|███████▎      | 22386/42624 [00:56<00:52, 385.34it/s]Preprocessing raw dataset...:  53%|███████▎      | 22425/42624 [00:56<00:53, 380.25it/s]Preprocessing raw dataset...:  53%|███████▍      | 22464/42624 [00:56<00:54, 372.65it/s]Preprocessing raw dataset...:  53%|███████▍      | 22502/42624 [00:56<00:53, 374.27it/s]Preprocessing raw dataset...:  53%|███████▍      | 22540/42624 [00:56<00:53, 375.05it/s]Preprocessing raw dataset...:  53%|███████▍      | 22578/42624 [00:56<00:58, 344.81it/s]Preprocessing raw dataset...:  53%|███████▍      | 22614/42624 [00:56<00:57, 345.68it/s]Preprocessing raw dataset...:  53%|███████▍      | 22653/42624 [00:57<00:55, 357.61it/s]Preprocessing raw dataset...:  53%|███████▍      | 22692/42624 [00:57<00:54, 365.58it/s]Preprocessing raw dataset...:  53%|███████▍      | 22729/42624 [00:57<00:55, 356.75it/s]Preprocessing raw dataset...:  53%|███████▍      | 22768/42624 [00:57<00:54, 363.37it/s]Preprocessing raw dataset...:  54%|███████▍      | 22805/42624 [00:57<00:56, 351.28it/s]Preprocessing raw dataset...:  54%|███████▌      | 22845/42624 [00:57<00:54, 361.87it/s]Preprocessing raw dataset...:  54%|███████▌      | 22885/42624 [00:57<00:53, 367.92it/s]Preprocessing raw dataset...:  54%|███████▌      | 22922/42624 [00:57<00:53, 367.87it/s]Preprocessing raw dataset...:  54%|███████▌      | 22965/42624 [00:57<00:50, 385.73it/s]Preprocessing raw dataset...:  54%|███████▌      | 23006/42624 [00:57<00:50, 390.95it/s]Preprocessing raw dataset...:  54%|███████▌      | 23046/42624 [00:58<00:50, 388.62it/s]Preprocessing raw dataset...:  54%|███████▌      | 23085/42624 [00:58<00:53, 366.55it/s]Preprocessing raw dataset...:  54%|███████▌      | 23122/42624 [00:58<00:53, 366.34it/s]Preprocessing raw dataset...:  54%|███████▌      | 23164/42624 [00:58<00:51, 379.21it/s]Preprocessing raw dataset...:  54%|███████▌      | 23203/42624 [00:58<00:53, 363.30it/s]Preprocessing raw dataset...:  55%|███████▋      | 23246/42624 [00:58<00:51, 379.63it/s]Preprocessing raw dataset...:  55%|███████▋      | 23287/42624 [00:58<00:50, 386.26it/s]Preprocessing raw dataset...:  55%|███████▋      | 23326/42624 [00:58<00:52, 370.95it/s]Preprocessing raw dataset...:  55%|███████▋      | 23369/42624 [00:58<00:49, 386.81it/s]Preprocessing raw dataset...:  55%|███████▋      | 23417/42624 [00:59<00:46, 412.07it/s]Preprocessing raw dataset...:  55%|███████▋      | 23459/42624 [00:59<00:48, 397.00it/s]Preprocessing raw dataset...:  55%|███████▋      | 23499/42624 [00:59<00:48, 396.03it/s]Preprocessing raw dataset...:  55%|███████▋      | 23539/42624 [00:59<00:49, 383.33it/s]Preprocessing raw dataset...:  55%|███████▋      | 23578/42624 [00:59<00:54, 349.76it/s]Preprocessing raw dataset...:  55%|███████▊      | 23622/42624 [00:59<00:50, 373.53it/s]Preprocessing raw dataset...:  56%|███████▊      | 23662/42624 [00:59<00:50, 378.36it/s]Preprocessing raw dataset...:  56%|███████▊      | 23702/42624 [00:59<00:49, 384.20it/s]Preprocessing raw dataset...:  56%|███████▊      | 23745/42624 [00:59<00:48, 390.44it/s]Preprocessing raw dataset...:  56%|███████▊      | 23785/42624 [01:00<00:49, 378.59it/s]Preprocessing raw dataset...:  56%|███████▊      | 23824/42624 [01:00<00:50, 375.13it/s]Preprocessing raw dataset...:  56%|███████▊      | 23864/42624 [01:00<00:49, 379.06it/s]Preprocessing raw dataset...:  56%|███████▊      | 23903/42624 [01:00<00:51, 366.05it/s]Preprocessing raw dataset...:  56%|███████▊      | 23940/42624 [01:00<00:52, 356.10it/s]Preprocessing raw dataset...:  56%|███████▉      | 23980/42624 [01:00<00:50, 366.20it/s]Preprocessing raw dataset...:  56%|███████▉      | 24019/42624 [01:00<00:50, 371.29it/s]Preprocessing raw dataset...:  56%|███████▉      | 24058/42624 [01:00<00:49, 372.65it/s]Preprocessing raw dataset...:  57%|███████▉      | 24096/42624 [01:00<00:51, 361.10it/s]Preprocessing raw dataset...:  57%|███████▉      | 24133/42624 [01:00<00:52, 355.15it/s]Preprocessing raw dataset...:  57%|███████▉      | 24175/42624 [01:01<00:50, 364.83it/s]Preprocessing raw dataset...:  57%|███████▉      | 24212/42624 [01:01<00:51, 356.37it/s]Preprocessing raw dataset...:  57%|███████▉      | 24249/42624 [01:01<00:51, 357.89it/s]Preprocessing raw dataset...:  57%|███████▉      | 24285/42624 [01:01<00:53, 345.58it/s]Preprocessing raw dataset...:  57%|███████▉      | 24322/42624 [01:01<00:52, 350.65it/s]Preprocessing raw dataset...:  57%|████████      | 24361/42624 [01:01<00:50, 361.47it/s]Preprocessing raw dataset...:  57%|████████      | 24403/42624 [01:01<00:48, 377.15it/s]Preprocessing raw dataset...:  57%|████████      | 24444/42624 [01:01<00:47, 385.88it/s]Preprocessing raw dataset...:  57%|████████      | 24483/42624 [01:01<00:48, 372.11it/s]Preprocessing raw dataset...:  58%|████████      | 24521/42624 [01:02<00:48, 374.09it/s]Preprocessing raw dataset...:  58%|████████      | 24562/42624 [01:02<00:48, 375.79it/s]Preprocessing raw dataset...:  58%|████████      | 24604/42624 [01:02<00:46, 386.65it/s]Preprocessing raw dataset...:  58%|████████      | 24643/42624 [01:02<00:51, 347.69it/s]Preprocessing raw dataset...:  58%|████████      | 24682/42624 [01:02<00:50, 358.42it/s]Preprocessing raw dataset...:  58%|████████      | 24719/42624 [01:02<00:50, 356.23it/s]Preprocessing raw dataset...:  58%|████████▏     | 24756/42624 [01:02<00:50, 350.75it/s]Preprocessing raw dataset...:  58%|████████▏     | 24795/42624 [01:02<00:50, 354.82it/s]Preprocessing raw dataset...:  58%|████████▏     | 24831/42624 [01:02<00:51, 345.72it/s]Preprocessing raw dataset...:  58%|████████▏     | 24870/42624 [01:03<00:49, 356.28it/s]Preprocessing raw dataset...:  58%|████████▏     | 24906/42624 [01:03<00:51, 346.69it/s]Preprocessing raw dataset...:  59%|████████▏     | 24941/42624 [01:03<00:53, 332.46it/s]Preprocessing raw dataset...:  59%|████████▏     | 24978/42624 [01:03<00:51, 339.58it/s]Preprocessing raw dataset...:  59%|████████▏     | 25013/42624 [01:03<00:51, 342.39it/s]Preprocessing raw dataset...:  59%|████████▏     | 25053/42624 [01:03<00:49, 357.68it/s]Preprocessing raw dataset...:  59%|████████▏     | 25089/42624 [01:03<00:49, 352.18it/s]Preprocessing raw dataset...:  59%|████████▎     | 25126/42624 [01:03<00:49, 355.76it/s]Preprocessing raw dataset...:  59%|████████▎     | 25162/42624 [01:03<00:49, 352.12it/s]Preprocessing raw dataset...:  59%|████████▎     | 25201/42624 [01:03<00:48, 362.63it/s]Preprocessing raw dataset...:  59%|████████▎     | 25238/42624 [01:04<00:48, 356.39it/s]Preprocessing raw dataset...:  59%|████████▎     | 25274/42624 [01:04<00:48, 356.86it/s]Preprocessing raw dataset...:  59%|████████▎     | 25318/42624 [01:04<00:45, 380.26it/s]Preprocessing raw dataset...:  59%|████████▎     | 25357/42624 [01:04<00:45, 381.58it/s]Preprocessing raw dataset...:  60%|████████▎     | 25396/42624 [01:04<00:46, 367.72it/s]Preprocessing raw dataset...:  60%|████████▎     | 25433/42624 [01:04<00:47, 360.58it/s]Preprocessing raw dataset...:  60%|████████▎     | 25470/42624 [01:04<00:51, 334.21it/s]Preprocessing raw dataset...:  60%|████████▍     | 25509/42624 [01:04<00:49, 348.65it/s]Preprocessing raw dataset...:  60%|████████▍     | 25546/42624 [01:04<00:48, 354.34it/s]Preprocessing raw dataset...:  60%|████████▍     | 25583/42624 [01:05<00:47, 358.61it/s]Preprocessing raw dataset...:  60%|████████▍     | 25628/42624 [01:05<00:44, 382.84it/s]Preprocessing raw dataset...:  60%|████████▍     | 25667/42624 [01:05<00:46, 362.30it/s]Preprocessing raw dataset...:  60%|████████▍     | 25704/42624 [01:05<00:46, 362.58it/s]Preprocessing raw dataset...:  60%|████████▍     | 25741/42624 [01:05<00:47, 354.36it/s]Preprocessing raw dataset...:  60%|████████▍     | 25778/42624 [01:05<00:47, 354.05it/s]Preprocessing raw dataset...:  61%|████████▍     | 25817/42624 [01:05<00:46, 363.04it/s]Preprocessing raw dataset...:  61%|████████▍     | 25854/42624 [01:05<00:47, 351.32it/s]Preprocessing raw dataset...:  61%|████████▌     | 25894/42624 [01:05<00:45, 364.64it/s]Preprocessing raw dataset...:  61%|████████▌     | 25933/42624 [01:05<00:44, 371.68it/s]Preprocessing raw dataset...:  61%|████████▌     | 25971/42624 [01:06<00:47, 350.92it/s]Preprocessing raw dataset...:  61%|████████▌     | 26008/42624 [01:06<00:46, 355.86it/s]Preprocessing raw dataset...:  61%|████████▌     | 26047/42624 [01:06<00:45, 364.84it/s]Preprocessing raw dataset...:  61%|████████▌     | 26096/42624 [01:06<00:41, 400.47it/s]Preprocessing raw dataset...:  61%|████████▌     | 26137/42624 [01:06<00:42, 385.11it/s]Preprocessing raw dataset...:  61%|████████▌     | 26176/42624 [01:06<00:45, 364.99it/s]Preprocessing raw dataset...:  62%|████████▌     | 26214/42624 [01:06<00:44, 367.23it/s]Preprocessing raw dataset...:  62%|████████▌     | 26252/42624 [01:06<00:44, 368.98it/s]Preprocessing raw dataset...:  62%|████████▋     | 26295/42624 [01:06<00:42, 386.12it/s]Preprocessing raw dataset...:  62%|████████▋     | 26334/42624 [01:07<00:43, 378.51it/s]Preprocessing raw dataset...:  62%|████████▋     | 26378/42624 [01:07<00:41, 394.87it/s]Preprocessing raw dataset...:  62%|████████▋     | 26418/42624 [01:07<00:41, 391.31it/s]Preprocessing raw dataset...:  62%|████████▋     | 26458/42624 [01:07<00:41, 392.31it/s]Preprocessing raw dataset...:  62%|████████▋     | 26498/42624 [01:07<00:43, 367.29it/s]Preprocessing raw dataset...:  62%|████████▋     | 26536/42624 [01:07<00:43, 369.63it/s]Preprocessing raw dataset...:  62%|████████▋     | 26574/42624 [01:07<00:43, 367.23it/s]Preprocessing raw dataset...:  62%|████████▋     | 26612/42624 [01:07<00:43, 370.03it/s]Preprocessing raw dataset...:  63%|████████▊     | 26652/42624 [01:07<00:42, 374.23it/s]Preprocessing raw dataset...:  63%|████████▊     | 26698/42624 [01:07<00:40, 396.07it/s]Preprocessing raw dataset...:  63%|████████▊     | 26739/42624 [01:08<00:40, 395.37it/s]Preprocessing raw dataset...:  63%|████████▊     | 26782/42624 [01:08<00:39, 403.99it/s]Preprocessing raw dataset...:  63%|████████▊     | 26823/42624 [01:08<00:40, 390.41it/s]Preprocessing raw dataset...:  63%|████████▊     | 26863/42624 [01:08<00:40, 385.66it/s]Preprocessing raw dataset...:  63%|████████▊     | 26902/42624 [01:08<00:41, 379.63it/s]Preprocessing raw dataset...:  63%|████████▊     | 26942/42624 [01:08<00:40, 385.22it/s]Preprocessing raw dataset...:  63%|████████▊     | 26981/42624 [01:08<00:45, 342.04it/s]Preprocessing raw dataset...:  63%|████████▉     | 27021/42624 [01:08<00:43, 357.33it/s]Preprocessing raw dataset...:  63%|████████▉     | 27058/42624 [01:08<00:45, 341.93it/s]Preprocessing raw dataset...:  64%|████████▉     | 27095/42624 [01:09<00:44, 348.09it/s]Preprocessing raw dataset...:  64%|████████▉     | 27142/42624 [01:09<00:40, 378.61it/s]Preprocessing raw dataset...:  64%|████████▉     | 27181/42624 [01:09<00:43, 357.62it/s]Preprocessing raw dataset...:  64%|████████▉     | 27222/42624 [01:09<00:41, 371.70it/s]Preprocessing raw dataset...:  64%|████████▉     | 27263/42624 [01:09<00:40, 379.64it/s]Preprocessing raw dataset...:  64%|████████▉     | 27303/42624 [01:09<00:40, 382.17it/s]Preprocessing raw dataset...:  64%|████████▉     | 27342/42624 [01:09<00:41, 366.88it/s]Preprocessing raw dataset...:  64%|████████▉     | 27382/42624 [01:09<00:41, 370.68it/s]Preprocessing raw dataset...:  64%|█████████     | 27420/42624 [01:09<00:41, 365.12it/s]Preprocessing raw dataset...:  64%|█████████     | 27457/42624 [01:10<00:42, 355.97it/s]Preprocessing raw dataset...:  65%|█████████     | 27498/42624 [01:10<00:41, 367.85it/s]Preprocessing raw dataset...:  65%|█████████     | 27535/42624 [01:10<00:42, 353.66it/s]Preprocessing raw dataset...:  65%|█████████     | 27571/42624 [01:10<00:43, 349.98it/s]Preprocessing raw dataset...:  65%|█████████     | 27607/42624 [01:10<00:43, 345.30it/s]Preprocessing raw dataset...:  65%|█████████     | 27642/42624 [01:10<00:46, 320.35it/s]Preprocessing raw dataset...:  65%|█████████     | 27676/42624 [01:10<00:46, 324.46it/s]Preprocessing raw dataset...:  65%|█████████     | 27709/42624 [01:10<00:47, 314.27it/s]Preprocessing raw dataset...:  65%|█████████     | 27750/42624 [01:10<00:43, 339.77it/s]Preprocessing raw dataset...:  65%|█████████▏    | 27785/42624 [01:11<00:45, 327.74it/s]Preprocessing raw dataset...:  65%|█████████▏    | 27827/42624 [01:11<00:42, 344.34it/s]Preprocessing raw dataset...:  65%|█████████▏    | 27869/42624 [01:11<00:40, 361.62it/s]Preprocessing raw dataset...:  65%|█████████▏    | 27908/42624 [01:11<00:39, 369.12it/s]Preprocessing raw dataset...:  66%|█████████▏    | 27946/42624 [01:11<00:41, 356.95it/s]Preprocessing raw dataset...:  66%|█████████▏    | 27990/42624 [01:11<00:38, 379.08it/s]Preprocessing raw dataset...:  66%|█████████▏    | 28029/42624 [01:11<00:40, 358.51it/s]Preprocessing raw dataset...:  66%|█████████▏    | 28068/42624 [01:11<00:39, 365.01it/s]Preprocessing raw dataset...:  66%|█████████▏    | 28108/42624 [01:11<00:38, 374.55it/s]Preprocessing raw dataset...:  66%|█████████▏    | 28146/42624 [01:12<00:38, 373.53it/s]Preprocessing raw dataset...:  66%|█████████▎    | 28184/42624 [01:12<00:41, 351.61it/s]Preprocessing raw dataset...:  66%|█████████▎    | 28222/42624 [01:12<00:40, 357.34it/s]Preprocessing raw dataset...:  66%|█████████▎    | 28261/42624 [01:12<00:39, 365.20it/s]Preprocessing raw dataset...:  66%|█████████▎    | 28306/42624 [01:12<00:36, 388.76it/s]Preprocessing raw dataset...:  67%|█████████▎    | 28346/42624 [01:12<00:38, 370.30it/s]Preprocessing raw dataset...:  67%|█████████▎    | 28384/42624 [01:12<00:38, 367.21it/s]Preprocessing raw dataset...:  67%|█████████▎    | 28421/42624 [01:12<00:39, 357.44it/s]Preprocessing raw dataset...:  67%|█████████▎    | 28457/42624 [01:12<00:41, 344.58it/s]Preprocessing raw dataset...:  67%|█████████▎    | 28492/42624 [01:13<00:41, 344.25it/s]Preprocessing raw dataset...:  67%|█████████▎    | 28527/42624 [01:13<00:42, 334.67it/s]Preprocessing raw dataset...:  67%|█████████▍    | 28577/42624 [01:13<00:37, 376.13it/s]Preprocessing raw dataset...:  67%|█████████▍    | 28615/42624 [01:13<00:37, 371.65it/s]Preprocessing raw dataset...:  67%|█████████▍    | 28654/42624 [01:13<00:37, 375.13it/s]Preprocessing raw dataset...:  67%|█████████▍    | 28692/42624 [01:13<00:38, 361.80it/s]Preprocessing raw dataset...:  67%|█████████▍    | 28731/42624 [01:13<00:37, 366.57it/s]Preprocessing raw dataset...:  67%|█████████▍    | 28768/42624 [01:13<00:37, 366.13it/s]Preprocessing raw dataset...:  68%|█████████▍    | 28805/42624 [01:13<00:38, 359.77it/s]Preprocessing raw dataset...:  68%|█████████▍    | 28846/42624 [01:13<00:36, 372.54it/s]Preprocessing raw dataset...:  68%|█████████▍    | 28890/42624 [01:14<00:35, 391.37it/s]Preprocessing raw dataset...:  68%|█████████▌    | 28930/42624 [01:14<00:35, 387.83it/s]Preprocessing raw dataset...:  68%|█████████▌    | 28973/42624 [01:14<00:34, 400.11it/s]Preprocessing raw dataset...:  68%|█████████▌    | 29014/42624 [01:14<00:36, 370.33it/s]Preprocessing raw dataset...:  68%|█████████▌    | 29052/42624 [01:14<00:38, 351.19it/s]Preprocessing raw dataset...:  68%|█████████▌    | 29090/42624 [01:14<00:37, 358.89it/s]Preprocessing raw dataset...:  68%|█████████▌    | 29127/42624 [01:14<00:38, 347.49it/s]Preprocessing raw dataset...:  68%|█████████▌    | 29163/42624 [01:14<00:39, 343.53it/s]Preprocessing raw dataset...:  69%|█████████▌    | 29198/42624 [01:14<00:39, 342.39it/s]Preprocessing raw dataset...:  69%|█████████▌    | 29233/42624 [01:15<00:39, 340.80it/s]Preprocessing raw dataset...:  69%|█████████▌    | 29268/42624 [01:15<00:39, 340.33it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29310/42624 [01:15<00:36, 362.57it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29350/42624 [01:15<00:35, 371.05it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29388/42624 [01:15<00:36, 360.06it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29428/42624 [01:15<00:36, 364.53it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29473/42624 [01:15<00:33, 387.31it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29512/42624 [01:15<00:36, 359.50it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29552/42624 [01:15<00:35, 368.28it/s]Preprocessing raw dataset...:  69%|█████████▋    | 29590/42624 [01:15<00:35, 370.56it/s]Preprocessing raw dataset...:  70%|█████████▋    | 29628/42624 [01:16<00:35, 366.19it/s]Preprocessing raw dataset...:  70%|█████████▋    | 29673/42624 [01:16<00:33, 384.41it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29712/42624 [01:16<00:33, 384.53it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29751/42624 [01:16<00:34, 377.79it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29789/42624 [01:16<00:35, 365.66it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29826/42624 [01:16<00:36, 350.36it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29864/42624 [01:16<00:35, 357.62it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29912/42624 [01:16<00:32, 392.12it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29952/42624 [01:16<00:34, 368.15it/s]Preprocessing raw dataset...:  70%|█████████▊    | 29990/42624 [01:17<00:34, 368.85it/s]Preprocessing raw dataset...:  70%|█████████▊    | 30030/42624 [01:17<00:33, 376.95it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30068/42624 [01:17<00:34, 364.96it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30105/42624 [01:17<00:35, 355.13it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30141/42624 [01:17<00:35, 348.60it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30176/42624 [01:17<00:38, 327.27it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30212/42624 [01:17<00:37, 333.62it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30246/42624 [01:17<00:37, 327.22it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30282/42624 [01:17<00:36, 335.09it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30316/42624 [01:18<00:38, 320.35it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30350/42624 [01:18<00:37, 325.14it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30389/42624 [01:18<00:35, 340.54it/s]Preprocessing raw dataset...:  71%|█████████▉    | 30424/42624 [01:18<00:35, 341.79it/s]Preprocessing raw dataset...:  71%|██████████    | 30459/42624 [01:18<00:35, 341.10it/s]Preprocessing raw dataset...:  72%|██████████    | 30495/42624 [01:18<00:35, 344.09it/s]Preprocessing raw dataset...:  72%|██████████    | 30537/42624 [01:18<00:33, 365.62it/s]Preprocessing raw dataset...:  72%|██████████    | 30574/42624 [01:18<00:34, 351.78it/s]Preprocessing raw dataset...:  72%|██████████    | 30610/42624 [01:18<00:34, 344.55it/s]Preprocessing raw dataset...:  72%|██████████    | 30648/42624 [01:19<00:33, 353.47it/s]Preprocessing raw dataset...:  72%|██████████    | 30687/42624 [01:19<00:32, 361.88it/s]Preprocessing raw dataset...:  72%|██████████    | 30724/42624 [01:19<00:34, 342.06it/s]Preprocessing raw dataset...:  72%|██████████    | 30759/42624 [01:19<00:35, 338.27it/s]Preprocessing raw dataset...:  72%|██████████    | 30795/42624 [01:19<00:34, 342.46it/s]Preprocessing raw dataset...:  72%|██████████▏   | 30830/42624 [01:19<00:35, 335.10it/s]Preprocessing raw dataset...:  72%|██████████▏   | 30870/42624 [01:19<00:33, 349.69it/s]Preprocessing raw dataset...:  73%|██████████▏   | 30906/42624 [01:19<00:34, 337.98it/s]Preprocessing raw dataset...:  73%|██████████▏   | 30942/42624 [01:19<00:33, 343.94it/s]Preprocessing raw dataset...:  73%|██████████▏   | 30978/42624 [01:19<00:33, 346.04it/s]Preprocessing raw dataset...:  73%|██████████▏   | 31014/42624 [01:20<00:33, 348.40it/s]Preprocessing raw dataset...:  73%|██████████▏   | 31053/42624 [01:20<00:32, 358.40it/s]Preprocessing raw dataset...:  73%|██████████▏   | 31089/42624 [01:20<00:32, 356.25it/s]Preprocessing raw dataset...:  73%|██████████▏   | 31125/42624 [01:20<00:32, 352.52it/s]Preprocessing raw dataset...:  73%|██████████▏   | 31161/42624 [01:20<00:33, 343.69it/s]Preprocessing raw dataset...:  73%|██████████▏   | 31196/42624 [01:20<00:34, 332.88it/s]Preprocessing raw dataset...:  73%|██████████▎   | 31242/42624 [01:20<00:31, 367.02it/s]Preprocessing raw dataset...:  73%|██████████▎   | 31285/42624 [01:20<00:29, 384.71it/s]Preprocessing raw dataset...:  73%|██████████▎   | 31325/42624 [01:20<00:29, 386.56it/s]Preprocessing raw dataset...:  74%|██████████▎   | 31372/42624 [01:21<00:27, 410.67it/s]Preprocessing raw dataset...:  74%|██████████▎   | 31414/42624 [01:21<00:28, 399.84it/s]Preprocessing raw dataset...:  74%|██████████▎   | 31455/42624 [01:21<00:29, 374.29it/s]Preprocessing raw dataset...:  74%|██████████▎   | 31493/42624 [01:21<00:30, 367.26it/s]Preprocessing raw dataset...:  74%|██████████▎   | 31531/42624 [01:21<00:30, 360.33it/s]Preprocessing raw dataset...:  74%|██████████▎   | 31568/42624 [01:21<00:32, 343.16it/s]Preprocessing raw dataset...:  74%|██████████▍   | 31609/42624 [01:21<00:30, 361.20it/s]Preprocessing raw dataset...:  74%|██████████▍   | 31655/42624 [01:21<00:28, 384.86it/s]Preprocessing raw dataset...:  74%|██████████▍   | 31694/42624 [01:21<00:28, 382.06it/s]Preprocessing raw dataset...:  74%|██████████▍   | 31733/42624 [01:22<00:29, 363.54it/s]Preprocessing raw dataset...:  75%|██████████▍   | 31770/42624 [01:22<00:30, 360.59it/s]Preprocessing raw dataset...:  75%|██████████▍   | 31807/42624 [01:22<00:31, 348.94it/s]Preprocessing raw dataset...:  75%|██████████▍   | 31848/42624 [01:22<00:29, 362.59it/s]Preprocessing raw dataset...:  75%|██████████▍   | 31885/42624 [01:22<00:30, 353.18it/s]Preprocessing raw dataset...:  75%|██████████▍   | 31928/42624 [01:22<00:28, 374.47it/s]Preprocessing raw dataset...:  75%|██████████▌   | 31968/42624 [01:22<00:27, 381.65it/s]Preprocessing raw dataset...:  75%|██████████▌   | 32009/42624 [01:22<00:27, 388.83it/s]Preprocessing raw dataset...:  75%|██████████▌   | 32049/42624 [01:22<00:30, 350.58it/s]Preprocessing raw dataset...:  75%|██████████▌   | 32086/42624 [01:22<00:29, 353.56it/s]Preprocessing raw dataset...:  75%|██████████▌   | 32122/42624 [01:23<00:30, 341.88it/s]Preprocessing raw dataset...:  75%|██████████▌   | 32157/42624 [01:23<00:31, 337.48it/s]Preprocessing raw dataset...:  76%|██████████▌   | 32202/42624 [01:23<00:28, 366.76it/s]Preprocessing raw dataset...:  76%|██████████▌   | 32240/42624 [01:23<00:28, 368.22it/s]Preprocessing raw dataset...:  76%|██████████▌   | 32278/42624 [01:23<00:28, 361.75it/s]Preprocessing raw dataset...:  76%|██████████▌   | 32315/42624 [01:23<00:28, 359.95it/s]Preprocessing raw dataset...:  76%|██████████▋   | 32356/42624 [01:23<00:27, 373.01it/s]Preprocessing raw dataset...:  76%|██████████▋   | 32394/42624 [01:23<00:28, 363.68it/s]Preprocessing raw dataset...:  76%|██████████▋   | 32437/42624 [01:23<00:26, 380.57it/s]Preprocessing raw dataset...:  76%|██████████▋   | 32476/42624 [01:24<00:27, 375.18it/s]Preprocessing raw dataset...:  76%|██████████▋   | 32514/42624 [01:24<00:27, 363.54it/s]Preprocessing raw dataset...:  76%|██████████▋   | 32551/42624 [01:24<00:29, 343.12it/s]Preprocessing raw dataset...:  76%|██████████▋   | 32587/42624 [01:24<00:29, 344.73it/s]Preprocessing raw dataset...:  77%|██████████▋   | 32633/42624 [01:24<00:26, 375.27it/s]Preprocessing raw dataset...:  77%|██████████▋   | 32671/42624 [01:24<00:26, 370.41it/s]Preprocessing raw dataset...:  77%|██████████▋   | 32709/42624 [01:24<00:27, 357.58it/s]Preprocessing raw dataset...:  77%|██████████▊   | 32750/42624 [01:24<00:26, 368.44it/s]Preprocessing raw dataset...:  77%|██████████▊   | 32788/42624 [01:24<00:27, 358.28it/s]Preprocessing raw dataset...:  77%|██████████▊   | 32832/42624 [01:25<00:25, 379.41it/s]Preprocessing raw dataset...:  77%|██████████▊   | 32878/42624 [01:25<00:24, 401.76it/s]Preprocessing raw dataset...:  77%|██████████▊   | 32919/42624 [01:25<00:24, 401.58it/s]Preprocessing raw dataset...:  77%|██████████▊   | 32961/42624 [01:25<00:23, 406.35it/s]Preprocessing raw dataset...:  77%|██████████▊   | 33002/42624 [01:25<00:24, 390.86it/s]Preprocessing raw dataset...:  78%|██████████▊   | 33042/42624 [01:25<00:25, 379.02it/s]Preprocessing raw dataset...:  78%|██████████▊   | 33081/42624 [01:25<00:25, 374.90it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33119/42624 [01:25<00:25, 371.45it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33157/42624 [01:25<00:25, 365.12it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33199/42624 [01:25<00:24, 380.32it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33238/42624 [01:26<00:25, 368.50it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33275/42624 [01:26<00:26, 351.73it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33318/42624 [01:26<00:25, 372.11it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33356/42624 [01:26<00:25, 364.46it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33393/42624 [01:26<00:25, 358.18it/s]Preprocessing raw dataset...:  78%|██████████▉   | 33429/42624 [01:26<00:26, 353.26it/s]Preprocessing raw dataset...:  79%|██████████▉   | 33469/42624 [01:26<00:25, 363.24it/s]Preprocessing raw dataset...:  79%|███████████   | 33511/42624 [01:26<00:24, 377.12it/s]Preprocessing raw dataset...:  79%|███████████   | 33549/42624 [01:26<00:24, 373.61it/s]Preprocessing raw dataset...:  79%|███████████   | 33590/42624 [01:27<00:23, 377.48it/s]Preprocessing raw dataset...:  79%|███████████   | 33628/42624 [01:27<00:23, 375.66it/s]Preprocessing raw dataset...:  79%|███████████   | 33670/42624 [01:27<00:23, 388.43it/s]Preprocessing raw dataset...:  79%|███████████   | 33709/42624 [01:27<00:23, 383.92it/s]Preprocessing raw dataset...:  79%|███████████   | 33751/42624 [01:27<00:22, 392.33it/s]Preprocessing raw dataset...:  79%|███████████   | 33791/42624 [01:27<00:23, 370.96it/s]Preprocessing raw dataset...:  79%|███████████   | 33829/42624 [01:27<00:24, 362.56it/s]Preprocessing raw dataset...:  79%|███████████   | 33866/42624 [01:27<00:24, 362.74it/s]Preprocessing raw dataset...:  80%|███████████▏  | 33904/42624 [01:27<00:23, 366.24it/s]Preprocessing raw dataset...:  80%|███████████▏  | 33941/42624 [01:28<00:23, 362.35it/s]Preprocessing raw dataset...:  80%|███████████▏  | 33980/42624 [01:28<00:23, 368.12it/s]Preprocessing raw dataset...:  80%|███████████▏  | 34022/42624 [01:28<00:22, 381.64it/s]Preprocessing raw dataset...:  80%|███████████▏  | 34061/42624 [01:28<00:25, 340.36it/s]Preprocessing raw dataset...:  80%|███████████▏  | 34100/42624 [01:28<00:24, 351.85it/s]Preprocessing raw dataset...:  80%|███████████▏  | 34137/42624 [01:28<00:24, 353.14it/s]Preprocessing raw dataset...:  80%|███████████▏  | 34173/42624 [01:28<00:24, 346.67it/s]Preprocessing raw dataset...:  80%|███████████▏  | 34209/42624 [01:28<00:24, 342.75it/s]Preprocessing raw dataset...:  80%|███████████▏  | 34244/42624 [01:28<00:24, 344.53it/s]Preprocessing raw dataset...:  80%|███████████▎  | 34279/42624 [01:28<00:24, 345.10it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34319/42624 [01:29<00:23, 357.80it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34355/42624 [01:29<00:23, 357.07it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34393/42624 [01:29<00:22, 359.60it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34430/42624 [01:29<00:23, 348.90it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34468/42624 [01:29<00:22, 354.80it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34504/42624 [01:29<00:23, 348.17it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34548/42624 [01:29<00:21, 373.96it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34586/42624 [01:29<00:22, 363.59it/s]Preprocessing raw dataset...:  81%|███████████▎  | 34628/42624 [01:29<00:21, 378.55it/s]Preprocessing raw dataset...:  81%|███████████▍  | 34667/42624 [01:30<00:22, 346.76it/s]Preprocessing raw dataset...:  81%|███████████▍  | 34703/42624 [01:30<00:23, 331.05it/s]Preprocessing raw dataset...:  82%|███████████▍  | 34742/42624 [01:30<00:23, 342.45it/s]Preprocessing raw dataset...:  82%|███████████▍  | 34784/42624 [01:30<00:21, 361.88it/s]Preprocessing raw dataset...:  82%|███████████▍  | 34823/42624 [01:30<00:21, 369.77it/s]Preprocessing raw dataset...:  82%|███████████▍  | 34861/42624 [01:30<00:20, 370.54it/s]Preprocessing raw dataset...:  82%|███████████▍  | 34902/42624 [01:30<00:20, 380.18it/s]Preprocessing raw dataset...:  82%|███████████▍  | 34945/42624 [01:30<00:19, 392.52it/s]Preprocessing raw dataset...:  82%|███████████▍  | 34985/42624 [01:30<00:21, 361.38it/s]Preprocessing raw dataset...:  82%|███████████▌  | 35023/42624 [01:31<00:20, 365.75it/s]Preprocessing raw dataset...:  82%|███████████▌  | 35063/42624 [01:31<00:20, 375.43it/s]Preprocessing raw dataset...:  82%|███████████▌  | 35101/42624 [01:31<00:20, 361.58it/s]Preprocessing raw dataset...:  82%|███████████▌  | 35138/42624 [01:31<00:20, 363.95it/s]Preprocessing raw dataset...:  83%|███████████▌  | 35175/42624 [01:31<00:20, 356.53it/s]Preprocessing raw dataset...:  83%|███████████▌  | 35211/42624 [01:31<00:21, 351.10it/s]Preprocessing raw dataset...:  83%|███████████▌  | 35250/42624 [01:31<00:20, 361.26it/s]Preprocessing raw dataset...:  83%|███████████▌  | 35289/42624 [01:31<00:19, 368.93it/s]Preprocessing raw dataset...:  83%|███████████▌  | 35330/42624 [01:31<00:19, 379.33it/s]Preprocessing raw dataset...:  83%|███████████▌  | 35372/42624 [01:31<00:18, 388.91it/s]Preprocessing raw dataset...:  83%|███████████▋  | 35415/42624 [01:32<00:17, 400.54it/s]Preprocessing raw dataset...:  83%|███████████▋  | 35456/42624 [01:32<00:18, 393.11it/s]Preprocessing raw dataset...:  83%|███████████▋  | 35496/42624 [01:32<00:18, 379.89it/s]Preprocessing raw dataset...:  83%|███████████▋  | 35539/42624 [01:32<00:18, 391.69it/s]Preprocessing raw dataset...:  83%|███████████▋  | 35579/42624 [01:32<00:17, 392.22it/s]Preprocessing raw dataset...:  84%|███████████▋  | 35620/42624 [01:32<00:17, 397.10it/s]Preprocessing raw dataset...:  84%|███████████▋  | 35660/42624 [01:32<00:19, 356.43it/s]Preprocessing raw dataset...:  84%|███████████▋  | 35697/42624 [01:32<00:19, 357.57it/s]Preprocessing raw dataset...:  84%|███████████▋  | 35734/42624 [01:32<00:19, 358.73it/s]Preprocessing raw dataset...:  84%|███████████▊  | 35774/42624 [01:33<00:18, 368.01it/s]Preprocessing raw dataset...:  84%|███████████▊  | 35821/42624 [01:33<00:17, 393.10it/s]Preprocessing raw dataset...:  84%|███████████▊  | 35861/42624 [01:33<00:17, 391.40it/s]Preprocessing raw dataset...:  84%|███████████▊  | 35902/42624 [01:33<00:17, 394.09it/s]Preprocessing raw dataset...:  84%|███████████▊  | 35942/42624 [01:33<00:18, 369.94it/s]Preprocessing raw dataset...:  84%|███████████▊  | 35981/42624 [01:33<00:17, 373.53it/s]Preprocessing raw dataset...:  85%|███████████▊  | 36019/42624 [01:33<00:18, 363.12it/s]Preprocessing raw dataset...:  85%|███████████▊  | 36056/42624 [01:33<00:18, 351.33it/s]Preprocessing raw dataset...:  85%|███████████▊  | 36095/42624 [01:33<00:18, 361.96it/s]Preprocessing raw dataset...:  85%|███████████▊  | 36134/42624 [01:33<00:17, 368.95it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36176/42624 [01:34<00:16, 380.67it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36215/42624 [01:34<00:18, 353.83it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36251/42624 [01:34<00:18, 351.78it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36291/42624 [01:34<00:17, 365.22it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36330/42624 [01:34<00:16, 371.11it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36370/42624 [01:34<00:16, 369.90it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36408/42624 [01:34<00:18, 343.84it/s]Preprocessing raw dataset...:  85%|███████████▉  | 36443/42624 [01:34<00:18, 337.55it/s]Preprocessing raw dataset...:  86%|███████████▉  | 36485/42624 [01:34<00:17, 356.09it/s]Preprocessing raw dataset...:  86%|███████████▉  | 36525/42624 [01:35<00:16, 365.51it/s]Preprocessing raw dataset...:  86%|████████████  | 36562/42624 [01:35<00:17, 354.88it/s]Preprocessing raw dataset...:  86%|████████████  | 36606/42624 [01:35<00:15, 378.78it/s]Preprocessing raw dataset...:  86%|████████████  | 36645/42624 [01:35<00:15, 378.13it/s]Preprocessing raw dataset...:  86%|████████████  | 36689/42624 [01:35<00:14, 395.82it/s]Preprocessing raw dataset...:  86%|████████████  | 36729/42624 [01:35<00:16, 365.19it/s]Preprocessing raw dataset...:  86%|████████████  | 36774/42624 [01:35<00:15, 381.45it/s]Preprocessing raw dataset...:  86%|████████████  | 36813/42624 [01:35<00:15, 378.94it/s]Preprocessing raw dataset...:  86%|████████████  | 36852/42624 [01:35<00:16, 349.17it/s]Preprocessing raw dataset...:  87%|████████████  | 36888/42624 [01:36<00:16, 342.68it/s]Preprocessing raw dataset...:  87%|████████████▏ | 36923/42624 [01:36<00:17, 331.36it/s]Preprocessing raw dataset...:  87%|████████████▏ | 36962/42624 [01:36<00:16, 346.79it/s]Preprocessing raw dataset...:  87%|████████████▏ | 36998/42624 [01:36<00:16, 338.50it/s]Preprocessing raw dataset...:  87%|████████████▏ | 37035/42624 [01:36<00:16, 345.05it/s]Preprocessing raw dataset...:  87%|████████████▏ | 37075/42624 [01:36<00:15, 360.04it/s]Preprocessing raw dataset...:  87%|████████████▏ | 37112/42624 [01:36<00:15, 348.58it/s]Preprocessing raw dataset...:  87%|████████████▏ | 37148/42624 [01:36<00:15, 351.49it/s]Preprocessing raw dataset...:  87%|████████████▏ | 37184/42624 [01:36<00:15, 351.33it/s]Preprocessing raw dataset...:  87%|████████████▏ | 37225/42624 [01:37<00:14, 365.09it/s]Preprocessing raw dataset...:  87%|████████████▏ | 37262/42624 [01:37<00:14, 361.31it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37304/42624 [01:37<00:14, 375.71it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37345/42624 [01:37<00:13, 383.68it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37384/42624 [01:37<00:14, 369.10it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37422/42624 [01:37<00:14, 367.38it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37459/42624 [01:37<00:14, 352.42it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37498/42624 [01:37<00:14, 358.57it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37534/42624 [01:37<00:14, 355.11it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37570/42624 [01:37<00:14, 348.67it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37608/42624 [01:38<00:14, 353.26it/s]Preprocessing raw dataset...:  88%|████████████▎ | 37644/42624 [01:38<00:14, 347.20it/s]Preprocessing raw dataset...:  88%|████████████▍ | 37686/42624 [01:38<00:13, 367.86it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37730/42624 [01:38<00:12, 387.66it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37769/42624 [01:38<00:13, 362.15it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37807/42624 [01:38<00:13, 366.84it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37844/42624 [01:38<00:13, 366.39it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37881/42624 [01:38<00:13, 358.65it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37918/42624 [01:38<00:13, 349.29it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37956/42624 [01:39<00:13, 352.73it/s]Preprocessing raw dataset...:  89%|████████████▍ | 37992/42624 [01:39<00:13, 332.73it/s]Preprocessing raw dataset...:  89%|████████████▍ | 38030/42624 [01:39<00:13, 344.18it/s]Preprocessing raw dataset...:  89%|████████████▌ | 38067/42624 [01:39<00:13, 347.36it/s]Preprocessing raw dataset...:  89%|████████████▌ | 38105/42624 [01:39<00:12, 353.52it/s]Preprocessing raw dataset...:  89%|████████████▌ | 38143/42624 [01:39<00:12, 359.54it/s]Preprocessing raw dataset...:  90%|████████████▌ | 38185/42624 [01:39<00:11, 375.26it/s]Preprocessing raw dataset...:  90%|████████████▌ | 38223/42624 [01:39<00:12, 353.00it/s]Preprocessing raw dataset...:  90%|████████████▌ | 38260/42624 [01:39<00:12, 355.97it/s]Preprocessing raw dataset...:  90%|████████████▌ | 38296/42624 [01:40<00:12, 334.10it/s]Preprocessing raw dataset...:  90%|████████████▌ | 38338/42624 [01:40<00:12, 356.82it/s]Preprocessing raw dataset...:  90%|████████████▌ | 38375/42624 [01:40<00:11, 360.15it/s]Preprocessing raw dataset...:  90%|████████████▌ | 38412/42624 [01:40<00:12, 335.50it/s]Preprocessing raw dataset...:  90%|████████████▋ | 38448/42624 [01:40<00:12, 340.89it/s]Preprocessing raw dataset...:  90%|████████████▋ | 38486/42624 [01:40<00:12, 343.36it/s]Preprocessing raw dataset...:  90%|████████████▋ | 38521/42624 [01:40<00:11, 342.68it/s]Preprocessing raw dataset...:  90%|████████████▋ | 38561/42624 [01:40<00:11, 356.83it/s]Preprocessing raw dataset...:  91%|████████████▋ | 38609/42624 [01:40<00:10, 388.33it/s]Preprocessing raw dataset...:  91%|████████████▋ | 38649/42624 [01:41<00:10, 371.80it/s]Preprocessing raw dataset...:  91%|████████████▋ | 38687/42624 [01:41<00:10, 367.43it/s]Preprocessing raw dataset...:  91%|████████████▋ | 38733/42624 [01:41<00:09, 393.09it/s]Preprocessing raw dataset...:  91%|████████████▋ | 38773/42624 [01:41<00:10, 361.57it/s]Preprocessing raw dataset...:  91%|████████████▋ | 38810/42624 [01:41<00:10, 352.05it/s]Preprocessing raw dataset...:  91%|████████████▊ | 38853/42624 [01:41<00:10, 371.68it/s]Preprocessing raw dataset...:  91%|████████████▊ | 38893/42624 [01:41<00:09, 379.47it/s]Preprocessing raw dataset...:  91%|████████████▊ | 38932/42624 [01:41<00:10, 366.98it/s]Preprocessing raw dataset...:  91%|████████████▊ | 38970/42624 [01:41<00:10, 351.73it/s]Preprocessing raw dataset...:  92%|████████████▊ | 39009/42624 [01:42<00:10, 358.11it/s]Preprocessing raw dataset...:  92%|████████████▊ | 39055/42624 [01:42<00:09, 385.12it/s]Preprocessing raw dataset...:  92%|████████████▊ | 39094/42624 [01:42<00:09, 385.79it/s]Preprocessing raw dataset...:  92%|████████████▊ | 39133/42624 [01:42<00:09, 370.46it/s]Preprocessing raw dataset...:  92%|████████████▊ | 39171/42624 [01:42<00:09, 357.36it/s]Preprocessing raw dataset...:  92%|████████████▉ | 39217/42624 [01:42<00:08, 385.70it/s]Preprocessing raw dataset...:  92%|████████████▉ | 39256/42624 [01:42<00:09, 366.72it/s]Preprocessing raw dataset...:  92%|████████████▉ | 39296/42624 [01:42<00:08, 375.90it/s]Preprocessing raw dataset...:  92%|████████████▉ | 39338/42624 [01:42<00:08, 385.54it/s]Preprocessing raw dataset...:  92%|████████████▉ | 39377/42624 [01:42<00:09, 359.00it/s]Preprocessing raw dataset...:  92%|████████████▉ | 39414/42624 [01:43<00:08, 361.49it/s]Preprocessing raw dataset...:  93%|████████████▉ | 39455/42624 [01:43<00:08, 370.51it/s]Preprocessing raw dataset...:  93%|████████████▉ | 39493/42624 [01:43<00:08, 365.38it/s]Preprocessing raw dataset...:  93%|████████████▉ | 39534/42624 [01:43<00:08, 374.55it/s]Preprocessing raw dataset...:  93%|████████████▉ | 39577/42624 [01:43<00:07, 390.26it/s]Preprocessing raw dataset...:  93%|█████████████ | 39617/42624 [01:43<00:07, 386.59it/s]Preprocessing raw dataset...:  93%|█████████████ | 39657/42624 [01:43<00:07, 384.73it/s]Preprocessing raw dataset...:  93%|█████████████ | 39696/42624 [01:43<00:07, 373.80it/s]Preprocessing raw dataset...:  93%|█████████████ | 39734/42624 [01:43<00:07, 374.56it/s]Preprocessing raw dataset...:  93%|█████████████ | 39772/42624 [01:44<00:07, 364.02it/s]Preprocessing raw dataset...:  93%|█████████████ | 39813/42624 [01:44<00:07, 377.04it/s]Preprocessing raw dataset...:  93%|█████████████ | 39851/42624 [01:44<00:07, 368.90it/s]Preprocessing raw dataset...:  94%|█████████████ | 39889/42624 [01:44<00:07, 360.73it/s]Preprocessing raw dataset...:  94%|█████████████ | 39932/42624 [01:44<00:07, 378.85it/s]Preprocessing raw dataset...:  94%|█████████████▏| 39971/42624 [01:44<00:07, 374.92it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40012/42624 [01:44<00:06, 384.75it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40051/42624 [01:44<00:06, 371.79it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40089/42624 [01:44<00:06, 369.01it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40127/42624 [01:45<00:07, 353.16it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40163/42624 [01:45<00:07, 329.12it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40204/42624 [01:45<00:07, 345.27it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40239/42624 [01:45<00:06, 341.14it/s]Preprocessing raw dataset...:  94%|█████████████▏| 40275/42624 [01:45<00:06, 346.40it/s]Preprocessing raw dataset...:  95%|█████████████▏| 40317/42624 [01:45<00:06, 363.42it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40354/42624 [01:45<00:06, 364.08it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40391/42624 [01:45<00:06, 362.70it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40428/42624 [01:45<00:06, 355.82it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40466/42624 [01:45<00:06, 355.18it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40504/42624 [01:46<00:05, 359.15it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40541/42624 [01:46<00:05, 361.28it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40580/42624 [01:46<00:05, 367.97it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40617/42624 [01:46<00:05, 350.53it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40653/42624 [01:46<00:05, 338.23it/s]Preprocessing raw dataset...:  95%|█████████████▎| 40688/42624 [01:46<00:06, 320.18it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40726/42624 [01:46<00:05, 334.42it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40762/42624 [01:46<00:05, 339.59it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40799/42624 [01:46<00:05, 345.00it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40842/42624 [01:47<00:04, 365.74it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40885/42624 [01:47<00:04, 381.45it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40924/42624 [01:47<00:04, 373.39it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40962/42624 [01:47<00:04, 366.20it/s]Preprocessing raw dataset...:  96%|█████████████▍| 40999/42624 [01:47<00:04, 362.19it/s]Preprocessing raw dataset...:  96%|█████████████▍| 41036/42624 [01:47<00:04, 359.16it/s]Preprocessing raw dataset...:  96%|█████████████▍| 41076/42624 [01:47<00:04, 368.38it/s]Preprocessing raw dataset...:  96%|█████████████▌| 41113/42624 [01:47<00:04, 351.95it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41153/42624 [01:47<00:04, 364.39it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41190/42624 [01:48<00:04, 349.85it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41226/42624 [01:48<00:04, 336.30it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41260/42624 [01:48<00:04, 321.70it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41294/42624 [01:48<00:04, 324.93it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41327/42624 [01:48<00:04, 323.11it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41360/42624 [01:48<00:03, 320.26it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41393/42624 [01:48<00:03, 319.32it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41437/42624 [01:48<00:03, 351.41it/s]Preprocessing raw dataset...:  97%|█████████████▌| 41479/42624 [01:48<00:03, 371.01it/s]Preprocessing raw dataset...:  97%|█████████████▋| 41517/42624 [01:48<00:03, 363.91it/s]Preprocessing raw dataset...:  97%|█████████████▋| 41554/42624 [01:49<00:03, 356.58it/s]Preprocessing raw dataset...:  98%|█████████████▋| 41591/42624 [01:49<00:02, 358.08it/s]Preprocessing raw dataset...:  98%|█████████████▋| 41635/42624 [01:49<00:02, 380.15it/s]Preprocessing raw dataset...:  98%|█████████████▋| 41674/42624 [01:49<00:02, 379.82it/s]Preprocessing raw dataset...:  98%|█████████████▋| 41713/42624 [01:49<00:02, 353.93it/s]Preprocessing raw dataset...:  98%|█████████████▋| 41753/42624 [01:49<00:02, 366.33it/s]Preprocessing raw dataset...:  98%|█████████████▋| 41791/42624 [01:49<00:02, 356.50it/s]Preprocessing raw dataset...:  98%|█████████████▋| 41830/42624 [01:49<00:02, 364.25it/s]Preprocessing raw dataset...:  98%|█████████████▊| 41867/42624 [01:49<00:02, 359.79it/s]Preprocessing raw dataset...:  98%|█████████████▊| 41904/42624 [01:50<00:02, 359.18it/s]Preprocessing raw dataset...:  98%|█████████████▊| 41942/42624 [01:50<00:01, 357.12it/s]Preprocessing raw dataset...:  99%|█████████████▊| 41985/42624 [01:50<00:01, 378.01it/s]Preprocessing raw dataset...:  99%|█████████████▊| 42023/42624 [01:50<00:01, 356.41it/s]Preprocessing raw dataset...:  99%|█████████████▊| 42062/42624 [01:50<00:01, 365.16it/s]Preprocessing raw dataset...:  99%|█████████████▊| 42101/42624 [01:50<00:01, 370.97it/s]Preprocessing raw dataset...:  99%|█████████████▊| 42139/42624 [01:50<00:01, 355.41it/s]Preprocessing raw dataset...:  99%|█████████████▊| 42180/42624 [01:50<00:01, 368.56it/s]Preprocessing raw dataset...:  99%|█████████████▊| 42219/42624 [01:50<00:01, 372.91it/s]Preprocessing raw dataset...:  99%|█████████████▉| 42257/42624 [01:51<00:01, 345.88it/s]Preprocessing raw dataset...:  99%|█████████████▉| 42293/42624 [01:51<00:00, 340.61it/s]Preprocessing raw dataset...:  99%|█████████████▉| 42334/42624 [01:51<00:00, 356.58it/s]Preprocessing raw dataset...:  99%|█████████████▉| 42370/42624 [01:51<00:01, 170.44it/s]Preprocessing raw dataset...:  99%|█████████████▉| 42404/42624 [01:51<00:01, 197.30it/s]Preprocessing raw dataset...: 100%|█████████████▉| 42440/42624 [01:51<00:00, 227.61it/s]Preprocessing raw dataset...: 100%|█████████████▉| 42474/42624 [01:52<00:00, 249.99it/s]Preprocessing raw dataset...: 100%|█████████████▉| 42516/42624 [01:52<00:00, 288.67it/s]Preprocessing raw dataset...: 100%|█████████████▉| 42551/42624 [01:52<00:00, 286.77it/s]Preprocessing raw dataset...: 100%|█████████████▉| 42584/42624 [01:52<00:00, 284.50it/s]Preprocessing raw dataset...: 100%|█████████████▉| 42618/42624 [01:52<00:00, 295.86it/s]Preprocessing raw dataset...: 100%|██████████████| 42624/42624 [01:52<00:00, 378.90it/s]
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Detected CUDA files, patching ldflags
Emitting ninja build file /root/.cache/torch_extensions/py310_cu117/fused_adam/build.ninja...
Building extension module fused_adam...
Allowing ninja to set a default number of workers... (overridable by setting the environment variable MAX_JOBS=N)
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Using /root/.cache/torch_extensions/py310_cu117 as PyTorch extensions root...
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Loading extension module fused_adam...
Training 1/2 epoch:   0%|                                      | 0/1066 [00:00<?, ?it/s]Training 1/2 epoch (loss 0.7031):   0%|                        | 0/1066 [00:06<?, ?it/s]Training 1/2 epoch (loss 0.7031):   0%|              | 1/1066 [00:06<2:02:32,  6.90s/it]Training 1/2 epoch (loss 0.8242):   0%|              | 1/1066 [00:13<2:02:32,  6.90s/it]Training 1/2 epoch (loss 0.8242):   0%|              | 2/1066 [00:13<1:57:20,  6.62s/it]Training 1/2 epoch (loss 0.6328):   0%|              | 2/1066 [00:20<1:57:20,  6.62s/it]Training 1/2 epoch (loss 0.6328):   0%|              | 3/1066 [00:20<1:59:47,  6.76s/it]Training 1/2 epoch (loss 0.6836):   0%|              | 3/1066 [00:26<1:59:47,  6.76s/it]Training 1/2 epoch (loss 0.6836):   0%|              | 4/1066 [00:26<1:57:19,  6.63s/it]Training 1/2 epoch (loss 0.7734):   0%|              | 4/1066 [00:32<1:57:19,  6.63s/it]Training 1/2 epoch (loss 0.7734):   0%|              | 5/1066 [00:32<1:55:07,  6.51s/it]Training 1/2 epoch (loss 0.6992):   0%|              | 5/1066 [00:40<1:55:07,  6.51s/it]Training 1/2 epoch (loss 0.6992):   1%|              | 6/1066 [00:40<1:58:20,  6.70s/it]Training 1/2 epoch (loss 0.7852):   1%|              | 6/1066 [00:45<1:58:20,  6.70s/it]Training 1/2 epoch (loss 0.7852):   1%|              | 7/1066 [00:45<1:48:37,  6.15s/it]Training 1/2 epoch (loss 0.8203):   1%|              | 7/1066 [00:51<1:48:37,  6.15s/it]Training 1/2 epoch (loss 0.8203):   1%|              | 8/1066 [00:51<1:48:31,  6.15s/it]Training 1/2 epoch (loss 0.6797):   1%|              | 8/1066 [00:57<1:48:31,  6.15s/it]Training 1/2 epoch (loss 0.6797):   1%|              | 9/1066 [00:57<1:48:49,  6.18s/it]Training 1/2 epoch (loss 0.7188):   1%|              | 9/1066 [01:02<1:48:49,  6.18s/it]Training 1/2 epoch (loss 0.7188):   1%|             | 10/1066 [01:02<1:42:36,  5.83s/it]Training 1/2 epoch (loss 0.7734):   1%|             | 10/1066 [01:08<1:42:36,  5.83s/it]Training 1/2 epoch (loss 0.7734):   1%|▏            | 11/1066 [01:08<1:44:52,  5.96s/it]Training 1/2 epoch (loss 0.6758):   1%|▏            | 11/1066 [01:15<1:44:52,  5.96s/it]Training 1/2 epoch (loss 0.6758):   1%|▏            | 12/1066 [01:15<1:47:32,  6.12s/it]Training 1/2 epoch (loss 0.7500):   1%|▏            | 12/1066 [01:21<1:47:32,  6.12s/it]Training 1/2 epoch (loss 0.7500):   1%|▏            | 13/1066 [01:21<1:47:10,  6.11s/it]Training 1/2 epoch (loss 0.6836):   1%|▏            | 13/1066 [01:27<1:47:10,  6.11s/it]Training 1/2 epoch (loss 0.6836):   1%|▏            | 14/1066 [01:27<1:48:37,  6.20s/it]Training 1/2 epoch (loss 0.7109):   1%|▏            | 14/1066 [01:34<1:48:37,  6.20s/it]Training 1/2 epoch (loss 0.7109):   1%|▏            | 15/1066 [01:34<1:49:29,  6.25s/it]Training 1/2 epoch (loss 0.7773):   1%|▏            | 15/1066 [01:40<1:49:29,  6.25s/it]Training 1/2 epoch (loss 0.7773):   2%|▏            | 16/1066 [01:40<1:50:03,  6.29s/it]Training 1/2 epoch (loss 0.6797):   2%|▏            | 16/1066 [01:46<1:50:03,  6.29s/it]Training 1/2 epoch (loss 0.6797):   2%|▏            | 17/1066 [01:46<1:50:40,  6.33s/it]Training 1/2 epoch (loss 0.6289):   2%|▏            | 17/1066 [01:53<1:50:40,  6.33s/it]Training 1/2 epoch (loss 0.6289):   2%|▏            | 18/1066 [01:53<1:51:25,  6.38s/it]Training 1/2 epoch (loss 0.5469):   2%|▏            | 18/1066 [01:59<1:51:25,  6.38s/it]Training 1/2 epoch (loss 0.5469):   2%|▏            | 19/1066 [01:59<1:49:31,  6.28s/it]Training 1/2 epoch (loss 0.7188):   2%|▏            | 19/1066 [02:05<1:49:31,  6.28s/it]Training 1/2 epoch (loss 0.7188):   2%|▏            | 20/1066 [02:05<1:49:14,  6.27s/it]Training 1/2 epoch (loss 0.5742):   2%|▏            | 20/1066 [02:12<1:49:14,  6.27s/it]Training 1/2 epoch (loss 0.5742):   2%|▎            | 21/1066 [02:12<1:49:56,  6.31s/it]Training 1/2 epoch (loss 0.5625):   2%|▎            | 21/1066 [02:18<1:49:56,  6.31s/it]Training 1/2 epoch (loss 0.5625):   2%|▎            | 22/1066 [02:18<1:48:15,  6.22s/it]Training 1/2 epoch (loss 0.5938):   2%|▎            | 22/1066 [02:23<1:48:15,  6.22s/it]Training 1/2 epoch (loss 0.5938):   2%|▎            | 23/1066 [02:23<1:42:31,  5.90s/it]Training 1/2 epoch (loss 0.6328):   2%|▎            | 23/1066 [02:28<1:42:31,  5.90s/it]Training 1/2 epoch (loss 0.6328):   2%|▎            | 24/1066 [02:28<1:40:52,  5.81s/it]Training 1/2 epoch (loss 0.5820):   2%|▎            | 24/1066 [02:34<1:40:52,  5.81s/it]Training 1/2 epoch (loss 0.5820):   2%|▎            | 25/1066 [02:34<1:42:22,  5.90s/it]Training 1/2 epoch (loss 0.5820):   2%|▎            | 25/1066 [02:41<1:42:22,  5.90s/it]Training 1/2 epoch (loss 0.5820):   2%|▎            | 26/1066 [02:41<1:44:15,  6.01s/it]Training 1/2 epoch (loss 0.7812):   2%|▎            | 26/1066 [02:47<1:44:15,  6.01s/it]Training 1/2 epoch (loss 0.7812):   3%|▎            | 27/1066 [02:47<1:43:19,  5.97s/it]Training 1/2 epoch (loss 0.6602):   3%|▎            | 27/1066 [02:53<1:43:19,  5.97s/it]Training 1/2 epoch (loss 0.6602):   3%|▎            | 28/1066 [02:53<1:44:18,  6.03s/it]Training 1/2 epoch (loss 0.7461):   3%|▎            | 28/1066 [02:59<1:44:18,  6.03s/it]Training 1/2 epoch (loss 0.7461):   3%|▎            | 29/1066 [02:59<1:46:35,  6.17s/it]Training 1/2 epoch (loss 0.6875):   3%|▎            | 29/1066 [03:06<1:46:35,  6.17s/it]Training 1/2 epoch (loss 0.6875):   3%|▎            | 30/1066 [03:06<1:47:04,  6.20s/it]Training 1/2 epoch (loss 0.5820):   3%|▎            | 30/1066 [03:12<1:47:04,  6.20s/it]Training 1/2 epoch (loss 0.5820):   3%|▍            | 31/1066 [03:12<1:47:41,  6.24s/it]Training 1/2 epoch (loss 0.5078):   3%|▍            | 31/1066 [03:17<1:47:41,  6.24s/it]Training 1/2 epoch (loss 0.5078):   3%|▍            | 32/1066 [03:17<1:42:52,  5.97s/it]Training 1/2 epoch (loss 0.6445):   3%|▍            | 32/1066 [03:24<1:42:52,  5.97s/it]Training 1/2 epoch (loss 0.6445):   3%|▍            | 33/1066 [03:24<1:45:46,  6.14s/it]Training 1/2 epoch (loss 0.4922):   3%|▍            | 33/1066 [03:30<1:45:46,  6.14s/it]Training 1/2 epoch (loss 0.4922):   3%|▍            | 34/1066 [03:30<1:46:22,  6.18s/it]Training 1/2 epoch (loss 0.6016):   3%|▍            | 34/1066 [03:36<1:46:22,  6.18s/it]Training 1/2 epoch (loss 0.6016):   3%|▍            | 35/1066 [03:36<1:46:44,  6.21s/it]Training 1/2 epoch (loss 0.6016):   3%|▍            | 35/1066 [03:43<1:46:44,  6.21s/it]Training 1/2 epoch (loss 0.6016):   3%|▍            | 36/1066 [03:43<1:48:54,  6.34s/it]Training 1/2 epoch (loss 0.5625):   3%|▍            | 36/1066 [03:49<1:48:54,  6.34s/it]Training 1/2 epoch (loss 0.5625):   3%|▍            | 37/1066 [03:49<1:48:13,  6.31s/it]Training 1/2 epoch (loss 0.5586):   3%|▍            | 37/1066 [03:55<1:48:13,  6.31s/it]Training 1/2 epoch (loss 0.5586):   4%|▍            | 38/1066 [03:55<1:44:11,  6.08s/it]Training 1/2 epoch (loss 0.5391):   4%|▍            | 38/1066 [04:01<1:44:11,  6.08s/it]Training 1/2 epoch (loss 0.5391):   4%|▍            | 39/1066 [04:01<1:45:51,  6.18s/it]Training 1/2 epoch (loss 0.6211):   4%|▍            | 39/1066 [04:07<1:45:51,  6.18s/it]Training 1/2 epoch (loss 0.6211):   4%|▍            | 40/1066 [04:07<1:42:04,  5.97s/it]Training 1/2 epoch (loss 0.5117):   4%|▍            | 40/1066 [04:13<1:42:04,  5.97s/it]Training 1/2 epoch (loss 0.5117):   4%|▌            | 41/1066 [04:13<1:43:39,  6.07s/it]Training 1/2 epoch (loss 0.6914):   4%|▌            | 41/1066 [04:18<1:43:39,  6.07s/it]Training 1/2 epoch (loss 0.6914):   4%|▌            | 42/1066 [04:18<1:39:25,  5.83s/it]Training 1/2 epoch (loss 0.4258):   4%|▌            | 42/1066 [04:24<1:39:25,  5.83s/it]Training 1/2 epoch (loss 0.4258):   4%|▌            | 43/1066 [04:24<1:37:09,  5.70s/it]Training 1/2 epoch (loss 0.4258):   4%|▌            | 43/1066 [04:30<1:37:09,  5.70s/it]Training 1/2 epoch (loss 0.4258):   4%|▌            | 44/1066 [04:30<1:40:36,  5.91s/it]Training 1/2 epoch (loss 0.5508):   4%|▌            | 44/1066 [04:36<1:40:36,  5.91s/it]Training 1/2 epoch (loss 0.5508):   4%|▌            | 45/1066 [04:36<1:43:23,  6.08s/it]Training 1/2 epoch (loss 0.5156):   4%|▌            | 45/1066 [04:43<1:43:23,  6.08s/it]Training 1/2 epoch (loss 0.5156):   4%|▌            | 46/1066 [04:43<1:44:38,  6.16s/it]Training 1/2 epoch (loss 0.5586):   4%|▌            | 46/1066 [04:49<1:44:38,  6.16s/it]Training 1/2 epoch (loss 0.5586):   4%|▌            | 47/1066 [04:49<1:43:32,  6.10s/it]Training 1/2 epoch (loss 0.5508):   4%|▌            | 47/1066 [04:55<1:43:32,  6.10s/it]Training 1/2 epoch (loss 0.5508):   5%|▌            | 48/1066 [04:55<1:41:40,  5.99s/it]Training 1/2 epoch (loss 0.5391):   5%|▌            | 48/1066 [05:01<1:41:40,  5.99s/it]Training 1/2 epoch (loss 0.5391):   5%|▌            | 49/1066 [05:01<1:42:49,  6.07s/it]Training 1/2 epoch (loss 0.5547):   5%|▌            | 49/1066 [05:07<1:42:49,  6.07s/it]Training 1/2 epoch (loss 0.5547):   5%|▌            | 50/1066 [05:07<1:43:51,  6.13s/it]Training 1/2 epoch (loss 0.4707):   5%|▌            | 50/1066 [05:14<1:43:51,  6.13s/it]Training 1/2 epoch (loss 0.4707):   5%|▌            | 51/1066 [05:14<1:46:02,  6.27s/it]Training 1/2 epoch (loss 0.5430):   5%|▌            | 51/1066 [05:19<1:46:02,  6.27s/it]Training 1/2 epoch (loss 0.5430):   5%|▋            | 52/1066 [05:19<1:43:08,  6.10s/it]Training 1/2 epoch (loss 0.4922):   5%|▋            | 52/1066 [05:25<1:43:08,  6.10s/it]Training 1/2 epoch (loss 0.4922):   5%|▋            | 53/1066 [05:25<1:42:27,  6.07s/it]Training 1/2 epoch (loss 0.5898):   5%|▋            | 53/1066 [05:31<1:42:27,  6.07s/it]Training 1/2 epoch (loss 0.5898):   5%|▋            | 54/1066 [05:31<1:41:15,  6.00s/it]Training 1/2 epoch (loss 0.5000):   5%|▋            | 54/1066 [05:38<1:41:15,  6.00s/it]Training 1/2 epoch (loss 0.5000):   5%|▋            | 55/1066 [05:38<1:43:35,  6.15s/it]Training 1/2 epoch (loss 0.4922):   5%|▋            | 55/1066 [05:44<1:43:35,  6.15s/it]Training 1/2 epoch (loss 0.4922):   5%|▋            | 56/1066 [05:44<1:43:21,  6.14s/it]Training 1/2 epoch (loss 0.5195):   5%|▋            | 56/1066 [05:50<1:43:21,  6.14s/it]Training 1/2 epoch (loss 0.5195):   5%|▋            | 57/1066 [05:50<1:45:37,  6.28s/it]Training 1/2 epoch (loss 0.4824):   5%|▋            | 57/1066 [05:57<1:45:37,  6.28s/it]Training 1/2 epoch (loss 0.4824):   5%|▋            | 58/1066 [05:57<1:45:29,  6.28s/it]Training 1/2 epoch (loss 0.5117):   5%|▋            | 58/1066 [06:03<1:45:29,  6.28s/it]Training 1/2 epoch (loss 0.5117):   6%|▋            | 59/1066 [06:03<1:43:24,  6.16s/it]Training 1/2 epoch (loss 0.3789):   6%|▋            | 59/1066 [06:08<1:43:24,  6.16s/it]Training 1/2 epoch (loss 0.3789):   6%|▋            | 60/1066 [06:08<1:41:53,  6.08s/it]Training 1/2 epoch (loss 0.5469):   6%|▋            | 60/1066 [06:15<1:41:53,  6.08s/it]Training 1/2 epoch (loss 0.5469):   6%|▋            | 61/1066 [06:15<1:41:44,  6.07s/it]Training 1/2 epoch (loss 0.5430):   6%|▋            | 61/1066 [06:21<1:41:44,  6.07s/it]Training 1/2 epoch (loss 0.5430):   6%|▊            | 62/1066 [06:21<1:41:12,  6.05s/it]Training 1/2 epoch (loss 0.4746):   6%|▊            | 62/1066 [06:27<1:41:12,  6.05s/it]Training 1/2 epoch (loss 0.4746):   6%|▊            | 63/1066 [06:27<1:43:21,  6.18s/it]Training 1/2 epoch (loss 0.4473):   6%|▊            | 63/1066 [06:32<1:43:21,  6.18s/it]Training 1/2 epoch (loss 0.4473):   6%|▊            | 64/1066 [06:32<1:37:38,  5.85s/it]Training 1/2 epoch (loss 0.4902):   6%|▊            | 64/1066 [06:39<1:37:38,  5.85s/it]Training 1/2 epoch (loss 0.4902):   6%|▊            | 65/1066 [06:39<1:40:55,  6.05s/it]Training 1/2 epoch (loss 0.4258):   6%|▊            | 65/1066 [06:45<1:40:55,  6.05s/it]Training 1/2 epoch (loss 0.4258):   6%|▊            | 66/1066 [06:45<1:43:27,  6.21s/it]Training 1/2 epoch (loss 0.4551):   6%|▊            | 66/1066 [06:51<1:43:27,  6.21s/it]Training 1/2 epoch (loss 0.4551):   6%|▊            | 67/1066 [06:51<1:43:43,  6.23s/it]Training 1/2 epoch (loss 0.5898):   6%|▊            | 67/1066 [06:57<1:43:43,  6.23s/it]Training 1/2 epoch (loss 0.5898):   6%|▊            | 68/1066 [06:57<1:42:15,  6.15s/it]Training 1/2 epoch (loss 0.5352):   6%|▊            | 68/1066 [07:04<1:42:15,  6.15s/it]Training 1/2 epoch (loss 0.5352):   6%|▊            | 69/1066 [07:04<1:43:28,  6.23s/it]Training 1/2 epoch (loss 0.7734):   6%|▊            | 69/1066 [07:10<1:43:28,  6.23s/it]Training 1/2 epoch (loss 0.7734):   7%|▊            | 70/1066 [07:10<1:43:15,  6.22s/it]Training 1/2 epoch (loss 0.5703):   7%|▊            | 70/1066 [07:15<1:43:15,  6.22s/it]Training 1/2 epoch (loss 0.5703):   7%|▊            | 71/1066 [07:15<1:38:00,  5.91s/it]Training 1/2 epoch (loss 0.6133):   7%|▊            | 71/1066 [07:22<1:38:00,  5.91s/it]Training 1/2 epoch (loss 0.6133):   7%|▉            | 72/1066 [07:22<1:41:19,  6.12s/it]Training 1/2 epoch (loss 0.5078):   7%|▉            | 72/1066 [07:28<1:41:19,  6.12s/it]Training 1/2 epoch (loss 0.5078):   7%|▉            | 73/1066 [07:28<1:43:06,  6.23s/it]Training 1/2 epoch (loss 0.6016):   7%|▉            | 73/1066 [07:34<1:43:06,  6.23s/it]Training 1/2 epoch (loss 0.6016):   7%|▉            | 74/1066 [07:34<1:41:57,  6.17s/it]Training 1/2 epoch (loss 0.6641):   7%|▉            | 74/1066 [07:41<1:41:57,  6.17s/it]Training 1/2 epoch (loss 0.6641):   7%|▉            | 75/1066 [07:41<1:44:03,  6.30s/it]Training 1/2 epoch (loss 0.5273):   7%|▉            | 75/1066 [07:47<1:44:03,  6.30s/it]Training 1/2 epoch (loss 0.5273):   7%|▉            | 76/1066 [07:47<1:42:52,  6.23s/it]Training 1/2 epoch (loss 0.5117):   7%|▉            | 76/1066 [07:53<1:42:52,  6.23s/it]Training 1/2 epoch (loss 0.5117):   7%|▉            | 77/1066 [07:53<1:39:35,  6.04s/it]Training 1/2 epoch (loss 0.5273):   7%|▉            | 77/1066 [07:59<1:39:35,  6.04s/it]Training 1/2 epoch (loss 0.5273):   7%|▉            | 78/1066 [07:59<1:41:41,  6.18s/it]Training 1/2 epoch (loss 0.5156):   7%|▉            | 78/1066 [08:06<1:41:41,  6.18s/it]Training 1/2 epoch (loss 0.5156):   7%|▉            | 79/1066 [08:06<1:43:01,  6.26s/it]Training 1/2 epoch (loss 0.4473):   7%|▉            | 79/1066 [08:12<1:43:01,  6.26s/it]Training 1/2 epoch (loss 0.4473):   8%|▉            | 80/1066 [08:12<1:41:36,  6.18s/it]Training 1/2 epoch (loss 0.4688):   8%|▉            | 80/1066 [08:18<1:41:36,  6.18s/it]Training 1/2 epoch (loss 0.4688):   8%|▉            | 81/1066 [08:18<1:43:30,  6.30s/it]Training 1/2 epoch (loss 0.5156):   8%|▉            | 81/1066 [08:24<1:43:30,  6.30s/it]Training 1/2 epoch (loss 0.5156):   8%|█            | 82/1066 [08:24<1:42:58,  6.28s/it]Training 1/2 epoch (loss 0.4746):   8%|█            | 82/1066 [08:30<1:42:58,  6.28s/it]Training 1/2 epoch (loss 0.4746):   8%|█            | 83/1066 [08:30<1:41:51,  6.22s/it]Training 1/2 epoch (loss 0.4785):   8%|█            | 83/1066 [08:37<1:41:51,  6.22s/it]Training 1/2 epoch (loss 0.4785):   8%|█            | 84/1066 [08:37<1:43:53,  6.35s/it]Training 1/2 epoch (loss 0.4805):   8%|█            | 84/1066 [08:43<1:43:53,  6.35s/it]Training 1/2 epoch (loss 0.4805):   8%|█            | 85/1066 [08:43<1:43:37,  6.34s/it]Training 1/2 epoch (loss 0.4570):   8%|█            | 85/1066 [08:50<1:43:37,  6.34s/it]Training 1/2 epoch (loss 0.4570):   8%|█            | 86/1066 [08:50<1:43:02,  6.31s/it]Training 1/2 epoch (loss 0.4688):   8%|█            | 86/1066 [08:56<1:43:02,  6.31s/it]Training 1/2 epoch (loss 0.4688):   8%|█            | 87/1066 [08:56<1:41:48,  6.24s/it]Training 1/2 epoch (loss 0.5352):   8%|█            | 87/1066 [09:02<1:41:48,  6.24s/it]Training 1/2 epoch (loss 0.5352):   8%|█            | 88/1066 [09:02<1:40:52,  6.19s/it]Training 1/2 epoch (loss 0.4141):   8%|█            | 88/1066 [09:08<1:40:52,  6.19s/it]Training 1/2 epoch (loss 0.4141):   8%|█            | 89/1066 [09:08<1:40:35,  6.18s/it]Training 1/2 epoch (loss 0.4531):   8%|█            | 89/1066 [09:14<1:40:35,  6.18s/it]Training 1/2 epoch (loss 0.4531):   8%|█            | 90/1066 [09:14<1:39:51,  6.14s/it]Training 1/2 epoch (loss 0.5625):   8%|█            | 90/1066 [09:20<1:39:51,  6.14s/it]Training 1/2 epoch (loss 0.5625):   9%|█            | 91/1066 [09:20<1:37:05,  5.97s/it]Training 1/2 epoch (loss 0.5117):   9%|█            | 91/1066 [09:26<1:37:05,  5.97s/it]Training 1/2 epoch (loss 0.5117):   9%|█            | 92/1066 [09:26<1:38:50,  6.09s/it]Training 1/2 epoch (loss 0.4961):   9%|█            | 92/1066 [09:32<1:38:50,  6.09s/it]Training 1/2 epoch (loss 0.4961):   9%|█▏           | 93/1066 [09:32<1:40:10,  6.18s/it]Training 1/2 epoch (loss 0.5039):   9%|█▏           | 93/1066 [09:39<1:40:10,  6.18s/it]Training 1/2 epoch (loss 0.5039):   9%|█▏           | 94/1066 [09:39<1:41:27,  6.26s/it]Training 1/2 epoch (loss 0.6172):   9%|█▏           | 94/1066 [09:45<1:41:27,  6.26s/it]Training 1/2 epoch (loss 0.6172):   9%|█▏           | 95/1066 [09:45<1:40:49,  6.23s/it]Training 1/2 epoch (loss 0.3809):   9%|█▏           | 95/1066 [09:52<1:40:49,  6.23s/it]Training 1/2 epoch (loss 0.3809):   9%|█▏           | 96/1066 [09:52<1:42:30,  6.34s/it]Training 1/2 epoch (loss 0.5352):   9%|█▏           | 96/1066 [09:58<1:42:30,  6.34s/it]Training 1/2 epoch (loss 0.5352):   9%|█▏           | 97/1066 [09:58<1:42:53,  6.37s/it]Training 1/2 epoch (loss 0.5625):   9%|█▏           | 97/1066 [10:04<1:42:53,  6.37s/it]Training 1/2 epoch (loss 0.5625):   9%|█▏           | 98/1066 [10:04<1:42:19,  6.34s/it]Training 1/2 epoch (loss 0.4043):   9%|█▏           | 98/1066 [10:11<1:42:19,  6.34s/it]Training 1/2 epoch (loss 0.4043):   9%|█▏           | 99/1066 [10:11<1:41:47,  6.32s/it]Training 1/2 epoch (loss 0.5234):   9%|█▏           | 99/1066 [10:16<1:41:47,  6.32s/it]Training 1/2 epoch (loss 0.5234):   9%|█▏          | 100/1066 [10:16<1:37:14,  6.04s/it]Training 1/2 epoch (loss 0.4922):   9%|█▏          | 100/1066 [10:23<1:37:14,  6.04s/it]Training 1/2 epoch (loss 0.4922):   9%|█▏          | 101/1066 [10:23<1:39:48,  6.21s/it]Training 1/2 epoch (loss 0.5547):   9%|█▏          | 101/1066 [10:29<1:39:48,  6.21s/it]Training 1/2 epoch (loss 0.5547):  10%|█▏          | 102/1066 [10:29<1:41:18,  6.30s/it]Training 1/2 epoch (loss 0.3691):  10%|█▏          | 102/1066 [10:35<1:41:18,  6.30s/it]Training 1/2 epoch (loss 0.3691):  10%|█▏          | 103/1066 [10:35<1:40:46,  6.28s/it]Training 1/2 epoch (loss 0.5000):  10%|█▏          | 103/1066 [10:42<1:40:46,  6.28s/it]Training 1/2 epoch (loss 0.5000):  10%|█▏          | 104/1066 [10:42<1:40:42,  6.28s/it]Training 1/2 epoch (loss 0.5352):  10%|█▏          | 104/1066 [10:48<1:40:42,  6.28s/it]Training 1/2 epoch (loss 0.5352):  10%|█▏          | 105/1066 [10:48<1:42:31,  6.40s/it]Training 1/2 epoch (loss 0.5625):  10%|█▏          | 105/1066 [10:54<1:42:31,  6.40s/it]Training 1/2 epoch (loss 0.5625):  10%|█▏          | 106/1066 [10:54<1:41:31,  6.35s/it]Training 1/2 epoch (loss 0.4922):  10%|█▏          | 106/1066 [11:01<1:41:31,  6.35s/it]Training 1/2 epoch (loss 0.4922):  10%|█▏          | 107/1066 [11:01<1:40:50,  6.31s/it]Training 1/2 epoch (loss 0.5391):  10%|█▏          | 107/1066 [11:07<1:40:50,  6.31s/it]Training 1/2 epoch (loss 0.5391):  10%|█▏          | 108/1066 [11:07<1:41:45,  6.37s/it]Training 1/2 epoch (loss 0.5625):  10%|█▏          | 108/1066 [11:13<1:41:45,  6.37s/it]Training 1/2 epoch (loss 0.5625):  10%|█▏          | 109/1066 [11:13<1:41:18,  6.35s/it]Training 1/2 epoch (loss 0.5234):  10%|█▏          | 109/1066 [11:20<1:41:18,  6.35s/it]Training 1/2 epoch (loss 0.5234):  10%|█▏          | 110/1066 [11:20<1:41:16,  6.36s/it]Training 1/2 epoch (loss 0.4863):  10%|█▏          | 110/1066 [11:27<1:41:16,  6.36s/it]Training 1/2 epoch (loss 0.4863):  10%|█▏          | 111/1066 [11:27<1:42:48,  6.46s/it]Training 1/2 epoch (loss 0.5547):  10%|█▏          | 111/1066 [11:33<1:42:48,  6.46s/it]Training 1/2 epoch (loss 0.5547):  11%|█▎          | 112/1066 [11:33<1:41:36,  6.39s/it]Training 1/2 epoch (loss 0.4727):  11%|█▎          | 112/1066 [11:38<1:41:36,  6.39s/it]Training 1/2 epoch (loss 0.4727):  11%|█▎          | 113/1066 [11:38<1:38:04,  6.18s/it]Training 1/2 epoch (loss 0.5703):  11%|█▎          | 113/1066 [11:45<1:38:04,  6.18s/it]Training 1/2 epoch (loss 0.5703):  11%|█▎          | 114/1066 [11:45<1:38:43,  6.22s/it]Training 1/2 epoch (loss 0.5664):  11%|█▎          | 114/1066 [11:50<1:38:43,  6.22s/it]Training 1/2 epoch (loss 0.5664):  11%|█▎          | 115/1066 [11:50<1:33:00,  5.87s/it]Training 1/2 epoch (loss 0.5469):  11%|█▎          | 115/1066 [11:56<1:33:00,  5.87s/it]Training 1/2 epoch (loss 0.5469):  11%|█▎          | 116/1066 [11:56<1:34:36,  5.97s/it]Training 1/2 epoch (loss 0.5195):  11%|█▎          | 116/1066 [12:03<1:34:36,  5.97s/it]Training 1/2 epoch (loss 0.5195):  11%|█▎          | 117/1066 [12:03<1:37:18,  6.15s/it]Training 1/2 epoch (loss 0.5625):  11%|█▎          | 117/1066 [12:09<1:37:18,  6.15s/it]Training 1/2 epoch (loss 0.5625):  11%|█▎          | 118/1066 [12:09<1:38:01,  6.20s/it]Training 1/2 epoch (loss 0.5234):  11%|█▎          | 118/1066 [12:14<1:38:01,  6.20s/it]Training 1/2 epoch (loss 0.5234):  11%|█▎          | 119/1066 [12:14<1:33:53,  5.95s/it]Training 1/2 epoch (loss 0.5352):  11%|█▎          | 119/1066 [12:21<1:33:53,  5.95s/it]Training 1/2 epoch (loss 0.5352):  11%|█▎          | 120/1066 [12:21<1:35:18,  6.05s/it]Training 1/2 epoch (loss 0.4395):  11%|█▎          | 120/1066 [12:27<1:35:18,  6.05s/it]Training 1/2 epoch (loss 0.4395):  11%|█▎          | 121/1066 [12:27<1:36:02,  6.10s/it]Training 1/2 epoch (loss 0.5234):  11%|█▎          | 121/1066 [12:33<1:36:02,  6.10s/it]Training 1/2 epoch (loss 0.5234):  11%|█▎          | 122/1066 [12:33<1:37:14,  6.18s/it]Training 1/2 epoch (loss 0.4941):  11%|█▎          | 122/1066 [12:38<1:37:14,  6.18s/it]Training 1/2 epoch (loss 0.4941):  12%|█▍          | 123/1066 [12:38<1:32:42,  5.90s/it]Training 1/2 epoch (loss 0.4727):  12%|█▍          | 123/1066 [12:44<1:32:42,  5.90s/it]Training 1/2 epoch (loss 0.4727):  12%|█▍          | 124/1066 [12:44<1:31:14,  5.81s/it]Training 1/2 epoch (loss 0.5898):  12%|█▍          | 124/1066 [12:50<1:31:14,  5.81s/it]Training 1/2 epoch (loss 0.5898):  12%|█▍          | 125/1066 [12:50<1:33:23,  5.95s/it]Training 1/2 epoch (loss 0.6094):  12%|█▍          | 125/1066 [12:56<1:33:23,  5.95s/it]Training 1/2 epoch (loss 0.6094):  12%|█▍          | 126/1066 [12:56<1:33:22,  5.96s/it]Training 1/2 epoch (loss 0.4258):  12%|█▍          | 126/1066 [13:02<1:33:22,  5.96s/it]Training 1/2 epoch (loss 0.4258):  12%|█▍          | 127/1066 [13:02<1:33:41,  5.99s/it]Training 1/2 epoch (loss 0.4883):  12%|█▍          | 127/1066 [13:09<1:33:41,  5.99s/it]Training 1/2 epoch (loss 0.4883):  12%|█▍          | 128/1066 [13:09<1:34:41,  6.06s/it]Training 1/2 epoch (loss 0.4844):  12%|█▍          | 128/1066 [13:14<1:34:41,  6.06s/it]Training 1/2 epoch (loss 0.4844):  12%|█▍          | 129/1066 [13:14<1:33:05,  5.96s/it]Training 1/2 epoch (loss 0.5625):  12%|█▍          | 129/1066 [13:21<1:33:05,  5.96s/it]Training 1/2 epoch (loss 0.5625):  12%|█▍          | 130/1066 [13:21<1:35:11,  6.10s/it]Training 1/2 epoch (loss 0.4238):  12%|█▍          | 130/1066 [13:27<1:35:11,  6.10s/it]Training 1/2 epoch (loss 0.4238):  12%|█▍          | 131/1066 [13:27<1:36:11,  6.17s/it]Training 1/2 epoch (loss 0.4766):  12%|█▍          | 131/1066 [13:34<1:36:11,  6.17s/it]Training 1/2 epoch (loss 0.4766):  12%|█▍          | 132/1066 [13:34<1:37:34,  6.27s/it]Training 1/2 epoch (loss 0.4668):  12%|█▍          | 132/1066 [13:40<1:37:34,  6.27s/it]Training 1/2 epoch (loss 0.4668):  12%|█▍          | 133/1066 [13:40<1:37:24,  6.26s/it]Training 1/2 epoch (loss 0.4902):  12%|█▍          | 133/1066 [13:45<1:37:24,  6.26s/it]Training 1/2 epoch (loss 0.4902):  13%|█▌          | 134/1066 [13:45<1:33:28,  6.02s/it]Training 1/2 epoch (loss 0.5625):  13%|█▌          | 134/1066 [13:50<1:33:28,  6.02s/it]Training 1/2 epoch (loss 0.5625):  13%|█▌          | 135/1066 [13:50<1:29:47,  5.79s/it]Training 1/2 epoch (loss 0.6016):  13%|█▌          | 135/1066 [13:57<1:29:47,  5.79s/it]Training 1/2 epoch (loss 0.6016):  13%|█▌          | 136/1066 [13:57<1:32:37,  5.98s/it]Training 1/2 epoch (loss 0.5625):  13%|█▌          | 136/1066 [14:03<1:32:37,  5.98s/it]Training 1/2 epoch (loss 0.5625):  13%|█▌          | 137/1066 [14:03<1:32:54,  6.00s/it]Training 1/2 epoch (loss 0.5391):  13%|█▌          | 137/1066 [14:10<1:32:54,  6.00s/it]Training 1/2 epoch (loss 0.5391):  13%|█▌          | 138/1066 [14:10<1:35:57,  6.20s/it]Training 1/2 epoch (loss 0.5469):  13%|█▌          | 138/1066 [14:15<1:35:57,  6.20s/it]Training 1/2 epoch (loss 0.5469):  13%|█▌          | 139/1066 [14:15<1:30:34,  5.86s/it]Training 1/2 epoch (loss 0.5469):  13%|█▌          | 139/1066 [14:21<1:30:34,  5.86s/it]Training 1/2 epoch (loss 0.5469):  13%|█▌          | 140/1066 [14:21<1:32:44,  6.01s/it]Training 1/2 epoch (loss 0.3750):  13%|█▌          | 140/1066 [14:28<1:32:44,  6.01s/it]Training 1/2 epoch (loss 0.3750):  13%|█▌          | 141/1066 [14:28<1:35:15,  6.18s/it]Training 1/2 epoch (loss 0.4844):  13%|█▌          | 141/1066 [14:34<1:35:15,  6.18s/it]Training 1/2 epoch (loss 0.4844):  13%|█▌          | 142/1066 [14:34<1:34:30,  6.14s/it]Training 1/2 epoch (loss 0.3965):  13%|█▌          | 142/1066 [14:40<1:34:30,  6.14s/it]Training 1/2 epoch (loss 0.3965):  13%|█▌          | 143/1066 [14:40<1:35:58,  6.24s/it]Training 1/2 epoch (loss 0.5586):  13%|█▌          | 143/1066 [14:47<1:35:58,  6.24s/it]Training 1/2 epoch (loss 0.5586):  14%|█▌          | 144/1066 [14:47<1:36:43,  6.29s/it]Training 1/2 epoch (loss 0.5039):  14%|█▌          | 144/1066 [14:53<1:36:43,  6.29s/it]Training 1/2 epoch (loss 0.5039):  14%|█▋          | 145/1066 [14:53<1:37:04,  6.32s/it]Training 1/2 epoch (loss 0.5664):  14%|█▋          | 145/1066 [14:59<1:37:04,  6.32s/it]Training 1/2 epoch (loss 0.5664):  14%|█▋          | 146/1066 [14:59<1:36:54,  6.32s/it]Training 1/2 epoch (loss 0.4512):  14%|█▋          | 146/1066 [15:05<1:36:54,  6.32s/it]Training 1/2 epoch (loss 0.4512):  14%|█▋          | 147/1066 [15:05<1:32:35,  6.05s/it]Training 1/2 epoch (loss 0.5195):  14%|█▋          | 147/1066 [15:10<1:32:35,  6.05s/it]Training 1/2 epoch (loss 0.5195):  14%|█▋          | 148/1066 [15:10<1:28:56,  5.81s/it]Training 1/2 epoch (loss 0.5898):  14%|█▋          | 148/1066 [15:15<1:28:56,  5.81s/it]Training 1/2 epoch (loss 0.5898):  14%|█▋          | 149/1066 [15:15<1:25:25,  5.59s/it]Training 1/2 epoch (loss 0.4297):  14%|█▋          | 149/1066 [15:22<1:25:25,  5.59s/it]Training 1/2 epoch (loss 0.4297):  14%|█▋          | 150/1066 [15:22<1:30:25,  5.92s/it]Training 1/2 epoch (loss 0.5664):  14%|█▋          | 150/1066 [15:28<1:30:25,  5.92s/it]Training 1/2 epoch (loss 0.5664):  14%|█▋          | 151/1066 [15:28<1:30:50,  5.96s/it]Training 1/2 epoch (loss 0.4863):  14%|█▋          | 151/1066 [15:33<1:30:50,  5.96s/it]Training 1/2 epoch (loss 0.4863):  14%|█▋          | 152/1066 [15:33<1:27:17,  5.73s/it]Training 1/2 epoch (loss 0.5156):  14%|█▋          | 152/1066 [15:39<1:27:17,  5.73s/it]Training 1/2 epoch (loss 0.5156):  14%|█▋          | 153/1066 [15:39<1:30:18,  5.93s/it]Training 1/2 epoch (loss 0.5156):  14%|█▋          | 153/1066 [15:45<1:30:18,  5.93s/it]Training 1/2 epoch (loss 0.5156):  14%|█▋          | 154/1066 [15:45<1:30:42,  5.97s/it]Training 1/2 epoch (loss 0.5156):  14%|█▋          | 154/1066 [15:52<1:30:42,  5.97s/it]Training 1/2 epoch (loss 0.5156):  15%|█▋          | 155/1066 [15:52<1:32:19,  6.08s/it]Training 1/2 epoch (loss 0.4336):  15%|█▋          | 155/1066 [15:59<1:32:19,  6.08s/it]Training 1/2 epoch (loss 0.4336):  15%|█▊          | 156/1066 [15:59<1:35:32,  6.30s/it]Training 1/2 epoch (loss 0.4297):  15%|█▊          | 156/1066 [16:05<1:35:32,  6.30s/it]Training 1/2 epoch (loss 0.4297):  15%|█▊          | 157/1066 [16:05<1:34:52,  6.26s/it]Training 1/2 epoch (loss 0.5430):  15%|█▊          | 157/1066 [16:11<1:34:52,  6.26s/it]Training 1/2 epoch (loss 0.5430):  15%|█▊          | 158/1066 [16:11<1:33:08,  6.15s/it]Training 1/2 epoch (loss 0.5508):  15%|█▊          | 158/1066 [16:17<1:33:08,  6.15s/it]Training 1/2 epoch (loss 0.5508):  15%|█▊          | 159/1066 [16:17<1:34:19,  6.24s/it]Training 1/2 epoch (loss 0.5234):  15%|█▊          | 159/1066 [16:22<1:34:19,  6.24s/it]Training 1/2 epoch (loss 0.5234):  15%|█▊          | 160/1066 [16:22<1:29:52,  5.95s/it]Training 1/2 epoch (loss 0.4648):  15%|█▊          | 160/1066 [16:29<1:29:52,  5.95s/it]Training 1/2 epoch (loss 0.4648):  15%|█▊          | 161/1066 [16:29<1:31:11,  6.05s/it]Training 1/2 epoch (loss 0.4863):  15%|█▊          | 161/1066 [16:35<1:31:11,  6.05s/it]Training 1/2 epoch (loss 0.4863):  15%|█▊          | 162/1066 [16:35<1:31:33,  6.08s/it]Training 1/2 epoch (loss 0.6094):  15%|█▊          | 162/1066 [16:41<1:31:33,  6.08s/it]Training 1/2 epoch (loss 0.6094):  15%|█▊          | 163/1066 [16:41<1:30:56,  6.04s/it]Training 1/2 epoch (loss 0.5195):  15%|█▊          | 163/1066 [16:46<1:30:56,  6.04s/it]Training 1/2 epoch (loss 0.5195):  15%|█▊          | 164/1066 [16:46<1:26:37,  5.76s/it]Training 1/2 epoch (loss 0.5547):  15%|█▊          | 164/1066 [16:51<1:26:37,  5.76s/it]Training 1/2 epoch (loss 0.5547):  15%|█▊          | 165/1066 [16:51<1:24:06,  5.60s/it]Training 1/2 epoch (loss 0.4727):  15%|█▊          | 165/1066 [16:57<1:24:06,  5.60s/it]Training 1/2 epoch (loss 0.4727):  16%|█▊          | 166/1066 [16:57<1:25:43,  5.71s/it]Training 1/2 epoch (loss 0.4434):  16%|█▊          | 166/1066 [17:03<1:25:43,  5.71s/it]Training 1/2 epoch (loss 0.4434):  16%|█▉          | 167/1066 [17:03<1:27:13,  5.82s/it]Training 1/2 epoch (loss 0.6016):  16%|█▉          | 167/1066 [17:10<1:27:13,  5.82s/it]Training 1/2 epoch (loss 0.6016):  16%|█▉          | 168/1066 [17:10<1:29:39,  5.99s/it]Training 1/2 epoch (loss 0.5430):  16%|█▉          | 168/1066 [17:16<1:29:39,  5.99s/it]Training 1/2 epoch (loss 0.5430):  16%|█▉          | 169/1066 [17:16<1:30:22,  6.04s/it]Training 1/2 epoch (loss 0.3906):  16%|█▉          | 169/1066 [17:22<1:30:22,  6.04s/it]Training 1/2 epoch (loss 0.3906):  16%|█▉          | 170/1066 [17:22<1:32:11,  6.17s/it]Training 1/2 epoch (loss 0.4453):  16%|█▉          | 170/1066 [17:29<1:32:11,  6.17s/it]Training 1/2 epoch (loss 0.4453):  16%|█▉          | 171/1066 [17:29<1:33:18,  6.26s/it]Training 1/2 epoch (loss 0.4648):  16%|█▉          | 171/1066 [17:35<1:33:18,  6.26s/it]Training 1/2 epoch (loss 0.4648):  16%|█▉          | 172/1066 [17:35<1:34:09,  6.32s/it]Training 1/2 epoch (loss 0.4922):  16%|█▉          | 172/1066 [17:41<1:34:09,  6.32s/it]Training 1/2 epoch (loss 0.4922):  16%|█▉          | 173/1066 [17:41<1:32:49,  6.24s/it]Training 1/2 epoch (loss 0.4102):  16%|█▉          | 173/1066 [17:46<1:32:49,  6.24s/it]Training 1/2 epoch (loss 0.4102):  16%|█▉          | 174/1066 [17:46<1:28:25,  5.95s/it]Training 1/2 epoch (loss 0.5039):  16%|█▉          | 174/1066 [17:53<1:28:25,  5.95s/it]Training 1/2 epoch (loss 0.5039):  16%|█▉          | 175/1066 [17:53<1:29:45,  6.04s/it]Training 1/2 epoch (loss 0.4570):  16%|█▉          | 175/1066 [17:59<1:29:45,  6.04s/it]Training 1/2 epoch (loss 0.4570):  17%|█▉          | 176/1066 [17:59<1:30:32,  6.10s/it]Training 1/2 epoch (loss 0.4766):  17%|█▉          | 176/1066 [18:05<1:30:32,  6.10s/it]Training 1/2 epoch (loss 0.4766):  17%|█▉          | 177/1066 [18:05<1:31:57,  6.21s/it]Training 1/2 epoch (loss 0.4531):  17%|█▉          | 177/1066 [18:12<1:31:57,  6.21s/it]Training 1/2 epoch (loss 0.4531):  17%|██          | 178/1066 [18:12<1:32:00,  6.22s/it]Training 1/2 epoch (loss 0.5195):  17%|██          | 178/1066 [18:18<1:32:00,  6.22s/it]Training 1/2 epoch (loss 0.5195):  17%|██          | 179/1066 [18:18<1:32:20,  6.25s/it]Training 1/2 epoch (loss 0.5469):  17%|██          | 179/1066 [18:25<1:32:20,  6.25s/it]Training 1/2 epoch (loss 0.5469):  17%|██          | 180/1066 [18:25<1:34:20,  6.39s/it]Training 1/2 epoch (loss 0.5391):  17%|██          | 180/1066 [18:30<1:34:20,  6.39s/it]Training 1/2 epoch (loss 0.5391):  17%|██          | 181/1066 [18:30<1:31:16,  6.19s/it]Training 1/2 epoch (loss 0.4434):  17%|██          | 181/1066 [18:37<1:31:16,  6.19s/it]Training 1/2 epoch (loss 0.4434):  17%|██          | 182/1066 [18:37<1:31:53,  6.24s/it]Training 1/2 epoch (loss 0.4316):  17%|██          | 182/1066 [18:43<1:31:53,  6.24s/it]Training 1/2 epoch (loss 0.4316):  17%|██          | 183/1066 [18:43<1:33:54,  6.38s/it]Training 1/2 epoch (loss 0.4121):  17%|██          | 183/1066 [18:49<1:33:54,  6.38s/it]Training 1/2 epoch (loss 0.4121):  17%|██          | 184/1066 [18:49<1:30:08,  6.13s/it]Training 1/2 epoch (loss 0.5039):  17%|██          | 184/1066 [18:55<1:30:08,  6.13s/it]Training 1/2 epoch (loss 0.5039):  17%|██          | 185/1066 [18:55<1:29:38,  6.11s/it]Training 1/2 epoch (loss 0.4648):  17%|██          | 185/1066 [19:02<1:29:38,  6.11s/it]Training 1/2 epoch (loss 0.4648):  17%|██          | 186/1066 [19:02<1:31:27,  6.24s/it]Training 1/2 epoch (loss 0.4512):  17%|██          | 186/1066 [19:08<1:31:27,  6.24s/it]Training 1/2 epoch (loss 0.4512):  18%|██          | 187/1066 [19:08<1:32:11,  6.29s/it]Training 1/2 epoch (loss 0.4141):  18%|██          | 187/1066 [19:14<1:32:11,  6.29s/it]Training 1/2 epoch (loss 0.4141):  18%|██          | 188/1066 [19:14<1:32:37,  6.33s/it]Training 1/2 epoch (loss 0.5000):  18%|██          | 188/1066 [19:20<1:32:37,  6.33s/it]Training 1/2 epoch (loss 0.5000):  18%|██▏         | 189/1066 [19:20<1:28:34,  6.06s/it]Training 1/2 epoch (loss 0.5117):  18%|██▏         | 189/1066 [19:26<1:28:34,  6.06s/it]Training 1/2 epoch (loss 0.5117):  18%|██▏         | 190/1066 [19:26<1:28:52,  6.09s/it]Training 1/2 epoch (loss 0.4727):  18%|██▏         | 190/1066 [19:32<1:28:52,  6.09s/it]Training 1/2 epoch (loss 0.4727):  18%|██▏         | 191/1066 [19:32<1:29:38,  6.15s/it]Training 1/2 epoch (loss 0.4961):  18%|██▏         | 191/1066 [19:39<1:29:38,  6.15s/it]Training 1/2 epoch (loss 0.4961):  18%|██▏         | 192/1066 [19:39<1:32:08,  6.33s/it]Training 1/2 epoch (loss 0.4668):  18%|██▏         | 192/1066 [19:45<1:32:08,  6.33s/it]Training 1/2 epoch (loss 0.4668):  18%|██▏         | 193/1066 [19:45<1:32:00,  6.32s/it]Training 1/2 epoch (loss 0.5234):  18%|██▏         | 193/1066 [19:52<1:32:00,  6.32s/it]Training 1/2 epoch (loss 0.5234):  18%|██▏         | 194/1066 [19:52<1:31:42,  6.31s/it]Training 1/2 epoch (loss 0.4609):  18%|██▏         | 194/1066 [19:57<1:31:42,  6.31s/it]Training 1/2 epoch (loss 0.4609):  18%|██▏         | 195/1066 [19:57<1:27:51,  6.05s/it]Training 1/2 epoch (loss 0.5547):  18%|██▏         | 195/1066 [20:04<1:27:51,  6.05s/it]Training 1/2 epoch (loss 0.5547):  18%|██▏         | 196/1066 [20:04<1:29:35,  6.18s/it]Training 1/2 epoch (loss 0.5586):  18%|██▏         | 196/1066 [20:09<1:29:35,  6.18s/it]Training 1/2 epoch (loss 0.5586):  18%|██▏         | 197/1066 [20:09<1:27:40,  6.05s/it]Training 1/2 epoch (loss 0.5234):  18%|██▏         | 197/1066 [20:16<1:27:40,  6.05s/it]Training 1/2 epoch (loss 0.5234):  19%|██▏         | 198/1066 [20:16<1:29:11,  6.17s/it]Training 1/2 epoch (loss 0.6484):  19%|██▏         | 198/1066 [20:22<1:29:11,  6.17s/it]Training 1/2 epoch (loss 0.6484):  19%|██▏         | 199/1066 [20:22<1:29:12,  6.17s/it]Training 1/2 epoch (loss 0.4805):  19%|██▏         | 199/1066 [20:28<1:29:12,  6.17s/it]Training 1/2 epoch (loss 0.4805):  19%|██▎         | 200/1066 [20:28<1:29:53,  6.23s/it]Training 1/2 epoch (loss 0.4062):  19%|██▎         | 200/1066 [20:34<1:29:53,  6.23s/it]Training 1/2 epoch (loss 0.4062):  19%|██▎         | 201/1066 [20:34<1:27:08,  6.04s/it]Training 1/2 epoch (loss 0.4199):  19%|██▎         | 201/1066 [20:40<1:27:08,  6.04s/it]Training 1/2 epoch (loss 0.4199):  19%|██▎         | 202/1066 [20:40<1:28:12,  6.13s/it]Training 1/2 epoch (loss 0.4219):  19%|██▎         | 202/1066 [20:47<1:28:12,  6.13s/it]Training 1/2 epoch (loss 0.4219):  19%|██▎         | 203/1066 [20:47<1:29:02,  6.19s/it]Training 1/2 epoch (loss 0.4180):  19%|██▎         | 203/1066 [20:53<1:29:02,  6.19s/it]Training 1/2 epoch (loss 0.4180):  19%|██▎         | 204/1066 [20:53<1:29:57,  6.26s/it]Training 1/2 epoch (loss 0.5156):  19%|██▎         | 204/1066 [20:59<1:29:57,  6.26s/it]Training 1/2 epoch (loss 0.5156):  19%|██▎         | 205/1066 [20:59<1:28:50,  6.19s/it]Training 1/2 epoch (loss 0.3594):  19%|██▎         | 205/1066 [21:05<1:28:50,  6.19s/it]Training 1/2 epoch (loss 0.3594):  19%|██▎         | 206/1066 [21:05<1:29:02,  6.21s/it]Training 1/2 epoch (loss 0.5195):  19%|██▎         | 206/1066 [21:12<1:29:02,  6.21s/it]Training 1/2 epoch (loss 0.5195):  19%|██▎         | 207/1066 [21:12<1:30:02,  6.29s/it]Training 1/2 epoch (loss 0.4688):  19%|██▎         | 207/1066 [21:18<1:30:02,  6.29s/it]Training 1/2 epoch (loss 0.4688):  20%|██▎         | 208/1066 [21:18<1:28:44,  6.21s/it]Training 1/2 epoch (loss 0.4863):  20%|██▎         | 208/1066 [21:24<1:28:44,  6.21s/it]Training 1/2 epoch (loss 0.4863):  20%|██▎         | 209/1066 [21:24<1:28:45,  6.21s/it]Training 1/2 epoch (loss 0.5898):  20%|██▎         | 209/1066 [21:29<1:28:45,  6.21s/it]Training 1/2 epoch (loss 0.5898):  20%|██▎         | 210/1066 [21:29<1:24:39,  5.93s/it]Training 1/2 epoch (loss 0.4668):  20%|██▎         | 210/1066 [21:35<1:24:39,  5.93s/it]Training 1/2 epoch (loss 0.4668):  20%|██▍         | 211/1066 [21:35<1:25:40,  6.01s/it]Training 1/2 epoch (loss 0.5234):  20%|██▍         | 211/1066 [21:42<1:25:40,  6.01s/it]Training 1/2 epoch (loss 0.5234):  20%|██▍         | 212/1066 [21:42<1:26:15,  6.06s/it]Training 1/2 epoch (loss 0.4941):  20%|██▍         | 212/1066 [21:48<1:26:15,  6.06s/it]Training 1/2 epoch (loss 0.4941):  20%|██▍         | 213/1066 [21:48<1:28:44,  6.24s/it]Training 1/2 epoch (loss 0.5938):  20%|██▍         | 213/1066 [21:54<1:28:44,  6.24s/it]Training 1/2 epoch (loss 0.5938):  20%|██▍         | 214/1066 [21:54<1:28:26,  6.23s/it]Training 1/2 epoch (loss 0.4883):  20%|██▍         | 214/1066 [22:01<1:28:26,  6.23s/it]Training 1/2 epoch (loss 0.4883):  20%|██▍         | 215/1066 [22:01<1:28:27,  6.24s/it]Training 1/2 epoch (loss 0.4746):  20%|██▍         | 215/1066 [22:06<1:28:27,  6.24s/it]Training 1/2 epoch (loss 0.4746):  20%|██▍         | 216/1066 [22:06<1:25:44,  6.05s/it]Training 1/2 epoch (loss 0.4746):  20%|██▍         | 216/1066 [22:11<1:25:44,  6.05s/it]Training 1/2 epoch (loss 0.4746):  20%|██▍         | 217/1066 [22:11<1:21:22,  5.75s/it]Training 1/2 epoch (loss 0.5312):  20%|██▍         | 217/1066 [22:18<1:21:22,  5.75s/it]Training 1/2 epoch (loss 0.5312):  20%|██▍         | 218/1066 [22:18<1:23:19,  5.90s/it]Training 1/2 epoch (loss 0.5469):  20%|██▍         | 218/1066 [22:24<1:23:19,  5.90s/it]Training 1/2 epoch (loss 0.5469):  21%|██▍         | 219/1066 [22:24<1:24:51,  6.01s/it]Training 1/2 epoch (loss 0.4434):  21%|██▍         | 219/1066 [22:29<1:24:51,  6.01s/it]Training 1/2 epoch (loss 0.4434):  21%|██▍         | 220/1066 [22:29<1:21:46,  5.80s/it]Training 1/2 epoch (loss 0.3789):  21%|██▍         | 220/1066 [22:35<1:21:46,  5.80s/it]Training 1/2 epoch (loss 0.3789):  21%|██▍         | 221/1066 [22:35<1:21:04,  5.76s/it]Training 1/2 epoch (loss 0.5156):  21%|██▍         | 221/1066 [22:41<1:21:04,  5.76s/it]Training 1/2 epoch (loss 0.5156):  21%|██▍         | 222/1066 [22:41<1:24:03,  5.98s/it]Training 1/2 epoch (loss 0.5039):  21%|██▍         | 222/1066 [22:47<1:24:03,  5.98s/it]Training 1/2 epoch (loss 0.5039):  21%|██▌         | 223/1066 [22:47<1:24:18,  6.00s/it]Training 1/2 epoch (loss 0.5039):  21%|██▌         | 223/1066 [22:54<1:24:18,  6.00s/it]Training 1/2 epoch (loss 0.5039):  21%|██▌         | 224/1066 [22:54<1:25:34,  6.10s/it]Training 1/2 epoch (loss 0.4668):  21%|██▌         | 224/1066 [23:00<1:25:34,  6.10s/it]Training 1/2 epoch (loss 0.4668):  21%|██▌         | 225/1066 [23:00<1:26:56,  6.20s/it]Training 1/2 epoch (loss 0.4336):  21%|██▌         | 225/1066 [23:07<1:26:56,  6.20s/it]Training 1/2 epoch (loss 0.4336):  21%|██▌         | 226/1066 [23:07<1:27:52,  6.28s/it]Training 1/2 epoch (loss 0.5469):  21%|██▌         | 226/1066 [23:12<1:27:52,  6.28s/it]Training 1/2 epoch (loss 0.5469):  21%|██▌         | 227/1066 [23:12<1:25:29,  6.11s/it]Training 1/2 epoch (loss 0.4219):  21%|██▌         | 227/1066 [23:19<1:25:29,  6.11s/it]Training 1/2 epoch (loss 0.4219):  21%|██▌         | 228/1066 [23:19<1:26:00,  6.16s/it]Training 1/2 epoch (loss 0.4727):  21%|██▌         | 228/1066 [23:25<1:26:00,  6.16s/it]Training 1/2 epoch (loss 0.4727):  21%|██▌         | 229/1066 [23:25<1:26:44,  6.22s/it]Training 1/2 epoch (loss 0.5000):  21%|██▌         | 229/1066 [23:31<1:26:44,  6.22s/it]Training 1/2 epoch (loss 0.5000):  22%|██▌         | 230/1066 [23:31<1:27:04,  6.25s/it]Training 1/2 epoch (loss 0.4023):  22%|██▌         | 230/1066 [23:38<1:27:04,  6.25s/it]Training 1/2 epoch (loss 0.4023):  22%|██▌         | 231/1066 [23:38<1:27:50,  6.31s/it]Training 1/2 epoch (loss 0.5625):  22%|██▌         | 231/1066 [23:44<1:27:50,  6.31s/it]Training 1/2 epoch (loss 0.5625):  22%|██▌         | 232/1066 [23:44<1:28:30,  6.37s/it]Training 1/2 epoch (loss 0.6172):  22%|██▌         | 232/1066 [23:51<1:28:30,  6.37s/it]Training 1/2 epoch (loss 0.6172):  22%|██▌         | 233/1066 [23:51<1:28:11,  6.35s/it]Training 1/2 epoch (loss 0.5469):  22%|██▌         | 233/1066 [23:57<1:28:11,  6.35s/it]Training 1/2 epoch (loss 0.5469):  22%|██▋         | 234/1066 [23:57<1:28:28,  6.38s/it]Training 1/2 epoch (loss 0.4727):  22%|██▋         | 234/1066 [24:03<1:28:28,  6.38s/it]Training 1/2 epoch (loss 0.4727):  22%|██▋         | 235/1066 [24:03<1:27:27,  6.32s/it]Training 1/2 epoch (loss 0.4785):  22%|██▋         | 235/1066 [24:08<1:27:27,  6.32s/it]Training 1/2 epoch (loss 0.4785):  22%|██▋         | 236/1066 [24:08<1:22:45,  5.98s/it]Training 1/2 epoch (loss 0.5664):  22%|██▋         | 236/1066 [24:14<1:22:45,  5.98s/it]Training 1/2 epoch (loss 0.5664):  22%|██▋         | 237/1066 [24:14<1:20:56,  5.86s/it]Training 1/2 epoch (loss 0.4316):  22%|██▋         | 237/1066 [24:20<1:20:56,  5.86s/it]Training 1/2 epoch (loss 0.4316):  22%|██▋         | 238/1066 [24:20<1:21:26,  5.90s/it]Training 1/2 epoch (loss 0.4180):  22%|██▋         | 238/1066 [24:26<1:21:26,  5.90s/it]Training 1/2 epoch (loss 0.4180):  22%|██▋         | 239/1066 [24:26<1:23:33,  6.06s/it]Training 1/2 epoch (loss 0.4336):  22%|██▋         | 239/1066 [24:33<1:23:33,  6.06s/it]Training 1/2 epoch (loss 0.4336):  23%|██▋         | 240/1066 [24:33<1:24:18,  6.12s/it]Training 1/2 epoch (loss 0.5742):  23%|██▋         | 240/1066 [24:38<1:24:18,  6.12s/it]Training 1/2 epoch (loss 0.5742):  23%|██▋         | 241/1066 [24:38<1:22:42,  6.02s/it]Training 1/2 epoch (loss 0.4258):  23%|██▋         | 241/1066 [24:45<1:22:42,  6.02s/it]Training 1/2 epoch (loss 0.4258):  23%|██▋         | 242/1066 [24:45<1:24:10,  6.13s/it]Training 1/2 epoch (loss 0.4414):  23%|██▋         | 242/1066 [24:51<1:24:10,  6.13s/it]Training 1/2 epoch (loss 0.4414):  23%|██▋         | 243/1066 [24:51<1:25:31,  6.24s/it]Training 1/2 epoch (loss 0.4316):  23%|██▋         | 243/1066 [24:57<1:25:31,  6.24s/it]Training 1/2 epoch (loss 0.4316):  23%|██▋         | 244/1066 [24:57<1:24:44,  6.19s/it]Training 1/2 epoch (loss 0.4395):  23%|██▋         | 244/1066 [25:04<1:24:44,  6.19s/it]Training 1/2 epoch (loss 0.4395):  23%|██▊         | 245/1066 [25:04<1:25:00,  6.21s/it]Training 1/2 epoch (loss 0.4648):  23%|██▊         | 245/1066 [25:10<1:25:00,  6.21s/it]Training 1/2 epoch (loss 0.4648):  23%|██▊         | 246/1066 [25:10<1:26:01,  6.29s/it]Training 1/2 epoch (loss 0.5078):  23%|██▊         | 246/1066 [25:16<1:26:01,  6.29s/it]Training 1/2 epoch (loss 0.5078):  23%|██▊         | 247/1066 [25:16<1:24:29,  6.19s/it]Training 1/2 epoch (loss 0.4395):  23%|██▊         | 247/1066 [25:22<1:24:29,  6.19s/it]Training 1/2 epoch (loss 0.4395):  23%|██▊         | 248/1066 [25:22<1:23:53,  6.15s/it]Training 1/2 epoch (loss 0.5781):  23%|██▊         | 248/1066 [25:29<1:23:53,  6.15s/it]Training 1/2 epoch (loss 0.5781):  23%|██▊         | 249/1066 [25:29<1:26:01,  6.32s/it]Training 1/2 epoch (loss 0.4922):  23%|██▊         | 249/1066 [25:35<1:26:01,  6.32s/it]Training 1/2 epoch (loss 0.4922):  23%|██▊         | 250/1066 [25:35<1:26:15,  6.34s/it]Training 1/2 epoch (loss 0.5742):  23%|██▊         | 250/1066 [25:41<1:26:15,  6.34s/it]Training 1/2 epoch (loss 0.5742):  24%|██▊         | 251/1066 [25:41<1:25:22,  6.29s/it]Training 1/2 epoch (loss 0.5391):  24%|██▊         | 251/1066 [25:47<1:25:22,  6.29s/it]Training 1/2 epoch (loss 0.5391):  24%|██▊         | 252/1066 [25:47<1:21:10,  5.98s/it]Training 1/2 epoch (loss 0.4688):  24%|██▊         | 252/1066 [25:51<1:21:10,  5.98s/it]Training 1/2 epoch (loss 0.4688):  24%|██▊         | 253/1066 [25:51<1:15:49,  5.60s/it]Training 1/2 epoch (loss 0.4102):  24%|██▊         | 253/1066 [25:57<1:15:49,  5.60s/it]Training 1/2 epoch (loss 0.4102):  24%|██▊         | 254/1066 [25:57<1:17:28,  5.73s/it]Training 1/2 epoch (loss 0.4746):  24%|██▊         | 254/1066 [26:04<1:17:28,  5.73s/it]Training 1/2 epoch (loss 0.4746):  24%|██▊         | 255/1066 [26:04<1:20:28,  5.95s/it]Training 1/2 epoch (loss 0.3867):  24%|██▊         | 255/1066 [26:10<1:20:28,  5.95s/it]Training 1/2 epoch (loss 0.3867):  24%|██▉         | 256/1066 [26:10<1:20:40,  5.98s/it]Training 1/2 epoch (loss 0.4316):  24%|██▉         | 256/1066 [26:16<1:20:40,  5.98s/it]Training 1/2 epoch (loss 0.4316):  24%|██▉         | 257/1066 [26:16<1:21:28,  6.04s/it]Training 1/2 epoch (loss 0.4629):  24%|██▉         | 257/1066 [26:23<1:21:28,  6.04s/it]Training 1/2 epoch (loss 0.4629):  24%|██▉         | 258/1066 [26:23<1:24:01,  6.24s/it]Training 1/2 epoch (loss 0.4980):  24%|██▉         | 258/1066 [26:29<1:24:01,  6.24s/it]Training 1/2 epoch (loss 0.4980):  24%|██▉         | 259/1066 [26:29<1:24:03,  6.25s/it]Training 1/2 epoch (loss 0.5195):  24%|██▉         | 259/1066 [26:35<1:24:03,  6.25s/it]Training 1/2 epoch (loss 0.5195):  24%|██▉         | 260/1066 [26:35<1:23:51,  6.24s/it]Training 1/2 epoch (loss 0.4844):  24%|██▉         | 260/1066 [26:41<1:23:51,  6.24s/it]Training 1/2 epoch (loss 0.4844):  24%|██▉         | 261/1066 [26:41<1:20:37,  6.01s/it]Training 1/2 epoch (loss 0.3164):  24%|██▉         | 261/1066 [26:47<1:20:37,  6.01s/it]Training 1/2 epoch (loss 0.3164):  25%|██▉         | 262/1066 [26:47<1:21:48,  6.10s/it]Training 1/2 epoch (loss 0.5195):  25%|██▉         | 262/1066 [26:54<1:21:48,  6.10s/it]Training 1/2 epoch (loss 0.5195):  25%|██▉         | 263/1066 [26:54<1:22:48,  6.19s/it]Training 1/2 epoch (loss 0.4668):  25%|██▉         | 263/1066 [27:00<1:22:48,  6.19s/it]Training 1/2 epoch (loss 0.4668):  25%|██▉         | 264/1066 [27:00<1:24:23,  6.31s/it]Training 1/2 epoch (loss 0.4590):  25%|██▉         | 264/1066 [27:05<1:24:23,  6.31s/it]Training 1/2 epoch (loss 0.4590):  25%|██▉         | 265/1066 [27:05<1:20:17,  6.01s/it]Training 1/2 epoch (loss 0.5195):  25%|██▉         | 265/1066 [27:12<1:20:17,  6.01s/it]Training 1/2 epoch (loss 0.5195):  25%|██▉         | 266/1066 [27:12<1:20:25,  6.03s/it]Training 1/2 epoch (loss 0.5117):  25%|██▉         | 266/1066 [27:18<1:20:25,  6.03s/it]Training 1/2 epoch (loss 0.5117):  25%|███         | 267/1066 [27:18<1:21:46,  6.14s/it]Training 1/2 epoch (loss 0.4219):  25%|███         | 267/1066 [27:23<1:21:46,  6.14s/it]Training 1/2 epoch (loss 0.4219):  25%|███         | 268/1066 [27:23<1:18:02,  5.87s/it]Training 1/2 epoch (loss 0.4609):  25%|███         | 268/1066 [27:29<1:18:02,  5.87s/it]Training 1/2 epoch (loss 0.4609):  25%|███         | 269/1066 [27:29<1:19:18,  5.97s/it]Training 1/2 epoch (loss 0.5391):  25%|███         | 269/1066 [27:36<1:19:18,  5.97s/it]Training 1/2 epoch (loss 0.5391):  25%|███         | 270/1066 [27:36<1:21:27,  6.14s/it]Training 1/2 epoch (loss 0.5039):  25%|███         | 270/1066 [27:42<1:21:27,  6.14s/it]Training 1/2 epoch (loss 0.5039):  25%|███         | 271/1066 [27:42<1:22:03,  6.19s/it]Training 1/2 epoch (loss 0.5273):  25%|███         | 271/1066 [27:49<1:22:03,  6.19s/it]Training 1/2 epoch (loss 0.5273):  26%|███         | 272/1066 [27:49<1:22:38,  6.25s/it]Training 1/2 epoch (loss 0.5742):  26%|███         | 272/1066 [27:55<1:22:38,  6.25s/it]Training 1/2 epoch (loss 0.5742):  26%|███         | 273/1066 [27:55<1:23:04,  6.29s/it]Training 1/2 epoch (loss 0.6328):  26%|███         | 273/1066 [28:01<1:23:04,  6.29s/it]Training 1/2 epoch (loss 0.6328):  26%|███         | 274/1066 [28:01<1:23:28,  6.32s/it]Training 1/2 epoch (loss 0.4668):  26%|███         | 274/1066 [28:08<1:23:28,  6.32s/it]Training 1/2 epoch (loss 0.4668):  26%|███         | 275/1066 [28:08<1:23:22,  6.32s/it]Training 1/2 epoch (loss 0.4648):  26%|███         | 275/1066 [28:14<1:23:22,  6.32s/it]Training 1/2 epoch (loss 0.4648):  26%|███         | 276/1066 [28:14<1:23:01,  6.31s/it]Training 1/2 epoch (loss 0.4824):  26%|███         | 276/1066 [28:20<1:23:01,  6.31s/it]Training 1/2 epoch (loss 0.4824):  26%|███         | 277/1066 [28:20<1:23:08,  6.32s/it]Training 1/2 epoch (loss 0.4414):  26%|███         | 277/1066 [28:27<1:23:08,  6.32s/it]Training 1/2 epoch (loss 0.4414):  26%|███▏        | 278/1066 [28:27<1:23:03,  6.32s/it]Training 1/2 epoch (loss 0.4375):  26%|███▏        | 278/1066 [28:33<1:23:03,  6.32s/it]Training 1/2 epoch (loss 0.4375):  26%|███▏        | 279/1066 [28:33<1:23:26,  6.36s/it]Training 1/2 epoch (loss 0.4785):  26%|███▏        | 279/1066 [28:39<1:23:26,  6.36s/it]Training 1/2 epoch (loss 0.4785):  26%|███▏        | 280/1066 [28:39<1:22:53,  6.33s/it]Training 1/2 epoch (loss 0.4629):  26%|███▏        | 280/1066 [28:46<1:22:53,  6.33s/it]Training 1/2 epoch (loss 0.4629):  26%|███▏        | 281/1066 [28:46<1:22:34,  6.31s/it]Training 1/2 epoch (loss 0.6094):  26%|███▏        | 281/1066 [28:51<1:22:34,  6.31s/it]Training 1/2 epoch (loss 0.6094):  26%|███▏        | 282/1066 [28:51<1:19:53,  6.11s/it]Training 1/2 epoch (loss 0.5938):  26%|███▏        | 282/1066 [28:57<1:19:53,  6.11s/it]Training 1/2 epoch (loss 0.5938):  27%|███▏        | 283/1066 [28:57<1:20:06,  6.14s/it]Training 1/2 epoch (loss 0.4805):  27%|███▏        | 283/1066 [29:04<1:20:06,  6.14s/it]Training 1/2 epoch (loss 0.4805):  27%|███▏        | 284/1066 [29:04<1:21:23,  6.25s/it]Training 1/2 epoch (loss 0.4609):  27%|███▏        | 284/1066 [29:10<1:21:23,  6.25s/it]Training 1/2 epoch (loss 0.4609):  27%|███▏        | 285/1066 [29:10<1:20:37,  6.19s/it]Training 1/2 epoch (loss 0.4180):  27%|███▏        | 285/1066 [29:16<1:20:37,  6.19s/it]Training 1/2 epoch (loss 0.4180):  27%|███▏        | 286/1066 [29:16<1:20:52,  6.22s/it]Training 1/2 epoch (loss 0.4102):  27%|███▏        | 286/1066 [29:23<1:20:52,  6.22s/it]Training 1/2 epoch (loss 0.4102):  27%|███▏        | 287/1066 [29:23<1:21:07,  6.25s/it]Training 1/2 epoch (loss 0.4707):  27%|███▏        | 287/1066 [29:29<1:21:07,  6.25s/it]Training 1/2 epoch (loss 0.4707):  27%|███▏        | 288/1066 [29:29<1:22:47,  6.38s/it]Training 1/2 epoch (loss 0.4297):  27%|███▏        | 288/1066 [29:36<1:22:47,  6.38s/it]Training 1/2 epoch (loss 0.4297):  27%|███▎        | 289/1066 [29:36<1:22:01,  6.33s/it]Training 1/2 epoch (loss 0.4609):  27%|███▎        | 289/1066 [29:42<1:22:01,  6.33s/it]Training 1/2 epoch (loss 0.4609):  27%|███▎        | 290/1066 [29:42<1:20:50,  6.25s/it]Training 1/2 epoch (loss 0.4219):  27%|███▎        | 290/1066 [29:48<1:20:50,  6.25s/it]Training 1/2 epoch (loss 0.4219):  27%|███▎        | 291/1066 [29:48<1:21:19,  6.30s/it]Training 1/2 epoch (loss 0.4004):  27%|███▎        | 291/1066 [29:54<1:21:19,  6.30s/it]Training 1/2 epoch (loss 0.4004):  27%|███▎        | 292/1066 [29:54<1:20:03,  6.21s/it]Training 1/2 epoch (loss 0.5039):  27%|███▎        | 292/1066 [30:00<1:20:03,  6.21s/it]Training 1/2 epoch (loss 0.5039):  27%|███▎        | 293/1066 [30:00<1:20:15,  6.23s/it]Training 1/2 epoch (loss 0.4043):  27%|███▎        | 293/1066 [30:07<1:20:15,  6.23s/it]Training 1/2 epoch (loss 0.4043):  28%|███▎        | 294/1066 [30:07<1:21:57,  6.37s/it]Training 1/2 epoch (loss 0.3828):  28%|███▎        | 294/1066 [30:13<1:21:57,  6.37s/it]Training 1/2 epoch (loss 0.3828):  28%|███▎        | 295/1066 [30:13<1:22:09,  6.39s/it]Training 1/2 epoch (loss 0.4395):  28%|███▎        | 295/1066 [30:19<1:22:09,  6.39s/it]Training 1/2 epoch (loss 0.4395):  28%|███▎        | 296/1066 [30:19<1:17:35,  6.05s/it]Training 1/2 epoch (loss 0.5508):  28%|███▎        | 296/1066 [30:24<1:17:35,  6.05s/it]Training 1/2 epoch (loss 0.5508):  28%|███▎        | 297/1066 [30:24<1:15:12,  5.87s/it]Training 1/2 epoch (loss 0.5391):  28%|███▎        | 297/1066 [30:30<1:15:12,  5.87s/it]Training 1/2 epoch (loss 0.5391):  28%|███▎        | 298/1066 [30:30<1:17:03,  6.02s/it]Training 1/2 epoch (loss 0.5117):  28%|███▎        | 298/1066 [30:37<1:17:03,  6.02s/it]Training 1/2 epoch (loss 0.5117):  28%|███▎        | 299/1066 [30:37<1:17:11,  6.04s/it]Training 1/2 epoch (loss 0.4707):  28%|███▎        | 299/1066 [30:43<1:17:11,  6.04s/it]Training 1/2 epoch (loss 0.4707):  28%|███▍        | 300/1066 [30:43<1:19:07,  6.20s/it]Training 1/2 epoch (loss 0.5625):  28%|███▍        | 300/1066 [30:50<1:19:07,  6.20s/it]Training 1/2 epoch (loss 0.5625):  28%|███▍        | 301/1066 [30:50<1:19:51,  6.26s/it]Training 1/2 epoch (loss 0.5078):  28%|███▍        | 301/1066 [30:56<1:19:51,  6.26s/it]Training 1/2 epoch (loss 0.5078):  28%|███▍        | 302/1066 [30:56<1:19:33,  6.25s/it]Training 1/2 epoch (loss 0.5977):  28%|███▍        | 302/1066 [31:02<1:19:33,  6.25s/it]Training 1/2 epoch (loss 0.5977):  28%|███▍        | 303/1066 [31:02<1:20:22,  6.32s/it]Training 1/2 epoch (loss 0.4551):  28%|███▍        | 303/1066 [31:09<1:20:22,  6.32s/it]Training 1/2 epoch (loss 0.4551):  29%|███▍        | 304/1066 [31:09<1:20:26,  6.33s/it]Training 1/2 epoch (loss 0.4258):  29%|███▍        | 304/1066 [31:15<1:20:26,  6.33s/it]Training 1/2 epoch (loss 0.4258):  29%|███▍        | 305/1066 [31:15<1:20:24,  6.34s/it]Training 1/2 epoch (loss 0.5742):  29%|███▍        | 305/1066 [31:21<1:20:24,  6.34s/it]Training 1/2 epoch (loss 0.5742):  29%|███▍        | 306/1066 [31:21<1:20:45,  6.38s/it]Training 1/2 epoch (loss 0.4902):  29%|███▍        | 306/1066 [31:28<1:20:45,  6.38s/it]Training 1/2 epoch (loss 0.4902):  29%|███▍        | 307/1066 [31:28<1:20:40,  6.38s/it]Training 1/2 epoch (loss 0.5000):  29%|███▍        | 307/1066 [31:34<1:20:40,  6.38s/it]Training 1/2 epoch (loss 0.5000):  29%|███▍        | 308/1066 [31:34<1:20:55,  6.41s/it]Training 1/2 epoch (loss 0.5078):  29%|███▍        | 308/1066 [31:40<1:20:55,  6.41s/it]Training 1/2 epoch (loss 0.5078):  29%|███▍        | 309/1066 [31:40<1:18:47,  6.24s/it]Training 1/2 epoch (loss 0.4023):  29%|███▍        | 309/1066 [31:47<1:18:47,  6.24s/it]Training 1/2 epoch (loss 0.4023):  29%|███▍        | 310/1066 [31:47<1:19:41,  6.33s/it]Training 1/2 epoch (loss 0.4473):  29%|███▍        | 310/1066 [31:53<1:19:41,  6.33s/it]Training 1/2 epoch (loss 0.4473):  29%|███▌        | 311/1066 [31:53<1:19:23,  6.31s/it]Training 1/2 epoch (loss 0.4062):  29%|███▌        | 311/1066 [31:59<1:19:23,  6.31s/it]Training 1/2 epoch (loss 0.4062):  29%|███▌        | 312/1066 [31:59<1:19:17,  6.31s/it]Training 1/2 epoch (loss 0.3906):  29%|███▌        | 312/1066 [32:05<1:19:17,  6.31s/it]Training 1/2 epoch (loss 0.3906):  29%|███▌        | 313/1066 [32:05<1:18:52,  6.29s/it]Training 1/2 epoch (loss 0.5586):  29%|███▌        | 313/1066 [32:12<1:18:52,  6.29s/it]Training 1/2 epoch (loss 0.5586):  29%|███▌        | 314/1066 [32:12<1:17:58,  6.22s/it]Training 1/2 epoch (loss 0.5312):  29%|███▌        | 314/1066 [32:18<1:17:58,  6.22s/it]Training 1/2 epoch (loss 0.5312):  30%|███▌        | 315/1066 [32:18<1:17:32,  6.20s/it]Training 1/2 epoch (loss 0.5039):  30%|███▌        | 315/1066 [32:24<1:17:32,  6.20s/it]Training 1/2 epoch (loss 0.5039):  30%|███▌        | 316/1066 [32:24<1:17:08,  6.17s/it]Training 1/2 epoch (loss 0.5664):  30%|███▌        | 316/1066 [32:30<1:17:08,  6.17s/it]Training 1/2 epoch (loss 0.5664):  30%|███▌        | 317/1066 [32:30<1:16:37,  6.14s/it]Training 1/2 epoch (loss 0.4727):  30%|███▌        | 317/1066 [32:36<1:16:37,  6.14s/it]Training 1/2 epoch (loss 0.4727):  30%|███▌        | 318/1066 [32:36<1:18:15,  6.28s/it]Training 1/2 epoch (loss 0.5273):  30%|███▌        | 318/1066 [32:43<1:18:15,  6.28s/it]Training 1/2 epoch (loss 0.5273):  30%|███▌        | 319/1066 [32:43<1:18:21,  6.29s/it]Training 1/2 epoch (loss 0.4727):  30%|███▌        | 319/1066 [32:48<1:18:21,  6.29s/it]Training 1/2 epoch (loss 0.4727):  30%|███▌        | 320/1066 [32:48<1:14:12,  5.97s/it]Training 1/2 epoch (loss 0.5000):  30%|███▌        | 320/1066 [32:53<1:14:12,  5.97s/it]Training 1/2 epoch (loss 0.5000):  30%|███▌        | 321/1066 [32:53<1:12:13,  5.82s/it]Training 1/2 epoch (loss 0.4395):  30%|███▌        | 321/1066 [32:59<1:12:13,  5.82s/it]Training 1/2 epoch (loss 0.4395):  30%|███▌        | 322/1066 [32:59<1:12:51,  5.88s/it]Training 1/2 epoch (loss 0.4336):  30%|███▌        | 322/1066 [33:06<1:12:51,  5.88s/it]Training 1/2 epoch (loss 0.4336):  30%|███▋        | 323/1066 [33:06<1:14:42,  6.03s/it]Training 1/2 epoch (loss 0.4766):  30%|███▋        | 323/1066 [33:13<1:14:42,  6.03s/it]Training 1/2 epoch (loss 0.4766):  30%|███▋        | 324/1066 [33:13<1:16:56,  6.22s/it]Training 1/2 epoch (loss 0.4336):  30%|███▋        | 324/1066 [33:19<1:16:56,  6.22s/it]Training 1/2 epoch (loss 0.4336):  30%|███▋        | 325/1066 [33:19<1:16:52,  6.22s/it]Training 1/2 epoch (loss 0.4258):  30%|███▋        | 325/1066 [33:25<1:16:52,  6.22s/it]Training 1/2 epoch (loss 0.4258):  31%|███▋        | 326/1066 [33:25<1:16:50,  6.23s/it]Training 1/2 epoch (loss 0.4199):  31%|███▋        | 326/1066 [33:31<1:16:50,  6.23s/it]Training 1/2 epoch (loss 0.4199):  31%|███▋        | 327/1066 [33:31<1:17:26,  6.29s/it]Training 1/2 epoch (loss 0.4453):  31%|███▋        | 327/1066 [33:37<1:17:26,  6.29s/it]Training 1/2 epoch (loss 0.4453):  31%|███▋        | 328/1066 [33:37<1:13:48,  6.00s/it]Training 1/2 epoch (loss 0.5195):  31%|███▋        | 328/1066 [33:42<1:13:48,  6.00s/it]Training 1/2 epoch (loss 0.5195):  31%|███▋        | 329/1066 [33:42<1:10:15,  5.72s/it]Training 1/2 epoch (loss 0.4922):  31%|███▋        | 329/1066 [33:48<1:10:15,  5.72s/it]Training 1/2 epoch (loss 0.4922):  31%|███▋        | 330/1066 [33:48<1:13:19,  5.98s/it]Training 1/2 epoch (loss 0.6016):  31%|███▋        | 330/1066 [33:55<1:13:19,  5.98s/it]Training 1/2 epoch (loss 0.6016):  31%|███▋        | 331/1066 [33:55<1:13:46,  6.02s/it]Training 1/2 epoch (loss 0.4453):  31%|███▋        | 331/1066 [34:01<1:13:46,  6.02s/it]Training 1/2 epoch (loss 0.4453):  31%|███▋        | 332/1066 [34:01<1:14:18,  6.07s/it]Training 1/2 epoch (loss 0.5195):  31%|███▋        | 332/1066 [34:07<1:14:18,  6.07s/it]Training 1/2 epoch (loss 0.5195):  31%|███▋        | 333/1066 [34:07<1:15:32,  6.18s/it]Training 1/2 epoch (loss 0.3730):  31%|███▋        | 333/1066 [34:13<1:15:32,  6.18s/it]Training 1/2 epoch (loss 0.3730):  31%|███▊        | 334/1066 [34:13<1:13:05,  5.99s/it]Training 1/2 epoch (loss 0.4902):  31%|███▊        | 334/1066 [34:19<1:13:05,  5.99s/it]Training 1/2 epoch (loss 0.4902):  31%|███▊        | 335/1066 [34:19<1:14:18,  6.10s/it]Training 1/2 epoch (loss 0.4805):  31%|███▊        | 335/1066 [34:24<1:14:18,  6.10s/it]Training 1/2 epoch (loss 0.4805):  32%|███▊        | 336/1066 [34:24<1:11:05,  5.84s/it]Training 1/2 epoch (loss 0.4590):  32%|███▊        | 336/1066 [34:31<1:11:05,  5.84s/it]Training 1/2 epoch (loss 0.4590):  32%|███▊        | 337/1066 [34:31<1:12:47,  5.99s/it]Training 1/2 epoch (loss 0.4863):  32%|███▊        | 337/1066 [34:37<1:12:47,  5.99s/it]Training 1/2 epoch (loss 0.4863):  32%|███▊        | 338/1066 [34:37<1:13:45,  6.08s/it]Training 1/2 epoch (loss 0.4746):  32%|███▊        | 338/1066 [34:43<1:13:45,  6.08s/it]Training 1/2 epoch (loss 0.4746):  32%|███▊        | 339/1066 [34:43<1:15:19,  6.22s/it]Training 1/2 epoch (loss 0.3945):  32%|███▊        | 339/1066 [34:50<1:15:19,  6.22s/it]Training 1/2 epoch (loss 0.3945):  32%|███▊        | 340/1066 [34:50<1:15:53,  6.27s/it]Training 1/2 epoch (loss 0.3105):  32%|███▊        | 340/1066 [34:56<1:15:53,  6.27s/it]Training 1/2 epoch (loss 0.3105):  32%|███▊        | 341/1066 [34:56<1:16:27,  6.33s/it]Training 1/2 epoch (loss 0.5703):  32%|███▊        | 341/1066 [35:02<1:16:27,  6.33s/it]Training 1/2 epoch (loss 0.5703):  32%|███▊        | 342/1066 [35:02<1:13:37,  6.10s/it]Training 1/2 epoch (loss 0.3750):  32%|███▊        | 342/1066 [35:08<1:13:37,  6.10s/it]Training 1/2 epoch (loss 0.3750):  32%|███▊        | 343/1066 [35:08<1:14:20,  6.17s/it]Training 1/2 epoch (loss 0.3340):  32%|███▊        | 343/1066 [35:14<1:14:20,  6.17s/it]Training 1/2 epoch (loss 0.3340):  32%|███▊        | 344/1066 [35:14<1:13:52,  6.14s/it]Training 1/2 epoch (loss 0.4746):  32%|███▊        | 344/1066 [35:21<1:13:52,  6.14s/it]Training 1/2 epoch (loss 0.4746):  32%|███▉        | 345/1066 [35:21<1:15:07,  6.25s/it]Training 1/2 epoch (loss 0.5273):  32%|███▉        | 345/1066 [35:26<1:15:07,  6.25s/it]Training 1/2 epoch (loss 0.5273):  32%|███▉        | 346/1066 [35:26<1:12:35,  6.05s/it]Training 1/2 epoch (loss 0.4473):  32%|███▉        | 346/1066 [35:33<1:12:35,  6.05s/it]Training 1/2 epoch (loss 0.4473):  33%|███▉        | 347/1066 [35:33<1:13:33,  6.14s/it]Training 1/2 epoch (loss 0.4883):  33%|███▉        | 347/1066 [35:38<1:13:33,  6.14s/it]Training 1/2 epoch (loss 0.4883):  33%|███▉        | 348/1066 [35:38<1:10:50,  5.92s/it]Training 1/2 epoch (loss 0.5547):  33%|███▉        | 348/1066 [35:45<1:10:50,  5.92s/it]Training 1/2 epoch (loss 0.5547):  33%|███▉        | 349/1066 [35:45<1:12:47,  6.09s/it]Training 1/2 epoch (loss 0.5117):  33%|███▉        | 349/1066 [35:50<1:12:47,  6.09s/it]Training 1/2 epoch (loss 0.5117):  33%|███▉        | 350/1066 [35:50<1:09:44,  5.84s/it]Training 1/2 epoch (loss 0.4922):  33%|███▉        | 350/1066 [35:56<1:09:44,  5.84s/it]Training 1/2 epoch (loss 0.4922):  33%|███▉        | 351/1066 [35:56<1:10:06,  5.88s/it]Training 1/2 epoch (loss 0.5977):  33%|███▉        | 351/1066 [36:02<1:10:06,  5.88s/it]Training 1/2 epoch (loss 0.5977):  33%|███▉        | 352/1066 [36:02<1:10:39,  5.94s/it]Training 1/2 epoch (loss 0.4453):  33%|███▉        | 352/1066 [36:08<1:10:39,  5.94s/it]Training 1/2 epoch (loss 0.4453):  33%|███▉        | 353/1066 [36:08<1:12:09,  6.07s/it]Training 1/2 epoch (loss 0.4766):  33%|███▉        | 353/1066 [36:14<1:12:09,  6.07s/it]Training 1/2 epoch (loss 0.4766):  33%|███▉        | 354/1066 [36:14<1:12:08,  6.08s/it]Training 1/2 epoch (loss 0.4199):  33%|███▉        | 354/1066 [36:21<1:12:08,  6.08s/it]Training 1/2 epoch (loss 0.4199):  33%|███▉        | 355/1066 [36:21<1:12:04,  6.08s/it]Training 1/2 epoch (loss 0.5469):  33%|███▉        | 355/1066 [36:27<1:12:04,  6.08s/it]Training 1/2 epoch (loss 0.5469):  33%|████        | 356/1066 [36:27<1:12:55,  6.16s/it]Training 1/2 epoch (loss 0.4844):  33%|████        | 356/1066 [36:33<1:12:55,  6.16s/it]Training 1/2 epoch (loss 0.4844):  33%|████        | 357/1066 [36:33<1:12:33,  6.14s/it]Training 1/2 epoch (loss 0.4570):  33%|████        | 357/1066 [36:39<1:12:33,  6.14s/it]Training 1/2 epoch (loss 0.4570):  34%|████        | 358/1066 [36:39<1:12:06,  6.11s/it]Training 1/2 epoch (loss 0.4102):  34%|████        | 358/1066 [36:45<1:12:06,  6.11s/it]Training 1/2 epoch (loss 0.4102):  34%|████        | 359/1066 [36:45<1:12:39,  6.17s/it]Training 1/2 epoch (loss 0.5117):  34%|████        | 359/1066 [36:52<1:12:39,  6.17s/it]Training 1/2 epoch (loss 0.5117):  34%|████        | 360/1066 [36:52<1:14:19,  6.32s/it]Training 1/2 epoch (loss 0.4375):  34%|████        | 360/1066 [36:58<1:14:19,  6.32s/it]Training 1/2 epoch (loss 0.4375):  34%|████        | 361/1066 [36:58<1:13:16,  6.24s/it]Training 1/2 epoch (loss 0.4219):  34%|████        | 361/1066 [37:04<1:13:16,  6.24s/it]Training 1/2 epoch (loss 0.4219):  34%|████        | 362/1066 [37:04<1:11:45,  6.12s/it]Training 1/2 epoch (loss 0.6719):  34%|████        | 362/1066 [37:10<1:11:45,  6.12s/it]Training 1/2 epoch (loss 0.6719):  34%|████        | 363/1066 [37:10<1:12:59,  6.23s/it]Training 1/2 epoch (loss 0.5273):  34%|████        | 363/1066 [37:16<1:12:59,  6.23s/it]Training 1/2 epoch (loss 0.5273):  34%|████        | 364/1066 [37:16<1:12:05,  6.16s/it]Training 1/2 epoch (loss 0.6250):  34%|████        | 364/1066 [37:23<1:12:05,  6.16s/it]Training 1/2 epoch (loss 0.6250):  34%|████        | 365/1066 [37:23<1:11:58,  6.16s/it]Training 1/2 epoch (loss 0.4805):  34%|████        | 365/1066 [37:29<1:11:58,  6.16s/it]Training 1/2 epoch (loss 0.4805):  34%|████        | 366/1066 [37:29<1:13:30,  6.30s/it]Training 1/2 epoch (loss 0.5078):  34%|████        | 366/1066 [37:35<1:13:30,  6.30s/it]Training 1/2 epoch (loss 0.5078):  34%|████▏       | 367/1066 [37:35<1:12:02,  6.18s/it]Training 1/2 epoch (loss 0.5039):  34%|████▏       | 367/1066 [37:40<1:12:02,  6.18s/it]Training 1/2 epoch (loss 0.5039):  35%|████▏       | 368/1066 [37:40<1:07:59,  5.84s/it]Training 1/2 epoch (loss 0.4902):  35%|████▏       | 368/1066 [37:47<1:07:59,  5.84s/it]Training 1/2 epoch (loss 0.4902):  35%|████▏       | 369/1066 [37:47<1:10:21,  6.06s/it]Training 1/2 epoch (loss 0.4922):  35%|████▏       | 369/1066 [37:53<1:10:21,  6.06s/it]Training 1/2 epoch (loss 0.4922):  35%|████▏       | 370/1066 [37:53<1:11:21,  6.15s/it]Training 1/2 epoch (loss 0.4570):  35%|████▏       | 370/1066 [37:59<1:11:21,  6.15s/it]Training 1/2 epoch (loss 0.4570):  35%|████▏       | 371/1066 [37:59<1:11:19,  6.16s/it]Training 1/2 epoch (loss 0.5195):  35%|████▏       | 371/1066 [38:06<1:11:19,  6.16s/it]Training 1/2 epoch (loss 0.5195):  35%|████▏       | 372/1066 [38:06<1:12:54,  6.30s/it]Training 1/2 epoch (loss 0.4648):  35%|████▏       | 372/1066 [38:12<1:12:54,  6.30s/it]Training 1/2 epoch (loss 0.4648):  35%|████▏       | 373/1066 [38:12<1:13:04,  6.33s/it]Training 1/2 epoch (loss 0.4688):  35%|████▏       | 373/1066 [38:18<1:13:04,  6.33s/it]Training 1/2 epoch (loss 0.4688):  35%|████▏       | 374/1066 [38:18<1:10:10,  6.09s/it]Training 1/2 epoch (loss 0.4941):  35%|████▏       | 374/1066 [38:24<1:10:10,  6.09s/it]Training 1/2 epoch (loss 0.4941):  35%|████▏       | 375/1066 [38:24<1:11:37,  6.22s/it]Training 1/2 epoch (loss 0.3828):  35%|████▏       | 375/1066 [38:31<1:11:37,  6.22s/it]Training 1/2 epoch (loss 0.3828):  35%|████▏       | 376/1066 [38:31<1:12:22,  6.29s/it]Training 1/2 epoch (loss 0.5664):  35%|████▏       | 376/1066 [38:37<1:12:22,  6.29s/it]Training 1/2 epoch (loss 0.5664):  35%|████▏       | 377/1066 [38:37<1:12:00,  6.27s/it]Training 1/2 epoch (loss 0.5625):  35%|████▏       | 377/1066 [38:43<1:12:00,  6.27s/it]Training 1/2 epoch (loss 0.5625):  35%|████▎       | 378/1066 [38:43<1:12:47,  6.35s/it]Training 1/2 epoch (loss 0.4609):  35%|████▎       | 378/1066 [38:50<1:12:47,  6.35s/it]Training 1/2 epoch (loss 0.4609):  36%|████▎       | 379/1066 [38:50<1:11:57,  6.28s/it]Training 1/2 epoch (loss 0.3984):  36%|████▎       | 379/1066 [38:56<1:11:57,  6.28s/it]Training 1/2 epoch (loss 0.3984):  36%|████▎       | 380/1066 [38:56<1:11:53,  6.29s/it]Training 1/2 epoch (loss 0.4219):  36%|████▎       | 380/1066 [39:02<1:11:53,  6.29s/it]Training 1/2 epoch (loss 0.4219):  36%|████▎       | 381/1066 [39:02<1:11:38,  6.28s/it]Training 1/2 epoch (loss 0.5000):  36%|████▎       | 381/1066 [39:08<1:11:38,  6.28s/it]Training 1/2 epoch (loss 0.5000):  36%|████▎       | 382/1066 [39:08<1:11:23,  6.26s/it]Training 1/2 epoch (loss 0.4395):  36%|████▎       | 382/1066 [39:15<1:11:23,  6.26s/it]Training 1/2 epoch (loss 0.4395):  36%|████▎       | 383/1066 [39:15<1:11:04,  6.24s/it]Training 1/2 epoch (loss 0.4492):  36%|████▎       | 383/1066 [39:21<1:11:04,  6.24s/it]Training 1/2 epoch (loss 0.4492):  36%|████▎       | 384/1066 [39:21<1:12:04,  6.34s/it]Training 1/2 epoch (loss 0.5898):  36%|████▎       | 384/1066 [39:27<1:12:04,  6.34s/it]Training 1/2 epoch (loss 0.5898):  36%|████▎       | 385/1066 [39:27<1:10:22,  6.20s/it]Training 1/2 epoch (loss 0.4570):  36%|████▎       | 385/1066 [39:33<1:10:22,  6.20s/it]Training 1/2 epoch (loss 0.4570):  36%|████▎       | 386/1066 [39:33<1:09:48,  6.16s/it]Training 1/2 epoch (loss 0.4199):  36%|████▎       | 386/1066 [39:40<1:09:48,  6.16s/it]Training 1/2 epoch (loss 0.4199):  36%|████▎       | 387/1066 [39:40<1:10:47,  6.26s/it]Training 1/2 epoch (loss 0.4629):  36%|████▎       | 387/1066 [39:46<1:10:47,  6.26s/it]Training 1/2 epoch (loss 0.4629):  36%|████▎       | 388/1066 [39:46<1:11:33,  6.33s/it]Training 1/2 epoch (loss 0.5508):  36%|████▎       | 388/1066 [39:52<1:11:33,  6.33s/it]Training 1/2 epoch (loss 0.5508):  36%|████▍       | 389/1066 [39:52<1:10:30,  6.25s/it]Training 1/2 epoch (loss 0.4062):  36%|████▍       | 389/1066 [39:58<1:10:30,  6.25s/it]Training 1/2 epoch (loss 0.4062):  37%|████▍       | 390/1066 [39:58<1:10:17,  6.24s/it]Training 1/2 epoch (loss 0.5469):  37%|████▍       | 390/1066 [40:04<1:10:17,  6.24s/it]Training 1/2 epoch (loss 0.5469):  37%|████▍       | 391/1066 [40:04<1:06:44,  5.93s/it]Training 1/2 epoch (loss 0.4961):  37%|████▍       | 391/1066 [40:10<1:06:44,  5.93s/it]Training 1/2 epoch (loss 0.4961):  37%|████▍       | 392/1066 [40:10<1:07:02,  5.97s/it]Training 1/2 epoch (loss 0.6133):  37%|████▍       | 392/1066 [40:16<1:07:02,  5.97s/it]Training 1/2 epoch (loss 0.6133):  37%|████▍       | 393/1066 [40:16<1:07:20,  6.00s/it]Training 1/2 epoch (loss 0.4492):  37%|████▍       | 393/1066 [40:22<1:07:20,  6.00s/it]Training 1/2 epoch (loss 0.4492):  37%|████▍       | 394/1066 [40:22<1:08:24,  6.11s/it]Training 1/2 epoch (loss 0.4004):  37%|████▍       | 394/1066 [40:28<1:08:24,  6.11s/it]Training 1/2 epoch (loss 0.4004):  37%|████▍       | 395/1066 [40:28<1:08:51,  6.16s/it]Training 1/2 epoch (loss 0.3984):  37%|████▍       | 395/1066 [40:35<1:08:51,  6.16s/it]Training 1/2 epoch (loss 0.3984):  37%|████▍       | 396/1066 [40:35<1:08:48,  6.16s/it]Training 1/2 epoch (loss 0.3477):  37%|████▍       | 396/1066 [40:40<1:08:48,  6.16s/it]Training 1/2 epoch (loss 0.3477):  37%|████▍       | 397/1066 [40:40<1:05:02,  5.83s/it]Training 1/2 epoch (loss 0.5039):  37%|████▍       | 397/1066 [40:46<1:05:02,  5.83s/it]Training 1/2 epoch (loss 0.5039):  37%|████▍       | 398/1066 [40:46<1:07:02,  6.02s/it]Training 1/2 epoch (loss 0.4824):  37%|████▍       | 398/1066 [40:52<1:07:02,  6.02s/it]Training 1/2 epoch (loss 0.4824):  37%|████▍       | 399/1066 [40:52<1:08:16,  6.14s/it]Training 1/2 epoch (loss 0.3906):  37%|████▍       | 399/1066 [40:59<1:08:16,  6.14s/it]Training 1/2 epoch (loss 0.3906):  38%|████▌       | 400/1066 [40:59<1:08:30,  6.17s/it]Training 1/2 epoch (loss 0.5000):  38%|████▌       | 400/1066 [41:05<1:08:30,  6.17s/it]Training 1/2 epoch (loss 0.5000):  38%|████▌       | 401/1066 [41:05<1:08:52,  6.21s/it]Training 1/2 epoch (loss 0.6016):  38%|████▌       | 401/1066 [41:12<1:08:52,  6.21s/it]Training 1/2 epoch (loss 0.6016):  38%|████▌       | 402/1066 [41:12<1:10:21,  6.36s/it]Training 1/2 epoch (loss 0.5039):  38%|████▌       | 402/1066 [41:18<1:10:21,  6.36s/it]Training 1/2 epoch (loss 0.5039):  38%|████▌       | 403/1066 [41:18<1:08:31,  6.20s/it]Training 1/2 epoch (loss 0.4785):  38%|████▌       | 403/1066 [41:24<1:08:31,  6.20s/it]Training 1/2 epoch (loss 0.4785):  38%|████▌       | 404/1066 [41:24<1:09:38,  6.31s/it]Training 1/2 epoch (loss 0.6289):  38%|████▌       | 404/1066 [41:31<1:09:38,  6.31s/it]Training 1/2 epoch (loss 0.6289):  38%|████▌       | 405/1066 [41:31<1:10:44,  6.42s/it]Training 1/2 epoch (loss 0.5312):  38%|████▌       | 405/1066 [41:36<1:10:44,  6.42s/it]Training 1/2 epoch (loss 0.5312):  38%|████▌       | 406/1066 [41:36<1:06:59,  6.09s/it]Training 1/2 epoch (loss 0.5664):  38%|████▌       | 406/1066 [41:41<1:06:59,  6.09s/it]Training 1/2 epoch (loss 0.5664):  38%|████▌       | 407/1066 [41:41<1:04:28,  5.87s/it]Training 1/2 epoch (loss 0.4316):  38%|████▌       | 407/1066 [41:48<1:04:28,  5.87s/it]Training 1/2 epoch (loss 0.4316):  38%|████▌       | 408/1066 [41:48<1:07:09,  6.12s/it]Training 1/2 epoch (loss 0.4102):  38%|████▌       | 408/1066 [41:54<1:07:09,  6.12s/it]Training 1/2 epoch (loss 0.4102):  38%|████▌       | 409/1066 [41:54<1:05:46,  6.01s/it]Training 1/2 epoch (loss 0.5781):  38%|████▌       | 409/1066 [42:00<1:05:46,  6.01s/it]Training 1/2 epoch (loss 0.5781):  38%|████▌       | 410/1066 [42:00<1:06:49,  6.11s/it]Training 1/2 epoch (loss 0.4648):  38%|████▌       | 410/1066 [42:07<1:06:49,  6.11s/it]Training 1/2 epoch (loss 0.4648):  39%|████▋       | 411/1066 [42:07<1:07:52,  6.22s/it]Training 1/2 epoch (loss 0.5000):  39%|████▋       | 411/1066 [42:13<1:07:52,  6.22s/it]Training 1/2 epoch (loss 0.5000):  39%|████▋       | 412/1066 [42:13<1:06:38,  6.11s/it]Training 1/2 epoch (loss 0.5000):  39%|████▋       | 412/1066 [42:19<1:06:38,  6.11s/it]Training 1/2 epoch (loss 0.5000):  39%|████▋       | 413/1066 [42:19<1:07:25,  6.20s/it]Training 1/2 epoch (loss 0.4531):  39%|████▋       | 413/1066 [42:25<1:07:25,  6.20s/it]Training 1/2 epoch (loss 0.4531):  39%|████▋       | 414/1066 [42:25<1:07:30,  6.21s/it]Training 1/2 epoch (loss 0.4922):  39%|████▋       | 414/1066 [42:31<1:07:30,  6.21s/it]Training 1/2 epoch (loss 0.4922):  39%|████▋       | 415/1066 [42:31<1:07:18,  6.20s/it]Training 1/2 epoch (loss 0.5234):  39%|████▋       | 415/1066 [42:37<1:07:18,  6.20s/it]Training 1/2 epoch (loss 0.5234):  39%|████▋       | 416/1066 [42:37<1:04:34,  5.96s/it]Training 1/2 epoch (loss 0.4902):  39%|████▋       | 416/1066 [42:43<1:04:34,  5.96s/it]Training 1/2 epoch (loss 0.4902):  39%|████▋       | 417/1066 [42:43<1:05:03,  6.01s/it]Training 1/2 epoch (loss 0.4902):  39%|████▋       | 417/1066 [42:49<1:05:03,  6.01s/it]Training 1/2 epoch (loss 0.4902):  39%|████▋       | 418/1066 [42:49<1:05:36,  6.07s/it]Training 1/2 epoch (loss 0.4980):  39%|████▋       | 418/1066 [42:55<1:05:36,  6.07s/it]Training 1/2 epoch (loss 0.4980):  39%|████▋       | 419/1066 [42:55<1:06:12,  6.14s/it]Training 1/2 epoch (loss 0.4844):  39%|████▋       | 419/1066 [43:02<1:06:12,  6.14s/it]Training 1/2 epoch (loss 0.4844):  39%|████▋       | 420/1066 [43:02<1:07:24,  6.26s/it]Training 1/2 epoch (loss 0.4961):  39%|████▋       | 420/1066 [43:08<1:07:24,  6.26s/it]Training 1/2 epoch (loss 0.4961):  39%|████▋       | 421/1066 [43:08<1:07:51,  6.31s/it]Training 1/2 epoch (loss 0.4961):  39%|████▋       | 421/1066 [43:14<1:07:51,  6.31s/it]Training 1/2 epoch (loss 0.4961):  40%|████▊       | 422/1066 [43:14<1:06:53,  6.23s/it]Training 1/2 epoch (loss 0.4160):  40%|████▊       | 422/1066 [43:21<1:06:53,  6.23s/it]Training 1/2 epoch (loss 0.4160):  40%|████▊       | 423/1066 [43:21<1:07:31,  6.30s/it]Training 1/2 epoch (loss 0.4766):  40%|████▊       | 423/1066 [43:27<1:07:31,  6.30s/it]Training 1/2 epoch (loss 0.4766):  40%|████▊       | 424/1066 [43:27<1:07:27,  6.31s/it]Training 1/2 epoch (loss 0.5234):  40%|████▊       | 424/1066 [43:33<1:07:27,  6.31s/it]Training 1/2 epoch (loss 0.5234):  40%|████▊       | 425/1066 [43:33<1:04:03,  6.00s/it]Training 1/2 epoch (loss 0.4805):  40%|████▊       | 425/1066 [43:39<1:04:03,  6.00s/it]Training 1/2 epoch (loss 0.4805):  40%|████▊       | 426/1066 [43:39<1:04:56,  6.09s/it]Training 1/2 epoch (loss 0.4883):  40%|████▊       | 426/1066 [43:45<1:04:56,  6.09s/it]Training 1/2 epoch (loss 0.4883):  40%|████▊       | 427/1066 [43:45<1:06:13,  6.22s/it]Training 1/2 epoch (loss 0.5039):  40%|████▊       | 427/1066 [43:52<1:06:13,  6.22s/it]Training 1/2 epoch (loss 0.5039):  40%|████▊       | 428/1066 [43:52<1:06:23,  6.24s/it]Training 1/2 epoch (loss 0.5156):  40%|████▊       | 428/1066 [43:58<1:06:23,  6.24s/it]Training 1/2 epoch (loss 0.5156):  40%|████▊       | 429/1066 [43:58<1:06:16,  6.24s/it]Training 1/2 epoch (loss 0.3965):  40%|████▊       | 429/1066 [44:04<1:06:16,  6.24s/it]Training 1/2 epoch (loss 0.3965):  40%|████▊       | 430/1066 [44:04<1:06:12,  6.25s/it]Training 1/2 epoch (loss 0.4805):  40%|████▊       | 430/1066 [44:10<1:06:12,  6.25s/it]Training 1/2 epoch (loss 0.4805):  40%|████▊       | 431/1066 [44:10<1:06:12,  6.26s/it]Training 1/2 epoch (loss 0.5117):  40%|████▊       | 431/1066 [44:17<1:06:12,  6.26s/it]Training 1/2 epoch (loss 0.5117):  41%|████▊       | 432/1066 [44:17<1:07:26,  6.38s/it]Training 1/2 epoch (loss 0.5117):  41%|████▊       | 432/1066 [44:23<1:07:26,  6.38s/it]Training 1/2 epoch (loss 0.5117):  41%|████▊       | 433/1066 [44:23<1:07:11,  6.37s/it]Training 1/2 epoch (loss 0.4785):  41%|████▊       | 433/1066 [44:29<1:07:11,  6.37s/it]Training 1/2 epoch (loss 0.4785):  41%|████▉       | 434/1066 [44:29<1:05:44,  6.24s/it]Training 1/2 epoch (loss 0.4473):  41%|████▉       | 434/1066 [44:36<1:05:44,  6.24s/it]Training 1/2 epoch (loss 0.4473):  41%|████▉       | 435/1066 [44:36<1:05:35,  6.24s/it]Training 1/2 epoch (loss 0.4434):  41%|████▉       | 435/1066 [44:42<1:05:35,  6.24s/it]Training 1/2 epoch (loss 0.4434):  41%|████▉       | 436/1066 [44:42<1:05:24,  6.23s/it]Training 1/2 epoch (loss 0.4785):  41%|████▉       | 436/1066 [44:48<1:05:24,  6.23s/it]Training 1/2 epoch (loss 0.4785):  41%|████▉       | 437/1066 [44:48<1:05:56,  6.29s/it]Training 1/2 epoch (loss 0.5000):  41%|████▉       | 437/1066 [44:54<1:05:56,  6.29s/it]Training 1/2 epoch (loss 0.5000):  41%|████▉       | 438/1066 [44:54<1:03:13,  6.04s/it]Training 1/2 epoch (loss 0.5391):  41%|████▉       | 438/1066 [45:00<1:03:13,  6.04s/it]Training 1/2 epoch (loss 0.5391):  41%|████▉       | 439/1066 [45:00<1:03:57,  6.12s/it]Training 1/2 epoch (loss 0.4570):  41%|████▉       | 439/1066 [45:06<1:03:57,  6.12s/it]Training 1/2 epoch (loss 0.4570):  41%|████▉       | 440/1066 [45:06<1:03:38,  6.10s/it]Training 1/2 epoch (loss 0.4316):  41%|████▉       | 440/1066 [45:13<1:03:38,  6.10s/it]Training 1/2 epoch (loss 0.4316):  41%|████▉       | 441/1066 [45:13<1:04:58,  6.24s/it]Training 1/2 epoch (loss 0.5078):  41%|████▉       | 441/1066 [45:18<1:04:58,  6.24s/it]Training 1/2 epoch (loss 0.5078):  41%|████▉       | 442/1066 [45:18<1:03:22,  6.09s/it]Training 1/2 epoch (loss 0.5078):  41%|████▉       | 442/1066 [45:25<1:03:22,  6.09s/it]Training 1/2 epoch (loss 0.5078):  42%|████▉       | 443/1066 [45:25<1:04:02,  6.17s/it]Training 1/2 epoch (loss 0.3945):  42%|████▉       | 443/1066 [45:31<1:04:02,  6.17s/it]Training 1/2 epoch (loss 0.3945):  42%|████▉       | 444/1066 [45:31<1:03:29,  6.12s/it]Training 1/2 epoch (loss 0.5625):  42%|████▉       | 444/1066 [45:37<1:03:29,  6.12s/it]Training 1/2 epoch (loss 0.5625):  42%|█████       | 445/1066 [45:37<1:03:55,  6.18s/it]Training 1/2 epoch (loss 0.4648):  42%|█████       | 445/1066 [45:44<1:03:55,  6.18s/it]Training 1/2 epoch (loss 0.4648):  42%|█████       | 446/1066 [45:44<1:04:55,  6.28s/it]Training 1/2 epoch (loss 0.5547):  42%|█████       | 446/1066 [45:50<1:04:55,  6.28s/it]Training 1/2 epoch (loss 0.5547):  42%|█████       | 447/1066 [45:50<1:04:44,  6.27s/it]Training 1/2 epoch (loss 0.5781):  42%|█████       | 447/1066 [45:56<1:04:44,  6.27s/it]Training 1/2 epoch (loss 0.5781):  42%|█████       | 448/1066 [45:56<1:03:50,  6.20s/it]Training 1/2 epoch (loss 0.4785):  42%|█████       | 448/1066 [46:02<1:03:50,  6.20s/it]Training 1/2 epoch (loss 0.4785):  42%|█████       | 449/1066 [46:02<1:04:01,  6.23s/it]Training 1/2 epoch (loss 0.3926):  42%|█████       | 449/1066 [46:09<1:04:01,  6.23s/it]Training 1/2 epoch (loss 0.3926):  42%|█████       | 450/1066 [46:09<1:05:07,  6.34s/it]Training 1/2 epoch (loss 0.4629):  42%|█████       | 450/1066 [46:15<1:05:07,  6.34s/it]Training 1/2 epoch (loss 0.4629):  42%|█████       | 451/1066 [46:15<1:04:38,  6.31s/it]Training 1/2 epoch (loss 0.4316):  42%|█████       | 451/1066 [46:22<1:04:38,  6.31s/it]Training 1/2 epoch (loss 0.4316):  42%|█████       | 452/1066 [46:22<1:05:18,  6.38s/it]Training 1/2 epoch (loss 0.5039):  42%|█████       | 452/1066 [46:27<1:05:18,  6.38s/it]Training 1/2 epoch (loss 0.5039):  42%|█████       | 453/1066 [46:27<1:01:47,  6.05s/it]Training 1/2 epoch (loss 0.5234):  42%|█████       | 453/1066 [46:33<1:01:47,  6.05s/it]Training 1/2 epoch (loss 0.5234):  43%|█████       | 454/1066 [46:33<1:02:16,  6.11s/it]Training 1/2 epoch (loss 0.4141):  43%|█████       | 454/1066 [46:38<1:02:16,  6.11s/it]Training 1/2 epoch (loss 0.4141):  43%|█████▉        | 455/1066 [46:38<59:39,  5.86s/it]Training 1/2 epoch (loss 0.4453):  43%|█████▉        | 455/1066 [46:45<59:39,  5.86s/it]Training 1/2 epoch (loss 0.4453):  43%|█████▏      | 456/1066 [46:45<1:01:39,  6.06s/it]Training 1/2 epoch (loss 0.5312):  43%|█████▏      | 456/1066 [46:51<1:01:39,  6.06s/it]Training 1/2 epoch (loss 0.5312):  43%|█████▏      | 457/1066 [46:51<1:01:58,  6.11s/it]Training 1/2 epoch (loss 0.4922):  43%|█████▏      | 457/1066 [46:57<1:01:58,  6.11s/it]Training 1/2 epoch (loss 0.4922):  43%|█████▏      | 458/1066 [46:57<1:02:26,  6.16s/it]Training 1/2 epoch (loss 0.4043):  43%|█████▏      | 458/1066 [47:03<1:02:26,  6.16s/it]Training 1/2 epoch (loss 0.4043):  43%|█████▏      | 459/1066 [47:03<1:01:35,  6.09s/it]Training 1/2 epoch (loss 0.5391):  43%|█████▏      | 459/1066 [47:10<1:01:35,  6.09s/it]Training 1/2 epoch (loss 0.5391):  43%|█████▏      | 460/1066 [47:10<1:02:03,  6.14s/it]Training 1/2 epoch (loss 0.5234):  43%|█████▏      | 460/1066 [47:16<1:02:03,  6.14s/it]Training 1/2 epoch (loss 0.5234):  43%|█████▏      | 461/1066 [47:16<1:01:22,  6.09s/it]Training 1/2 epoch (loss 0.3965):  43%|█████▏      | 461/1066 [47:22<1:01:22,  6.09s/it]Training 1/2 epoch (loss 0.3965):  43%|█████▏      | 462/1066 [47:22<1:01:41,  6.13s/it]Training 1/2 epoch (loss 0.5234):  43%|█████▏      | 462/1066 [47:28<1:01:41,  6.13s/it]Training 1/2 epoch (loss 0.5234):  43%|█████▏      | 463/1066 [47:28<1:01:23,  6.11s/it]Training 1/2 epoch (loss 0.3887):  43%|█████▏      | 463/1066 [47:34<1:01:23,  6.11s/it]Training 1/2 epoch (loss 0.3887):  44%|█████▏      | 464/1066 [47:34<1:01:54,  6.17s/it]Training 1/2 epoch (loss 0.4551):  44%|█████▏      | 464/1066 [47:40<1:01:54,  6.17s/it]Training 1/2 epoch (loss 0.4551):  44%|█████▏      | 465/1066 [47:40<1:01:43,  6.16s/it]Training 1/2 epoch (loss 0.5078):  44%|█████▏      | 465/1066 [47:47<1:01:43,  6.16s/it]Training 1/2 epoch (loss 0.5078):  44%|█████▏      | 466/1066 [47:47<1:02:30,  6.25s/it]Training 1/2 epoch (loss 0.4570):  44%|█████▏      | 466/1066 [47:53<1:02:30,  6.25s/it]Training 1/2 epoch (loss 0.4570):  44%|█████▎      | 467/1066 [47:53<1:01:25,  6.15s/it]Training 1/2 epoch (loss 0.5117):  44%|█████▎      | 467/1066 [47:58<1:01:25,  6.15s/it]Training 1/2 epoch (loss 0.5117):  44%|██████▏       | 468/1066 [47:58<58:42,  5.89s/it]Training 1/2 epoch (loss 0.4668):  44%|██████▏       | 468/1066 [48:03<58:42,  5.89s/it]Training 1/2 epoch (loss 0.4668):  44%|██████▏       | 469/1066 [48:03<56:55,  5.72s/it]Training 1/2 epoch (loss 0.3613):  44%|██████▏       | 469/1066 [48:09<56:55,  5.72s/it]Training 1/2 epoch (loss 0.3613):  44%|██████▏       | 470/1066 [48:09<56:20,  5.67s/it]Training 1/2 epoch (loss 0.4609):  44%|██████▏       | 470/1066 [48:15<56:20,  5.67s/it]Training 1/2 epoch (loss 0.4609):  44%|██████▏       | 471/1066 [48:15<58:36,  5.91s/it]Training 1/2 epoch (loss 0.3633):  44%|██████▏       | 471/1066 [48:21<58:36,  5.91s/it]Training 1/2 epoch (loss 0.3633):  44%|██████▏       | 472/1066 [48:21<59:21,  6.00s/it]Training 1/2 epoch (loss 0.5000):  44%|██████▏       | 472/1066 [48:27<59:21,  6.00s/it]Training 1/2 epoch (loss 0.5000):  44%|██████▏       | 473/1066 [48:27<57:59,  5.87s/it]Training 1/2 epoch (loss 0.4668):  44%|██████▏       | 473/1066 [48:34<57:59,  5.87s/it]Training 1/2 epoch (loss 0.4668):  44%|█████▎      | 474/1066 [48:34<1:00:11,  6.10s/it]Training 1/2 epoch (loss 0.5859):  44%|█████▎      | 474/1066 [48:40<1:00:11,  6.10s/it]Training 1/2 epoch (loss 0.5859):  45%|█████▎      | 475/1066 [48:40<1:01:07,  6.21s/it]Training 1/2 epoch (loss 0.4805):  45%|█████▎      | 475/1066 [48:46<1:01:07,  6.21s/it]Training 1/2 epoch (loss 0.4805):  45%|██████▎       | 476/1066 [48:46<59:20,  6.04s/it]Training 1/2 epoch (loss 0.5742):  45%|██████▎       | 476/1066 [48:51<59:20,  6.04s/it]Training 1/2 epoch (loss 0.5742):  45%|██████▎       | 477/1066 [48:51<56:56,  5.80s/it]Training 1/2 epoch (loss 0.4961):  45%|██████▎       | 477/1066 [48:57<56:56,  5.80s/it]Training 1/2 epoch (loss 0.4961):  45%|██████▎       | 478/1066 [48:57<56:59,  5.81s/it]Training 1/2 epoch (loss 0.4473):  45%|██████▎       | 478/1066 [49:03<56:59,  5.81s/it]Training 1/2 epoch (loss 0.4473):  45%|██████▎       | 479/1066 [49:03<58:44,  6.00s/it]Training 1/2 epoch (loss 0.4922):  45%|██████▎       | 479/1066 [49:09<58:44,  6.00s/it]Training 1/2 epoch (loss 0.4922):  45%|██████▎       | 480/1066 [49:09<58:14,  5.96s/it]Training 1/2 epoch (loss 0.4199):  45%|██████▎       | 480/1066 [49:15<58:14,  5.96s/it]Training 1/2 epoch (loss 0.4199):  45%|██████▎       | 481/1066 [49:15<58:53,  6.04s/it]Training 1/2 epoch (loss 0.4180):  45%|██████▎       | 481/1066 [49:22<58:53,  6.04s/it]Training 1/2 epoch (loss 0.4180):  45%|██████▎       | 482/1066 [49:22<59:15,  6.09s/it]Training 1/2 epoch (loss 0.4922):  45%|██████▎       | 482/1066 [49:28<59:15,  6.09s/it]Training 1/2 epoch (loss 0.4922):  45%|█████▍      | 483/1066 [49:28<1:01:04,  6.29s/it]Training 1/2 epoch (loss 0.4258):  45%|█████▍      | 483/1066 [49:35<1:01:04,  6.29s/it]Training 1/2 epoch (loss 0.4258):  45%|█████▍      | 484/1066 [49:35<1:00:58,  6.29s/it]Training 1/2 epoch (loss 0.4551):  45%|█████▍      | 484/1066 [49:41<1:00:58,  6.29s/it]Training 1/2 epoch (loss 0.4551):  45%|█████▍      | 485/1066 [49:41<1:01:19,  6.33s/it]Training 1/2 epoch (loss 0.3965):  45%|█████▍      | 485/1066 [49:48<1:01:19,  6.33s/it]Training 1/2 epoch (loss 0.3965):  46%|█████▍      | 486/1066 [49:48<1:01:57,  6.41s/it]Training 1/2 epoch (loss 0.4531):  46%|█████▍      | 486/1066 [49:54<1:01:57,  6.41s/it]Training 1/2 epoch (loss 0.4531):  46%|█████▍      | 487/1066 [49:54<1:01:18,  6.35s/it]Training 1/2 epoch (loss 0.4473):  46%|█████▍      | 487/1066 [50:00<1:01:18,  6.35s/it]Training 1/2 epoch (loss 0.4473):  46%|█████▍      | 488/1066 [50:00<1:01:09,  6.35s/it]Training 1/2 epoch (loss 0.5820):  46%|█████▍      | 488/1066 [50:07<1:01:09,  6.35s/it]Training 1/2 epoch (loss 0.5820):  46%|█████▌      | 489/1066 [50:07<1:01:55,  6.44s/it]Training 1/2 epoch (loss 0.4902):  46%|█████▌      | 489/1066 [50:13<1:01:55,  6.44s/it]Training 1/2 epoch (loss 0.4902):  46%|█████▌      | 490/1066 [50:13<1:01:32,  6.41s/it]Training 1/2 epoch (loss 0.4844):  46%|█████▌      | 490/1066 [50:19<1:01:32,  6.41s/it]Training 1/2 epoch (loss 0.4844):  46%|█████▌      | 491/1066 [50:19<1:00:43,  6.34s/it]Training 1/2 epoch (loss 0.4590):  46%|█████▌      | 491/1066 [50:26<1:00:43,  6.34s/it]Training 1/2 epoch (loss 0.4590):  46%|█████▌      | 492/1066 [50:26<1:00:51,  6.36s/it]Training 1/2 epoch (loss 0.5391):  46%|█████▌      | 492/1066 [50:32<1:00:51,  6.36s/it]Training 1/2 epoch (loss 0.5391):  46%|█████▌      | 493/1066 [50:32<1:00:56,  6.38s/it]Training 1/2 epoch (loss 0.4414):  46%|█████▌      | 493/1066 [50:39<1:00:56,  6.38s/it]Training 1/2 epoch (loss 0.4414):  46%|█████▌      | 494/1066 [50:39<1:01:06,  6.41s/it]Training 1/2 epoch (loss 0.6055):  46%|█████▌      | 494/1066 [50:45<1:01:06,  6.41s/it]Training 1/2 epoch (loss 0.6055):  46%|█████▌      | 495/1066 [50:45<1:01:08,  6.42s/it]Training 1/2 epoch (loss 0.4629):  46%|█████▌      | 495/1066 [50:51<1:01:08,  6.42s/it]Training 1/2 epoch (loss 0.4629):  47%|██████▌       | 496/1066 [50:51<59:58,  6.31s/it]Training 1/2 epoch (loss 0.4609):  47%|██████▌       | 496/1066 [50:57<59:58,  6.31s/it]Training 1/2 epoch (loss 0.4609):  47%|██████▌       | 497/1066 [50:57<59:11,  6.24s/it]Training 1/2 epoch (loss 0.5156):  47%|██████▌       | 497/1066 [51:03<59:11,  6.24s/it]Training 1/2 epoch (loss 0.5156):  47%|██████▌       | 498/1066 [51:03<57:31,  6.08s/it]Training 1/2 epoch (loss 0.5469):  47%|██████▌       | 498/1066 [51:09<57:31,  6.08s/it]Training 1/2 epoch (loss 0.5469):  47%|██████▌       | 499/1066 [51:09<57:45,  6.11s/it]Training 1/2 epoch (loss 0.4141):  47%|██████▌       | 499/1066 [51:16<57:45,  6.11s/it]Training 1/2 epoch (loss 0.4141):  47%|██████▌       | 500/1066 [51:16<58:15,  6.18s/it]Training 1/2 epoch (loss 0.5469):  47%|██████▌       | 500/1066 [51:22<58:15,  6.18s/it]Training 1/2 epoch (loss 0.5469):  47%|██████▌       | 501/1066 [51:22<58:42,  6.23s/it]Training 1/2 epoch (loss 0.4082):  47%|██████▌       | 501/1066 [51:28<58:42,  6.23s/it]Training 1/2 epoch (loss 0.4082):  47%|██████▌       | 502/1066 [51:28<59:11,  6.30s/it]Training 1/2 epoch (loss 0.4980):  47%|██████▌       | 502/1066 [51:34<59:11,  6.30s/it]Training 1/2 epoch (loss 0.4980):  47%|██████▌       | 503/1066 [51:34<57:06,  6.09s/it]Training 1/2 epoch (loss 0.5117):  47%|██████▌       | 503/1066 [51:41<57:06,  6.09s/it]Training 1/2 epoch (loss 0.5117):  47%|██████▌       | 504/1066 [51:41<58:44,  6.27s/it]Training 1/2 epoch (loss 0.3262):  47%|██████▌       | 504/1066 [51:47<58:44,  6.27s/it]Training 1/2 epoch (loss 0.3262):  47%|██████▋       | 505/1066 [51:47<58:28,  6.25s/it]Training 1/2 epoch (loss 0.3164):  47%|██████▋       | 505/1066 [51:53<58:28,  6.25s/it]Training 1/2 epoch (loss 0.3164):  47%|██████▋       | 506/1066 [51:53<58:26,  6.26s/it]Training 1/2 epoch (loss 0.4570):  47%|██████▋       | 506/1066 [51:59<58:26,  6.26s/it]Training 1/2 epoch (loss 0.4570):  48%|██████▋       | 507/1066 [51:59<58:06,  6.24s/it]Training 1/2 epoch (loss 0.5273):  48%|██████▋       | 507/1066 [52:05<58:06,  6.24s/it]Training 1/2 epoch (loss 0.5273):  48%|██████▋       | 508/1066 [52:05<56:33,  6.08s/it]Training 1/2 epoch (loss 0.4961):  48%|██████▋       | 508/1066 [52:11<56:33,  6.08s/it]Training 1/2 epoch (loss 0.4961):  48%|██████▋       | 509/1066 [52:11<56:27,  6.08s/it]Training 1/2 epoch (loss 0.4883):  48%|██████▋       | 509/1066 [52:18<56:27,  6.08s/it]Training 1/2 epoch (loss 0.4883):  48%|██████▋       | 510/1066 [52:18<57:32,  6.21s/it]Training 1/2 epoch (loss 0.4395):  48%|██████▋       | 510/1066 [52:24<57:32,  6.21s/it]Training 1/2 epoch (loss 0.4395):  48%|██████▋       | 511/1066 [52:24<57:56,  6.26s/it]Training 1/2 epoch (loss 0.5156):  48%|██████▋       | 511/1066 [52:30<57:56,  6.26s/it]Training 1/2 epoch (loss 0.5156):  48%|██████▋       | 512/1066 [52:30<58:01,  6.29s/it]Training 1/2 epoch (loss 0.5156):  48%|██████▋       | 512/1066 [52:37<58:01,  6.29s/it]Training 1/2 epoch (loss 0.5156):  48%|██████▋       | 513/1066 [52:37<58:44,  6.37s/it]Training 1/2 epoch (loss 0.5859):  48%|██████▋       | 513/1066 [52:43<58:44,  6.37s/it]Training 1/2 epoch (loss 0.5859):  48%|██████▊       | 514/1066 [52:43<58:33,  6.36s/it]Training 1/2 epoch (loss 0.5352):  48%|██████▊       | 514/1066 [52:50<58:33,  6.36s/it]Training 1/2 epoch (loss 0.5352):  48%|██████▊       | 515/1066 [52:50<58:12,  6.34s/it]Training 1/2 epoch (loss 0.5000):  48%|██████▊       | 515/1066 [52:56<58:12,  6.34s/it]Training 1/2 epoch (loss 0.5000):  48%|██████▊       | 516/1066 [52:56<58:51,  6.42s/it]Training 1/2 epoch (loss 0.5117):  48%|██████▊       | 516/1066 [53:02<58:51,  6.42s/it]Training 1/2 epoch (loss 0.5117):  48%|██████▊       | 517/1066 [53:02<56:28,  6.17s/it]Training 1/2 epoch (loss 0.6133):  48%|██████▊       | 517/1066 [53:08<56:28,  6.17s/it]Training 1/2 epoch (loss 0.6133):  49%|██████▊       | 518/1066 [53:08<56:08,  6.15s/it]Training 1/2 epoch (loss 0.4805):  49%|██████▊       | 518/1066 [53:14<56:08,  6.15s/it]Training 1/2 epoch (loss 0.4805):  49%|██████▊       | 519/1066 [53:14<57:08,  6.27s/it]Training 1/2 epoch (loss 0.4648):  49%|██████▊       | 519/1066 [53:21<57:08,  6.27s/it]Training 1/2 epoch (loss 0.4648):  49%|██████▊       | 520/1066 [53:21<57:15,  6.29s/it]Training 1/2 epoch (loss 0.5078):  49%|██████▊       | 520/1066 [53:27<57:15,  6.29s/it]Training 1/2 epoch (loss 0.5078):  49%|██████▊       | 521/1066 [53:27<57:37,  6.34s/it]Training 1/2 epoch (loss 0.4414):  49%|██████▊       | 521/1066 [53:34<57:37,  6.34s/it]Training 1/2 epoch (loss 0.4414):  49%|██████▊       | 522/1066 [53:34<57:43,  6.37s/it]Training 1/2 epoch (loss 0.4258):  49%|██████▊       | 522/1066 [53:40<57:43,  6.37s/it]Training 1/2 epoch (loss 0.4258):  49%|██████▊       | 523/1066 [53:40<57:45,  6.38s/it]Training 1/2 epoch (loss 0.5742):  49%|██████▊       | 523/1066 [53:46<57:45,  6.38s/it]Training 1/2 epoch (loss 0.5742):  49%|██████▉       | 524/1066 [53:46<56:18,  6.23s/it]Training 1/2 epoch (loss 0.4277):  49%|██████▉       | 524/1066 [53:52<56:18,  6.23s/it]Training 1/2 epoch (loss 0.4277):  49%|██████▉       | 525/1066 [53:52<56:46,  6.30s/it]Training 1/2 epoch (loss 0.4707):  49%|██████▉       | 525/1066 [53:58<56:46,  6.30s/it]Training 1/2 epoch (loss 0.4707):  49%|██████▉       | 526/1066 [53:58<53:46,  5.98s/it]Training 1/2 epoch (loss 0.4219):  49%|██████▉       | 526/1066 [54:04<53:46,  5.98s/it]Training 1/2 epoch (loss 0.4219):  49%|██████▉       | 527/1066 [54:04<54:55,  6.11s/it]Training 1/2 epoch (loss 0.4375):  49%|██████▉       | 527/1066 [54:10<54:55,  6.11s/it]Training 1/2 epoch (loss 0.4375):  50%|██████▉       | 528/1066 [54:10<53:49,  6.00s/it]Training 1/2 epoch (loss 0.4062):  50%|██████▉       | 528/1066 [54:16<53:49,  6.00s/it]Training 1/2 epoch (loss 0.4062):  50%|██████▉       | 529/1066 [54:16<54:46,  6.12s/it]Training 1/2 epoch (loss 0.5273):  50%|██████▉       | 529/1066 [54:22<54:46,  6.12s/it]Training 1/2 epoch (loss 0.5273):  50%|██████▉       | 530/1066 [54:22<54:27,  6.10s/it]Training 1/2 epoch (loss 0.5547):  50%|██████▉       | 530/1066 [54:28<54:27,  6.10s/it]Training 1/2 epoch (loss 0.5547):  50%|██████▉       | 531/1066 [54:28<52:14,  5.86s/it]Training 1/2 epoch (loss 0.4805):  50%|██████▉       | 531/1066 [54:34<52:14,  5.86s/it]Training 1/2 epoch (loss 0.4805):  50%|██████▉       | 532/1066 [54:34<52:40,  5.92s/it]Training 1/2 epoch (loss 0.4531):  50%|██████▉       | 532/1066 [54:39<52:40,  5.92s/it]Training 1/2 epoch (loss 0.4531):  50%|███████       | 533/1066 [54:39<50:39,  5.70s/it]Training 2/2 epoch (loss 0.4160):  50%|███████       | 533/1066 [54:45<50:39,  5.70s/it]Training 2/2 epoch (loss 0.4160):  50%|███████       | 534/1066 [54:45<51:41,  5.83s/it]Training 2/2 epoch (loss 0.4844):  50%|███████       | 534/1066 [54:51<51:41,  5.83s/it]Training 2/2 epoch (loss 0.4844):  50%|███████       | 535/1066 [54:51<52:55,  5.98s/it]Training 2/2 epoch (loss 0.4082):  50%|███████       | 535/1066 [54:58<52:55,  5.98s/it]Training 2/2 epoch (loss 0.4082):  50%|███████       | 536/1066 [54:58<53:41,  6.08s/it]Training 2/2 epoch (loss 0.4570):  50%|███████       | 536/1066 [55:04<53:41,  6.08s/it]Training 2/2 epoch (loss 0.4570):  50%|███████       | 537/1066 [55:04<55:01,  6.24s/it]Training 2/2 epoch (loss 0.4473):  50%|███████       | 537/1066 [55:10<55:01,  6.24s/it]Training 2/2 epoch (loss 0.4473):  50%|███████       | 538/1066 [55:10<55:00,  6.25s/it]Training 2/2 epoch (loss 0.4727):  50%|███████       | 538/1066 [55:17<55:00,  6.25s/it]Training 2/2 epoch (loss 0.4727):  51%|███████       | 539/1066 [55:17<55:14,  6.29s/it]Training 2/2 epoch (loss 0.2734):  51%|███████       | 539/1066 [55:22<55:14,  6.29s/it]Training 2/2 epoch (loss 0.2734):  51%|███████       | 540/1066 [55:22<52:28,  5.99s/it]Training 2/2 epoch (loss 0.4707):  51%|███████       | 540/1066 [55:28<52:28,  5.99s/it]Training 2/2 epoch (loss 0.4707):  51%|███████       | 541/1066 [55:28<52:52,  6.04s/it]Training 2/2 epoch (loss 0.5312):  51%|███████       | 541/1066 [55:34<52:52,  6.04s/it]Training 2/2 epoch (loss 0.5312):  51%|███████       | 542/1066 [55:34<52:28,  6.01s/it]Training 2/2 epoch (loss 0.4453):  51%|███████       | 542/1066 [55:39<52:28,  6.01s/it]Training 2/2 epoch (loss 0.4453):  51%|███████▏      | 543/1066 [55:39<50:27,  5.79s/it]Training 2/2 epoch (loss 0.3438):  51%|███████▏      | 543/1066 [55:46<50:27,  5.79s/it]Training 2/2 epoch (loss 0.3438):  51%|███████▏      | 544/1066 [55:46<51:44,  5.95s/it]Training 2/2 epoch (loss 0.3477):  51%|███████▏      | 544/1066 [55:52<51:44,  5.95s/it]Training 2/2 epoch (loss 0.3477):  51%|███████▏      | 545/1066 [55:52<52:41,  6.07s/it]Training 2/2 epoch (loss 0.4219):  51%|███████▏      | 545/1066 [55:58<52:41,  6.07s/it]Training 2/2 epoch (loss 0.4219):  51%|███████▏      | 546/1066 [55:58<53:01,  6.12s/it]Training 2/2 epoch (loss 0.3301):  51%|███████▏      | 546/1066 [56:05<53:01,  6.12s/it]Training 2/2 epoch (loss 0.3301):  51%|███████▏      | 547/1066 [56:05<53:35,  6.20s/it]Training 2/2 epoch (loss 0.3496):  51%|███████▏      | 547/1066 [56:11<53:35,  6.20s/it]Training 2/2 epoch (loss 0.3496):  51%|███████▏      | 548/1066 [56:11<53:48,  6.23s/it]Training 2/2 epoch (loss 0.3320):  51%|███████▏      | 548/1066 [56:18<53:48,  6.23s/it]Training 2/2 epoch (loss 0.3320):  52%|███████▏      | 549/1066 [56:18<54:23,  6.31s/it]Training 2/2 epoch (loss 0.4570):  52%|███████▏      | 549/1066 [56:24<54:23,  6.31s/it]Training 2/2 epoch (loss 0.4570):  52%|███████▏      | 550/1066 [56:24<54:34,  6.35s/it]Training 2/2 epoch (loss 0.3516):  52%|███████▏      | 550/1066 [56:30<54:34,  6.35s/it]Training 2/2 epoch (loss 0.3516):  52%|███████▏      | 551/1066 [56:30<54:38,  6.37s/it]Training 2/2 epoch (loss 0.3594):  52%|███████▏      | 551/1066 [56:37<54:38,  6.37s/it]Training 2/2 epoch (loss 0.3594):  52%|███████▏      | 552/1066 [56:37<54:17,  6.34s/it]Training 2/2 epoch (loss 0.2637):  52%|███████▏      | 552/1066 [56:43<54:17,  6.34s/it]Training 2/2 epoch (loss 0.2637):  52%|███████▎      | 553/1066 [56:43<53:52,  6.30s/it]Training 2/2 epoch (loss 0.2754):  52%|███████▎      | 553/1066 [56:49<53:52,  6.30s/it]Training 2/2 epoch (loss 0.2754):  52%|███████▎      | 554/1066 [56:49<53:49,  6.31s/it]Training 2/2 epoch (loss 0.2891):  52%|███████▎      | 554/1066 [56:55<53:49,  6.31s/it]Training 2/2 epoch (loss 0.2891):  52%|███████▎      | 555/1066 [56:55<53:37,  6.30s/it]Training 2/2 epoch (loss 0.3613):  52%|███████▎      | 555/1066 [57:01<53:37,  6.30s/it]Training 2/2 epoch (loss 0.3613):  52%|███████▎      | 556/1066 [57:01<50:36,  5.95s/it]Training 2/2 epoch (loss 0.4648):  52%|███████▎      | 556/1066 [57:06<50:36,  5.95s/it]Training 2/2 epoch (loss 0.4648):  52%|███████▎      | 557/1066 [57:06<49:20,  5.82s/it]Training 2/2 epoch (loss 0.3320):  52%|███████▎      | 557/1066 [57:13<49:20,  5.82s/it]Training 2/2 epoch (loss 0.3320):  52%|███████▎      | 558/1066 [57:13<50:42,  5.99s/it]Training 2/2 epoch (loss 0.1982):  52%|███████▎      | 558/1066 [57:19<50:42,  5.99s/it]Training 2/2 epoch (loss 0.1982):  52%|███████▎      | 559/1066 [57:19<51:06,  6.05s/it]Training 2/2 epoch (loss 0.3438):  52%|███████▎      | 559/1066 [57:24<51:06,  6.05s/it]Training 2/2 epoch (loss 0.3438):  53%|███████▎      | 560/1066 [57:24<49:53,  5.92s/it]Training 2/2 epoch (loss 0.3086):  53%|███████▎      | 560/1066 [57:31<49:53,  5.92s/it]Training 2/2 epoch (loss 0.3086):  53%|███████▎      | 561/1066 [57:31<51:19,  6.10s/it]Training 2/2 epoch (loss 0.2734):  53%|███████▎      | 561/1066 [57:37<51:19,  6.10s/it]Training 2/2 epoch (loss 0.2734):  53%|███████▍      | 562/1066 [57:37<51:59,  6.19s/it]Training 2/2 epoch (loss 0.3555):  53%|███████▍      | 562/1066 [57:43<51:59,  6.19s/it]Training 2/2 epoch (loss 0.3555):  53%|███████▍      | 563/1066 [57:43<51:35,  6.15s/it]Training 2/2 epoch (loss 0.2871):  53%|███████▍      | 563/1066 [57:50<51:35,  6.15s/it]Training 2/2 epoch (loss 0.2871):  53%|███████▍      | 564/1066 [57:50<52:35,  6.29s/it]Training 2/2 epoch (loss 0.1553):  53%|███████▍      | 564/1066 [57:55<52:35,  6.29s/it]Training 2/2 epoch (loss 0.1553):  53%|███████▍      | 565/1066 [57:55<50:00,  5.99s/it]Training 2/2 epoch (loss 0.2773):  53%|███████▍      | 565/1066 [58:01<50:00,  5.99s/it]Training 2/2 epoch (loss 0.2773):  53%|███████▍      | 566/1066 [58:01<50:30,  6.06s/it]Training 2/2 epoch (loss 0.3887):  53%|███████▍      | 566/1066 [58:08<50:30,  6.06s/it]Training 2/2 epoch (loss 0.3887):  53%|███████▍      | 567/1066 [58:08<51:25,  6.18s/it]Training 2/2 epoch (loss 0.3516):  53%|███████▍      | 567/1066 [58:14<51:25,  6.18s/it]Training 2/2 epoch (loss 0.3516):  53%|███████▍      | 568/1066 [58:14<51:31,  6.21s/it]Training 2/2 epoch (loss 0.7148):  53%|███████▍      | 568/1066 [58:20<51:31,  6.21s/it]Training 2/2 epoch (loss 0.7148):  53%|███████▍      | 569/1066 [58:20<51:37,  6.23s/it]Training 2/2 epoch (loss 0.6523):  53%|███████▍      | 569/1066 [58:27<51:37,  6.23s/it]Training 2/2 epoch (loss 0.6523):  53%|███████▍      | 570/1066 [58:27<52:10,  6.31s/it]Training 2/2 epoch (loss 0.4160):  53%|███████▍      | 570/1066 [58:32<52:10,  6.31s/it]Training 2/2 epoch (loss 0.4160):  54%|███████▍      | 571/1066 [58:32<49:58,  6.06s/it]Training 2/2 epoch (loss 0.4004):  54%|███████▍      | 571/1066 [58:39<49:58,  6.06s/it]Training 2/2 epoch (loss 0.4004):  54%|███████▌      | 572/1066 [58:39<50:15,  6.10s/it]Training 2/2 epoch (loss 0.6016):  54%|███████▌      | 572/1066 [58:44<50:15,  6.10s/it]Training 2/2 epoch (loss 0.6016):  54%|███████▌      | 573/1066 [58:44<49:24,  6.01s/it]Training 2/2 epoch (loss 0.2676):  54%|███████▌      | 573/1066 [58:51<49:24,  6.01s/it]Training 2/2 epoch (loss 0.2676):  54%|███████▌      | 574/1066 [58:51<50:09,  6.12s/it]Training 2/2 epoch (loss 0.6562):  54%|███████▌      | 574/1066 [58:56<50:09,  6.12s/it]Training 2/2 epoch (loss 0.6562):  54%|███████▌      | 575/1066 [58:56<47:23,  5.79s/it]Training 2/2 epoch (loss 0.1543):  54%|███████▌      | 575/1066 [59:01<47:23,  5.79s/it]Training 2/2 epoch (loss 0.1543):  54%|███████▌      | 576/1066 [59:01<46:42,  5.72s/it]Training 2/2 epoch (loss 0.1816):  54%|███████▌      | 576/1066 [59:08<46:42,  5.72s/it]Training 2/2 epoch (loss 0.1816):  54%|███████▌      | 577/1066 [59:08<48:16,  5.92s/it]Training 2/2 epoch (loss 0.1611):  54%|███████▌      | 577/1066 [59:14<48:16,  5.92s/it]Training 2/2 epoch (loss 0.1611):  54%|███████▌      | 578/1066 [59:14<49:00,  6.03s/it]Training 2/2 epoch (loss 0.2256):  54%|███████▌      | 578/1066 [59:21<49:00,  6.03s/it]Training 2/2 epoch (loss 0.2256):  54%|███████▌      | 579/1066 [59:21<50:05,  6.17s/it]Training 2/2 epoch (loss 0.3945):  54%|███████▌      | 579/1066 [59:27<50:05,  6.17s/it]Training 2/2 epoch (loss 0.3945):  54%|███████▌      | 580/1066 [59:27<49:34,  6.12s/it]Training 2/2 epoch (loss 0.2812):  54%|███████▌      | 580/1066 [59:32<49:34,  6.12s/it]Training 2/2 epoch (loss 0.2812):  55%|███████▋      | 581/1066 [59:32<48:09,  5.96s/it]Training 2/2 epoch (loss 0.3438):  55%|███████▋      | 581/1066 [59:39<48:09,  5.96s/it]Training 2/2 epoch (loss 0.3438):  55%|███████▋      | 582/1066 [59:39<49:19,  6.11s/it]Training 2/2 epoch (loss 0.2383):  55%|███████▋      | 582/1066 [59:45<49:19,  6.11s/it]Training 2/2 epoch (loss 0.2383):  55%|███████▋      | 583/1066 [59:45<49:45,  6.18s/it]Training 2/2 epoch (loss 0.3281):  55%|███████▋      | 583/1066 [59:51<49:45,  6.18s/it]Training 2/2 epoch (loss 0.3281):  55%|███████▋      | 584/1066 [59:51<50:19,  6.26s/it]Training 2/2 epoch (loss 0.3184):  55%|███████▋      | 584/1066 [59:57<50:19,  6.26s/it]Training 2/2 epoch (loss 0.3184):  55%|███████▋      | 585/1066 [59:57<49:12,  6.14s/it]Training 2/2 epoch (loss 0.2051):  55%|██████▌     | 585/1066 [1:00:03<49:12,  6.14s/it]Training 2/2 epoch (loss 0.2051):  55%|██████▌     | 586/1066 [1:00:03<48:34,  6.07s/it]Training 2/2 epoch (loss 0.2334):  55%|██████▌     | 586/1066 [1:00:09<48:34,  6.07s/it]Training 2/2 epoch (loss 0.2334):  55%|██████▌     | 587/1066 [1:00:09<47:39,  5.97s/it]Training 2/2 epoch (loss 0.1104):  55%|██████▌     | 587/1066 [1:00:15<47:39,  5.97s/it]Training 2/2 epoch (loss 0.1104):  55%|██████▌     | 588/1066 [1:00:15<48:57,  6.14s/it]Training 2/2 epoch (loss 0.1436):  55%|██████▌     | 588/1066 [1:00:22<48:57,  6.14s/it]Training 2/2 epoch (loss 0.1436):  55%|██████▋     | 589/1066 [1:00:22<48:36,  6.11s/it]Training 2/2 epoch (loss 0.1445):  55%|██████▋     | 589/1066 [1:00:28<48:36,  6.11s/it]Training 2/2 epoch (loss 0.1445):  55%|██████▋     | 590/1066 [1:00:28<49:08,  6.19s/it]Training 2/2 epoch (loss 0.1816):  55%|██████▋     | 590/1066 [1:00:34<49:08,  6.19s/it]Training 2/2 epoch (loss 0.1816):  55%|██████▋     | 591/1066 [1:00:34<49:41,  6.28s/it]Training 2/2 epoch (loss 0.2188):  55%|██████▋     | 591/1066 [1:00:40<49:41,  6.28s/it]Training 2/2 epoch (loss 0.2188):  56%|██████▋     | 592/1066 [1:00:40<48:38,  6.16s/it]Training 2/2 epoch (loss 0.1167):  56%|██████▋     | 592/1066 [1:00:46<48:38,  6.16s/it]Training 2/2 epoch (loss 0.1167):  56%|██████▋     | 593/1066 [1:00:46<47:37,  6.04s/it]Training 2/2 epoch (loss 0.1079):  56%|██████▋     | 593/1066 [1:00:52<47:37,  6.04s/it]Training 2/2 epoch (loss 0.1079):  56%|██████▋     | 594/1066 [1:00:52<48:10,  6.12s/it]Training 2/2 epoch (loss 0.1060):  56%|██████▋     | 594/1066 [1:00:58<48:10,  6.12s/it]Training 2/2 epoch (loss 0.1060):  56%|██████▋     | 595/1066 [1:00:58<47:27,  6.04s/it]Training 2/2 epoch (loss 0.1475):  56%|██████▋     | 595/1066 [1:01:04<47:27,  6.04s/it]Training 2/2 epoch (loss 0.1475):  56%|██████▋     | 596/1066 [1:01:04<47:47,  6.10s/it]Training 2/2 epoch (loss 0.1406):  56%|██████▋     | 596/1066 [1:01:10<47:47,  6.10s/it]Training 2/2 epoch (loss 0.1406):  56%|██████▋     | 597/1066 [1:01:10<45:45,  5.85s/it]Training 2/2 epoch (loss 0.0991):  56%|██████▋     | 597/1066 [1:01:16<45:45,  5.85s/it]Training 2/2 epoch (loss 0.0991):  56%|██████▋     | 598/1066 [1:01:16<46:56,  6.02s/it]Training 2/2 epoch (loss 0.0845):  56%|██████▋     | 598/1066 [1:01:22<46:56,  6.02s/it]Training 2/2 epoch (loss 0.0845):  56%|██████▋     | 599/1066 [1:01:22<47:34,  6.11s/it]Training 2/2 epoch (loss 0.1592):  56%|██████▋     | 599/1066 [1:01:29<47:34,  6.11s/it]Training 2/2 epoch (loss 0.1592):  56%|██████▊     | 600/1066 [1:01:29<48:35,  6.26s/it]Training 2/2 epoch (loss 0.1758):  56%|██████▊     | 600/1066 [1:01:35<48:35,  6.26s/it]Training 2/2 epoch (loss 0.1758):  56%|██████▊     | 601/1066 [1:01:35<47:47,  6.17s/it]Training 2/2 epoch (loss 0.1523):  56%|██████▊     | 601/1066 [1:01:41<47:47,  6.17s/it]Training 2/2 epoch (loss 0.1523):  56%|██████▊     | 602/1066 [1:01:41<47:58,  6.20s/it]Training 2/2 epoch (loss 0.3867):  56%|██████▊     | 602/1066 [1:01:48<47:58,  6.20s/it]Training 2/2 epoch (loss 0.3867):  57%|██████▊     | 603/1066 [1:01:48<48:35,  6.30s/it]Training 2/2 epoch (loss 0.3008):  57%|██████▊     | 603/1066 [1:01:53<48:35,  6.30s/it]Training 2/2 epoch (loss 0.3008):  57%|██████▊     | 604/1066 [1:01:53<45:54,  5.96s/it]Training 2/2 epoch (loss 0.3320):  57%|██████▊     | 604/1066 [1:01:59<45:54,  5.96s/it]Training 2/2 epoch (loss 0.3320):  57%|██████▊     | 605/1066 [1:01:59<46:41,  6.08s/it]Training 2/2 epoch (loss 0.2891):  57%|██████▊     | 605/1066 [1:02:06<46:41,  6.08s/it]Training 2/2 epoch (loss 0.2891):  57%|██████▊     | 606/1066 [1:02:06<48:01,  6.26s/it]Training 2/2 epoch (loss 0.3125):  57%|██████▊     | 606/1066 [1:02:12<48:01,  6.26s/it]Training 2/2 epoch (loss 0.3125):  57%|██████▊     | 607/1066 [1:02:12<47:19,  6.19s/it]Training 2/2 epoch (loss 0.3496):  57%|██████▊     | 607/1066 [1:02:18<47:19,  6.19s/it]Training 2/2 epoch (loss 0.3496):  57%|██████▊     | 608/1066 [1:02:18<47:28,  6.22s/it]Training 2/2 epoch (loss 0.1318):  57%|██████▊     | 608/1066 [1:02:25<47:28,  6.22s/it]Training 2/2 epoch (loss 0.1318):  57%|██████▊     | 609/1066 [1:02:25<47:28,  6.23s/it]Training 2/2 epoch (loss 0.1309):  57%|██████▊     | 609/1066 [1:02:30<47:28,  6.23s/it]Training 2/2 epoch (loss 0.1309):  57%|██████▊     | 610/1066 [1:02:30<45:45,  6.02s/it]Training 2/2 epoch (loss 0.1143):  57%|██████▊     | 610/1066 [1:02:36<45:45,  6.02s/it]Training 2/2 epoch (loss 0.1143):  57%|██████▉     | 611/1066 [1:02:36<46:17,  6.10s/it]Training 2/2 epoch (loss 0.1143):  57%|██████▉     | 611/1066 [1:02:43<46:17,  6.10s/it]Training 2/2 epoch (loss 0.1143):  57%|██████▉     | 612/1066 [1:02:43<47:30,  6.28s/it]Training 2/2 epoch (loss 0.1011):  57%|██████▉     | 612/1066 [1:02:49<47:30,  6.28s/it]Training 2/2 epoch (loss 0.1011):  58%|██████▉     | 613/1066 [1:02:49<46:53,  6.21s/it]Training 2/2 epoch (loss 0.0295):  58%|██████▉     | 613/1066 [1:02:55<46:53,  6.21s/it]Training 2/2 epoch (loss 0.0295):  58%|██████▉     | 614/1066 [1:02:55<47:03,  6.25s/it]Training 2/2 epoch (loss 0.0469):  58%|██████▉     | 614/1066 [1:03:02<47:03,  6.25s/it]Training 2/2 epoch (loss 0.0469):  58%|██████▉     | 615/1066 [1:03:02<47:19,  6.30s/it]Training 2/2 epoch (loss 0.0386):  58%|██████▉     | 615/1066 [1:03:08<47:19,  6.30s/it]Training 2/2 epoch (loss 0.0386):  58%|██████▉     | 616/1066 [1:03:08<46:44,  6.23s/it]Training 2/2 epoch (loss 0.0752):  58%|██████▉     | 616/1066 [1:03:14<46:44,  6.23s/it]Training 2/2 epoch (loss 0.0752):  58%|██████▉     | 617/1066 [1:03:14<46:59,  6.28s/it]Training 2/2 epoch (loss 0.0820):  58%|██████▉     | 617/1066 [1:03:21<46:59,  6.28s/it]Training 2/2 epoch (loss 0.0820):  58%|██████▉     | 618/1066 [1:03:21<47:14,  6.33s/it]Training 2/2 epoch (loss 0.0447):  58%|██████▉     | 618/1066 [1:03:27<47:14,  6.33s/it]Training 2/2 epoch (loss 0.0447):  58%|██████▉     | 619/1066 [1:03:27<47:03,  6.32s/it]Training 2/2 epoch (loss 0.1143):  58%|██████▉     | 619/1066 [1:03:33<47:03,  6.32s/it]Training 2/2 epoch (loss 0.1143):  58%|██████▉     | 620/1066 [1:03:33<45:59,  6.19s/it]Training 2/2 epoch (loss 0.0752):  58%|██████▉     | 620/1066 [1:03:39<45:59,  6.19s/it]Training 2/2 epoch (loss 0.0752):  58%|██████▉     | 621/1066 [1:03:39<45:54,  6.19s/it]Training 2/2 epoch (loss 0.0364):  58%|██████▉     | 621/1066 [1:03:45<45:54,  6.19s/it]Training 2/2 epoch (loss 0.0364):  58%|███████     | 622/1066 [1:03:45<45:45,  6.18s/it]Training 2/2 epoch (loss 0.0640):  58%|███████     | 622/1066 [1:03:51<45:45,  6.18s/it]Training 2/2 epoch (loss 0.0640):  58%|███████     | 623/1066 [1:03:51<45:03,  6.10s/it]Training 2/2 epoch (loss 0.0654):  58%|███████     | 623/1066 [1:03:57<45:03,  6.10s/it]Training 2/2 epoch (loss 0.0654):  59%|███████     | 624/1066 [1:03:57<43:59,  5.97s/it]Training 2/2 epoch (loss 0.0586):  59%|███████     | 624/1066 [1:04:03<43:59,  5.97s/it]Training 2/2 epoch (loss 0.0586):  59%|███████     | 625/1066 [1:04:03<44:30,  6.05s/it]Training 2/2 epoch (loss 0.0189):  59%|███████     | 625/1066 [1:04:09<44:30,  6.05s/it]Training 2/2 epoch (loss 0.0189):  59%|███████     | 626/1066 [1:04:09<44:44,  6.10s/it]Training 2/2 epoch (loss 0.0688):  59%|███████     | 626/1066 [1:04:16<44:44,  6.10s/it]Training 2/2 epoch (loss 0.0688):  59%|███████     | 627/1066 [1:04:16<45:48,  6.26s/it]Training 2/2 epoch (loss 0.0513):  59%|███████     | 627/1066 [1:04:22<45:48,  6.26s/it]Training 2/2 epoch (loss 0.0513):  59%|███████     | 628/1066 [1:04:22<45:21,  6.21s/it]Training 2/2 epoch (loss 0.0374):  59%|███████     | 628/1066 [1:04:29<45:21,  6.21s/it]Training 2/2 epoch (loss 0.0374):  59%|███████     | 629/1066 [1:04:29<45:47,  6.29s/it]Training 2/2 epoch (loss 0.0471):  59%|███████     | 629/1066 [1:04:35<45:47,  6.29s/it]Training 2/2 epoch (loss 0.0471):  59%|███████     | 630/1066 [1:04:35<46:31,  6.40s/it]Training 2/2 epoch (loss 0.1206):  59%|███████     | 630/1066 [1:04:42<46:31,  6.40s/it]Training 2/2 epoch (loss 0.1206):  59%|███████     | 631/1066 [1:04:42<46:08,  6.36s/it]Training 2/2 epoch (loss 0.1050):  59%|███████     | 631/1066 [1:04:48<46:08,  6.36s/it]Training 2/2 epoch (loss 0.1050):  59%|███████     | 632/1066 [1:04:48<45:30,  6.29s/it]Training 2/2 epoch (loss 0.1885):  59%|███████     | 632/1066 [1:04:53<45:30,  6.29s/it]Training 2/2 epoch (loss 0.1885):  59%|███████▏    | 633/1066 [1:04:53<43:53,  6.08s/it]Training 2/2 epoch (loss 0.1465):  59%|███████▏    | 633/1066 [1:05:00<43:53,  6.08s/it]Training 2/2 epoch (loss 0.1465):  59%|███████▏    | 634/1066 [1:05:00<44:39,  6.20s/it]Training 2/2 epoch (loss 0.1143):  59%|███████▏    | 634/1066 [1:05:06<44:39,  6.20s/it]Training 2/2 epoch (loss 0.1143):  60%|███████▏    | 635/1066 [1:05:06<44:53,  6.25s/it]Training 2/2 epoch (loss 0.0981):  60%|███████▏    | 635/1066 [1:05:13<44:53,  6.25s/it]Training 2/2 epoch (loss 0.0981):  60%|███████▏    | 636/1066 [1:05:13<45:17,  6.32s/it]Training 2/2 epoch (loss 0.0552):  60%|███████▏    | 636/1066 [1:05:19<45:17,  6.32s/it]Training 2/2 epoch (loss 0.0552):  60%|███████▏    | 637/1066 [1:05:19<44:54,  6.28s/it]Training 2/2 epoch (loss 0.1484):  60%|███████▏    | 637/1066 [1:05:25<44:54,  6.28s/it]Training 2/2 epoch (loss 0.1484):  60%|███████▏    | 638/1066 [1:05:25<45:09,  6.33s/it]Training 2/2 epoch (loss 0.0811):  60%|███████▏    | 638/1066 [1:05:32<45:09,  6.33s/it]Training 2/2 epoch (loss 0.0811):  60%|███████▏    | 639/1066 [1:05:32<45:22,  6.37s/it]Training 2/2 epoch (loss 0.1631):  60%|███████▏    | 639/1066 [1:05:38<45:22,  6.37s/it]Training 2/2 epoch (loss 0.1631):  60%|███████▏    | 640/1066 [1:05:38<44:47,  6.31s/it]Training 2/2 epoch (loss 0.0645):  60%|███████▏    | 640/1066 [1:05:44<44:47,  6.31s/it]Training 2/2 epoch (loss 0.0645):  60%|███████▏    | 641/1066 [1:05:44<44:43,  6.31s/it]Training 2/2 epoch (loss 0.0376):  60%|███████▏    | 641/1066 [1:05:51<44:43,  6.31s/it]Training 2/2 epoch (loss 0.0376):  60%|███████▏    | 642/1066 [1:05:51<45:04,  6.38s/it]Training 2/2 epoch (loss 0.0840):  60%|███████▏    | 642/1066 [1:05:57<45:04,  6.38s/it]Training 2/2 epoch (loss 0.0840):  60%|███████▏    | 643/1066 [1:05:57<44:55,  6.37s/it]Training 2/2 epoch (loss 0.0664):  60%|███████▏    | 643/1066 [1:06:03<44:55,  6.37s/it]Training 2/2 epoch (loss 0.0664):  60%|███████▏    | 644/1066 [1:06:03<45:00,  6.40s/it]Training 2/2 epoch (loss 0.0791):  60%|███████▏    | 644/1066 [1:06:10<45:00,  6.40s/it]Training 2/2 epoch (loss 0.0791):  61%|███████▎    | 645/1066 [1:06:10<45:12,  6.44s/it]Training 2/2 epoch (loss 0.0732):  61%|███████▎    | 645/1066 [1:06:16<45:12,  6.44s/it]Training 2/2 epoch (loss 0.0732):  61%|███████▎    | 646/1066 [1:06:16<43:21,  6.19s/it]Training 2/2 epoch (loss 0.0908):  61%|███████▎    | 646/1066 [1:06:22<43:21,  6.19s/it]Training 2/2 epoch (loss 0.0908):  61%|███████▎    | 647/1066 [1:06:22<43:01,  6.16s/it]Training 2/2 epoch (loss 0.1953):  61%|███████▎    | 647/1066 [1:06:27<43:01,  6.16s/it]Training 2/2 epoch (loss 0.1953):  61%|███████▎    | 648/1066 [1:06:27<41:03,  5.89s/it]Training 2/2 epoch (loss 0.0352):  61%|███████▎    | 648/1066 [1:06:33<41:03,  5.89s/it]Training 2/2 epoch (loss 0.0352):  61%|███████▎    | 649/1066 [1:06:33<41:41,  6.00s/it]Training 2/2 epoch (loss 0.0923):  61%|███████▎    | 649/1066 [1:06:40<41:41,  6.00s/it]Training 2/2 epoch (loss 0.0923):  61%|███████▎    | 650/1066 [1:06:40<42:15,  6.09s/it]Training 2/2 epoch (loss 0.0757):  61%|███████▎    | 650/1066 [1:06:46<42:15,  6.09s/it]Training 2/2 epoch (loss 0.0757):  61%|███████▎    | 651/1066 [1:06:46<43:10,  6.24s/it]Training 2/2 epoch (loss 0.1235):  61%|███████▎    | 651/1066 [1:06:52<43:10,  6.24s/it]Training 2/2 epoch (loss 0.1235):  61%|███████▎    | 652/1066 [1:06:52<41:13,  5.98s/it]Training 2/2 epoch (loss 0.1602):  61%|███████▎    | 652/1066 [1:06:58<41:13,  5.98s/it]Training 2/2 epoch (loss 0.1602):  61%|███████▎    | 653/1066 [1:06:58<41:19,  6.00s/it]Training 2/2 epoch (loss 0.0383):  61%|███████▎    | 653/1066 [1:07:04<41:19,  6.00s/it]Training 2/2 epoch (loss 0.0383):  61%|███████▎    | 654/1066 [1:07:04<42:02,  6.12s/it]Training 2/2 epoch (loss 0.0581):  61%|███████▎    | 654/1066 [1:07:10<42:02,  6.12s/it]Training 2/2 epoch (loss 0.0581):  61%|███████▎    | 655/1066 [1:07:10<42:21,  6.18s/it]Training 2/2 epoch (loss 0.0569):  61%|███████▎    | 655/1066 [1:07:15<42:21,  6.18s/it]Training 2/2 epoch (loss 0.0569):  62%|███████▍    | 656/1066 [1:07:15<39:56,  5.85s/it]Training 2/2 epoch (loss 0.1216):  62%|███████▍    | 656/1066 [1:07:21<39:56,  5.85s/it]Training 2/2 epoch (loss 0.1216):  62%|███████▍    | 657/1066 [1:07:21<39:47,  5.84s/it]Training 2/2 epoch (loss 0.1709):  62%|███████▍    | 657/1066 [1:07:28<39:47,  5.84s/it]Training 2/2 epoch (loss 0.1709):  62%|███████▍    | 658/1066 [1:07:28<40:49,  6.00s/it]Training 2/2 epoch (loss 0.1069):  62%|███████▍    | 658/1066 [1:07:33<40:49,  6.00s/it]Training 2/2 epoch (loss 0.1069):  62%|███████▍    | 659/1066 [1:07:33<40:23,  5.96s/it]Training 2/2 epoch (loss 0.2441):  62%|███████▍    | 659/1066 [1:07:40<40:23,  5.96s/it]Training 2/2 epoch (loss 0.2441):  62%|███████▍    | 660/1066 [1:07:40<40:55,  6.05s/it]Training 2/2 epoch (loss 0.0762):  62%|███████▍    | 660/1066 [1:07:46<40:55,  6.05s/it]Training 2/2 epoch (loss 0.0762):  62%|███████▍    | 661/1066 [1:07:46<41:18,  6.12s/it]Training 2/2 epoch (loss 0.1387):  62%|███████▍    | 661/1066 [1:07:52<41:18,  6.12s/it]Training 2/2 epoch (loss 0.1387):  62%|███████▍    | 662/1066 [1:07:52<40:03,  5.95s/it]Training 2/2 epoch (loss 0.0408):  62%|███████▍    | 662/1066 [1:07:58<40:03,  5.95s/it]Training 2/2 epoch (loss 0.0408):  62%|███████▍    | 663/1066 [1:07:58<41:14,  6.14s/it]Training 2/2 epoch (loss 0.0400):  62%|███████▍    | 663/1066 [1:08:04<41:14,  6.14s/it]Training 2/2 epoch (loss 0.0400):  62%|███████▍    | 664/1066 [1:08:04<41:23,  6.18s/it]Training 2/2 epoch (loss 0.0476):  62%|███████▍    | 664/1066 [1:08:11<41:23,  6.18s/it]Training 2/2 epoch (loss 0.0476):  62%|███████▍    | 665/1066 [1:08:11<41:32,  6.22s/it]Training 2/2 epoch (loss 0.0635):  62%|███████▍    | 665/1066 [1:08:17<41:32,  6.22s/it]Training 2/2 epoch (loss 0.0635):  62%|███████▍    | 666/1066 [1:08:17<41:41,  6.25s/it]Training 2/2 epoch (loss 0.1011):  62%|███████▍    | 666/1066 [1:08:22<41:41,  6.25s/it]Training 2/2 epoch (loss 0.1011):  63%|███████▌    | 667/1066 [1:08:22<39:54,  6.00s/it]Training 2/2 epoch (loss 0.0762):  63%|███████▌    | 667/1066 [1:08:27<39:54,  6.00s/it]Training 2/2 epoch (loss 0.0762):  63%|███████▌    | 668/1066 [1:08:27<37:51,  5.71s/it]Training 2/2 epoch (loss 0.1055):  63%|███████▌    | 668/1066 [1:08:34<37:51,  5.71s/it]Training 2/2 epoch (loss 0.1055):  63%|███████▌    | 669/1066 [1:08:34<39:40,  6.00s/it]Training 2/2 epoch (loss 0.0996):  63%|███████▌    | 669/1066 [1:08:40<39:40,  6.00s/it]Training 2/2 epoch (loss 0.0996):  63%|███████▌    | 670/1066 [1:08:40<39:41,  6.01s/it]Training 2/2 epoch (loss 0.0645):  63%|███████▌    | 670/1066 [1:08:47<39:41,  6.01s/it]Training 2/2 epoch (loss 0.0645):  63%|███████▌    | 671/1066 [1:08:47<40:36,  6.17s/it]Training 2/2 epoch (loss 0.0869):  63%|███████▌    | 671/1066 [1:08:52<40:36,  6.17s/it]Training 2/2 epoch (loss 0.0869):  63%|███████▌    | 672/1066 [1:08:52<38:46,  5.90s/it]Training 2/2 epoch (loss 0.1206):  63%|███████▌    | 672/1066 [1:08:58<38:46,  5.90s/it]Training 2/2 epoch (loss 0.1206):  63%|███████▌    | 673/1066 [1:08:58<39:24,  6.02s/it]Training 2/2 epoch (loss 0.0513):  63%|███████▌    | 673/1066 [1:09:05<39:24,  6.02s/it]Training 2/2 epoch (loss 0.0513):  63%|███████▌    | 674/1066 [1:09:05<39:53,  6.11s/it]Training 2/2 epoch (loss 0.0698):  63%|███████▌    | 674/1066 [1:09:11<39:53,  6.11s/it]Training 2/2 epoch (loss 0.0698):  63%|███████▌    | 675/1066 [1:09:11<40:06,  6.15s/it]Training 2/2 epoch (loss 0.0527):  63%|███████▌    | 675/1066 [1:09:17<40:06,  6.15s/it]Training 2/2 epoch (loss 0.0527):  63%|███████▌    | 676/1066 [1:09:17<40:24,  6.22s/it]Training 2/2 epoch (loss 0.0566):  63%|███████▌    | 676/1066 [1:09:23<40:24,  6.22s/it]Training 2/2 epoch (loss 0.0566):  64%|███████▌    | 677/1066 [1:09:23<40:16,  6.21s/it]Training 2/2 epoch (loss 0.0618):  64%|███████▌    | 677/1066 [1:09:30<40:16,  6.21s/it]Training 2/2 epoch (loss 0.0618):  64%|███████▋    | 678/1066 [1:09:30<40:59,  6.34s/it]Training 2/2 epoch (loss 0.0525):  64%|███████▋    | 678/1066 [1:09:36<40:59,  6.34s/it]Training 2/2 epoch (loss 0.0525):  64%|███████▋    | 679/1066 [1:09:36<40:42,  6.31s/it]Training 2/2 epoch (loss 0.0476):  64%|███████▋    | 679/1066 [1:09:42<40:42,  6.31s/it]Training 2/2 epoch (loss 0.0476):  64%|███████▋    | 680/1066 [1:09:42<38:28,  5.98s/it]Training 2/2 epoch (loss 0.1309):  64%|███████▋    | 680/1066 [1:09:47<38:28,  5.98s/it]Training 2/2 epoch (loss 0.1309):  64%|███████▋    | 681/1066 [1:09:47<37:39,  5.87s/it]Training 2/2 epoch (loss 0.0664):  64%|███████▋    | 681/1066 [1:09:52<37:39,  5.87s/it]Training 2/2 epoch (loss 0.0664):  64%|███████▋    | 682/1066 [1:09:52<36:04,  5.64s/it]Training 2/2 epoch (loss 0.0491):  64%|███████▋    | 682/1066 [1:09:59<36:04,  5.64s/it]Training 2/2 epoch (loss 0.0491):  64%|███████▋    | 683/1066 [1:09:59<37:30,  5.88s/it]Training 2/2 epoch (loss 0.0471):  64%|███████▋    | 683/1066 [1:10:05<37:30,  5.88s/it]Training 2/2 epoch (loss 0.0471):  64%|███████▋    | 684/1066 [1:10:05<38:03,  5.98s/it]Training 2/2 epoch (loss 0.0674):  64%|███████▋    | 684/1066 [1:10:10<38:03,  5.98s/it]Training 2/2 epoch (loss 0.0674):  64%|███████▋    | 685/1066 [1:10:10<36:27,  5.74s/it]Training 2/2 epoch (loss 0.1113):  64%|███████▋    | 685/1066 [1:10:16<36:27,  5.74s/it]Training 2/2 epoch (loss 0.1113):  64%|███████▋    | 686/1066 [1:10:16<37:05,  5.86s/it]Training 2/2 epoch (loss 0.1562):  64%|███████▋    | 686/1066 [1:10:22<37:05,  5.86s/it]Training 2/2 epoch (loss 0.1562):  64%|███████▋    | 687/1066 [1:10:22<37:45,  5.98s/it]Training 2/2 epoch (loss 0.1060):  64%|███████▋    | 687/1066 [1:10:29<37:45,  5.98s/it]Training 2/2 epoch (loss 0.1060):  65%|███████▋    | 688/1066 [1:10:29<38:30,  6.11s/it]Training 2/2 epoch (loss 0.0762):  65%|███████▋    | 688/1066 [1:10:35<38:30,  6.11s/it]Training 2/2 epoch (loss 0.0762):  65%|███████▊    | 689/1066 [1:10:35<39:14,  6.25s/it]Training 2/2 epoch (loss 0.1982):  65%|███████▊    | 689/1066 [1:10:42<39:14,  6.25s/it]Training 2/2 epoch (loss 0.1982):  65%|███████▊    | 690/1066 [1:10:42<39:31,  6.31s/it]Training 2/2 epoch (loss 0.0396):  65%|███████▊    | 690/1066 [1:10:48<39:31,  6.31s/it]Training 2/2 epoch (loss 0.0396):  65%|███████▊    | 691/1066 [1:10:48<38:44,  6.20s/it]Training 2/2 epoch (loss 0.2354):  65%|███████▊    | 691/1066 [1:10:54<38:44,  6.20s/it]Training 2/2 epoch (loss 0.2354):  65%|███████▊    | 692/1066 [1:10:54<38:47,  6.22s/it]Training 2/2 epoch (loss 0.1045):  65%|███████▊    | 692/1066 [1:11:00<38:47,  6.22s/it]Training 2/2 epoch (loss 0.1045):  65%|███████▊    | 693/1066 [1:11:00<37:19,  6.00s/it]Training 2/2 epoch (loss 0.0598):  65%|███████▊    | 693/1066 [1:11:06<37:19,  6.00s/it]Training 2/2 epoch (loss 0.0598):  65%|███████▊    | 694/1066 [1:11:06<37:40,  6.08s/it]Training 2/2 epoch (loss 0.1543):  65%|███████▊    | 694/1066 [1:11:12<37:40,  6.08s/it]Training 2/2 epoch (loss 0.1543):  65%|███████▊    | 695/1066 [1:11:12<37:21,  6.04s/it]Training 2/2 epoch (loss 0.2100):  65%|███████▊    | 695/1066 [1:11:18<37:21,  6.04s/it]Training 2/2 epoch (loss 0.2100):  65%|███████▊    | 696/1066 [1:11:18<37:23,  6.06s/it]Training 2/2 epoch (loss 0.2246):  65%|███████▊    | 696/1066 [1:11:23<37:23,  6.06s/it]Training 2/2 epoch (loss 0.2246):  65%|███████▊    | 697/1066 [1:11:23<35:32,  5.78s/it]Training 2/2 epoch (loss 0.1533):  65%|███████▊    | 697/1066 [1:11:28<35:32,  5.78s/it]Training 2/2 epoch (loss 0.1533):  65%|███████▊    | 698/1066 [1:11:28<34:05,  5.56s/it]Training 2/2 epoch (loss 0.0747):  65%|███████▊    | 698/1066 [1:11:34<34:05,  5.56s/it]Training 2/2 epoch (loss 0.0747):  66%|███████▊    | 699/1066 [1:11:34<35:12,  5.76s/it]Training 2/2 epoch (loss 0.0986):  66%|███████▊    | 699/1066 [1:11:40<35:12,  5.76s/it]Training 2/2 epoch (loss 0.0986):  66%|███████▉    | 700/1066 [1:11:40<35:44,  5.86s/it]Training 2/2 epoch (loss 0.0635):  66%|███████▉    | 700/1066 [1:11:47<35:44,  5.86s/it]Training 2/2 epoch (loss 0.0635):  66%|███████▉    | 701/1066 [1:11:47<36:22,  5.98s/it]Training 2/2 epoch (loss 0.1094):  66%|███████▉    | 701/1066 [1:11:53<36:22,  5.98s/it]Training 2/2 epoch (loss 0.1094):  66%|███████▉    | 702/1066 [1:11:53<36:57,  6.09s/it]Training 2/2 epoch (loss 0.0374):  66%|███████▉    | 702/1066 [1:11:59<36:57,  6.09s/it]Training 2/2 epoch (loss 0.0374):  66%|███████▉    | 703/1066 [1:11:59<37:18,  6.17s/it]Training 2/2 epoch (loss 0.2383):  66%|███████▉    | 703/1066 [1:12:06<37:18,  6.17s/it]Training 2/2 epoch (loss 0.2383):  66%|███████▉    | 704/1066 [1:12:06<37:24,  6.20s/it]Training 2/2 epoch (loss 0.0544):  66%|███████▉    | 704/1066 [1:12:12<37:24,  6.20s/it]Training 2/2 epoch (loss 0.0544):  66%|███████▉    | 705/1066 [1:12:12<38:12,  6.35s/it]Training 2/2 epoch (loss 0.0383):  66%|███████▉    | 705/1066 [1:12:18<38:12,  6.35s/it]Training 2/2 epoch (loss 0.0383):  66%|███████▉    | 706/1066 [1:12:18<37:25,  6.24s/it]Training 2/2 epoch (loss 0.0615):  66%|███████▉    | 706/1066 [1:12:23<37:25,  6.24s/it]Training 2/2 epoch (loss 0.0615):  66%|███████▉    | 707/1066 [1:12:23<35:12,  5.88s/it]Training 2/2 epoch (loss 0.0938):  66%|███████▉    | 707/1066 [1:12:30<35:12,  5.88s/it]Training 2/2 epoch (loss 0.0938):  66%|███████▉    | 708/1066 [1:12:30<36:21,  6.09s/it]Training 2/2 epoch (loss 0.1689):  66%|███████▉    | 708/1066 [1:12:36<36:21,  6.09s/it]Training 2/2 epoch (loss 0.1689):  67%|███████▉    | 709/1066 [1:12:36<36:31,  6.14s/it]Training 2/2 epoch (loss 0.1543):  67%|███████▉    | 709/1066 [1:12:42<36:31,  6.14s/it]Training 2/2 epoch (loss 0.1543):  67%|███████▉    | 710/1066 [1:12:42<36:38,  6.18s/it]Training 2/2 epoch (loss 0.0374):  67%|███████▉    | 710/1066 [1:12:49<36:38,  6.18s/it]Training 2/2 epoch (loss 0.0374):  67%|████████    | 711/1066 [1:12:49<37:06,  6.27s/it]Training 2/2 epoch (loss 0.1777):  67%|████████    | 711/1066 [1:12:55<37:06,  6.27s/it]Training 2/2 epoch (loss 0.1777):  67%|████████    | 712/1066 [1:12:55<36:52,  6.25s/it]Training 2/2 epoch (loss 0.1611):  67%|████████    | 712/1066 [1:13:02<36:52,  6.25s/it]Training 2/2 epoch (loss 0.1611):  67%|████████    | 713/1066 [1:13:02<37:02,  6.30s/it]Training 2/2 epoch (loss 0.3340):  67%|████████    | 713/1066 [1:13:08<37:02,  6.30s/it]Training 2/2 epoch (loss 0.3340):  67%|████████    | 714/1066 [1:13:08<36:22,  6.20s/it]Training 2/2 epoch (loss 0.0542):  67%|████████    | 714/1066 [1:13:14<36:22,  6.20s/it]Training 2/2 epoch (loss 0.0542):  67%|████████    | 715/1066 [1:13:14<36:24,  6.22s/it]Training 2/2 epoch (loss 0.1196):  67%|████████    | 715/1066 [1:13:20<36:24,  6.22s/it]Training 2/2 epoch (loss 0.1196):  67%|████████    | 716/1066 [1:13:20<36:33,  6.27s/it]Training 2/2 epoch (loss 0.1201):  67%|████████    | 716/1066 [1:13:26<36:33,  6.27s/it]Training 2/2 epoch (loss 0.1201):  67%|████████    | 717/1066 [1:13:26<35:36,  6.12s/it]Training 2/2 epoch (loss 0.1216):  67%|████████    | 717/1066 [1:13:32<35:36,  6.12s/it]Training 2/2 epoch (loss 0.1216):  67%|████████    | 718/1066 [1:13:32<35:22,  6.10s/it]Training 2/2 epoch (loss 0.0786):  67%|████████    | 718/1066 [1:13:38<35:22,  6.10s/it]Training 2/2 epoch (loss 0.0786):  67%|████████    | 719/1066 [1:13:38<35:34,  6.15s/it]Training 2/2 epoch (loss 0.0400):  67%|████████    | 719/1066 [1:13:45<35:34,  6.15s/it]Training 2/2 epoch (loss 0.0400):  68%|████████    | 720/1066 [1:13:45<36:20,  6.30s/it]Training 2/2 epoch (loss 0.1074):  68%|████████    | 720/1066 [1:13:51<36:20,  6.30s/it]Training 2/2 epoch (loss 0.1074):  68%|████████    | 721/1066 [1:13:51<36:29,  6.35s/it]Training 2/2 epoch (loss 0.0791):  68%|████████    | 721/1066 [1:13:57<36:29,  6.35s/it]Training 2/2 epoch (loss 0.0791):  68%|████████▏   | 722/1066 [1:13:57<34:19,  5.99s/it]Training 2/2 epoch (loss 0.0427):  68%|████████▏   | 722/1066 [1:14:03<34:19,  5.99s/it]Training 2/2 epoch (loss 0.0427):  68%|████████▏   | 723/1066 [1:14:03<34:49,  6.09s/it]Training 2/2 epoch (loss 0.0391):  68%|████████▏   | 723/1066 [1:14:09<34:49,  6.09s/it]Training 2/2 epoch (loss 0.0391):  68%|████████▏   | 724/1066 [1:14:09<35:12,  6.18s/it]Training 2/2 epoch (loss 0.0645):  68%|████████▏   | 724/1066 [1:14:16<35:12,  6.18s/it]Training 2/2 epoch (loss 0.0645):  68%|████████▏   | 725/1066 [1:14:16<35:31,  6.25s/it]Training 2/2 epoch (loss 0.0165):  68%|████████▏   | 725/1066 [1:14:22<35:31,  6.25s/it]Training 2/2 epoch (loss 0.0165):  68%|████████▏   | 726/1066 [1:14:22<35:52,  6.33s/it]Training 2/2 epoch (loss 0.0271):  68%|████████▏   | 726/1066 [1:14:29<35:52,  6.33s/it]Training 2/2 epoch (loss 0.0271):  68%|████████▏   | 727/1066 [1:14:29<35:47,  6.33s/it]Training 2/2 epoch (loss 0.0361):  68%|████████▏   | 727/1066 [1:14:34<35:47,  6.33s/it]Training 2/2 epoch (loss 0.0361):  68%|████████▏   | 728/1066 [1:14:34<33:53,  6.02s/it]Training 2/2 epoch (loss 0.0500):  68%|████████▏   | 728/1066 [1:14:40<33:53,  6.02s/it]Training 2/2 epoch (loss 0.0500):  68%|████████▏   | 729/1066 [1:14:40<34:53,  6.21s/it]Training 2/2 epoch (loss 0.0469):  68%|████████▏   | 729/1066 [1:14:46<34:53,  6.21s/it]Training 2/2 epoch (loss 0.0469):  68%|████████▏   | 730/1066 [1:14:46<34:05,  6.09s/it]Training 2/2 epoch (loss 0.0684):  68%|████████▏   | 730/1066 [1:14:53<34:05,  6.09s/it]Training 2/2 epoch (loss 0.0684):  69%|████████▏   | 731/1066 [1:14:53<34:19,  6.15s/it]Training 2/2 epoch (loss 0.0344):  69%|████████▏   | 731/1066 [1:14:59<34:19,  6.15s/it]Training 2/2 epoch (loss 0.0344):  69%|████████▏   | 732/1066 [1:14:59<34:36,  6.22s/it]Training 2/2 epoch (loss 0.0271):  69%|████████▏   | 732/1066 [1:15:05<34:36,  6.22s/it]Training 2/2 epoch (loss 0.0271):  69%|████████▎   | 733/1066 [1:15:05<34:37,  6.24s/it]Training 2/2 epoch (loss 0.0566):  69%|████████▎   | 733/1066 [1:15:11<34:37,  6.24s/it]Training 2/2 epoch (loss 0.0566):  69%|████████▎   | 734/1066 [1:15:11<33:08,  5.99s/it]Training 2/2 epoch (loss 0.0432):  69%|████████▎   | 734/1066 [1:15:17<33:08,  5.99s/it]Training 2/2 epoch (loss 0.0432):  69%|████████▎   | 735/1066 [1:15:17<33:52,  6.14s/it]Training 2/2 epoch (loss 0.0275):  69%|████████▎   | 735/1066 [1:15:23<33:52,  6.14s/it]Training 2/2 epoch (loss 0.0275):  69%|████████▎   | 736/1066 [1:15:23<33:59,  6.18s/it]Training 2/2 epoch (loss 0.0693):  69%|████████▎   | 736/1066 [1:15:30<33:59,  6.18s/it]Training 2/2 epoch (loss 0.0693):  69%|████████▎   | 737/1066 [1:15:30<34:01,  6.21s/it]Training 2/2 epoch (loss 0.0776):  69%|████████▎   | 737/1066 [1:15:36<34:01,  6.21s/it]Training 2/2 epoch (loss 0.0776):  69%|████████▎   | 738/1066 [1:15:36<34:00,  6.22s/it]Training 2/2 epoch (loss 0.0113):  69%|████████▎   | 738/1066 [1:15:42<34:00,  6.22s/it]Training 2/2 epoch (loss 0.0113):  69%|████████▎   | 739/1066 [1:15:42<33:55,  6.23s/it]Training 2/2 epoch (loss 0.0396):  69%|████████▎   | 739/1066 [1:15:48<33:55,  6.23s/it]Training 2/2 epoch (loss 0.0396):  69%|████████▎   | 740/1066 [1:15:48<33:56,  6.25s/it]Training 2/2 epoch (loss 0.0422):  69%|████████▎   | 740/1066 [1:15:55<33:56,  6.25s/it]Training 2/2 epoch (loss 0.0422):  70%|████████▎   | 741/1066 [1:15:55<33:51,  6.25s/it]Training 2/2 epoch (loss 0.0166):  70%|████████▎   | 741/1066 [1:16:01<33:51,  6.25s/it]Training 2/2 epoch (loss 0.0166):  70%|████████▎   | 742/1066 [1:16:01<33:37,  6.23s/it]Training 2/2 epoch (loss 0.0713):  70%|████████▎   | 742/1066 [1:16:06<33:37,  6.23s/it]Training 2/2 epoch (loss 0.0713):  70%|████████▎   | 743/1066 [1:16:06<31:40,  5.89s/it]Training 2/2 epoch (loss 0.0420):  70%|████████▎   | 743/1066 [1:16:12<31:40,  5.89s/it]Training 2/2 epoch (loss 0.0420):  70%|████████▍   | 744/1066 [1:16:12<32:33,  6.07s/it]Training 2/2 epoch (loss 0.0388):  70%|████████▍   | 744/1066 [1:16:19<32:33,  6.07s/it]Training 2/2 epoch (loss 0.0388):  70%|████████▍   | 745/1066 [1:16:19<32:31,  6.08s/it]Training 2/2 epoch (loss 0.0305):  70%|████████▍   | 745/1066 [1:16:25<32:31,  6.08s/it]Training 2/2 epoch (loss 0.0305):  70%|████████▍   | 746/1066 [1:16:25<33:05,  6.21s/it]Training 2/2 epoch (loss 0.0444):  70%|████████▍   | 746/1066 [1:16:32<33:05,  6.21s/it]Training 2/2 epoch (loss 0.0444):  70%|████████▍   | 747/1066 [1:16:32<33:25,  6.29s/it]Training 2/2 epoch (loss 0.0654):  70%|████████▍   | 747/1066 [1:16:38<33:25,  6.29s/it]Training 2/2 epoch (loss 0.0654):  70%|████████▍   | 748/1066 [1:16:38<33:13,  6.27s/it]Training 2/2 epoch (loss 0.0503):  70%|████████▍   | 748/1066 [1:16:43<33:13,  6.27s/it]Training 2/2 epoch (loss 0.0503):  70%|████████▍   | 749/1066 [1:16:43<32:02,  6.06s/it]Training 2/2 epoch (loss 0.0669):  70%|████████▍   | 749/1066 [1:16:49<32:02,  6.06s/it]Training 2/2 epoch (loss 0.0669):  70%|████████▍   | 750/1066 [1:16:49<30:39,  5.82s/it]Training 2/2 epoch (loss 0.1094):  70%|████████▍   | 750/1066 [1:16:55<30:39,  5.82s/it]Training 2/2 epoch (loss 0.1094):  70%|████████▍   | 751/1066 [1:16:55<31:14,  5.95s/it]Training 2/2 epoch (loss 0.0505):  70%|████████▍   | 751/1066 [1:17:01<31:14,  5.95s/it]Training 2/2 epoch (loss 0.0505):  71%|████████▍   | 752/1066 [1:17:01<31:12,  5.96s/it]Training 2/2 epoch (loss 0.0591):  71%|████████▍   | 752/1066 [1:17:06<31:12,  5.96s/it]Training 2/2 epoch (loss 0.0591):  71%|████████▍   | 753/1066 [1:17:06<30:22,  5.82s/it]Training 2/2 epoch (loss 0.0435):  71%|████████▍   | 753/1066 [1:17:12<30:22,  5.82s/it]Training 2/2 epoch (loss 0.0435):  71%|████████▍   | 754/1066 [1:17:12<30:06,  5.79s/it]Training 2/2 epoch (loss 0.0371):  71%|████████▍   | 754/1066 [1:17:18<30:06,  5.79s/it]Training 2/2 epoch (loss 0.0371):  71%|████████▍   | 755/1066 [1:17:18<30:40,  5.92s/it]Training 2/2 epoch (loss 0.0361):  71%|████████▍   | 755/1066 [1:17:25<30:40,  5.92s/it]Training 2/2 epoch (loss 0.0361):  71%|████████▌   | 756/1066 [1:17:25<31:05,  6.02s/it]Training 2/2 epoch (loss 0.0266):  71%|████████▌   | 756/1066 [1:17:31<31:05,  6.02s/it]Training 2/2 epoch (loss 0.0266):  71%|████████▌   | 757/1066 [1:17:31<31:33,  6.13s/it]Training 2/2 epoch (loss 0.0640):  71%|████████▌   | 757/1066 [1:17:37<31:33,  6.13s/it]Training 2/2 epoch (loss 0.0640):  71%|████████▌   | 758/1066 [1:17:37<31:36,  6.16s/it]Training 2/2 epoch (loss 0.0425):  71%|████████▌   | 758/1066 [1:17:44<31:36,  6.16s/it]Training 2/2 epoch (loss 0.0425):  71%|████████▌   | 759/1066 [1:17:44<32:12,  6.30s/it]Training 2/2 epoch (loss 0.0378):  71%|████████▌   | 759/1066 [1:17:50<32:12,  6.30s/it]Training 2/2 epoch (loss 0.0378):  71%|████████▌   | 760/1066 [1:17:50<31:20,  6.14s/it]Training 2/2 epoch (loss 0.0295):  71%|████████▌   | 760/1066 [1:17:56<31:20,  6.14s/it]Training 2/2 epoch (loss 0.0295):  71%|████████▌   | 761/1066 [1:17:56<31:06,  6.12s/it]Training 2/2 epoch (loss 0.0713):  71%|████████▌   | 761/1066 [1:18:02<31:06,  6.12s/it]Training 2/2 epoch (loss 0.0713):  71%|████████▌   | 762/1066 [1:18:02<31:26,  6.21s/it]Training 2/2 epoch (loss 0.0513):  71%|████████▌   | 762/1066 [1:18:08<31:26,  6.21s/it]Training 2/2 epoch (loss 0.0513):  72%|████████▌   | 763/1066 [1:18:08<31:35,  6.26s/it]Training 2/2 epoch (loss 0.0566):  72%|████████▌   | 763/1066 [1:18:15<31:35,  6.26s/it]Training 2/2 epoch (loss 0.0566):  72%|████████▌   | 764/1066 [1:18:15<31:27,  6.25s/it]Training 2/2 epoch (loss 0.2969):  72%|████████▌   | 764/1066 [1:18:21<31:27,  6.25s/it]Training 2/2 epoch (loss 0.2969):  72%|████████▌   | 765/1066 [1:18:21<31:52,  6.35s/it]Training 2/2 epoch (loss 0.0630):  72%|████████▌   | 765/1066 [1:18:28<31:52,  6.35s/it]Training 2/2 epoch (loss 0.0630):  72%|████████▌   | 766/1066 [1:18:28<31:52,  6.37s/it]Training 2/2 epoch (loss 0.1060):  72%|████████▌   | 766/1066 [1:18:34<31:52,  6.37s/it]Training 2/2 epoch (loss 0.1060):  72%|████████▋   | 767/1066 [1:18:34<31:32,  6.33s/it]Training 2/2 epoch (loss 0.0923):  72%|████████▋   | 767/1066 [1:18:40<31:32,  6.33s/it]Training 2/2 epoch (loss 0.0923):  72%|████████▋   | 768/1066 [1:18:40<31:30,  6.34s/it]Training 2/2 epoch (loss 0.1631):  72%|████████▋   | 768/1066 [1:18:45<31:30,  6.34s/it]Training 2/2 epoch (loss 0.1631):  72%|████████▋   | 769/1066 [1:18:45<29:43,  6.01s/it]Training 2/2 epoch (loss 0.1904):  72%|████████▋   | 769/1066 [1:18:51<29:43,  6.01s/it]Training 2/2 epoch (loss 0.1904):  72%|████████▋   | 770/1066 [1:18:51<28:48,  5.84s/it]Training 2/2 epoch (loss 0.0427):  72%|████████▋   | 770/1066 [1:18:57<28:48,  5.84s/it]Training 2/2 epoch (loss 0.0427):  72%|████████▋   | 771/1066 [1:18:57<29:08,  5.93s/it]Training 2/2 epoch (loss 0.0289):  72%|████████▋   | 771/1066 [1:19:03<29:08,  5.93s/it]Training 2/2 epoch (loss 0.0289):  72%|████████▋   | 772/1066 [1:19:03<29:32,  6.03s/it]Training 2/2 epoch (loss 0.0408):  72%|████████▋   | 772/1066 [1:19:09<29:32,  6.03s/it]Training 2/2 epoch (loss 0.0408):  73%|████████▋   | 773/1066 [1:19:09<29:29,  6.04s/it]Training 2/2 epoch (loss 0.0654):  73%|████████▋   | 773/1066 [1:19:15<29:29,  6.04s/it]Training 2/2 epoch (loss 0.0654):  73%|████████▋   | 774/1066 [1:19:15<29:18,  6.02s/it]Training 2/2 epoch (loss 0.0215):  73%|████████▋   | 774/1066 [1:19:22<29:18,  6.02s/it]Training 2/2 epoch (loss 0.0215):  73%|████████▋   | 775/1066 [1:19:22<29:39,  6.11s/it]Training 2/2 epoch (loss 0.0184):  73%|████████▋   | 775/1066 [1:19:28<29:39,  6.11s/it]Training 2/2 epoch (loss 0.0184):  73%|████████▋   | 776/1066 [1:19:28<29:50,  6.18s/it]Training 2/2 epoch (loss 0.0217):  73%|████████▋   | 776/1066 [1:19:34<29:50,  6.18s/it]Training 2/2 epoch (loss 0.0217):  73%|████████▋   | 777/1066 [1:19:34<29:55,  6.21s/it]Training 2/2 epoch (loss 0.0258):  73%|████████▋   | 777/1066 [1:19:41<29:55,  6.21s/it]Training 2/2 epoch (loss 0.0258):  73%|████████▊   | 778/1066 [1:19:41<29:52,  6.22s/it]Training 2/2 epoch (loss 0.0586):  73%|████████▊   | 778/1066 [1:19:47<29:52,  6.22s/it]Training 2/2 epoch (loss 0.0586):  73%|████████▊   | 779/1066 [1:19:47<29:53,  6.25s/it]Training 2/2 epoch (loss 0.0640):  73%|████████▊   | 779/1066 [1:19:53<29:53,  6.25s/it]Training 2/2 epoch (loss 0.0640):  73%|████████▊   | 780/1066 [1:19:53<29:50,  6.26s/it]Training 2/2 epoch (loss 0.0129):  73%|████████▊   | 780/1066 [1:19:59<29:50,  6.26s/it]Training 2/2 epoch (loss 0.0129):  73%|████████▊   | 781/1066 [1:19:59<29:18,  6.17s/it]Training 2/2 epoch (loss 0.0515):  73%|████████▊   | 781/1066 [1:20:06<29:18,  6.17s/it]Training 2/2 epoch (loss 0.0515):  73%|████████▊   | 782/1066 [1:20:06<29:44,  6.28s/it]Training 2/2 epoch (loss 0.0217):  73%|████████▊   | 782/1066 [1:20:12<29:44,  6.28s/it]Training 2/2 epoch (loss 0.0217):  73%|████████▊   | 783/1066 [1:20:12<30:07,  6.39s/it]Training 2/2 epoch (loss 0.0889):  73%|████████▊   | 783/1066 [1:20:18<30:07,  6.39s/it]Training 2/2 epoch (loss 0.0889):  74%|████████▊   | 784/1066 [1:20:18<29:38,  6.31s/it]Training 2/2 epoch (loss 0.0194):  74%|████████▊   | 784/1066 [1:20:24<29:38,  6.31s/it]Training 2/2 epoch (loss 0.0194):  74%|████████▊   | 785/1066 [1:20:24<27:53,  5.95s/it]Training 2/2 epoch (loss 0.0134):  74%|████████▊   | 785/1066 [1:20:28<27:53,  5.95s/it]Training 2/2 epoch (loss 0.0134):  74%|████████▊   | 786/1066 [1:20:28<26:23,  5.65s/it]Training 2/2 epoch (loss 0.0121):  74%|████████▊   | 786/1066 [1:20:35<26:23,  5.65s/it]Training 2/2 epoch (loss 0.0121):  74%|████████▊   | 787/1066 [1:20:35<26:48,  5.77s/it]Training 2/2 epoch (loss 0.0562):  74%|████████▊   | 787/1066 [1:20:41<26:48,  5.77s/it]Training 2/2 epoch (loss 0.0562):  74%|████████▊   | 788/1066 [1:20:41<27:27,  5.93s/it]Training 2/2 epoch (loss 0.0491):  74%|████████▊   | 788/1066 [1:20:47<27:27,  5.93s/it]Training 2/2 epoch (loss 0.0491):  74%|████████▉   | 789/1066 [1:20:47<27:50,  6.03s/it]Training 2/2 epoch (loss 0.0547):  74%|████████▉   | 789/1066 [1:20:53<27:50,  6.03s/it]Training 2/2 epoch (loss 0.0547):  74%|████████▉   | 790/1066 [1:20:53<27:56,  6.07s/it]Training 2/2 epoch (loss 0.0640):  74%|████████▉   | 790/1066 [1:21:00<27:56,  6.07s/it]Training 2/2 epoch (loss 0.0640):  74%|████████▉   | 791/1066 [1:21:00<28:16,  6.17s/it]Training 2/2 epoch (loss 0.0108):  74%|████████▉   | 791/1066 [1:21:06<28:16,  6.17s/it]Training 2/2 epoch (loss 0.0108):  74%|████████▉   | 792/1066 [1:21:06<28:35,  6.26s/it]Training 2/2 epoch (loss 0.0559):  74%|████████▉   | 792/1066 [1:21:12<28:35,  6.26s/it]Training 2/2 epoch (loss 0.0559):  74%|████████▉   | 793/1066 [1:21:12<28:26,  6.25s/it]Training 2/2 epoch (loss 0.0493):  74%|████████▉   | 793/1066 [1:21:18<28:26,  6.25s/it]Training 2/2 epoch (loss 0.0493):  74%|████████▉   | 794/1066 [1:21:18<26:58,  5.95s/it]Training 2/2 epoch (loss 0.0145):  74%|████████▉   | 794/1066 [1:21:24<26:58,  5.95s/it]Training 2/2 epoch (loss 0.0145):  75%|████████▉   | 795/1066 [1:21:24<27:40,  6.13s/it]Training 2/2 epoch (loss 0.1123):  75%|████████▉   | 795/1066 [1:21:31<27:40,  6.13s/it]Training 2/2 epoch (loss 0.1123):  75%|████████▉   | 796/1066 [1:21:31<28:03,  6.23s/it]Training 2/2 epoch (loss 0.0153):  75%|████████▉   | 796/1066 [1:21:37<28:03,  6.23s/it]Training 2/2 epoch (loss 0.0153):  75%|████████▉   | 797/1066 [1:21:37<28:12,  6.29s/it]Training 2/2 epoch (loss 0.0615):  75%|████████▉   | 797/1066 [1:21:43<28:12,  6.29s/it]Training 2/2 epoch (loss 0.0615):  75%|████████▉   | 798/1066 [1:21:43<27:01,  6.05s/it]Training 2/2 epoch (loss 0.0972):  75%|████████▉   | 798/1066 [1:21:49<27:01,  6.05s/it]Training 2/2 epoch (loss 0.0972):  75%|████████▉   | 799/1066 [1:21:49<27:01,  6.07s/it]Training 2/2 epoch (loss 0.1875):  75%|████████▉   | 799/1066 [1:21:55<27:01,  6.07s/it]Training 2/2 epoch (loss 0.1875):  75%|█████████   | 800/1066 [1:21:55<27:03,  6.10s/it]Training 2/2 epoch (loss 0.0752):  75%|█████████   | 800/1066 [1:22:00<27:03,  6.10s/it]Training 2/2 epoch (loss 0.0752):  75%|█████████   | 801/1066 [1:22:00<25:56,  5.87s/it]Training 2/2 epoch (loss 0.1240):  75%|█████████   | 801/1066 [1:22:06<25:56,  5.87s/it]Training 2/2 epoch (loss 0.1240):  75%|█████████   | 802/1066 [1:22:06<26:10,  5.95s/it]Training 2/2 epoch (loss 0.0898):  75%|█████████   | 802/1066 [1:22:13<26:10,  5.95s/it]Training 2/2 epoch (loss 0.0898):  75%|█████████   | 803/1066 [1:22:13<26:38,  6.08s/it]Training 2/2 epoch (loss 0.2578):  75%|█████████   | 803/1066 [1:22:19<26:38,  6.08s/it]Training 2/2 epoch (loss 0.2578):  75%|█████████   | 804/1066 [1:22:19<27:05,  6.20s/it]Training 2/2 epoch (loss 0.0908):  75%|█████████   | 804/1066 [1:22:25<27:05,  6.20s/it]Training 2/2 epoch (loss 0.0908):  76%|█████████   | 805/1066 [1:22:25<27:05,  6.23s/it]Training 2/2 epoch (loss 0.0459):  76%|█████████   | 805/1066 [1:22:32<27:05,  6.23s/it]Training 2/2 epoch (loss 0.0459):  76%|█████████   | 806/1066 [1:22:32<27:03,  6.24s/it]Training 2/2 epoch (loss 0.1562):  76%|█████████   | 806/1066 [1:22:38<27:03,  6.24s/it]Training 2/2 epoch (loss 0.1562):  76%|█████████   | 807/1066 [1:22:38<27:28,  6.36s/it]Training 2/2 epoch (loss 0.0491):  76%|█████████   | 807/1066 [1:22:45<27:28,  6.36s/it]Training 2/2 epoch (loss 0.0491):  76%|█████████   | 808/1066 [1:22:45<27:17,  6.35s/it]Training 2/2 epoch (loss 0.0068):  76%|█████████   | 808/1066 [1:22:51<27:17,  6.35s/it]Training 2/2 epoch (loss 0.0068):  76%|█████████   | 809/1066 [1:22:51<26:50,  6.27s/it]Training 2/2 epoch (loss 0.0320):  76%|█████████   | 809/1066 [1:22:57<26:50,  6.27s/it]Training 2/2 epoch (loss 0.0320):  76%|█████████   | 810/1066 [1:22:57<27:04,  6.35s/it]Training 2/2 epoch (loss 0.0295):  76%|█████████   | 810/1066 [1:23:03<27:04,  6.35s/it]Training 2/2 epoch (loss 0.0295):  76%|█████████▏  | 811/1066 [1:23:03<26:46,  6.30s/it]Training 2/2 epoch (loss 0.0200):  76%|█████████▏  | 811/1066 [1:23:10<26:46,  6.30s/it]Training 2/2 epoch (loss 0.0200):  76%|█████████▏  | 812/1066 [1:23:10<26:43,  6.31s/it]Training 2/2 epoch (loss 0.0427):  76%|█████████▏  | 812/1066 [1:23:16<26:43,  6.31s/it]Training 2/2 epoch (loss 0.0427):  76%|█████████▏  | 813/1066 [1:23:16<26:41,  6.33s/it]Training 2/2 epoch (loss 0.0996):  76%|█████████▏  | 813/1066 [1:23:22<26:41,  6.33s/it]Training 2/2 epoch (loss 0.0996):  76%|█████████▏  | 814/1066 [1:23:22<26:23,  6.28s/it]Training 2/2 epoch (loss 0.0684):  76%|█████████▏  | 814/1066 [1:23:28<26:23,  6.28s/it]Training 2/2 epoch (loss 0.0684):  76%|█████████▏  | 815/1066 [1:23:28<25:14,  6.04s/it]Training 2/2 epoch (loss 0.0120):  76%|█████████▏  | 815/1066 [1:23:34<25:14,  6.04s/it]Training 2/2 epoch (loss 0.0120):  77%|█████████▏  | 816/1066 [1:23:34<25:44,  6.18s/it]Training 2/2 epoch (loss 0.0051):  77%|█████████▏  | 816/1066 [1:23:41<25:44,  6.18s/it]Training 2/2 epoch (loss 0.0051):  77%|█████████▏  | 817/1066 [1:23:41<25:54,  6.24s/it]Training 2/2 epoch (loss 0.0869):  77%|█████████▏  | 817/1066 [1:23:47<25:54,  6.24s/it]Training 2/2 epoch (loss 0.0869):  77%|█████████▏  | 818/1066 [1:23:47<25:24,  6.15s/it]Training 2/2 epoch (loss 0.0559):  77%|█████████▏  | 818/1066 [1:23:53<25:24,  6.15s/it]Training 2/2 epoch (loss 0.0559):  77%|█████████▏  | 819/1066 [1:23:53<25:47,  6.26s/it]Training 2/2 epoch (loss 0.0393):  77%|█████████▏  | 819/1066 [1:23:59<25:47,  6.26s/it]Training 2/2 epoch (loss 0.0393):  77%|█████████▏  | 820/1066 [1:23:59<25:36,  6.24s/it]Training 2/2 epoch (loss 0.0121):  77%|█████████▏  | 820/1066 [1:24:06<25:36,  6.24s/it]Training 2/2 epoch (loss 0.0121):  77%|█████████▏  | 821/1066 [1:24:06<25:47,  6.32s/it]Training 2/2 epoch (loss 0.0830):  77%|█████████▏  | 821/1066 [1:24:12<25:47,  6.32s/it]Training 2/2 epoch (loss 0.0830):  77%|█████████▎  | 822/1066 [1:24:12<25:56,  6.38s/it]Training 2/2 epoch (loss 0.1084):  77%|█████████▎  | 822/1066 [1:24:18<25:56,  6.38s/it]Training 2/2 epoch (loss 0.1084):  77%|█████████▎  | 823/1066 [1:24:18<25:23,  6.27s/it]Training 2/2 epoch (loss 0.0405):  77%|█████████▎  | 823/1066 [1:24:25<25:23,  6.27s/it]Training 2/2 epoch (loss 0.0405):  77%|█████████▎  | 824/1066 [1:24:25<25:08,  6.23s/it]Training 2/2 epoch (loss 0.0332):  77%|█████████▎  | 824/1066 [1:24:31<25:08,  6.23s/it]Training 2/2 epoch (loss 0.0332):  77%|█████████▎  | 825/1066 [1:24:31<25:05,  6.25s/it]Training 2/2 epoch (loss 0.0522):  77%|█████████▎  | 825/1066 [1:24:37<25:05,  6.25s/it]Training 2/2 epoch (loss 0.0522):  77%|█████████▎  | 826/1066 [1:24:37<24:52,  6.22s/it]Training 2/2 epoch (loss 0.0041):  77%|█████████▎  | 826/1066 [1:24:44<24:52,  6.22s/it]Training 2/2 epoch (loss 0.0041):  78%|█████████▎  | 827/1066 [1:24:44<25:07,  6.31s/it]Training 2/2 epoch (loss 0.0537):  78%|█████████▎  | 827/1066 [1:24:50<25:07,  6.31s/it]Training 2/2 epoch (loss 0.0537):  78%|█████████▎  | 828/1066 [1:24:50<25:32,  6.44s/it]Training 2/2 epoch (loss 0.0562):  78%|█████████▎  | 828/1066 [1:24:56<25:32,  6.44s/it]Training 2/2 epoch (loss 0.0562):  78%|█████████▎  | 829/1066 [1:24:56<24:00,  6.08s/it]Training 2/2 epoch (loss 0.0291):  78%|█████████▎  | 829/1066 [1:25:01<24:00,  6.08s/it]Training 2/2 epoch (loss 0.0291):  78%|█████████▎  | 830/1066 [1:25:01<22:55,  5.83s/it]Training 2/2 epoch (loss 0.0325):  78%|█████████▎  | 830/1066 [1:25:07<22:55,  5.83s/it]Training 2/2 epoch (loss 0.0325):  78%|█████████▎  | 831/1066 [1:25:07<23:38,  6.03s/it]Training 2/2 epoch (loss 0.0576):  78%|█████████▎  | 831/1066 [1:25:13<23:38,  6.03s/it]Training 2/2 epoch (loss 0.0576):  78%|█████████▎  | 832/1066 [1:25:13<23:36,  6.05s/it]Training 2/2 epoch (loss 0.0275):  78%|█████████▎  | 832/1066 [1:25:20<23:36,  6.05s/it]Training 2/2 epoch (loss 0.0275):  78%|█████████▍  | 833/1066 [1:25:20<23:46,  6.12s/it]Training 2/2 epoch (loss 0.0747):  78%|█████████▍  | 833/1066 [1:25:26<23:46,  6.12s/it]Training 2/2 epoch (loss 0.0747):  78%|█████████▍  | 834/1066 [1:25:26<24:11,  6.25s/it]Training 2/2 epoch (loss 0.0165):  78%|█████████▍  | 834/1066 [1:25:32<24:11,  6.25s/it]Training 2/2 epoch (loss 0.0165):  78%|█████████▍  | 835/1066 [1:25:32<24:04,  6.25s/it]Training 2/2 epoch (loss 0.0540):  78%|█████████▍  | 835/1066 [1:25:39<24:04,  6.25s/it]Training 2/2 epoch (loss 0.0540):  78%|█████████▍  | 836/1066 [1:25:39<23:58,  6.25s/it]Training 2/2 epoch (loss 0.0112):  78%|█████████▍  | 836/1066 [1:25:45<23:58,  6.25s/it]Training 2/2 epoch (loss 0.0112):  79%|█████████▍  | 837/1066 [1:25:45<24:15,  6.36s/it]Training 2/2 epoch (loss 0.0388):  79%|█████████▍  | 837/1066 [1:25:52<24:15,  6.36s/it]Training 2/2 epoch (loss 0.0388):  79%|█████████▍  | 838/1066 [1:25:52<24:13,  6.37s/it]Training 2/2 epoch (loss 0.0505):  79%|█████████▍  | 838/1066 [1:25:58<24:13,  6.37s/it]Training 2/2 epoch (loss 0.0505):  79%|█████████▍  | 839/1066 [1:25:58<23:56,  6.33s/it]Training 2/2 epoch (loss 0.0277):  79%|█████████▍  | 839/1066 [1:26:04<23:56,  6.33s/it]Training 2/2 epoch (loss 0.0277):  79%|█████████▍  | 840/1066 [1:26:04<24:04,  6.39s/it]Training 2/2 epoch (loss 0.1152):  79%|█████████▍  | 840/1066 [1:26:11<24:04,  6.39s/it]Training 2/2 epoch (loss 0.1152):  79%|█████████▍  | 841/1066 [1:26:11<24:03,  6.41s/it]Training 2/2 epoch (loss 0.0256):  79%|█████████▍  | 841/1066 [1:26:17<24:03,  6.41s/it]Training 2/2 epoch (loss 0.0256):  79%|█████████▍  | 842/1066 [1:26:17<23:04,  6.18s/it]Training 2/2 epoch (loss 0.0079):  79%|█████████▍  | 842/1066 [1:26:23<23:04,  6.18s/it]Training 2/2 epoch (loss 0.0079):  79%|█████████▍  | 843/1066 [1:26:23<23:31,  6.33s/it]Training 2/2 epoch (loss 0.0055):  79%|█████████▍  | 843/1066 [1:26:30<23:31,  6.33s/it]Training 2/2 epoch (loss 0.0055):  79%|█████████▌  | 844/1066 [1:26:30<23:23,  6.32s/it]Training 2/2 epoch (loss 0.0035):  79%|█████████▌  | 844/1066 [1:26:36<23:23,  6.32s/it]Training 2/2 epoch (loss 0.0035):  79%|█████████▌  | 845/1066 [1:26:36<23:07,  6.28s/it]Training 2/2 epoch (loss 0.0038):  79%|█████████▌  | 845/1066 [1:26:42<23:07,  6.28s/it]Training 2/2 epoch (loss 0.0038):  79%|█████████▌  | 846/1066 [1:26:42<23:10,  6.32s/it]Training 2/2 epoch (loss 0.0081):  79%|█████████▌  | 846/1066 [1:26:48<23:10,  6.32s/it]Training 2/2 epoch (loss 0.0081):  79%|█████████▌  | 847/1066 [1:26:48<22:48,  6.25s/it]Training 2/2 epoch (loss 0.0019):  79%|█████████▌  | 847/1066 [1:26:54<22:48,  6.25s/it]Training 2/2 epoch (loss 0.0019):  80%|█████████▌  | 848/1066 [1:26:54<22:19,  6.14s/it]Training 2/2 epoch (loss 0.0123):  80%|█████████▌  | 848/1066 [1:27:00<22:19,  6.14s/it]Training 2/2 epoch (loss 0.0123):  80%|█████████▌  | 849/1066 [1:27:00<22:23,  6.19s/it]Training 2/2 epoch (loss 0.0378):  80%|█████████▌  | 849/1066 [1:27:07<22:23,  6.19s/it]Training 2/2 epoch (loss 0.0378):  80%|█████████▌  | 850/1066 [1:27:07<22:08,  6.15s/it]Training 2/2 epoch (loss 0.0048):  80%|█████████▌  | 850/1066 [1:27:13<22:08,  6.15s/it]Training 2/2 epoch (loss 0.0048):  80%|█████████▌  | 851/1066 [1:27:13<22:22,  6.25s/it]Training 2/2 epoch (loss 0.0344):  80%|█████████▌  | 851/1066 [1:27:19<22:22,  6.25s/it]Training 2/2 epoch (loss 0.0344):  80%|█████████▌  | 852/1066 [1:27:19<22:31,  6.31s/it]Training 2/2 epoch (loss 0.1484):  80%|█████████▌  | 852/1066 [1:27:25<22:31,  6.31s/it]Training 2/2 epoch (loss 0.1484):  80%|█████████▌  | 853/1066 [1:27:25<21:13,  5.98s/it]Training 2/2 epoch (loss 0.0342):  80%|█████████▌  | 853/1066 [1:27:30<21:13,  5.98s/it]Training 2/2 epoch (loss 0.0342):  80%|█████████▌  | 854/1066 [1:27:30<20:25,  5.78s/it]Training 2/2 epoch (loss 0.0089):  80%|█████████▌  | 854/1066 [1:27:36<20:25,  5.78s/it]Training 2/2 epoch (loss 0.0089):  80%|█████████▌  | 855/1066 [1:27:36<20:50,  5.93s/it]Training 2/2 epoch (loss 0.0806):  80%|█████████▌  | 855/1066 [1:27:43<20:50,  5.93s/it]Training 2/2 epoch (loss 0.0806):  80%|█████████▋  | 856/1066 [1:27:43<21:11,  6.06s/it]Training 2/2 epoch (loss 0.0147):  80%|█████████▋  | 856/1066 [1:27:49<21:11,  6.06s/it]Training 2/2 epoch (loss 0.0147):  80%|█████████▋  | 857/1066 [1:27:49<21:32,  6.18s/it]Training 2/2 epoch (loss 0.0162):  80%|█████████▋  | 857/1066 [1:27:55<21:32,  6.18s/it]Training 2/2 epoch (loss 0.0162):  80%|█████████▋  | 858/1066 [1:27:55<21:38,  6.24s/it]Training 2/2 epoch (loss 0.0251):  80%|█████████▋  | 858/1066 [1:28:02<21:38,  6.24s/it]Training 2/2 epoch (loss 0.0251):  81%|█████████▋  | 859/1066 [1:28:02<21:25,  6.21s/it]Training 2/2 epoch (loss 0.0221):  81%|█████████▋  | 859/1066 [1:28:08<21:25,  6.21s/it]Training 2/2 epoch (loss 0.0221):  81%|█████████▋  | 860/1066 [1:28:08<21:21,  6.22s/it]Training 2/2 epoch (loss 0.0170):  81%|█████████▋  | 860/1066 [1:28:13<21:21,  6.22s/it]Training 2/2 epoch (loss 0.0170):  81%|█████████▋  | 861/1066 [1:28:13<20:35,  6.03s/it]Training 2/2 epoch (loss 0.0579):  81%|█████████▋  | 861/1066 [1:28:18<20:35,  6.03s/it]Training 2/2 epoch (loss 0.0579):  81%|█████████▋  | 862/1066 [1:28:18<19:29,  5.73s/it]Training 2/2 epoch (loss 0.0177):  81%|█████████▋  | 862/1066 [1:28:25<19:29,  5.73s/it]Training 2/2 epoch (loss 0.0177):  81%|█████████▋  | 863/1066 [1:28:25<20:07,  5.95s/it]Training 2/2 epoch (loss 0.0461):  81%|█████████▋  | 863/1066 [1:28:31<20:07,  5.95s/it]Training 2/2 epoch (loss 0.0461):  81%|█████████▋  | 864/1066 [1:28:31<20:27,  6.08s/it]Training 2/2 epoch (loss 0.0269):  81%|█████████▋  | 864/1066 [1:28:37<20:27,  6.08s/it]Training 2/2 epoch (loss 0.0269):  81%|█████████▋  | 865/1066 [1:28:37<20:28,  6.11s/it]Training 2/2 epoch (loss 0.0476):  81%|█████████▋  | 865/1066 [1:28:44<20:28,  6.11s/it]Training 2/2 epoch (loss 0.0476):  81%|█████████▋  | 866/1066 [1:28:44<20:34,  6.17s/it]Training 2/2 epoch (loss 0.0222):  81%|█████████▋  | 866/1066 [1:28:50<20:34,  6.17s/it]Training 2/2 epoch (loss 0.0222):  81%|█████████▊  | 867/1066 [1:28:50<20:08,  6.07s/it]Training 2/2 epoch (loss 0.0118):  81%|█████████▊  | 867/1066 [1:28:56<20:08,  6.07s/it]Training 2/2 epoch (loss 0.0118):  81%|█████████▊  | 868/1066 [1:28:56<20:15,  6.14s/it]Training 2/2 epoch (loss 0.0957):  81%|█████████▊  | 868/1066 [1:29:01<20:15,  6.14s/it]Training 2/2 epoch (loss 0.0957):  82%|█████████▊  | 869/1066 [1:29:01<19:04,  5.81s/it]Training 2/2 epoch (loss 0.0093):  82%|█████████▊  | 869/1066 [1:29:08<19:04,  5.81s/it]Training 2/2 epoch (loss 0.0093):  82%|█████████▊  | 870/1066 [1:29:08<19:50,  6.08s/it]Training 2/2 epoch (loss 0.0228):  82%|█████████▊  | 870/1066 [1:29:14<19:50,  6.08s/it]Training 2/2 epoch (loss 0.0228):  82%|█████████▊  | 871/1066 [1:29:14<19:55,  6.13s/it]Training 2/2 epoch (loss 0.0073):  82%|█████████▊  | 871/1066 [1:29:20<19:55,  6.13s/it]Training 2/2 epoch (loss 0.0073):  82%|█████████▊  | 872/1066 [1:29:20<19:58,  6.18s/it]Training 2/2 epoch (loss 0.0071):  82%|█████████▊  | 872/1066 [1:29:27<19:58,  6.18s/it]Training 2/2 epoch (loss 0.0071):  82%|█████████▊  | 873/1066 [1:29:27<20:20,  6.33s/it]Training 2/2 epoch (loss 0.0330):  82%|█████████▊  | 873/1066 [1:29:33<20:20,  6.33s/it]Training 2/2 epoch (loss 0.0330):  82%|█████████▊  | 874/1066 [1:29:33<20:22,  6.37s/it]Training 2/2 epoch (loss 0.0352):  82%|█████████▊  | 874/1066 [1:29:39<20:22,  6.37s/it]Training 2/2 epoch (loss 0.0352):  82%|█████████▊  | 875/1066 [1:29:39<19:18,  6.07s/it]Training 2/2 epoch (loss 0.0066):  82%|█████████▊  | 875/1066 [1:29:45<19:18,  6.07s/it]Training 2/2 epoch (loss 0.0066):  82%|█████████▊  | 876/1066 [1:29:45<19:38,  6.20s/it]Training 2/2 epoch (loss 0.0747):  82%|█████████▊  | 876/1066 [1:29:51<19:38,  6.20s/it]Training 2/2 epoch (loss 0.0747):  82%|█████████▊  | 877/1066 [1:29:51<19:26,  6.17s/it]Training 2/2 epoch (loss 0.0083):  82%|█████████▊  | 877/1066 [1:29:58<19:26,  6.17s/it]Training 2/2 epoch (loss 0.0083):  82%|█████████▉  | 878/1066 [1:29:58<19:22,  6.19s/it]Training 2/2 epoch (loss 0.0240):  82%|█████████▉  | 878/1066 [1:30:03<19:22,  6.19s/it]Training 2/2 epoch (loss 0.0240):  82%|█████████▉  | 879/1066 [1:30:03<18:46,  6.02s/it]Training 2/2 epoch (loss 0.0037):  82%|█████████▉  | 879/1066 [1:30:10<18:46,  6.02s/it]Training 2/2 epoch (loss 0.0037):  83%|█████████▉  | 880/1066 [1:30:10<18:57,  6.12s/it]Training 2/2 epoch (loss 0.0374):  83%|█████████▉  | 880/1066 [1:30:15<18:57,  6.12s/it]Training 2/2 epoch (loss 0.0374):  83%|█████████▉  | 881/1066 [1:30:15<17:59,  5.84s/it]Training 2/2 epoch (loss 0.2061):  83%|█████████▉  | 881/1066 [1:30:21<17:59,  5.84s/it]Training 2/2 epoch (loss 0.2061):  83%|█████████▉  | 882/1066 [1:30:21<18:36,  6.07s/it]Training 2/2 epoch (loss 0.0176):  83%|█████████▉  | 882/1066 [1:30:27<18:36,  6.07s/it]Training 2/2 epoch (loss 0.0176):  83%|█████████▉  | 883/1066 [1:30:27<17:46,  5.83s/it]Training 2/2 epoch (loss 0.1064):  83%|█████████▉  | 883/1066 [1:30:32<17:46,  5.83s/it]Training 2/2 epoch (loss 0.1064):  83%|█████████▉  | 884/1066 [1:30:32<17:37,  5.81s/it]Training 2/2 epoch (loss 0.0737):  83%|█████████▉  | 884/1066 [1:30:39<17:37,  5.81s/it]Training 2/2 epoch (loss 0.0737):  83%|█████████▉  | 885/1066 [1:30:39<17:56,  5.95s/it]Training 2/2 epoch (loss 0.0583):  83%|█████████▉  | 885/1066 [1:30:45<17:56,  5.95s/it]Training 2/2 epoch (loss 0.0583):  83%|█████████▉  | 886/1066 [1:30:45<18:13,  6.07s/it]Training 2/2 epoch (loss 0.0684):  83%|█████████▉  | 886/1066 [1:30:51<18:13,  6.07s/it]Training 2/2 epoch (loss 0.0684):  83%|█████████▉  | 887/1066 [1:30:51<17:56,  6.02s/it]Training 2/2 epoch (loss 0.0713):  83%|█████████▉  | 887/1066 [1:30:57<17:56,  6.02s/it]Training 2/2 epoch (loss 0.0713):  83%|█████████▉  | 888/1066 [1:30:57<18:02,  6.08s/it]Training 2/2 epoch (loss 0.1816):  83%|█████████▉  | 888/1066 [1:31:03<18:02,  6.08s/it]Training 2/2 epoch (loss 0.1816):  83%|██████████  | 889/1066 [1:31:03<18:02,  6.12s/it]Training 2/2 epoch (loss 0.0498):  83%|██████████  | 889/1066 [1:31:09<18:02,  6.12s/it]Training 2/2 epoch (loss 0.0498):  83%|██████████  | 890/1066 [1:31:09<17:48,  6.07s/it]Training 2/2 epoch (loss 0.0908):  83%|██████████  | 890/1066 [1:31:16<17:48,  6.07s/it]Training 2/2 epoch (loss 0.0908):  84%|██████████  | 891/1066 [1:31:16<17:52,  6.13s/it]Training 2/2 epoch (loss 0.2168):  84%|██████████  | 891/1066 [1:31:22<17:52,  6.13s/it]Training 2/2 epoch (loss 0.2168):  84%|██████████  | 892/1066 [1:31:22<17:52,  6.17s/it]Training 2/2 epoch (loss 0.1641):  84%|██████████  | 892/1066 [1:31:28<17:52,  6.17s/it]Training 2/2 epoch (loss 0.1641):  84%|██████████  | 893/1066 [1:31:28<18:02,  6.26s/it]Training 2/2 epoch (loss 0.0330):  84%|██████████  | 893/1066 [1:31:35<18:02,  6.26s/it]Training 2/2 epoch (loss 0.0330):  84%|██████████  | 894/1066 [1:31:35<17:57,  6.27s/it]Training 2/2 epoch (loss 0.0302):  84%|██████████  | 894/1066 [1:31:40<17:57,  6.27s/it]Training 2/2 epoch (loss 0.0302):  84%|██████████  | 895/1066 [1:31:40<17:29,  6.14s/it]Training 2/2 epoch (loss 0.1455):  84%|██████████  | 895/1066 [1:31:47<17:29,  6.14s/it]Training 2/2 epoch (loss 0.1455):  84%|██████████  | 896/1066 [1:31:47<17:37,  6.22s/it]Training 2/2 epoch (loss 0.1875):  84%|██████████  | 896/1066 [1:31:53<17:37,  6.22s/it]Training 2/2 epoch (loss 0.1875):  84%|██████████  | 897/1066 [1:31:53<17:32,  6.23s/it]Training 2/2 epoch (loss 0.0610):  84%|██████████  | 897/1066 [1:31:59<17:32,  6.23s/it]Training 2/2 epoch (loss 0.0610):  84%|██████████  | 898/1066 [1:31:59<17:17,  6.18s/it]Training 2/2 epoch (loss 0.0610):  84%|██████████  | 898/1066 [1:32:05<17:17,  6.18s/it]Training 2/2 epoch (loss 0.0610):  84%|██████████  | 899/1066 [1:32:05<17:22,  6.24s/it]Training 2/2 epoch (loss 0.1582):  84%|██████████  | 899/1066 [1:32:12<17:22,  6.24s/it]Training 2/2 epoch (loss 0.1582):  84%|██████████▏ | 900/1066 [1:32:12<17:14,  6.23s/it]Training 2/2 epoch (loss 0.1167):  84%|██████████▏ | 900/1066 [1:32:17<17:14,  6.23s/it]Training 2/2 epoch (loss 0.1167):  85%|██████████▏ | 901/1066 [1:32:17<16:09,  5.88s/it]Training 2/2 epoch (loss 0.1348):  85%|██████████▏ | 901/1066 [1:32:23<16:09,  5.88s/it]Training 2/2 epoch (loss 0.1348):  85%|██████████▏ | 902/1066 [1:32:23<16:25,  6.01s/it]Training 2/2 epoch (loss 0.0757):  85%|██████████▏ | 902/1066 [1:32:30<16:25,  6.01s/it]Training 2/2 epoch (loss 0.0757):  85%|██████████▏ | 903/1066 [1:32:30<16:55,  6.23s/it]Training 2/2 epoch (loss 0.1216):  85%|██████████▏ | 903/1066 [1:32:36<16:55,  6.23s/it]Training 2/2 epoch (loss 0.1216):  85%|██████████▏ | 904/1066 [1:32:36<16:46,  6.21s/it]Training 2/2 epoch (loss 0.1348):  85%|██████████▏ | 904/1066 [1:32:42<16:46,  6.21s/it]Training 2/2 epoch (loss 0.1348):  85%|██████████▏ | 905/1066 [1:32:42<16:51,  6.28s/it]Training 2/2 epoch (loss 0.0500):  85%|██████████▏ | 905/1066 [1:32:49<16:51,  6.28s/it]Training 2/2 epoch (loss 0.0500):  85%|██████████▏ | 906/1066 [1:32:49<17:06,  6.41s/it]Training 2/2 epoch (loss 0.0508):  85%|██████████▏ | 906/1066 [1:32:55<17:06,  6.41s/it]Training 2/2 epoch (loss 0.0508):  85%|██████████▏ | 907/1066 [1:32:55<16:14,  6.13s/it]Training 2/2 epoch (loss 0.0253):  85%|██████████▏ | 907/1066 [1:33:01<16:14,  6.13s/it]Training 2/2 epoch (loss 0.0253):  85%|██████████▏ | 908/1066 [1:33:01<16:12,  6.16s/it]Training 2/2 epoch (loss 0.0137):  85%|██████████▏ | 908/1066 [1:33:08<16:12,  6.16s/it]Training 2/2 epoch (loss 0.0137):  85%|██████████▏ | 909/1066 [1:33:08<16:32,  6.32s/it]Training 2/2 epoch (loss 0.0137):  85%|██████████▏ | 909/1066 [1:33:14<16:32,  6.32s/it]Training 2/2 epoch (loss 0.0137):  85%|██████████▏ | 910/1066 [1:33:14<16:20,  6.28s/it]Training 2/2 epoch (loss 0.0325):  85%|██████████▏ | 910/1066 [1:33:20<16:20,  6.28s/it]Training 2/2 epoch (loss 0.0325):  85%|██████████▎ | 911/1066 [1:33:20<16:14,  6.29s/it]Training 2/2 epoch (loss 0.0605):  85%|██████████▎ | 911/1066 [1:33:26<16:14,  6.29s/it]Training 2/2 epoch (loss 0.0605):  86%|██████████▎ | 912/1066 [1:33:26<16:12,  6.32s/it]Training 2/2 epoch (loss 0.0291):  86%|██████████▎ | 912/1066 [1:33:33<16:12,  6.32s/it]Training 2/2 epoch (loss 0.0291):  86%|██████████▎ | 913/1066 [1:33:33<16:07,  6.32s/it]Training 2/2 epoch (loss 0.0032):  86%|██████████▎ | 913/1066 [1:33:39<16:07,  6.32s/it]Training 2/2 epoch (loss 0.0032):  86%|██████████▎ | 914/1066 [1:33:39<15:48,  6.24s/it]Training 2/2 epoch (loss 0.0312):  86%|██████████▎ | 914/1066 [1:33:45<15:48,  6.24s/it]Training 2/2 epoch (loss 0.0312):  86%|██████████▎ | 915/1066 [1:33:45<15:53,  6.31s/it]Training 2/2 epoch (loss 0.0192):  86%|██████████▎ | 915/1066 [1:33:51<15:53,  6.31s/it]Training 2/2 epoch (loss 0.0192):  86%|██████████▎ | 916/1066 [1:33:51<15:42,  6.29s/it]Training 2/2 epoch (loss 0.0134):  86%|██████████▎ | 916/1066 [1:33:58<15:42,  6.29s/it]Training 2/2 epoch (loss 0.0134):  86%|██████████▎ | 917/1066 [1:33:58<15:38,  6.30s/it]Training 2/2 epoch (loss 0.0640):  86%|██████████▎ | 917/1066 [1:34:04<15:38,  6.30s/it]Training 2/2 epoch (loss 0.0640):  86%|██████████▎ | 918/1066 [1:34:04<15:16,  6.19s/it]Training 2/2 epoch (loss 0.0176):  86%|██████████▎ | 918/1066 [1:34:10<15:16,  6.19s/it]Training 2/2 epoch (loss 0.0176):  86%|██████████▎ | 919/1066 [1:34:10<15:06,  6.17s/it]Training 2/2 epoch (loss 0.0087):  86%|██████████▎ | 919/1066 [1:34:16<15:06,  6.17s/it]Training 2/2 epoch (loss 0.0087):  86%|██████████▎ | 920/1066 [1:34:16<15:04,  6.19s/it]Training 2/2 epoch (loss 0.0215):  86%|██████████▎ | 920/1066 [1:34:23<15:04,  6.19s/it]Training 2/2 epoch (loss 0.0215):  86%|██████████▎ | 921/1066 [1:34:23<15:16,  6.32s/it]Training 2/2 epoch (loss 0.0344):  86%|██████████▎ | 921/1066 [1:34:29<15:16,  6.32s/it]Training 2/2 epoch (loss 0.0344):  86%|██████████▍ | 922/1066 [1:34:29<15:00,  6.25s/it]Training 2/2 epoch (loss 0.0079):  86%|██████████▍ | 922/1066 [1:34:35<15:00,  6.25s/it]Training 2/2 epoch (loss 0.0079):  87%|██████████▍ | 923/1066 [1:34:35<14:47,  6.21s/it]Training 2/2 epoch (loss 0.0175):  87%|██████████▍ | 923/1066 [1:34:40<14:47,  6.21s/it]Training 2/2 epoch (loss 0.0175):  87%|██████████▍ | 924/1066 [1:34:40<14:06,  5.96s/it]Training 2/2 epoch (loss 0.0840):  87%|██████████▍ | 924/1066 [1:34:46<14:06,  5.96s/it]Training 2/2 epoch (loss 0.0840):  87%|██████████▍ | 925/1066 [1:34:46<14:06,  6.01s/it]Training 2/2 epoch (loss 0.0237):  87%|██████████▍ | 925/1066 [1:34:52<14:06,  6.01s/it]Training 2/2 epoch (loss 0.0237):  87%|██████████▍ | 926/1066 [1:34:52<14:01,  6.01s/it]Training 2/2 epoch (loss 0.0045):  87%|██████████▍ | 926/1066 [1:34:59<14:01,  6.01s/it]Training 2/2 epoch (loss 0.0045):  87%|██████████▍ | 927/1066 [1:34:59<14:19,  6.18s/it]Training 2/2 epoch (loss 0.0093):  87%|██████████▍ | 927/1066 [1:35:05<14:19,  6.18s/it]Training 2/2 epoch (loss 0.0093):  87%|██████████▍ | 928/1066 [1:35:05<14:14,  6.19s/it]Training 2/2 epoch (loss 0.0430):  87%|██████████▍ | 928/1066 [1:35:11<14:14,  6.19s/it]Training 2/2 epoch (loss 0.0430):  87%|██████████▍ | 929/1066 [1:35:11<14:01,  6.14s/it]Training 2/2 epoch (loss 0.0122):  87%|██████████▍ | 929/1066 [1:35:17<14:01,  6.14s/it]Training 2/2 epoch (loss 0.0122):  87%|██████████▍ | 930/1066 [1:35:17<13:20,  5.89s/it]Training 2/2 epoch (loss 0.0408):  87%|██████████▍ | 930/1066 [1:35:23<13:20,  5.89s/it]Training 2/2 epoch (loss 0.0408):  87%|██████████▍ | 931/1066 [1:35:23<13:34,  6.03s/it]Training 2/2 epoch (loss 0.0120):  87%|██████████▍ | 931/1066 [1:35:29<13:34,  6.03s/it]Training 2/2 epoch (loss 0.0120):  87%|██████████▍ | 932/1066 [1:35:29<13:36,  6.10s/it]Training 2/2 epoch (loss 0.0684):  87%|██████████▍ | 932/1066 [1:35:36<13:36,  6.10s/it]Training 2/2 epoch (loss 0.0684):  88%|██████████▌ | 933/1066 [1:35:36<13:46,  6.21s/it]Training 2/2 epoch (loss 0.0200):  88%|██████████▌ | 933/1066 [1:35:42<13:46,  6.21s/it]Training 2/2 epoch (loss 0.0200):  88%|██████████▌ | 934/1066 [1:35:42<13:44,  6.25s/it]Training 2/2 epoch (loss 0.0322):  88%|██████████▌ | 934/1066 [1:35:49<13:44,  6.25s/it]Training 2/2 epoch (loss 0.0322):  88%|██████████▌ | 935/1066 [1:35:49<13:49,  6.33s/it]Training 2/2 epoch (loss 0.1064):  88%|██████████▌ | 935/1066 [1:35:55<13:49,  6.33s/it]Training 2/2 epoch (loss 0.1064):  88%|██████████▌ | 936/1066 [1:35:55<13:29,  6.23s/it]Training 2/2 epoch (loss 0.0486):  88%|██████████▌ | 936/1066 [1:36:01<13:29,  6.23s/it]Training 2/2 epoch (loss 0.0486):  88%|██████████▌ | 937/1066 [1:36:01<13:30,  6.28s/it]Training 2/2 epoch (loss 0.0447):  88%|██████████▌ | 937/1066 [1:36:07<13:30,  6.28s/it]Training 2/2 epoch (loss 0.0447):  88%|██████████▌ | 938/1066 [1:36:07<13:32,  6.35s/it]Training 2/2 epoch (loss 0.0197):  88%|██████████▌ | 938/1066 [1:36:13<13:32,  6.35s/it]Training 2/2 epoch (loss 0.0197):  88%|██████████▌ | 939/1066 [1:36:13<12:54,  6.10s/it]Training 2/2 epoch (loss 0.0256):  88%|██████████▌ | 939/1066 [1:36:18<12:54,  6.10s/it]Training 2/2 epoch (loss 0.0256):  88%|██████████▌ | 940/1066 [1:36:18<12:18,  5.86s/it]Training 2/2 epoch (loss 0.0659):  88%|██████████▌ | 940/1066 [1:36:25<12:18,  5.86s/it]Training 2/2 epoch (loss 0.0659):  88%|██████████▌ | 941/1066 [1:36:25<12:34,  6.04s/it]Training 2/2 epoch (loss 0.0605):  88%|██████████▌ | 941/1066 [1:36:31<12:34,  6.04s/it]Training 2/2 epoch (loss 0.0605):  88%|██████████▌ | 942/1066 [1:36:31<12:28,  6.04s/it]Training 2/2 epoch (loss 0.0508):  88%|██████████▌ | 942/1066 [1:36:37<12:28,  6.04s/it]Training 2/2 epoch (loss 0.0508):  88%|██████████▌ | 943/1066 [1:36:37<12:33,  6.13s/it]Training 2/2 epoch (loss 0.0806):  88%|██████████▌ | 943/1066 [1:36:43<12:33,  6.13s/it]Training 2/2 epoch (loss 0.0806):  89%|██████████▋ | 944/1066 [1:36:43<12:28,  6.14s/it]Training 2/2 epoch (loss 0.0405):  89%|██████████▋ | 944/1066 [1:36:49<12:28,  6.14s/it]Training 2/2 epoch (loss 0.0405):  89%|██████████▋ | 945/1066 [1:36:49<12:22,  6.13s/it]Training 2/2 epoch (loss 0.0913):  89%|██████████▋ | 945/1066 [1:36:56<12:22,  6.13s/it]Training 2/2 epoch (loss 0.0913):  89%|██████████▋ | 946/1066 [1:36:56<12:26,  6.22s/it]Training 2/2 epoch (loss 0.0063):  89%|██████████▋ | 946/1066 [1:37:02<12:26,  6.22s/it]Training 2/2 epoch (loss 0.0063):  89%|██████████▋ | 947/1066 [1:37:02<12:13,  6.17s/it]Training 2/2 epoch (loss 0.0297):  89%|██████████▋ | 947/1066 [1:37:08<12:13,  6.17s/it]Training 2/2 epoch (loss 0.0297):  89%|██████████▋ | 948/1066 [1:37:08<12:14,  6.22s/it]Training 2/2 epoch (loss 0.0108):  89%|██████████▋ | 948/1066 [1:37:14<12:14,  6.22s/it]Training 2/2 epoch (loss 0.0108):  89%|██████████▋ | 949/1066 [1:37:14<11:38,  5.97s/it]Training 2/2 epoch (loss 0.0117):  89%|██████████▋ | 949/1066 [1:37:20<11:38,  5.97s/it]Training 2/2 epoch (loss 0.0117):  89%|██████████▋ | 950/1066 [1:37:20<11:31,  5.96s/it]Training 2/2 epoch (loss 0.0304):  89%|██████████▋ | 950/1066 [1:37:26<11:31,  5.96s/it]Training 2/2 epoch (loss 0.0304):  89%|██████████▋ | 951/1066 [1:37:26<11:42,  6.11s/it]Training 2/2 epoch (loss 0.0598):  89%|██████████▋ | 951/1066 [1:37:32<11:42,  6.11s/it]Training 2/2 epoch (loss 0.0598):  89%|██████████▋ | 952/1066 [1:37:32<11:45,  6.19s/it]Training 2/2 epoch (loss 0.0264):  89%|██████████▋ | 952/1066 [1:37:39<11:45,  6.19s/it]Training 2/2 epoch (loss 0.0264):  89%|██████████▋ | 953/1066 [1:37:39<11:43,  6.23s/it]Training 2/2 epoch (loss 0.0221):  89%|██████████▋ | 953/1066 [1:37:45<11:43,  6.23s/it]Training 2/2 epoch (loss 0.0221):  89%|██████████▋ | 954/1066 [1:37:45<11:51,  6.35s/it]Training 2/2 epoch (loss 0.0513):  89%|██████████▋ | 954/1066 [1:37:51<11:51,  6.35s/it]Training 2/2 epoch (loss 0.0513):  90%|██████████▊ | 955/1066 [1:37:51<11:35,  6.27s/it]Training 2/2 epoch (loss 0.0315):  90%|██████████▊ | 955/1066 [1:37:58<11:35,  6.27s/it]Training 2/2 epoch (loss 0.0315):  90%|██████████▊ | 956/1066 [1:37:58<11:25,  6.23s/it]Training 2/2 epoch (loss 0.0072):  90%|██████████▊ | 956/1066 [1:38:04<11:25,  6.23s/it]Training 2/2 epoch (loss 0.0072):  90%|██████████▊ | 957/1066 [1:38:04<11:28,  6.31s/it]Training 2/2 epoch (loss 0.0112):  90%|██████████▊ | 957/1066 [1:38:09<11:28,  6.31s/it]Training 2/2 epoch (loss 0.0112):  90%|██████████▊ | 958/1066 [1:38:09<10:49,  6.01s/it]Training 2/2 epoch (loss 0.0540):  90%|██████████▊ | 958/1066 [1:38:15<10:49,  6.01s/it]Training 2/2 epoch (loss 0.0540):  90%|██████████▊ | 959/1066 [1:38:15<10:45,  6.03s/it]Training 2/2 epoch (loss 0.0177):  90%|██████████▊ | 959/1066 [1:38:22<10:45,  6.03s/it]Training 2/2 epoch (loss 0.0177):  90%|██████████▊ | 960/1066 [1:38:22<10:59,  6.22s/it]Training 2/2 epoch (loss 0.0236):  90%|██████████▊ | 960/1066 [1:38:28<10:59,  6.22s/it]Training 2/2 epoch (loss 0.0236):  90%|██████████▊ | 961/1066 [1:38:28<10:58,  6.27s/it]Training 2/2 epoch (loss 0.0184):  90%|██████████▊ | 961/1066 [1:38:34<10:58,  6.27s/it]Training 2/2 epoch (loss 0.0184):  90%|██████████▊ | 962/1066 [1:38:34<10:44,  6.19s/it]Training 2/2 epoch (loss 0.0266):  90%|██████████▊ | 962/1066 [1:38:41<10:44,  6.19s/it]Training 2/2 epoch (loss 0.0266):  90%|██████████▊ | 963/1066 [1:38:41<10:48,  6.29s/it]Training 2/2 epoch (loss 0.0097):  90%|██████████▊ | 963/1066 [1:38:47<10:48,  6.29s/it]Training 2/2 epoch (loss 0.0097):  90%|██████████▊ | 964/1066 [1:38:47<10:41,  6.29s/it]Training 2/2 epoch (loss 0.0737):  90%|██████████▊ | 964/1066 [1:38:54<10:41,  6.29s/it]Training 2/2 epoch (loss 0.0737):  91%|██████████▊ | 965/1066 [1:38:54<10:41,  6.35s/it]Training 2/2 epoch (loss 0.0483):  91%|██████████▊ | 965/1066 [1:39:00<10:41,  6.35s/it]Training 2/2 epoch (loss 0.0483):  91%|██████████▊ | 966/1066 [1:39:00<10:37,  6.38s/it]Training 2/2 epoch (loss 0.0047):  91%|██████████▊ | 966/1066 [1:39:06<10:37,  6.38s/it]Training 2/2 epoch (loss 0.0047):  91%|██████████▉ | 967/1066 [1:39:06<10:19,  6.26s/it]Training 2/2 epoch (loss 0.0537):  91%|██████████▉ | 967/1066 [1:39:12<10:19,  6.26s/it]Training 2/2 epoch (loss 0.0537):  91%|██████████▉ | 968/1066 [1:39:12<10:09,  6.22s/it]Training 2/2 epoch (loss 0.0476):  91%|██████████▉ | 968/1066 [1:39:19<10:09,  6.22s/it]Training 2/2 epoch (loss 0.0476):  91%|██████████▉ | 969/1066 [1:39:19<10:09,  6.28s/it]Training 2/2 epoch (loss 0.0369):  91%|██████████▉ | 969/1066 [1:39:25<10:09,  6.28s/it]Training 2/2 epoch (loss 0.0369):  91%|██████████▉ | 970/1066 [1:39:25<10:06,  6.32s/it]Training 2/2 epoch (loss 0.0454):  91%|██████████▉ | 970/1066 [1:39:31<10:06,  6.32s/it]Training 2/2 epoch (loss 0.0454):  91%|██████████▉ | 971/1066 [1:39:31<09:34,  6.05s/it]Training 2/2 epoch (loss 0.0116):  91%|██████████▉ | 971/1066 [1:39:37<09:34,  6.05s/it]Training 2/2 epoch (loss 0.0116):  91%|██████████▉ | 972/1066 [1:39:37<09:41,  6.19s/it]Training 2/2 epoch (loss 0.0298):  91%|██████████▉ | 972/1066 [1:39:43<09:41,  6.19s/it]Training 2/2 epoch (loss 0.0298):  91%|██████████▉ | 973/1066 [1:39:43<09:32,  6.16s/it]Training 2/2 epoch (loss 0.0337):  91%|██████████▉ | 973/1066 [1:39:50<09:32,  6.16s/it]Training 2/2 epoch (loss 0.0337):  91%|██████████▉ | 974/1066 [1:39:50<09:32,  6.22s/it]Training 2/2 epoch (loss 0.0718):  91%|██████████▉ | 974/1066 [1:39:56<09:32,  6.22s/it]Training 2/2 epoch (loss 0.0718):  91%|██████████▉ | 975/1066 [1:39:56<09:20,  6.16s/it]Training 2/2 epoch (loss 0.0086):  91%|██████████▉ | 975/1066 [1:40:02<09:20,  6.16s/it]Training 2/2 epoch (loss 0.0086):  92%|██████████▉ | 976/1066 [1:40:02<09:16,  6.18s/it]Training 2/2 epoch (loss 0.0125):  92%|██████████▉ | 976/1066 [1:40:08<09:16,  6.18s/it]Training 2/2 epoch (loss 0.0125):  92%|██████████▉ | 977/1066 [1:40:08<09:02,  6.09s/it]Training 2/2 epoch (loss 0.0981):  92%|██████████▉ | 977/1066 [1:40:14<09:02,  6.09s/it]Training 2/2 epoch (loss 0.0981):  92%|███████████ | 978/1066 [1:40:14<09:07,  6.23s/it]Training 2/2 epoch (loss 0.0398):  92%|███████████ | 978/1066 [1:40:21<09:07,  6.23s/it]Training 2/2 epoch (loss 0.0398):  92%|███████████ | 979/1066 [1:40:21<09:07,  6.29s/it]Training 2/2 epoch (loss 0.0815):  92%|███████████ | 979/1066 [1:40:27<09:07,  6.29s/it]Training 2/2 epoch (loss 0.0815):  92%|███████████ | 980/1066 [1:40:27<08:56,  6.23s/it]Training 2/2 epoch (loss 0.0913):  92%|███████████ | 980/1066 [1:40:33<08:56,  6.23s/it]Training 2/2 epoch (loss 0.0913):  92%|███████████ | 981/1066 [1:40:33<08:50,  6.24s/it]Training 2/2 epoch (loss 0.0205):  92%|███████████ | 981/1066 [1:40:39<08:50,  6.24s/it]Training 2/2 epoch (loss 0.0205):  92%|███████████ | 982/1066 [1:40:39<08:46,  6.27s/it]Training 2/2 epoch (loss 0.0190):  92%|███████████ | 982/1066 [1:40:46<08:46,  6.27s/it]Training 2/2 epoch (loss 0.0190):  92%|███████████ | 983/1066 [1:40:46<08:45,  6.33s/it]Training 2/2 epoch (loss 0.0466):  92%|███████████ | 983/1066 [1:40:52<08:45,  6.33s/it]Training 2/2 epoch (loss 0.0466):  92%|███████████ | 984/1066 [1:40:52<08:43,  6.39s/it]Training 2/2 epoch (loss 0.0437):  92%|███████████ | 984/1066 [1:40:59<08:43,  6.39s/it]Training 2/2 epoch (loss 0.0437):  92%|███████████ | 985/1066 [1:40:59<08:37,  6.39s/it]Training 2/2 epoch (loss 0.0483):  92%|███████████ | 985/1066 [1:41:04<08:37,  6.39s/it]Training 2/2 epoch (loss 0.0483):  92%|███████████ | 986/1066 [1:41:04<08:00,  6.00s/it]Training 2/2 epoch (loss 0.0043):  92%|███████████ | 986/1066 [1:41:10<08:00,  6.00s/it]Training 2/2 epoch (loss 0.0043):  93%|███████████ | 987/1066 [1:41:10<08:06,  6.16s/it]Training 2/2 epoch (loss 0.0354):  93%|███████████ | 987/1066 [1:41:16<08:06,  6.16s/it]Training 2/2 epoch (loss 0.0354):  93%|███████████ | 988/1066 [1:41:16<07:37,  5.87s/it]Training 2/2 epoch (loss 0.0063):  93%|███████████ | 988/1066 [1:41:22<07:37,  5.87s/it]Training 2/2 epoch (loss 0.0063):  93%|███████████▏| 989/1066 [1:41:22<07:42,  6.01s/it]Training 2/2 epoch (loss 0.0371):  93%|███████████▏| 989/1066 [1:41:28<07:42,  6.01s/it]Training 2/2 epoch (loss 0.0371):  93%|███████████▏| 990/1066 [1:41:28<07:46,  6.14s/it]Training 2/2 epoch (loss 0.0938):  93%|███████████▏| 990/1066 [1:41:35<07:46,  6.14s/it]Training 2/2 epoch (loss 0.0938):  93%|███████████▏| 991/1066 [1:41:35<07:45,  6.20s/it]Training 2/2 epoch (loss 0.0255):  93%|███████████▏| 991/1066 [1:41:40<07:45,  6.20s/it]Training 2/2 epoch (loss 0.0255):  93%|███████████▏| 992/1066 [1:41:40<07:29,  6.07s/it]Training 2/2 epoch (loss 0.0579):  93%|███████████▏| 992/1066 [1:41:47<07:29,  6.07s/it]Training 2/2 epoch (loss 0.0579):  93%|███████████▏| 993/1066 [1:41:47<07:30,  6.18s/it]Training 2/2 epoch (loss 0.0140):  93%|███████████▏| 993/1066 [1:41:53<07:30,  6.18s/it]Training 2/2 epoch (loss 0.0140):  93%|███████████▏| 994/1066 [1:41:53<07:19,  6.10s/it]Training 2/2 epoch (loss 0.0311):  93%|███████████▏| 994/1066 [1:41:59<07:19,  6.10s/it]Training 2/2 epoch (loss 0.0311):  93%|███████████▏| 995/1066 [1:41:59<07:10,  6.07s/it]Training 2/2 epoch (loss 0.0108):  93%|███████████▏| 995/1066 [1:42:05<07:10,  6.07s/it]Training 2/2 epoch (loss 0.0108):  93%|███████████▏| 996/1066 [1:42:05<07:09,  6.13s/it]Training 2/2 epoch (loss 0.0189):  93%|███████████▏| 996/1066 [1:42:11<07:09,  6.13s/it]Training 2/2 epoch (loss 0.0189):  94%|███████████▏| 997/1066 [1:42:11<07:08,  6.21s/it]Training 2/2 epoch (loss 0.0327):  94%|███████████▏| 997/1066 [1:42:17<07:08,  6.21s/it]Training 2/2 epoch (loss 0.0327):  94%|███████████▏| 998/1066 [1:42:17<06:56,  6.13s/it]Training 2/2 epoch (loss 0.0322):  94%|███████████▏| 998/1066 [1:42:24<06:56,  6.13s/it]Training 2/2 epoch (loss 0.0322):  94%|███████████▏| 999/1066 [1:42:24<07:01,  6.30s/it]Training 2/2 epoch (loss 0.0104):  94%|███████████▏| 999/1066 [1:42:30<07:01,  6.30s/it]Training 2/2 epoch (loss 0.0104):  94%|██████████▎| 1000/1066 [1:42:30<06:47,  6.18s/it]Training 2/2 epoch (loss 0.0544):  94%|██████████▎| 1000/1066 [1:42:35<06:47,  6.18s/it]Training 2/2 epoch (loss 0.0544):  94%|██████████▎| 1001/1066 [1:42:35<06:20,  5.85s/it]Training 2/2 epoch (loss 0.0026):  94%|██████████▎| 1001/1066 [1:42:41<06:20,  5.85s/it]Training 2/2 epoch (loss 0.0026):  94%|██████████▎| 1002/1066 [1:42:41<06:08,  5.76s/it]Training 2/2 epoch (loss 0.0029):  94%|██████████▎| 1002/1066 [1:42:46<06:08,  5.76s/it]Training 2/2 epoch (loss 0.0029):  94%|██████████▎| 1003/1066 [1:42:46<05:59,  5.70s/it]Training 2/2 epoch (loss 0.0133):  94%|██████████▎| 1003/1066 [1:42:53<05:59,  5.70s/it]Training 2/2 epoch (loss 0.0133):  94%|██████████▎| 1004/1066 [1:42:53<06:04,  5.88s/it]Training 2/2 epoch (loss 0.0240):  94%|██████████▎| 1004/1066 [1:42:59<06:04,  5.88s/it]Training 2/2 epoch (loss 0.0240):  94%|██████████▎| 1005/1066 [1:42:59<06:08,  6.03s/it]Training 2/2 epoch (loss 0.0073):  94%|██████████▎| 1005/1066 [1:43:04<06:08,  6.03s/it]Training 2/2 epoch (loss 0.0073):  94%|██████████▍| 1006/1066 [1:43:04<05:52,  5.87s/it]Training 2/2 epoch (loss 0.0093):  94%|██████████▍| 1006/1066 [1:43:11<05:52,  5.87s/it]Training 2/2 epoch (loss 0.0093):  94%|██████████▍| 1007/1066 [1:43:11<05:56,  6.03s/it]Training 2/2 epoch (loss 0.0376):  94%|██████████▍| 1007/1066 [1:43:17<05:56,  6.03s/it]Training 2/2 epoch (loss 0.0376):  95%|██████████▍| 1008/1066 [1:43:17<06:00,  6.22s/it]Training 2/2 epoch (loss 0.0294):  95%|██████████▍| 1008/1066 [1:43:23<06:00,  6.22s/it]Training 2/2 epoch (loss 0.0294):  95%|██████████▍| 1009/1066 [1:43:23<05:43,  6.03s/it]Training 2/2 epoch (loss 0.0566):  95%|██████████▍| 1009/1066 [1:43:28<05:43,  6.03s/it]Training 2/2 epoch (loss 0.0566):  95%|██████████▍| 1010/1066 [1:43:28<05:21,  5.74s/it]Training 2/2 epoch (loss 0.0435):  95%|██████████▍| 1010/1066 [1:43:34<05:21,  5.74s/it]Training 2/2 epoch (loss 0.0435):  95%|██████████▍| 1011/1066 [1:43:34<05:22,  5.86s/it]Training 2/2 epoch (loss 0.0041):  95%|██████████▍| 1011/1066 [1:43:41<05:22,  5.86s/it]Training 2/2 epoch (loss 0.0041):  95%|██████████▍| 1012/1066 [1:43:41<05:27,  6.06s/it]Training 2/2 epoch (loss 0.0654):  95%|██████████▍| 1012/1066 [1:43:46<05:27,  6.06s/it]Training 2/2 epoch (loss 0.0654):  95%|██████████▍| 1013/1066 [1:43:46<05:15,  5.96s/it]Training 2/2 epoch (loss 0.0332):  95%|██████████▍| 1013/1066 [1:43:53<05:15,  5.96s/it]Training 2/2 epoch (loss 0.0332):  95%|██████████▍| 1014/1066 [1:43:53<05:17,  6.10s/it]Training 2/2 epoch (loss 0.0344):  95%|██████████▍| 1014/1066 [1:43:59<05:17,  6.10s/it]Training 2/2 epoch (loss 0.0344):  95%|██████████▍| 1015/1066 [1:43:59<05:12,  6.12s/it]Training 2/2 epoch (loss 0.0302):  95%|██████████▍| 1015/1066 [1:44:06<05:12,  6.12s/it]Training 2/2 epoch (loss 0.0302):  95%|██████████▍| 1016/1066 [1:44:06<05:11,  6.23s/it]Training 2/2 epoch (loss 0.0059):  95%|██████████▍| 1016/1066 [1:44:12<05:11,  6.23s/it]Training 2/2 epoch (loss 0.0059):  95%|██████████▍| 1017/1066 [1:44:12<05:09,  6.33s/it]Training 2/2 epoch (loss 0.0036):  95%|██████████▍| 1017/1066 [1:44:19<05:09,  6.33s/it]Training 2/2 epoch (loss 0.0036):  95%|██████████▌| 1018/1066 [1:44:19<05:04,  6.34s/it]Training 2/2 epoch (loss 0.0076):  95%|██████████▌| 1018/1066 [1:44:25<05:04,  6.34s/it]Training 2/2 epoch (loss 0.0076):  96%|██████████▌| 1019/1066 [1:44:25<04:57,  6.33s/it]Training 2/2 epoch (loss 0.0118):  96%|██████████▌| 1019/1066 [1:44:31<04:57,  6.33s/it]Training 2/2 epoch (loss 0.0118):  96%|██████████▌| 1020/1066 [1:44:31<04:53,  6.39s/it]Training 2/2 epoch (loss 0.0176):  96%|██████████▌| 1020/1066 [1:44:38<04:53,  6.39s/it]Training 2/2 epoch (loss 0.0176):  96%|██████████▌| 1021/1066 [1:44:38<04:47,  6.38s/it]Training 2/2 epoch (loss 0.0801):  96%|██████████▌| 1021/1066 [1:44:44<04:47,  6.38s/it]Training 2/2 epoch (loss 0.0801):  96%|██████████▌| 1022/1066 [1:44:44<04:43,  6.44s/it]Training 2/2 epoch (loss 0.0129):  96%|██████████▌| 1022/1066 [1:44:51<04:43,  6.44s/it]Training 2/2 epoch (loss 0.0129):  96%|██████████▌| 1023/1066 [1:44:51<04:39,  6.50s/it]Training 2/2 epoch (loss 0.0229):  96%|██████████▌| 1023/1066 [1:44:57<04:39,  6.50s/it]Training 2/2 epoch (loss 0.0229):  96%|██████████▌| 1024/1066 [1:44:57<04:28,  6.40s/it]Training 2/2 epoch (loss 0.0332):  96%|██████████▌| 1024/1066 [1:45:03<04:28,  6.40s/it]Training 2/2 epoch (loss 0.0332):  96%|██████████▌| 1025/1066 [1:45:03<04:19,  6.33s/it]Training 2/2 epoch (loss 0.1016):  96%|██████████▌| 1025/1066 [1:45:10<04:19,  6.33s/it]Training 2/2 epoch (loss 0.1016):  96%|██████████▌| 1026/1066 [1:45:10<04:17,  6.44s/it]Training 2/2 epoch (loss 0.0618):  96%|██████████▌| 1026/1066 [1:45:16<04:17,  6.44s/it]Training 2/2 epoch (loss 0.0618):  96%|██████████▌| 1027/1066 [1:45:16<04:11,  6.45s/it]Training 2/2 epoch (loss 0.1543):  96%|██████████▌| 1027/1066 [1:45:23<04:11,  6.45s/it]Training 2/2 epoch (loss 0.1543):  96%|██████████▌| 1028/1066 [1:45:23<04:01,  6.37s/it]Training 2/2 epoch (loss 0.0203):  96%|██████████▌| 1028/1066 [1:45:29<04:01,  6.37s/it]Training 2/2 epoch (loss 0.0203):  97%|██████████▌| 1029/1066 [1:45:29<03:55,  6.36s/it]Training 2/2 epoch (loss 0.0374):  97%|██████████▌| 1029/1066 [1:45:35<03:55,  6.36s/it]Training 2/2 epoch (loss 0.0374):  97%|██████████▋| 1030/1066 [1:45:35<03:45,  6.26s/it]Training 2/2 epoch (loss 0.0967):  97%|██████████▋| 1030/1066 [1:45:40<03:45,  6.26s/it]Training 2/2 epoch (loss 0.0967):  97%|██████████▋| 1031/1066 [1:45:40<03:31,  6.04s/it]Training 2/2 epoch (loss 0.0996):  97%|██████████▋| 1031/1066 [1:45:47<03:31,  6.04s/it]Training 2/2 epoch (loss 0.0996):  97%|██████████▋| 1032/1066 [1:45:47<03:29,  6.16s/it]Training 2/2 epoch (loss 0.0413):  97%|██████████▋| 1032/1066 [1:45:53<03:29,  6.16s/it]Training 2/2 epoch (loss 0.0413):  97%|██████████▋| 1033/1066 [1:45:53<03:25,  6.22s/it]Training 2/2 epoch (loss 0.1348):  97%|██████████▋| 1033/1066 [1:45:59<03:25,  6.22s/it]Training 2/2 epoch (loss 0.1348):  97%|██████████▋| 1034/1066 [1:45:59<03:18,  6.19s/it]Training 2/2 epoch (loss 0.0461):  97%|██████████▋| 1034/1066 [1:46:06<03:18,  6.19s/it]Training 2/2 epoch (loss 0.0461):  97%|██████████▋| 1035/1066 [1:46:06<03:15,  6.30s/it]Training 2/2 epoch (loss 0.0299):  97%|██████████▋| 1035/1066 [1:46:12<03:15,  6.30s/it]Training 2/2 epoch (loss 0.0299):  97%|██████████▋| 1036/1066 [1:46:12<03:03,  6.10s/it]Training 2/2 epoch (loss 0.0347):  97%|██████████▋| 1036/1066 [1:46:18<03:03,  6.10s/it]Training 2/2 epoch (loss 0.0347):  97%|██████████▋| 1037/1066 [1:46:18<02:59,  6.21s/it]Training 2/2 epoch (loss 0.0327):  97%|██████████▋| 1037/1066 [1:46:24<02:59,  6.21s/it]Training 2/2 epoch (loss 0.0327):  97%|██████████▋| 1038/1066 [1:46:24<02:54,  6.24s/it]Training 2/2 epoch (loss 0.0132):  97%|██████████▋| 1038/1066 [1:46:31<02:54,  6.24s/it]Training 2/2 epoch (loss 0.0132):  97%|██████████▋| 1039/1066 [1:46:31<02:48,  6.26s/it]Training 2/2 epoch (loss 0.0074):  97%|██████████▋| 1039/1066 [1:46:37<02:48,  6.26s/it]Training 2/2 epoch (loss 0.0074):  98%|██████████▋| 1040/1066 [1:46:37<02:41,  6.19s/it]Training 2/2 epoch (loss 0.0188):  98%|██████████▋| 1040/1066 [1:46:43<02:41,  6.19s/it]Training 2/2 epoch (loss 0.0188):  98%|██████████▋| 1041/1066 [1:46:43<02:33,  6.15s/it]Training 2/2 epoch (loss 0.0359):  98%|██████████▋| 1041/1066 [1:46:49<02:33,  6.15s/it]Training 2/2 epoch (loss 0.0359):  98%|██████████▊| 1042/1066 [1:46:49<02:27,  6.13s/it]Training 2/2 epoch (loss 0.0874):  98%|██████████▊| 1042/1066 [1:46:55<02:27,  6.13s/it]Training 2/2 epoch (loss 0.0874):  98%|██████████▊| 1043/1066 [1:46:55<02:22,  6.19s/it]Training 2/2 epoch (loss 0.0278):  98%|██████████▊| 1043/1066 [1:47:02<02:22,  6.19s/it]Training 2/2 epoch (loss 0.0278):  98%|██████████▊| 1044/1066 [1:47:02<02:18,  6.29s/it]Training 2/2 epoch (loss 0.0583):  98%|██████████▊| 1044/1066 [1:47:08<02:18,  6.29s/it]Training 2/2 epoch (loss 0.0583):  98%|██████████▊| 1045/1066 [1:47:08<02:12,  6.32s/it]Training 2/2 epoch (loss 0.1230):  98%|██████████▊| 1045/1066 [1:47:15<02:12,  6.32s/it]Training 2/2 epoch (loss 0.1230):  98%|██████████▊| 1046/1066 [1:47:15<02:06,  6.35s/it]Training 2/2 epoch (loss 0.0255):  98%|██████████▊| 1046/1066 [1:47:21<02:06,  6.35s/it]Training 2/2 epoch (loss 0.0255):  98%|██████████▊| 1047/1066 [1:47:21<02:01,  6.39s/it]Training 2/2 epoch (loss 0.0522):  98%|██████████▊| 1047/1066 [1:47:27<02:01,  6.39s/it]Training 2/2 epoch (loss 0.0522):  98%|██████████▊| 1048/1066 [1:47:27<01:54,  6.33s/it]Training 2/2 epoch (loss 0.0933):  98%|██████████▊| 1048/1066 [1:47:34<01:54,  6.33s/it]Training 2/2 epoch (loss 0.0933):  98%|██████████▊| 1049/1066 [1:47:34<01:48,  6.36s/it]Training 2/2 epoch (loss 0.1484):  98%|██████████▊| 1049/1066 [1:47:39<01:48,  6.36s/it]Training 2/2 epoch (loss 0.1484):  98%|██████████▊| 1050/1066 [1:47:39<01:39,  6.20s/it]Training 2/2 epoch (loss 0.2305):  98%|██████████▊| 1050/1066 [1:47:46<01:39,  6.20s/it]Training 2/2 epoch (loss 0.2305):  99%|██████████▊| 1051/1066 [1:47:46<01:32,  6.17s/it]Training 2/2 epoch (loss 0.0649):  99%|██████████▊| 1051/1066 [1:47:52<01:32,  6.17s/it]Training 2/2 epoch (loss 0.0649):  99%|██████████▊| 1052/1066 [1:47:52<01:27,  6.24s/it]Training 2/2 epoch (loss 0.0552):  99%|██████████▊| 1052/1066 [1:47:59<01:27,  6.24s/it]Training 2/2 epoch (loss 0.0552):  99%|██████████▊| 1053/1066 [1:47:59<01:22,  6.35s/it]Training 2/2 epoch (loss 0.0150):  99%|██████████▊| 1053/1066 [1:48:05<01:22,  6.35s/it]Training 2/2 epoch (loss 0.0150):  99%|██████████▉| 1054/1066 [1:48:05<01:16,  6.36s/it]Training 2/2 epoch (loss 0.0530):  99%|██████████▉| 1054/1066 [1:48:11<01:16,  6.36s/it]Training 2/2 epoch (loss 0.0530):  99%|██████████▉| 1055/1066 [1:48:11<01:09,  6.33s/it]Training 2/2 epoch (loss 0.0703):  99%|██████████▉| 1055/1066 [1:48:18<01:09,  6.33s/it]Training 2/2 epoch (loss 0.0703):  99%|██████████▉| 1056/1066 [1:48:18<01:04,  6.43s/it]Training 2/2 epoch (loss 0.0413):  99%|██████████▉| 1056/1066 [1:48:24<01:04,  6.43s/it]Training 2/2 epoch (loss 0.0413):  99%|██████████▉| 1057/1066 [1:48:24<00:56,  6.27s/it]Training 2/2 epoch (loss 0.0417):  99%|██████████▉| 1057/1066 [1:48:30<00:56,  6.27s/it]Training 2/2 epoch (loss 0.0417):  99%|██████████▉| 1058/1066 [1:48:30<00:50,  6.29s/it]Training 2/2 epoch (loss 0.0576):  99%|██████████▉| 1058/1066 [1:48:36<00:50,  6.29s/it]Training 2/2 epoch (loss 0.0576):  99%|██████████▉| 1059/1066 [1:48:36<00:42,  6.04s/it]Training 2/2 epoch (loss 0.0452):  99%|██████████▉| 1059/1066 [1:48:42<00:42,  6.04s/it]Training 2/2 epoch (loss 0.0452):  99%|██████████▉| 1060/1066 [1:48:42<00:36,  6.17s/it]Training 2/2 epoch (loss 0.0260):  99%|██████████▉| 1060/1066 [1:48:48<00:36,  6.17s/it]Training 2/2 epoch (loss 0.0260): 100%|██████████▉| 1061/1066 [1:48:48<00:29,  5.99s/it]Training 2/2 epoch (loss 0.0204): 100%|██████████▉| 1061/1066 [1:48:54<00:29,  5.99s/it]Training 2/2 epoch (loss 0.0204): 100%|██████████▉| 1062/1066 [1:48:54<00:24,  6.20s/it]Training 2/2 epoch (loss 0.0688): 100%|██████████▉| 1062/1066 [1:49:00<00:24,  6.20s/it]Training 2/2 epoch (loss 0.0688): 100%|██████████▉| 1063/1066 [1:49:00<00:18,  6.14s/it]Training 2/2 epoch (loss 0.0361): 100%|██████████▉| 1063/1066 [1:49:05<00:18,  6.14s/it]Training 2/2 epoch (loss 0.0361): 100%|██████████▉| 1064/1066 [1:49:05<00:11,  5.83s/it]Training 2/2 epoch (loss 0.0347): 100%|██████████▉| 1064/1066 [1:49:12<00:11,  5.83s/it]Training 2/2 epoch (loss 0.0347): 100%|██████████▉| 1065/1066 [1:49:12<00:05,  5.97s/it]Training 2/2 epoch (loss 0.0522): 100%|██████████▉| 1065/1066 [1:49:17<00:05,  5.97s/it]Training 2/2 epoch (loss 0.0522): 100%|███████████| 1066/1066 [1:49:17<00:00,  5.73s/it]Training 2/2 epoch (loss 0.0522): 100%|███████████| 1066/1066 [1:49:17<00:00,  6.15s/it]