diff --git "a/slurm-logs/err-clip.log" "b/slurm-logs/err-clip.log"
new file mode 100644--- /dev/null
+++ "b/slurm-logs/err-clip.log"
@@ -0,0 +1,1108 @@
+Detected kernel version 4.18.0, which is below the recommended minimum of 5.5.0; this can cause the process to hang. It is recommended to upgrade the kernel to the minimum version or higher.
+02/04/2024 13:00:25 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 0
+Local process index: 0
+Device: cuda:0
+
+Mixed precision type: no
+
+02/04/2024 13:00:27 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 6
+Local process index: 6
+Device: cuda:6
+
+Mixed precision type: no
+
+02/04/2024 13:00:27 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 2
+Local process index: 2
+Device: cuda:2
+
+Mixed precision type: no
+
+02/04/2024 13:00:27 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 4
+Local process index: 4
+Device: cuda:4
+
+Mixed precision type: no
+
+02/04/2024 13:00:27 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 7
+Local process index: 7
+Device: cuda:7
+
+Mixed precision type: no
+
+02/04/2024 13:00:28 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 5
+Local process index: 5
+Device: cuda:5
+
+Mixed precision type: no
+
+02/04/2024 13:00:28 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 3
+Local process index: 3
+Device: cuda:3
+
+Mixed precision type: no
+
+02/04/2024 13:00:28 - INFO - __main__ - Distributed environment: DistributedType.MULTI_GPU  Backend: nccl
+Num processes: 8
+Process index: 1
+Local process index: 1
+Device: cuda:1
+
+Mixed precision type: no
+
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/.venv/lib/python3.11/site-packages/transformers/models/t5/tokenization_t5.py:240: FutureWarning: This tokenizer was incorrectly instantiated with a model max length of 512 which will be corrected in Transformers v5.
+For now, this behavior is kept to avoid breaking backwards compatibility when padding/encoding with `truncation is True`.
+- Be aware that you SHOULD NOT rely on t5-large automatically truncating your input to 512 when padding/encoding.
+- If you want to encode/pad to sequences longer than 512 you can either instantiate this tokenizer with `model_max_length` or pass `max_length` when encoding/padding.
+- To avoid this warning, please instantiate this tokenizer with `model_max_length` set to your preferred value.
+  warnings.warn(
+You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thouroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565
+Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
+You are using a model of type clip_text_model to instantiate a model of type . This is not supported for all configurations of models and can yield errors.
+{'clip_sample_range', 'timestep_spacing', 'thresholding', 'variance_type', 'dynamic_thresholding_ratio', 'sample_max_value'} was not found in config. Values will be initialized to default values.
+{'scaling_factor', 'force_upcast'} was not found in config. Values will be initialized to default values.
+{'upcast_attention', 'num_attention_heads', 'mid_block_only_cross_attention', 'cross_attention_norm', 'conv_out_kernel', 'encoder_hid_dim', 'addition_time_embed_dim', 'class_embed_type', 'time_embedding_dim', 'timestep_post_act', 'resnet_time_scale_shift', 'resnet_skip_time_act', 'attention_type', 'reverse_transformer_layers_per_block', 'conv_in_kernel', 'transformer_layers_per_block', 'projection_class_embeddings_input_dim', 'addition_embed_type_num_heads', 'mid_block_type', 'dropout', 'addition_embed_type', 'time_cond_proj_dim', 'encoder_hid_dim_type', 'time_embedding_type', 'class_embeddings_concat', 'resnet_out_scale_factor', 'time_embedding_act_fn'} was not found in config. Values will be initialized to default values.
+02/04/2024 13:01:18 - INFO - __main__ - Initializing controlnet weights from unet
+wandb: Currently logged in as: armanzarei. Use `wandb login --relogin` to force relogin
+wandb: wandb version 0.16.2 is available!  To upgrade, please run:
+wandb:  $ pip install wandb --upgrade
+wandb: Tracking run with wandb version 0.16.1
+wandb: Run data is saved locally in /cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/examples/controlnet/wandb/run-20240204_130216-tmxxyw1d
+wandb: Run `wandb offline` to turn off syncing.
+wandb: Syncing run legendary-dust-1
+wandb: ⭐️ View project at https://wandb.ai/armanzarei/only_t5_large_controlnet
+wandb: 🚀 View run at https://wandb.ai/armanzarei/only_t5_large_controlnet/runs/tmxxyw1d
+02/04/2024 13:02:19 - INFO - __main__ - ***** Models & Arguments *****
+02/04/2024 13:02:19 - INFO - __main__ -   T5 Text Encoder Model = t5-large (Output Dim = 1024)
+02/04/2024 13:02:19 - INFO - __main__ - ***** Running training *****
+02/04/2024 13:02:19 - INFO - __main__ -   Num examples = 566747
+02/04/2024 13:02:19 - INFO - __main__ -   Num batches each epoch = 17711
+02/04/2024 13:02:19 - INFO - __main__ -   Num Epochs = 1
+02/04/2024 13:02:19 - INFO - __main__ -   Instantaneous batch size per device = 4
+02/04/2024 13:02:19 - INFO - __main__ -   Total train batch size (w. parallel, distributed & accumulation) = 32
+02/04/2024 13:02:19 - INFO - __main__ -   Gradient Accumulation steps = 1
+02/04/2024 13:02:19 - INFO - __main__ -   Total optimization steps = 15001
+Steps:   0%|          | 0/15001 [00:00<?, ?it/s]Steps:   0%|          | 1/15001 [00:08<36:43:43,  8.81s/it]Steps:   0%|          | 1/15001 [00:08<36:43:43,  8.81s/it, loss=0.121, lr=1e-5]Steps:   0%|          | 2/15001 [00:10<19:36:45,  4.71s/it, loss=0.121, lr=1e-5]Steps:   0%|          | 2/15001 [00:10<19:36:45,  4.71s/it, loss=0.141, lr=1e-5]Steps:   0%|          | 3/15001 [00:12<14:19:02,  3.44s/it, loss=0.141, lr=1e-5]Steps:   0%|          | 3/15001 [00:12<14:19:02,  3.44s/it, loss=0.0263, lr=1e-5]Steps:   0%|          | 4/15001 [00:14<11:50:43,  2.84s/it, loss=0.0263, lr=1e-5]Steps:   0%|          | 4/15001 [00:14<11:50:43,  2.84s/it, loss=0.226, lr=1e-5] Steps:   0%|          | 5/15001 [00:16<10:21:55,  2.49s/it, loss=0.226, lr=1e-5]Steps:   0%|          | 5/15001 [00:16<10:21:55,  2.49s/it, loss=0.159, lr=1e-5]Steps:   0%|          | 6/15001 [00:18<9:28:18,  2.27s/it, loss=0.159, lr=1e-5] Steps:   0%|          | 6/15001 [00:18<9:28:18,  2.27s/it, loss=0.385, lr=1e-5]Steps:   0%|          | 7/15001 [00:21<10:30:40,  2.52s/it, loss=0.385, lr=1e-5]Steps:   0%|          | 7/15001 [00:21<10:30:40,  2.52s/it, loss=0.271, lr=1e-5]Steps:   0%|          | 8/15001 [00:22<9:23:32,  2.26s/it, loss=0.271, lr=1e-5] Steps:   0%|          | 8/15001 [00:22<9:23:32,  2.26s/it, loss=0.276, lr=1e-5]Steps:   0%|          | 9/15001 [00:24<8:30:00,  2.04s/it, loss=0.276, lr=1e-5]Steps:   0%|          | 9/15001 [00:24<8:30:00,  2.04s/it, loss=0.163, lr=1e-5]Steps:   0%|          | 10/15001 [00:26<8:19:42,  2.00s/it, loss=0.163, lr=1e-5]Steps:   0%|          | 10/15001 [00:26<8:19:42,  2.00s/it, loss=0.162, lr=1e-5]Steps:   0%|          | 11/15001 [00:28<8:19:58,  2.00s/it, loss=0.162, lr=1e-5]Steps:   0%|          | 11/15001 [00:28<8:19:58,  2.00s/it, loss=0.231, lr=1e-5]Steps:   0%|          | 12/15001 [00:30<7:59:38,  1.92s/it, loss=0.231, lr=1e-5]Steps:   0%|          | 12/15001 [00:30<7:59:38,  1.92s/it, loss=0.161, lr=1e-5]Steps:   0%|          | 13/15001 [00:32<8:09:16,  1.96s/it, loss=0.161, lr=1e-5]Steps:   0%|          | 13/15001 [00:32<8:09:16,  1.96s/it, loss=0.332, lr=1e-5]Steps:   0%|          | 14/15001 [00:34<8:25:09,  2.02s/it, loss=0.332, lr=1e-5]Steps:   0%|          | 14/15001 [00:34<8:25:09,  2.02s/it, loss=0.168, lr=1e-5]Steps:   0%|          | 15/15001 [00:36<8:16:58,  1.99s/it, loss=0.168, lr=1e-5]Steps:   0%|          | 15/15001 [00:36<8:16:58,  1.99s/it, loss=0.269, lr=1e-5]Steps:   0%|          | 16/15001 [00:38<8:21:33,  2.01s/it, loss=0.269, lr=1e-5]Steps:   0%|          | 16/15001 [00:38<8:21:33,  2.01s/it, loss=0.0931, lr=1e-5]Steps:   0%|          | 17/15001 [00:40<8:21:17,  2.01s/it, loss=0.0931, lr=1e-5]Steps:   0%|          | 17/15001 [00:40<8:21:17,  2.01s/it, loss=0.308, lr=1e-5] Steps:   0%|          | 18/15001 [00:41<7:52:48,  1.89s/it, loss=0.308, lr=1e-5]Steps:   0%|          | 18/15001 [00:42<7:52:48,  1.89s/it, loss=0.0127, lr=1e-5]Steps:   0%|          | 19/15001 [00:43<7:57:32,  1.91s/it, loss=0.0127, lr=1e-5]Steps:   0%|          | 19/15001 [00:44<7:57:32,  1.91s/it, loss=0.198, lr=1e-5] Steps:   0%|          | 20/15001 [00:45<7:38:35,  1.84s/it, loss=0.198, lr=1e-5]Steps:   0%|          | 20/15001 [00:45<7:38:35,  1.84s/it, loss=0.165, lr=1e-5]Steps:   0%|          | 21/15001 [00:47<7:46:19,  1.87s/it, loss=0.165, lr=1e-5]Steps:   0%|          | 21/15001 [00:47<7:46:19,  1.87s/it, loss=0.148, lr=1e-5]Steps:   0%|          | 22/15001 [00:49<7:59:52,  1.92s/it, loss=0.148, lr=1e-5]Steps:   0%|          | 22/15001 [00:49<7:59:52,  1.92s/it, loss=0.323, lr=1e-5]Steps:   0%|          | 23/15001 [00:51<7:53:47,  1.90s/it, loss=0.323, lr=1e-5]Steps:   0%|          | 23/15001 [00:51<7:53:47,  1.90s/it, loss=0.164, lr=1e-5]Steps:   0%|          | 24/15001 [00:52<7:28:57,  1.80s/it, loss=0.164, lr=1e-5]Steps:   0%|          | 24/15001 [00:53<7:28:57,  1.80s/it, loss=0.121, lr=1e-5]Steps:   0%|          | 25/15001 [00:54<7:28:36,  1.80s/it, loss=0.121, lr=1e-5]Steps:   0%|          | 25/15001 [00:55<7:28:36,  1.80s/it, loss=0.245, lr=1e-5]Steps:   0%|          | 26/15001 [00:56<7:51:14,  1.89s/it, loss=0.245, lr=1e-5]Steps:   0%|          | 26/15001 [00:57<7:51:14,  1.89s/it, loss=0.236, lr=1e-5]Steps:   0%|          | 27/15001 [00:58<7:52:16,  1.89s/it, loss=0.236, lr=1e-5]Steps:   0%|          | 27/15001 [00:58<7:52:16,  1.89s/it, loss=0.0748, lr=1e-5]Steps:   0%|          | 28/15001 [01:00<7:31:40,  1.81s/it, loss=0.0748, lr=1e-5]Steps:   0%|          | 28/15001 [01:00<7:31:40,  1.81s/it, loss=0.152, lr=1e-5] Steps:   0%|          | 29/15001 [01:02<7:45:03,  1.86s/it, loss=0.152, lr=1e-5]Steps:   0%|          | 29/15001 [01:02<7:45:03,  1.86s/it, loss=0.0206, lr=1e-5]Steps:   0%|          | 30/15001 [01:04<7:44:00,  1.86s/it, loss=0.0206, lr=1e-5]Steps:   0%|          | 30/15001 [01:04<7:44:00,  1.86s/it, loss=0.0594, lr=1e-5]Steps:   0%|          | 31/15001 [01:05<7:26:20,  1.79s/it, loss=0.0594, lr=1e-5]Steps:   0%|          | 31/15001 [01:06<7:26:20,  1.79s/it, loss=0.108, lr=1e-5] Steps:   0%|          | 32/15001 [01:07<7:37:19,  1.83s/it, loss=0.108, lr=1e-5]Steps:   0%|          | 32/15001 [01:09<7:37:19,  1.83s/it, loss=0.359, lr=1e-5]Steps:   0%|          | 33/15001 [01:10<9:01:47,  2.17s/it, loss=0.359, lr=1e-5]Steps:   0%|          | 33/15001 [01:10<9:01:47,  2.17s/it, loss=0.185, lr=1e-5]Steps:   0%|          | 34/15001 [01:12<8:44:55,  2.10s/it, loss=0.185, lr=1e-5]Steps:   0%|          | 34/15001 [01:12<8:44:55,  2.10s/it, loss=0.222, lr=1e-5]Steps:   0%|          | 35/15001 [01:14<8:38:18,  2.08s/it, loss=0.222, lr=1e-5]Steps:   0%|          | 35/15001 [01:14<8:38:18,  2.08s/it, loss=0.114, lr=1e-5]Steps:   0%|          | 36/15001 [01:16<8:33:49,  2.06s/it, loss=0.114, lr=1e-5]Steps:   0%|          | 36/15001 [01:16<8:33:49,  2.06s/it, loss=0.304, lr=1e-5]Steps:   0%|          | 37/15001 [01:18<8:34:00,  2.06s/it, loss=0.304, lr=1e-5]Steps:   0%|          | 37/15001 [01:18<8:34:00,  2.06s/it, loss=0.125, lr=1e-5]Steps:   0%|          | 38/15001 [01:20<8:38:27,  2.08s/it, loss=0.125, lr=1e-5]Steps:   0%|          | 38/15001 [01:21<8:38:27,  2.08s/it, loss=0.233, lr=1e-5]Steps:   0%|          | 39/15001 [01:22<8:28:45,  2.04s/it, loss=0.233, lr=1e-5]Steps:   0%|          | 39/15001 [01:22<8:28:45,  2.04s/it, loss=0.193, lr=1e-5]Steps:   0%|          | 40/15001 [01:24<8:07:11,  1.95s/it, loss=0.193, lr=1e-5]Steps:   0%|          | 40/15001 [01:25<8:07:11,  1.95s/it, loss=0.102, lr=1e-5]Steps:   0%|          | 41/15001 [01:26<8:02:20,  1.93s/it, loss=0.102, lr=1e-5]Steps:   0%|          | 41/15001 [01:26<8:02:20,  1.93s/it, loss=0.192, lr=1e-5]Steps:   0%|          | 42/15001 [01:28<8:04:09,  1.94s/it, loss=0.192, lr=1e-5]Steps:   0%|          | 42/15001 [01:28<8:04:09,  1.94s/it, loss=0.276, lr=1e-5]Steps:   0%|          | 43/15001 [01:30<8:07:48,  1.96s/it, loss=0.276, lr=1e-5]Steps:   0%|          | 43/15001 [01:30<8:07:48,  1.96s/it, loss=0.111, lr=1e-5]Steps:   0%|          | 44/15001 [01:32<7:44:11,  1.86s/it, loss=0.111, lr=1e-5]Steps:   0%|          | 44/15001 [01:32<7:44:11,  1.86s/it, loss=0.0665, lr=1e-5]Steps:   0%|          | 45/15001 [01:34<7:52:38,  1.90s/it, loss=0.0665, lr=1e-5]Steps:   0%|          | 45/15001 [01:34<7:52:38,  1.90s/it, loss=0.0312, lr=1e-5]Steps:   0%|          | 46/15001 [01:35<7:41:47,  1.85s/it, loss=0.0312, lr=1e-5]Steps:   0%|          | 46/15001 [01:36<7:41:47,  1.85s/it, loss=0.223, lr=1e-5] Steps:   0%|          | 47/15001 [01:37<7:48:18,  1.88s/it, loss=0.223, lr=1e-5]Steps:   0%|          | 47/15001 [01:37<7:48:18,  1.88s/it, loss=0.43, lr=1e-5] Steps:   0%|          | 48/15001 [01:39<7:59:08,  1.92s/it, loss=0.43, lr=1e-5]Steps:   0%|          | 48/15001 [01:39<7:59:08,  1.92s/it, loss=0.0699, lr=1e-5]Steps:   0%|          | 49/15001 [01:41<7:38:10,  1.84s/it, loss=0.0699, lr=1e-5]Steps:   0%|          | 49/15001 [01:41<7:38:10,  1.84s/it, loss=0.0709, lr=1e-5]Steps:   0%|          | 50/15001 [01:43<7:49:29,  1.88s/it, loss=0.0709, lr=1e-5]Steps:   0%|          | 50/15001 [01:43<7:49:29,  1.88s/it, loss=0.36, lr=1e-5]  Steps:   0%|          | 51/15001 [01:45<7:51:54,  1.89s/it, loss=0.36, lr=1e-5]Steps:   0%|          | 51/15001 [01:45<7:51:54,  1.89s/it, loss=0.0936, lr=1e-5]Steps:   0%|          | 52/15001 [01:47<7:51:13,  1.89s/it, loss=0.0936, lr=1e-5]Steps:   0%|          | 52/15001 [01:47<7:51:13,  1.89s/it, loss=0.062, lr=1e-5] Steps:   0%|          | 53/15001 [01:48<7:40:17,  1.85s/it, loss=0.062, lr=1e-5]Steps:   0%|          | 53/15001 [01:49<7:40:17,  1.85s/it, loss=0.0976, lr=1e-5]Steps:   0%|          | 54/15001 [01:50<7:21:34,  1.77s/it, loss=0.0976, lr=1e-5]Steps:   0%|          | 54/15001 [01:50<7:21:34,  1.77s/it, loss=0.255, lr=1e-5] Steps:   0%|          | 55/15001 [01:52<7:33:08,  1.82s/it, loss=0.255, lr=1e-5]Steps:   0%|          | 55/15001 [01:52<7:33:08,  1.82s/it, loss=0.203, lr=1e-5]Steps:   0%|          | 56/15001 [01:54<7:32:26,  1.82s/it, loss=0.203, lr=1e-5]Steps:   0%|          | 56/15001 [01:54<7:32:26,  1.82s/it, loss=0.14, lr=1e-5] Steps:   0%|          | 57/15001 [01:56<7:32:09,  1.82s/it, loss=0.14, lr=1e-5]Steps:   0%|          | 57/15001 [01:56<7:32:09,  1.82s/it, loss=0.117, lr=1e-5]Steps:   0%|          | 58/15001 [01:58<8:03:38,  1.94s/it, loss=0.117, lr=1e-5]Steps:   0%|          | 58/15001 [01:58<8:03:38,  1.94s/it, loss=0.129, lr=1e-5]Steps:   0%|          | 59/15001 [02:00<8:00:23,  1.93s/it, loss=0.129, lr=1e-5]Steps:   0%|          | 59/15001 [02:00<8:00:23,  1.93s/it, loss=0.118, lr=1e-5]Steps:   0%|          | 60/15001 [02:02<8:19:10,  2.00s/it, loss=0.118, lr=1e-5]Steps:   0%|          | 60/15001 [02:02<8:19:10,  2.00s/it, loss=0.0634, lr=1e-5]Steps:   0%|          | 61/15001 [02:04<8:27:19,  2.04s/it, loss=0.0634, lr=1e-5]Steps:   0%|          | 61/15001 [02:04<8:27:19,  2.04s/it, loss=0.0441, lr=1e-5]Steps:   0%|          | 62/15001 [02:06<8:34:17,  2.07s/it, loss=0.0441, lr=1e-5]Steps:   0%|          | 62/15001 [02:06<8:34:17,  2.07s/it, loss=0.282, lr=1e-5] Steps:   0%|          | 63/15001 [02:08<8:16:38,  1.99s/it, loss=0.282, lr=1e-5]Steps:   0%|          | 63/15001 [02:08<8:16:38,  1.99s/it, loss=0.202, lr=1e-5]Steps:   0%|          | 64/15001 [02:10<8:06:40,  1.95s/it, loss=0.202, lr=1e-5]Steps:   0%|          | 64/15001 [02:10<8:06:40,  1.95s/it, loss=0.135, lr=1e-5]Steps:   0%|          | 65/15001 [02:12<7:52:15,  1.90s/it, loss=0.135, lr=1e-5]Steps:   0%|          | 65/15001 [02:12<7:52:15,  1.90s/it, loss=0.228, lr=1e-5]Steps:   0%|          | 66/15001 [02:13<7:32:06,  1.82s/it, loss=0.228, lr=1e-5]Steps:   0%|          | 66/15001 [02:14<7:32:06,  1.82s/it, loss=0.0724, lr=1e-5]Steps:   0%|          | 67/15001 [02:15<7:40:47,  1.85s/it, loss=0.0724, lr=1e-5]Steps:   0%|          | 67/15001 [02:15<7:40:47,  1.85s/it, loss=0.0945, lr=1e-5]Steps:   0%|          | 68/15001 [02:17<7:42:17,  1.86s/it, loss=0.0945, lr=1e-5]Steps:   0%|          | 68/15001 [02:17<7:42:17,  1.86s/it, loss=0.175, lr=1e-5] Steps:   0%|          | 69/15001 [02:19<7:37:10,  1.84s/it, loss=0.175, lr=1e-5]Steps:   0%|          | 69/15001 [02:19<7:37:10,  1.84s/it, loss=0.0483, lr=1e-5]Steps:   0%|          | 70/15001 [02:21<7:30:33,  1.81s/it, loss=0.0483, lr=1e-5]Steps:   0%|          | 70/15001 [02:21<7:30:33,  1.81s/it, loss=0.2, lr=1e-5]   Steps:   0%|          | 71/15001 [02:22<7:35:29,  1.83s/it, loss=0.2, lr=1e-5]Steps:   0%|          | 71/15001 [02:23<7:35:29,  1.83s/it, loss=0.0853, lr=1e-5]Steps:   0%|          | 72/15001 [02:24<7:29:35,  1.81s/it, loss=0.0853, lr=1e-5]Steps:   0%|          | 72/15001 [02:24<7:29:35,  1.81s/it, loss=0.204, lr=1e-5] Steps:   0%|          | 73/15001 [02:26<7:34:18,  1.83s/it, loss=0.204, lr=1e-5]Steps:   0%|          | 73/15001 [02:26<7:34:18,  1.83s/it, loss=0.126, lr=1e-5]Steps:   0%|          | 74/15001 [02:28<7:53:51,  1.90s/it, loss=0.126, lr=1e-5]Steps:   0%|          | 74/15001 [02:28<7:53:51,  1.90s/it, loss=0.0971, lr=1e-5]Steps:   0%|          | 75/15001 [02:30<7:41:58,  1.86s/it, loss=0.0971, lr=1e-5]Steps:   0%|          | 75/15001 [02:30<7:41:58,  1.86s/it, loss=0.177, lr=1e-5] Steps:   1%|          | 76/15001 [02:31<7:15:35,  1.75s/it, loss=0.177, lr=1e-5]Steps:   1%|          | 76/15001 [02:32<7:15:35,  1.75s/it, loss=0.12, lr=1e-5] Steps:   1%|          | 77/15001 [02:34<7:40:34,  1.85s/it, loss=0.12, lr=1e-5]Steps:   1%|          | 77/15001 [02:34<7:40:34,  1.85s/it, loss=0.136, lr=1e-5]Steps:   1%|          | 78/15001 [02:36<8:00:02,  1.93s/it, loss=0.136, lr=1e-5]Steps:   1%|          | 78/15001 [02:36<8:00:02,  1.93s/it, loss=0.0617, lr=1e-5]Steps:   1%|          | 79/15001 [02:37<7:47:51,  1.88s/it, loss=0.0617, lr=1e-5]Steps:   1%|          | 79/15001 [02:38<7:47:51,  1.88s/it, loss=0.206, lr=1e-5] Steps:   1%|          | 80/15001 [02:39<7:48:08,  1.88s/it, loss=0.206, lr=1e-5]Steps:   1%|          | 80/15001 [02:39<7:48:08,  1.88s/it, loss=0.0877, lr=1e-5]Steps:   1%|          | 81/15001 [02:41<8:03:02,  1.94s/it, loss=0.0877, lr=1e-5]Steps:   1%|          | 81/15001 [02:42<8:03:02,  1.94s/it, loss=0.136, lr=1e-5] Steps:   1%|          | 82/15001 [02:43<7:54:24,  1.91s/it, loss=0.136, lr=1e-5]Steps:   1%|          | 82/15001 [02:44<7:54:24,  1.91s/it, loss=0.112, lr=1e-5]Steps:   1%|          | 83/15001 [02:45<8:00:45,  1.93s/it, loss=0.112, lr=1e-5]Steps:   1%|          | 83/15001 [02:46<8:00:45,  1.93s/it, loss=0.149, lr=1e-5]Steps:   1%|          | 84/15001 [02:47<8:24:10,  2.03s/it, loss=0.149, lr=1e-5]Steps:   1%|          | 84/15001 [02:48<8:24:10,  2.03s/it, loss=0.317, lr=1e-5]Steps:   1%|          | 85/15001 [02:49<8:18:49,  2.01s/it, loss=0.317, lr=1e-5]Steps:   1%|          | 85/15001 [02:50<8:18:49,  2.01s/it, loss=0.0626, lr=1e-5]Steps:   1%|          | 86/15001 [02:51<8:02:01,  1.94s/it, loss=0.0626, lr=1e-5]Steps:   1%|          | 86/15001 [02:51<8:02:01,  1.94s/it, loss=0.188, lr=1e-5] Steps:   1%|          | 87/15001 [02:53<7:59:01,  1.93s/it, loss=0.188, lr=1e-5]Steps:   1%|          | 87/15001 [02:53<7:59:01,  1.93s/it, loss=0.145, lr=1e-5]Steps:   1%|          | 88/15001 [02:55<7:45:23,  1.87s/it, loss=0.145, lr=1e-5]Steps:   1%|          | 88/15001 [02:55<7:45:23,  1.87s/it, loss=0.185, lr=1e-5]Steps:   1%|          | 89/15001 [02:57<7:56:06,  1.92s/it, loss=0.185, lr=1e-5]Steps:   1%|          | 89/15001 [02:57<7:56:06,  1.92s/it, loss=0.177, lr=1e-5]Steps:   1%|          | 90/15001 [02:59<7:46:52,  1.88s/it, loss=0.177, lr=1e-5]Steps:   1%|          | 90/15001 [02:59<7:46:52,  1.88s/it, loss=0.389, lr=1e-5]Steps:   1%|          | 91/15001 [03:00<7:36:40,  1.84s/it, loss=0.389, lr=1e-5]Steps:   1%|          | 91/15001 [03:01<7:36:40,  1.84s/it, loss=0.092, lr=1e-5]Steps:   1%|          | 92/15001 [03:03<8:00:24,  1.93s/it, loss=0.092, lr=1e-5]Steps:   1%|          | 92/15001 [03:03<8:00:24,  1.93s/it, loss=0.245, lr=1e-5]Steps:   1%|          | 93/15001 [03:04<7:50:17,  1.89s/it, loss=0.245, lr=1e-5]Steps:   1%|          | 93/15001 [03:05<7:50:17,  1.89s/it, loss=0.168, lr=1e-5]Steps:   1%|          | 94/15001 [03:06<7:48:31,  1.89s/it, loss=0.168, lr=1e-5]Steps:   1%|          | 94/15001 [03:06<7:48:31,  1.89s/it, loss=0.0996, lr=1e-5]Steps:   1%|          | 95/15001 [03:08<7:36:13,  1.84s/it, loss=0.0996, lr=1e-5]Steps:   1%|          | 95/15001 [03:08<7:36:13,  1.84s/it, loss=0.452, lr=1e-5] Steps:   1%|          | 96/15001 [03:10<7:28:59,  1.81s/it, loss=0.452, lr=1e-5]Steps:   1%|          | 96/15001 [03:10<7:28:59,  1.81s/it, loss=0.108, lr=1e-5]Steps:   1%|          | 97/15001 [03:12<7:37:42,  1.84s/it, loss=0.108, lr=1e-5]Steps:   1%|          | 97/15001 [03:12<7:37:42,  1.84s/it, loss=0.266, lr=1e-5]Steps:   1%|          | 98/15001 [03:13<7:41:26,  1.86s/it, loss=0.266, lr=1e-5]Steps:   1%|          | 98/15001 [03:14<7:41:26,  1.86s/it, loss=0.203, lr=1e-5]Steps:   1%|          | 99/15001 [03:15<7:44:17,  1.87s/it, loss=0.203, lr=1e-5]Steps:   1%|          | 99/15001 [03:16<7:44:17,  1.87s/it, loss=0.132, lr=1e-5]Steps:   1%|          | 100/15001 [03:17<7:33:48,  1.83s/it, loss=0.132, lr=1e-5]Steps:   1%|          | 100/15001 [03:17<7:33:48,  1.83s/it, loss=0.0446, lr=1e-5]Steps:   1%|          | 101/15001 [03:19<7:30:50,  1.82s/it, loss=0.0446, lr=1e-5]Steps:   1%|          | 101/15001 [03:19<7:30:50,  1.82s/it, loss=0.161, lr=1e-5] Steps:   1%|          | 102/15001 [03:21<7:40:07,  1.85s/it, loss=0.161, lr=1e-5]Steps:   1%|          | 102/15001 [03:21<7:40:07,  1.85s/it, loss=0.224, lr=1e-5]Steps:   1%|          | 103/15001 [03:23<8:03:04,  1.95s/it, loss=0.224, lr=1e-5]Steps:   1%|          | 103/15001 [03:23<8:03:04,  1.95s/it, loss=0.151, lr=1e-5]Steps:   1%|          | 104/15001 [03:25<8:19:47,  2.01s/it, loss=0.151, lr=1e-5]Steps:   1%|          | 104/15001 [03:25<8:19:47,  2.01s/it, loss=0.047, lr=1e-5]Steps:   1%|          | 105/15001 [03:27<8:15:02,  1.99s/it, loss=0.047, lr=1e-5]Steps:   1%|          | 105/15001 [03:27<8:15:02,  1.99s/it, loss=0.0749, lr=1e-5]Steps:   1%|          | 106/15001 [03:29<8:06:24,  1.96s/it, loss=0.0749, lr=1e-5]Steps:   1%|          | 106/15001 [03:29<8:06:24,  1.96s/it, loss=0.41, lr=1e-5]  Steps:   1%|          | 107/15001 [03:31<8:25:40,  2.04s/it, loss=0.41, lr=1e-5]Steps:   1%|          | 107/15001 [03:31<8:25:40,  2.04s/it, loss=0.194, lr=1e-5]Steps:   1%|          | 108/15001 [03:33<8:14:20,  1.99s/it, loss=0.194, lr=1e-5]Steps:   1%|          | 108/15001 [03:33<8:14:20,  1.99s/it, loss=0.0477, lr=1e-5]Steps:   1%|          | 109/15001 [03:35<7:52:34,  1.90s/it, loss=0.0477, lr=1e-5]Steps:   1%|          | 109/15001 [03:35<7:52:34,  1.90s/it, loss=0.208, lr=1e-5] Steps:   1%|          | 110/15001 [03:37<8:14:02,  1.99s/it, loss=0.208, lr=1e-5]Steps:   1%|          | 110/15001 [03:37<8:14:02,  1.99s/it, loss=0.134, lr=1e-5]Steps:   1%|          | 111/15001 [03:39<7:53:16,  1.91s/it, loss=0.134, lr=1e-5]Steps:   1%|          | 111/15001 [03:39<7:53:16,  1.91s/it, loss=0.2, lr=1e-5]  Steps:   1%|          | 112/15001 [03:41<7:52:04,  1.90s/it, loss=0.2, lr=1e-5]Steps:   1%|          | 112/15001 [03:41<7:52:04,  1.90s/it, loss=0.201, lr=1e-5]Steps:   1%|          | 113/15001 [03:42<7:49:21,  1.89s/it, loss=0.201, lr=1e-5]Steps:   1%|          | 113/15001 [03:43<7:49:21,  1.89s/it, loss=0.225, lr=1e-5]Steps:   1%|          | 114/15001 [03:44<7:36:58,  1.84s/it, loss=0.225, lr=1e-5]Steps:   1%|          | 114/15001 [03:44<7:36:58,  1.84s/it, loss=0.0519, lr=1e-5]Steps:   1%|          | 115/15001 [03:46<7:33:35,  1.83s/it, loss=0.0519, lr=1e-5]Steps:   1%|          | 115/15001 [03:46<7:33:35,  1.83s/it, loss=0.262, lr=1e-5] Steps:   1%|          | 116/15001 [03:48<7:43:50,  1.87s/it, loss=0.262, lr=1e-5]Steps:   1%|          | 116/15001 [03:48<7:43:50,  1.87s/it, loss=0.137, lr=1e-5]Steps:   1%|          | 117/15001 [03:50<7:39:36,  1.85s/it, loss=0.137, lr=1e-5]Steps:   1%|          | 117/15001 [03:50<7:39:36,  1.85s/it, loss=0.394, lr=1e-5]Steps:   1%|          | 118/15001 [03:51<7:21:32,  1.78s/it, loss=0.394, lr=1e-5]Steps:   1%|          | 118/15001 [03:52<7:21:32,  1.78s/it, loss=0.13, lr=1e-5] Steps:   1%|          | 119/15001 [03:53<7:35:55,  1.84s/it, loss=0.13, lr=1e-5]Steps:   1%|          | 119/15001 [03:53<7:35:55,  1.84s/it, loss=0.189, lr=1e-5]Steps:   1%|          | 120/15001 [03:55<7:25:56,  1.80s/it, loss=0.189, lr=1e-5]Steps:   1%|          | 120/15001 [03:55<7:25:56,  1.80s/it, loss=0.106, lr=1e-5]Steps:   1%|          | 121/15001 [03:57<7:30:52,  1.82s/it, loss=0.106, lr=1e-5]Steps:   1%|          | 121/15001 [03:57<7:30:52,  1.82s/it, loss=0.274, lr=1e-5]Steps:   1%|          | 122/15001 [03:59<7:38:33,  1.85s/it, loss=0.274, lr=1e-5]Steps:   1%|          | 122/15001 [03:59<7:38:33,  1.85s/it, loss=0.26, lr=1e-5] Steps:   1%|          | 123/15001 [04:01<7:37:17,  1.84s/it, loss=0.26, lr=1e-5]Steps:   1%|          | 123/15001 [04:01<7:37:17,  1.84s/it, loss=0.254, lr=1e-5]Steps:   1%|          | 124/15001 [04:03<7:42:20,  1.86s/it, loss=0.254, lr=1e-5]Steps:   1%|          | 124/15001 [04:03<7:42:20,  1.86s/it, loss=0.273, lr=1e-5]Steps:   1%|          | 125/15001 [04:05<7:53:07,  1.91s/it, loss=0.273, lr=1e-5]Steps:   1%|          | 125/15001 [04:05<7:53:07,  1.91s/it, loss=0.174, lr=1e-5]Steps:   1%|          | 126/15001 [04:06<7:42:47,  1.87s/it, loss=0.174, lr=1e-5]Steps:   1%|          | 126/15001 [04:07<7:42:47,  1.87s/it, loss=0.267, lr=1e-5]Steps:   1%|          | 127/15001 [04:09<8:09:14,  1.97s/it, loss=0.267, lr=1e-5]Steps:   1%|          | 127/15001 [04:09<8:09:14,  1.97s/it, loss=0.0495, lr=1e-5]Steps:   1%|          | 128/15001 [04:11<8:07:42,  1.97s/it, loss=0.0495, lr=1e-5]Steps:   1%|          | 128/15001 [04:11<8:07:42,  1.97s/it, loss=0.0709, lr=1e-5]Steps:   1%|          | 129/15001 [04:13<8:08:51,  1.97s/it, loss=0.0709, lr=1e-5]Steps:   1%|          | 129/15001 [04:13<8:08:51,  1.97s/it, loss=0.0498, lr=1e-5]Steps:   1%|          | 130/15001 [04:15<8:41:32,  2.10s/it, loss=0.0498, lr=1e-5]Steps:   1%|          | 130/15001 [04:15<8:41:32,  2.10s/it, loss=0.328, lr=1e-5] Steps:   1%|          | 131/15001 [04:17<8:14:30,  2.00s/it, loss=0.328, lr=1e-5]Steps:   1%|          | 131/15001 [04:17<8:14:30,  2.00s/it, loss=0.239, lr=1e-5]Steps:   1%|          | 132/15001 [04:18<7:59:34,  1.94s/it, loss=0.239, lr=1e-5]Steps:   1%|          | 132/15001 [04:19<7:59:34,  1.94s/it, loss=0.241, lr=1e-5]Steps:   1%|          | 133/15001 [04:20<7:57:55,  1.93s/it, loss=0.241, lr=1e-5]Steps:   1%|          | 133/15001 [04:20<7:57:55,  1.93s/it, loss=0.21, lr=1e-5] Steps:   1%|          | 134/15001 [04:22<7:37:34,  1.85s/it, loss=0.21, lr=1e-5]Steps:   1%|          | 134/15001 [04:22<7:37:34,  1.85s/it, loss=0.152, lr=1e-5]Steps:   1%|          | 135/15001 [04:24<7:30:14,  1.82s/it, loss=0.152, lr=1e-5]Steps:   1%|          | 135/15001 [04:24<7:30:14,  1.82s/it, loss=0.189, lr=1e-5]Steps:   1%|          | 136/15001 [04:26<7:39:32,  1.85s/it, loss=0.189, lr=1e-5]Steps:   1%|          | 136/15001 [04:26<7:39:32,  1.85s/it, loss=0.228, lr=1e-5]Steps:   1%|          | 137/15001 [04:28<7:44:39,  1.88s/it, loss=0.228, lr=1e-5]Steps:   1%|          | 137/15001 [04:28<7:44:39,  1.88s/it, loss=0.168, lr=1e-5]Steps:   1%|          | 138/15001 [04:30<7:49:00,  1.89s/it, loss=0.168, lr=1e-5]Steps:   1%|          | 138/15001 [04:30<7:49:00,  1.89s/it, loss=0.217, lr=1e-5]Steps:   1%|          | 139/15001 [04:31<7:31:20,  1.82s/it, loss=0.217, lr=1e-5]Steps:   1%|          | 139/15001 [04:31<7:31:20,  1.82s/it, loss=0.243, lr=1e-5]Steps:   1%|          | 140/15001 [04:33<7:32:51,  1.83s/it, loss=0.243, lr=1e-5]Steps:   1%|          | 140/15001 [04:33<7:32:51,  1.83s/it, loss=0.189, lr=1e-5]Steps:   1%|          | 141/15001 [04:35<7:26:43,  1.80s/it, loss=0.189, lr=1e-5]Steps:   1%|          | 141/15001 [04:35<7:26:43,  1.80s/it, loss=0.115, lr=1e-5]Steps:   1%|          | 142/15001 [04:37<7:41:50,  1.86s/it, loss=0.115, lr=1e-5]Steps:   1%|          | 142/15001 [04:37<7:41:50,  1.86s/it, loss=0.0581, lr=1e-5]Steps:   1%|          | 143/15001 [04:39<7:43:03,  1.87s/it, loss=0.0581, lr=1e-5]Steps:   1%|          | 143/15001 [04:39<7:43:03,  1.87s/it, loss=0.174, lr=1e-5] Steps:   1%|          | 144/15001 [04:40<7:19:08,  1.77s/it, loss=0.174, lr=1e-5]Steps:   1%|          | 144/15001 [04:41<7:19:08,  1.77s/it, loss=0.0969, lr=1e-5]Steps:   1%|          | 145/15001 [04:42<7:26:33,  1.80s/it, loss=0.0969, lr=1e-5]Steps:   1%|          | 145/15001 [04:42<7:26:33,  1.80s/it, loss=0.207, lr=1e-5] Steps:   1%|          | 146/15001 [04:44<7:26:19,  1.80s/it, loss=0.207, lr=1e-5]Steps:   1%|          | 146/15001 [04:44<7:26:19,  1.80s/it, loss=0.161, lr=1e-5]Steps:   1%|          | 147/15001 [04:46<7:52:48,  1.91s/it, loss=0.161, lr=1e-5]Steps:   1%|          | 147/15001 [04:46<7:52:48,  1.91s/it, loss=0.119, lr=1e-5]Steps:   1%|          | 148/15001 [04:48<7:42:01,  1.87s/it, loss=0.119, lr=1e-5]Steps:   1%|          | 148/15001 [04:48<7:42:01,  1.87s/it, loss=0.142, lr=1e-5]Steps:   1%|          | 149/15001 [04:50<8:21:06,  2.02s/it, loss=0.142, lr=1e-5]Steps:   1%|          | 149/15001 [04:50<8:21:06,  2.02s/it, loss=0.17, lr=1e-5] Steps:   1%|          | 150/15001 [04:52<8:15:40,  2.00s/it, loss=0.17, lr=1e-5]Steps:   1%|          | 150/15001 [04:52<8:15:40,  2.00s/it, loss=0.251, lr=1e-5]Steps:   1%|          | 151/15001 [04:54<8:19:15,  2.02s/it, loss=0.251, lr=1e-5]Steps:   1%|          | 151/15001 [04:54<8:19:15,  2.02s/it, loss=0.231, lr=1e-5]Steps:   1%|          | 152/15001 [04:56<8:24:44,  2.04s/it, loss=0.231, lr=1e-5]Steps:   1%|          | 152/15001 [04:57<8:24:44,  2.04s/it, loss=0.19, lr=1e-5] Steps:   1%|          | 153/15001 [04:58<8:20:33,  2.02s/it, loss=0.19, lr=1e-5]Steps:   1%|          | 153/15001 [04:58<8:20:33,  2.02s/it, loss=0.241, lr=1e-5]Steps:   1%|          | 154/15001 [05:00<8:08:43,  1.98s/it, loss=0.241, lr=1e-5]Steps:   1%|          | 154/15001 [05:00<8:08:43,  1.98s/it, loss=0.152, lr=1e-5]Steps:   1%|          | 155/15001 [05:02<7:54:29,  1.92s/it, loss=0.152, lr=1e-5]Steps:   1%|          | 155/15001 [05:02<7:54:29,  1.92s/it, loss=0.408, lr=1e-5]Steps:   1%|          | 156/15001 [05:04<7:28:43,  1.81s/it, loss=0.408, lr=1e-5]Steps:   1%|          | 156/15001 [05:04<7:28:43,  1.81s/it, loss=0.346, lr=1e-5]Steps:   1%|          | 157/15001 [05:05<7:24:16,  1.80s/it, loss=0.346, lr=1e-5]Steps:   1%|          | 157/15001 [05:06<7:24:16,  1.80s/it, loss=0.12, lr=1e-5] Steps:   1%|          | 158/15001 [05:07<7:37:49,  1.85s/it, loss=0.12, lr=1e-5]Steps:   1%|          | 158/15001 [05:08<7:37:49,  1.85s/it, loss=0.162, lr=1e-5]Steps:   1%|          | 159/15001 [05:09<7:36:49,  1.85s/it, loss=0.162, lr=1e-5]Steps:   1%|          | 159/15001 [05:09<7:36:49,  1.85s/it, loss=0.16, lr=1e-5] Steps:   1%|          | 160/15001 [05:11<7:52:06,  1.91s/it, loss=0.16, lr=1e-5]Steps:   1%|          | 160/15001 [05:11<7:52:06,  1.91s/it, loss=0.13, lr=1e-5]Steps:   1%|          | 161/15001 [05:13<7:39:56,  1.86s/it, loss=0.13, lr=1e-5]Steps:   1%|          | 161/15001 [05:13<7:39:56,  1.86s/it, loss=0.0249, lr=1e-5]Steps:   1%|          | 162/15001 [05:15<7:36:03,  1.84s/it, loss=0.0249, lr=1e-5]Steps:   1%|          | 162/15001 [05:15<7:36:03,  1.84s/it, loss=0.0333, lr=1e-5]Steps:   1%|          | 163/15001 [05:16<7:20:58,  1.78s/it, loss=0.0333, lr=1e-5]Steps:   1%|          | 163/15001 [05:17<7:20:58,  1.78s/it, loss=0.174, lr=1e-5] Steps:   1%|          | 164/15001 [05:19<7:47:54,  1.89s/it, loss=0.174, lr=1e-5]Steps:   1%|          | 164/15001 [05:19<7:47:54,  1.89s/it, loss=0.192, lr=1e-5]Steps:   1%|          | 165/15001 [05:20<7:43:24,  1.87s/it, loss=0.192, lr=1e-5]Steps:   1%|          | 165/15001 [05:20<7:43:24,  1.87s/it, loss=0.26, lr=1e-5] Steps:   1%|          | 166/15001 [05:22<7:31:10,  1.82s/it, loss=0.26, lr=1e-5]Steps:   1%|          | 166/15001 [05:22<7:31:10,  1.82s/it, loss=0.154, lr=1e-5]Steps:   1%|          | 167/15001 [05:24<7:23:09,  1.79s/it, loss=0.154, lr=1e-5]Steps:   1%|          | 167/15001 [05:24<7:23:09,  1.79s/it, loss=0.204, lr=1e-5]Steps:   1%|          | 168/15001 [05:26<7:35:52,  1.84s/it, loss=0.204, lr=1e-5]Steps:   1%|          | 168/15001 [05:26<7:35:52,  1.84s/it, loss=0.154, lr=1e-5]Steps:   1%|          | 169/15001 [05:27<7:24:04,  1.80s/it, loss=0.154, lr=1e-5]Steps:   1%|          | 169/15001 [05:28<7:24:04,  1.80s/it, loss=0.124, lr=1e-5]Steps:   1%|          | 170/15001 [05:29<7:37:38,  1.85s/it, loss=0.124, lr=1e-5]Steps:   1%|          | 170/15001 [05:30<7:37:38,  1.85s/it, loss=0.217, lr=1e-5]Steps:   1%|          | 171/15001 [05:32<8:18:36,  2.02s/it, loss=0.217, lr=1e-5]Steps:   1%|          | 171/15001 [05:32<8:18:36,  2.02s/it, loss=0.178, lr=1e-5]Steps:   1%|          | 172/15001 [05:34<8:27:38,  2.05s/it, loss=0.178, lr=1e-5]Steps:   1%|          | 172/15001 [05:34<8:27:38,  2.05s/it, loss=0.0956, lr=1e-5]Steps:   1%|          | 173/15001 [05:36<8:22:07,  2.03s/it, loss=0.0956, lr=1e-5]Steps:   1%|          | 173/15001 [05:36<8:22:07,  2.03s/it, loss=0.326, lr=1e-5] Steps:   1%|          | 174/15001 [05:38<8:25:28,  2.05s/it, loss=0.326, lr=1e-5]Steps:   1%|          | 174/15001 [05:38<8:25:28,  2.05s/it, loss=0.376, lr=1e-5]Steps:   1%|          | 175/15001 [05:40<8:14:37,  2.00s/it, loss=0.376, lr=1e-5]Steps:   1%|          | 175/15001 [05:40<8:14:37,  2.00s/it, loss=0.0799, lr=1e-5]Steps:   1%|          | 176/15001 [05:42<8:04:01,  1.96s/it, loss=0.0799, lr=1e-5]Steps:   1%|          | 176/15001 [05:42<8:04:01,  1.96s/it, loss=0.205, lr=1e-5] Steps:   1%|          | 177/15001 [05:44<7:57:58,  1.93s/it, loss=0.205, lr=1e-5]Steps:   1%|          | 177/15001 [05:44<7:57:58,  1.93s/it, loss=0.166, lr=1e-5]Steps:   1%|          | 178/15001 [05:46<7:52:58,  1.91s/it, loss=0.166, lr=1e-5]Steps:   1%|          | 178/15001 [05:46<7:52:58,  1.91s/it, loss=0.114, lr=1e-5]Steps:   1%|          | 179/15001 [05:47<7:24:05,  1.80s/it, loss=0.114, lr=1e-5]Steps:   1%|          | 179/15001 [05:47<7:24:05,  1.80s/it, loss=0.202, lr=1e-5]Steps:   1%|          | 180/15001 [05:49<7:34:51,  1.84s/it, loss=0.202, lr=1e-5]Steps:   1%|          | 180/15001 [05:49<7:34:51,  1.84s/it, loss=0.198, lr=1e-5]Steps:   1%|          | 181/15001 [05:51<7:37:46,  1.85s/it, loss=0.198, lr=1e-5]Steps:   1%|          | 181/15001 [05:51<7:37:46,  1.85s/it, loss=0.154, lr=1e-5]Steps:   1%|          | 182/15001 [05:53<7:28:55,  1.82s/it, loss=0.154, lr=1e-5]Steps:   1%|          | 182/15001 [05:53<7:28:55,  1.82s/it, loss=0.132, lr=1e-5]Steps:   1%|          | 183/15001 [05:54<7:30:16,  1.82s/it, loss=0.132, lr=1e-5]Steps:   1%|          | 183/15001 [05:55<7:30:16,  1.82s/it, loss=0.107, lr=1e-5]Steps:   1%|          | 184/15001 [05:56<7:42:20,  1.87s/it, loss=0.107, lr=1e-5]Steps:   1%|          | 184/15001 [05:57<7:42:20,  1.87s/it, loss=0.169, lr=1e-5]Steps:   1%|          | 185/15001 [05:58<7:47:39,  1.89s/it, loss=0.169, lr=1e-5]Steps:   1%|          | 185/15001 [05:58<7:47:39,  1.89s/it, loss=0.227, lr=1e-5]Steps:   1%|          | 186/15001 [06:00<7:16:50,  1.77s/it, loss=0.227, lr=1e-5]Steps:   1%|          | 186/15001 [06:00<7:16:50,  1.77s/it, loss=0.092, lr=1e-5]Steps:   1%|          | 187/15001 [06:02<7:47:37,  1.89s/it, loss=0.092, lr=1e-5]Steps:   1%|          | 187/15001 [06:02<7:47:37,  1.89s/it, loss=0.11, lr=1e-5] Steps:   1%|▏         | 188/15001 [06:04<7:39:39,  1.86s/it, loss=0.11, lr=1e-5]Steps:   1%|▏         | 188/15001 [06:04<7:39:39,  1.86s/it, loss=0.139, lr=1e-5]Steps:   1%|▏         | 189/15001 [06:06<7:32:52,  1.83s/it, loss=0.139, lr=1e-5]Steps:   1%|▏         | 189/15001 [06:06<7:32:52,  1.83s/it, loss=0.317, lr=1e-5]Steps:   1%|▏         | 190/15001 [06:07<7:27:15,  1.81s/it, loss=0.317, lr=1e-5]Steps:   1%|▏         | 190/15001 [06:08<7:27:15,  1.81s/it, loss=0.0369, lr=1e-5]Steps:   1%|▏         | 191/15001 [06:09<7:29:11,  1.82s/it, loss=0.0369, lr=1e-5]Steps:   1%|▏         | 191/15001 [06:10<7:29:11,  1.82s/it, loss=0.145, lr=1e-5] Steps:   1%|▏         | 192/15001 [06:11<8:02:48,  1.96s/it, loss=0.145, lr=1e-5]Steps:   1%|▏         | 192/15001 [06:12<8:02:48,  1.96s/it, loss=0.224, lr=1e-5]Steps:   1%|▏         | 193/15001 [06:13<8:04:31,  1.96s/it, loss=0.224, lr=1e-5]Steps:   1%|▏         | 193/15001 [06:14<8:04:31,  1.96s/it, loss=0.171, lr=1e-5]Steps:   1%|▏         | 194/15001 [06:15<8:09:01,  1.98s/it, loss=0.171, lr=1e-5]Steps:   1%|▏         | 194/15001 [06:16<8:09:01,  1.98s/it, loss=0.0204, lr=1e-5]Steps:   1%|▏         | 195/15001 [06:18<8:23:40,  2.04s/it, loss=0.0204, lr=1e-5]Steps:   1%|▏         | 195/15001 [06:18<8:23:40,  2.04s/it, loss=0.0937, lr=1e-5]Steps:   1%|▏         | 196/15001 [06:20<8:14:41,  2.00s/it, loss=0.0937, lr=1e-5]Steps:   1%|▏         | 196/15001 [06:20<8:14:41,  2.00s/it, loss=0.0917, lr=1e-5]Steps:   1%|▏         | 197/15001 [06:22<8:21:03,  2.03s/it, loss=0.0917, lr=1e-5]Steps:   1%|▏         | 197/15001 [06:22<8:21:03,  2.03s/it, loss=0.184, lr=1e-5] Steps:   1%|▏         | 198/15001 [06:23<7:57:23,  1.93s/it, loss=0.184, lr=1e-5]Steps:   1%|▏         | 198/15001 [06:23<7:57:23,  1.93s/it, loss=0.2, lr=1e-5]  Steps:   1%|▏         | 199/15001 [06:25<7:45:50,  1.89s/it, loss=0.2, lr=1e-5]Steps:   1%|▏         | 199/15001 [06:25<7:45:50,  1.89s/it, loss=0.0651, lr=1e-5]Steps:   1%|▏         | 200/15001 [06:27<7:33:16,  1.84s/it, loss=0.0651, lr=1e-5]Steps:   1%|▏         | 200/15001 [06:27<7:33:16,  1.84s/it, loss=0.108, lr=1e-5] Steps:   1%|▏         | 201/15001 [06:29<7:36:41,  1.85s/it, loss=0.108, lr=1e-5]Steps:   1%|▏         | 201/15001 [06:29<7:36:41,  1.85s/it, loss=0.191, lr=1e-5]Steps:   1%|▏         | 202/15001 [06:30<7:26:06,  1.81s/it, loss=0.191, lr=1e-5]Steps:   1%|▏         | 202/15001 [06:31<7:26:06,  1.81s/it, loss=0.196, lr=1e-5]Steps:   1%|▏         | 203/15001 [06:33<7:57:20,  1.94s/it, loss=0.196, lr=1e-5]Steps:   1%|▏         | 203/15001 [06:33<7:57:20,  1.94s/it, loss=0.176, lr=1e-5]Steps:   1%|▏         | 204/15001 [06:35<7:54:05,  1.92s/it, loss=0.176, lr=1e-5]Steps:   1%|▏         | 204/15001 [06:35<7:54:05,  1.92s/it, loss=0.216, lr=1e-5]Steps:   1%|▏         | 205/15001 [06:37<7:54:04,  1.92s/it, loss=0.216, lr=1e-5]Steps:   1%|▏         | 205/15001 [06:37<7:54:04,  1.92s/it, loss=0.073, lr=1e-5]Steps:   1%|▏         | 206/15001 [06:38<7:39:20,  1.86s/it, loss=0.073, lr=1e-5]Steps:   1%|▏         | 206/15001 [06:38<7:39:20,  1.86s/it, loss=0.119, lr=1e-5]Steps:   1%|▏         | 207/15001 [06:40<7:43:24,  1.88s/it, loss=0.119, lr=1e-5]Steps:   1%|▏         | 207/15001 [06:40<7:43:24,  1.88s/it, loss=0.195, lr=1e-5]Steps:   1%|▏         | 208/15001 [06:42<7:28:16,  1.82s/it, loss=0.195, lr=1e-5]Steps:   1%|▏         | 208/15001 [06:42<7:28:16,  1.82s/it, loss=0.245, lr=1e-5]Steps:   1%|▏         | 209/15001 [06:44<7:34:11,  1.84s/it, loss=0.245, lr=1e-5]Steps:   1%|▏         | 209/15001 [06:44<7:34:11,  1.84s/it, loss=0.158, lr=1e-5]Steps:   1%|▏         | 210/15001 [06:45<7:10:04,  1.74s/it, loss=0.158, lr=1e-5]Steps:   1%|▏         | 210/15001 [06:46<7:10:04,  1.74s/it, loss=0.222, lr=1e-5]Steps:   1%|▏         | 211/15001 [06:47<7:23:33,  1.80s/it, loss=0.222, lr=1e-5]Steps:   1%|▏         | 211/15001 [06:48<7:23:33,  1.80s/it, loss=0.168, lr=1e-5]Steps:   1%|▏         | 212/15001 [06:49<7:26:54,  1.81s/it, loss=0.168, lr=1e-5]Steps:   1%|▏         | 212/15001 [06:49<7:26:54,  1.81s/it, loss=0.206, lr=1e-5]Steps:   1%|▏         | 213/15001 [06:51<7:45:11,  1.89s/it, loss=0.206, lr=1e-5]Steps:   1%|▏         | 213/15001 [06:51<7:45:11,  1.89s/it, loss=0.18, lr=1e-5] Steps:   1%|▏         | 214/15001 [06:53<7:36:55,  1.85s/it, loss=0.18, lr=1e-5]Steps:   1%|▏         | 214/15001 [06:53<7:36:55,  1.85s/it, loss=0.252, lr=1e-5]Steps:   1%|▏         | 215/15001 [06:55<7:56:41,  1.93s/it, loss=0.252, lr=1e-5]Steps:   1%|▏         | 215/15001 [06:55<7:56:41,  1.93s/it, loss=0.141, lr=1e-5]Steps:   1%|▏         | 216/15001 [06:57<8:07:25,  1.98s/it, loss=0.141, lr=1e-5]Steps:   1%|▏         | 216/15001 [06:57<8:07:25,  1.98s/it, loss=0.112, lr=1e-5]Steps:   1%|▏         | 217/15001 [06:59<7:57:23,  1.94s/it, loss=0.112, lr=1e-5]Steps:   1%|▏         | 217/15001 [06:59<7:57:23,  1.94s/it, loss=0.243, lr=1e-5]Steps:   1%|▏         | 218/15001 [07:01<8:21:40,  2.04s/it, loss=0.243, lr=1e-5]Steps:   1%|▏         | 218/15001 [07:01<8:21:40,  2.04s/it, loss=0.268, lr=1e-5]Steps:   1%|▏         | 219/15001 [07:03<8:14:32,  2.01s/it, loss=0.268, lr=1e-5]Steps:   1%|▏         | 219/15001 [07:03<8:14:32,  2.01s/it, loss=0.0879, lr=1e-5]Steps:   1%|▏         | 220/15001 [07:05<8:08:19,  1.98s/it, loss=0.0879, lr=1e-5]Steps:   1%|▏         | 220/15001 [07:05<8:08:19,  1.98s/it, loss=0.26, lr=1e-5]  Steps:   1%|▏         | 221/15001 [07:07<7:49:23,  1.91s/it, loss=0.26, lr=1e-5]Steps:   1%|▏         | 221/15001 [07:07<7:49:23,  1.91s/it, loss=0.162, lr=1e-5]Steps:   1%|▏         | 222/15001 [07:08<7:32:27,  1.84s/it, loss=0.162, lr=1e-5]Steps:   1%|▏         | 222/15001 [07:09<7:32:27,  1.84s/it, loss=0.116, lr=1e-5]Steps:   1%|▏         | 223/15001 [07:10<7:42:42,  1.88s/it, loss=0.116, lr=1e-5]Steps:   1%|▏         | 223/15001 [07:11<7:42:42,  1.88s/it, loss=0.152, lr=1e-5]Steps:   1%|▏         | 224/15001 [07:12<7:44:51,  1.89s/it, loss=0.152, lr=1e-5]Steps:   1%|▏         | 224/15001 [07:12<7:44:51,  1.89s/it, loss=0.197, lr=1e-5]Steps:   1%|▏         | 225/15001 [07:14<7:32:24,  1.84s/it, loss=0.197, lr=1e-5]Steps:   1%|▏         | 225/15001 [07:14<7:32:24,  1.84s/it, loss=0.16, lr=1e-5] Steps:   2%|▏         | 226/15001 [07:16<7:33:08,  1.84s/it, loss=0.16, lr=1e-5]Steps:   2%|▏         | 226/15001 [07:16<7:33:08,  1.84s/it, loss=0.143, lr=1e-5]Steps:   2%|▏         | 227/15001 [07:18<7:22:11,  1.80s/it, loss=0.143, lr=1e-5]Steps:   2%|▏         | 227/15001 [07:18<7:22:11,  1.80s/it, loss=0.108, lr=1e-5]Steps:   2%|▏         | 228/15001 [07:20<7:34:28,  1.85s/it, loss=0.108, lr=1e-5]Steps:   2%|▏         | 228/15001 [07:20<7:34:28,  1.85s/it, loss=0.131, lr=1e-5]Steps:   2%|▏         | 229/15001 [07:21<7:36:59,  1.86s/it, loss=0.131, lr=1e-5]Steps:   2%|▏         | 229/15001 [07:22<7:36:59,  1.86s/it, loss=0.203, lr=1e-5]Steps:   2%|▏         | 230/15001 [07:23<7:32:02,  1.84s/it, loss=0.203, lr=1e-5]Steps:   2%|▏         | 230/15001 [07:23<7:32:02,  1.84s/it, loss=0.429, lr=1e-5]Steps:   2%|▏         | 231/15001 [07:25<7:35:31,  1.85s/it, loss=0.429, lr=1e-5]Steps:   2%|▏         | 231/15001 [07:25<7:35:31,  1.85s/it, loss=0.157, lr=1e-5]Steps:   2%|▏         | 232/15001 [07:27<7:40:22,  1.87s/it, loss=0.157, lr=1e-5]Steps:   2%|▏         | 232/15001 [07:27<7:40:22,  1.87s/it, loss=0.3, lr=1e-5]  Steps:   2%|▏         | 233/15001 [07:29<7:36:54,  1.86s/it, loss=0.3, lr=1e-5]Steps:   2%|▏         | 233/15001 [07:29<7:36:54,  1.86s/it, loss=0.153, lr=1e-5]Steps:   2%|▏         | 234/15001 [07:31<7:34:42,  1.85s/it, loss=0.153, lr=1e-5]Steps:   2%|▏         | 234/15001 [07:31<7:34:42,  1.85s/it, loss=0.0943, lr=1e-5]Steps:   2%|▏         | 235/15001 [07:33<7:38:42,  1.86s/it, loss=0.0943, lr=1e-5]Steps:   2%|▏         | 235/15001 [07:33<7:38:42,  1.86s/it, loss=0.347, lr=1e-5] Steps:   2%|▏         | 236/15001 [07:34<7:40:14,  1.87s/it, loss=0.347, lr=1e-5]Steps:   2%|▏         | 236/15001 [07:35<7:40:14,  1.87s/it, loss=0.0862, lr=1e-5]Steps:   2%|▏         | 237/15001 [07:36<7:46:18,  1.90s/it, loss=0.0862, lr=1e-5]Steps:   2%|▏         | 237/15001 [07:36<7:46:18,  1.90s/it, loss=0.119, lr=1e-5] Steps:   2%|▏         | 238/15001 [07:38<7:59:29,  1.95s/it, loss=0.119, lr=1e-5]Steps:   2%|▏         | 238/15001 [07:39<7:59:29,  1.95s/it, loss=0.0413, lr=1e-5]Steps:   2%|▏         | 239/15001 [07:40<7:57:25,  1.94s/it, loss=0.0413, lr=1e-5]Steps:   2%|▏         | 239/15001 [07:40<7:57:25,  1.94s/it, loss=0.127, lr=1e-5] Steps:   2%|▏         | 240/15001 [07:42<7:45:26,  1.89s/it, loss=0.127, lr=1e-5]Steps:   2%|▏         | 240/15001 [07:43<7:45:26,  1.89s/it, loss=0.0909, lr=1e-5]Steps:   2%|▏         | 241/15001 [07:44<8:11:00,  2.00s/it, loss=0.0909, lr=1e-5]Steps:   2%|▏         | 241/15001 [07:45<8:11:00,  2.00s/it, loss=0.0239, lr=1e-5]Steps:   2%|▏         | 242/15001 [07:46<8:13:51,  2.01s/it, loss=0.0239, lr=1e-5]Steps:   2%|▏         | 242/15001 [07:47<8:13:51,  2.01s/it, loss=0.223, lr=1e-5] Steps:   2%|▏         | 243/15001 [07:48<7:58:26,  1.95s/it, loss=0.223, lr=1e-5]Steps:   2%|▏         | 243/15001 [07:48<7:58:26,  1.95s/it, loss=0.197, lr=1e-5]Steps:   2%|▏         | 244/15001 [07:50<7:37:12,  1.86s/it, loss=0.197, lr=1e-5]Steps:   2%|▏         | 244/15001 [07:50<7:37:12,  1.86s/it, loss=0.092, lr=1e-5]Steps:   2%|▏         | 245/15001 [07:52<7:44:55,  1.89s/it, loss=0.092, lr=1e-5]Steps:   2%|▏         | 245/15001 [07:52<7:44:55,  1.89s/it, loss=0.192, lr=1e-5]Steps:   2%|▏         | 246/15001 [07:53<7:12:21,  1.76s/it, loss=0.192, lr=1e-5]Steps:   2%|▏         | 246/15001 [07:54<7:12:21,  1.76s/it, loss=0.0373, lr=1e-5]Steps:   2%|▏         | 247/15001 [07:55<7:42:15,  1.88s/it, loss=0.0373, lr=1e-5]Steps:   2%|▏         | 247/15001 [07:56<7:42:15,  1.88s/it, loss=0.0421, lr=1e-5]Steps:   2%|▏         | 248/15001 [07:57<7:41:06,  1.88s/it, loss=0.0421, lr=1e-5]Steps:   2%|▏         | 248/15001 [07:57<7:41:06,  1.88s/it, loss=0.183, lr=1e-5] Steps:   2%|▏         | 249/15001 [07:59<7:36:59,  1.86s/it, loss=0.183, lr=1e-5]Steps:   2%|▏         | 249/15001 [07:59<7:36:59,  1.86s/it, loss=0.26, lr=1e-5] Steps:   2%|▏         | 250/15001 [08:01<7:30:41,  1.83s/it, loss=0.26, lr=1e-5]Steps:   2%|▏         | 250/15001 [08:01<7:30:41,  1.83s/it, loss=0.195, lr=1e-5]Steps:   2%|▏         | 251/15001 [08:03<7:12:26,  1.76s/it, loss=0.195, lr=1e-5]Steps:   2%|▏         | 251/15001 [08:03<7:12:26,  1.76s/it, loss=0.313, lr=1e-5]Steps:   2%|▏         | 252/15001 [08:04<7:21:09,  1.79s/it, loss=0.313, lr=1e-5]Steps:   2%|▏         | 252/15001 [08:05<7:21:09,  1.79s/it, loss=0.125, lr=1e-5]Steps:   2%|▏         | 253/15001 [08:06<7:23:06,  1.80s/it, loss=0.125, lr=1e-5]Steps:   2%|▏         | 253/15001 [08:07<7:23:06,  1.80s/it, loss=0.185, lr=1e-5]Steps:   2%|▏         | 254/15001 [08:08<7:27:01,  1.82s/it, loss=0.185, lr=1e-5]Steps:   2%|▏         | 254/15001 [08:08<7:27:01,  1.82s/it, loss=0.226, lr=1e-5]Steps:   2%|▏         | 255/15001 [08:10<7:35:20,  1.85s/it, loss=0.226, lr=1e-5]Steps:   2%|▏         | 255/15001 [08:10<7:35:20,  1.85s/it, loss=0.108, lr=1e-5]Steps:   2%|▏         | 256/15001 [08:12<7:25:23,  1.81s/it, loss=0.108, lr=1e-5]Steps:   2%|▏         | 256/15001 [08:12<7:25:23,  1.81s/it, loss=0.207, lr=1e-5]Steps:   2%|▏         | 257/15001 [08:14<7:37:38,  1.86s/it, loss=0.207, lr=1e-5]Steps:   2%|▏         | 257/15001 [08:14<7:37:38,  1.86s/it, loss=0.112, lr=1e-5]Steps:   2%|▏         | 258/15001 [08:16<7:52:43,  1.92s/it, loss=0.112, lr=1e-5]Steps:   2%|▏         | 258/15001 [08:16<7:52:43,  1.92s/it, loss=0.106, lr=1e-5]Steps:   2%|▏         | 259/15001 [08:17<7:27:55,  1.82s/it, loss=0.106, lr=1e-5]Steps:   2%|▏         | 259/15001 [08:18<7:27:55,  1.82s/it, loss=0.0458, lr=1e-5]Steps:   2%|▏         | 260/15001 [08:19<7:48:38,  1.91s/it, loss=0.0458, lr=1e-5]Steps:   2%|▏         | 260/15001 [08:20<7:48:38,  1.91s/it, loss=0.258, lr=1e-5] Steps:   2%|▏         | 261/15001 [08:22<8:09:28,  1.99s/it, loss=0.258, lr=1e-5]Steps:   2%|▏         | 261/15001 [08:22<8:09:28,  1.99s/it, loss=0.0748, lr=1e-5]Steps:   2%|▏         | 262/15001 [08:23<7:57:24,  1.94s/it, loss=0.0748, lr=1e-5]Steps:   2%|▏         | 262/15001 [08:24<7:57:24,  1.94s/it, loss=0.415, lr=1e-5] Steps:   2%|▏         | 263/15001 [08:26<8:28:52,  2.07s/it, loss=0.415, lr=1e-5]Steps:   2%|▏         | 263/15001 [08:26<8:28:52,  2.07s/it, loss=0.468, lr=1e-5]Steps:   2%|▏         | 264/15001 [08:28<8:04:46,  1.97s/it, loss=0.468, lr=1e-5]Steps:   2%|▏         | 264/15001 [08:28<8:04:46,  1.97s/it, loss=0.0359, lr=1e-5]Steps:   2%|▏         | 265/15001 [08:30<8:35:23,  2.10s/it, loss=0.0359, lr=1e-5]Steps:   2%|▏         | 265/15001 [08:30<8:35:23,  2.10s/it, loss=0.273, lr=1e-5] Steps:   2%|▏         | 266/15001 [08:32<8:28:18,  2.07s/it, loss=0.273, lr=1e-5]Steps:   2%|▏         | 266/15001 [08:32<8:28:18,  2.07s/it, loss=0.0723, lr=1e-5]Steps:   2%|▏         | 267/15001 [08:34<8:09:57,  2.00s/it, loss=0.0723, lr=1e-5]Steps:   2%|▏         | 267/15001 [08:34<8:09:57,  2.00s/it, loss=0.0536, lr=1e-5]Steps:   2%|▏         | 268/15001 [08:36<8:04:09,  1.97s/it, loss=0.0536, lr=1e-5]Steps:   2%|▏         | 268/15001 [08:36<8:04:09,  1.97s/it, loss=0.107, lr=1e-5] Steps:   2%|▏         | 269/15001 [08:37<7:41:41,  1.88s/it, loss=0.107, lr=1e-5]Steps:   2%|▏         | 269/15001 [08:38<7:41:41,  1.88s/it, loss=0.439, lr=1e-5]Steps:   2%|▏         | 270/15001 [08:39<7:38:05,  1.87s/it, loss=0.439, lr=1e-5]Steps:   2%|▏         | 270/15001 [08:39<7:38:05,  1.87s/it, loss=0.121, lr=1e-5]Steps:   2%|▏         | 271/15001 [08:41<7:29:12,  1.83s/it, loss=0.121, lr=1e-5]Steps:   2%|▏         | 271/15001 [08:41<7:29:12,  1.83s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 272/15001 [08:43<7:18:41,  1.79s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 272/15001 [08:43<7:18:41,  1.79s/it, loss=0.175, lr=1e-5]Steps:   2%|▏         | 273/15001 [08:45<7:36:02,  1.86s/it, loss=0.175, lr=1e-5]Steps:   2%|▏         | 273/15001 [08:45<7:36:02,  1.86s/it, loss=0.221, lr=1e-5]Steps:   2%|▏         | 274/15001 [08:46<7:23:42,  1.81s/it, loss=0.221, lr=1e-5]Steps:   2%|▏         | 274/15001 [08:47<7:23:42,  1.81s/it, loss=0.15, lr=1e-5] Steps:   2%|▏         | 275/15001 [08:48<7:18:31,  1.79s/it, loss=0.15, lr=1e-5]Steps:   2%|▏         | 275/15001 [08:48<7:18:31,  1.79s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 276/15001 [08:50<7:30:04,  1.83s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 276/15001 [08:50<7:30:04,  1.83s/it, loss=0.178, lr=1e-5]Steps:   2%|▏         | 277/15001 [08:52<7:35:42,  1.86s/it, loss=0.178, lr=1e-5]Steps:   2%|▏         | 277/15001 [08:52<7:35:42,  1.86s/it, loss=0.177, lr=1e-5]Steps:   2%|▏         | 278/15001 [08:53<7:05:45,  1.74s/it, loss=0.177, lr=1e-5]Steps:   2%|▏         | 278/15001 [08:54<7:05:45,  1.74s/it, loss=0.162, lr=1e-5]Steps:   2%|▏         | 279/15001 [08:55<7:14:41,  1.77s/it, loss=0.162, lr=1e-5]Steps:   2%|▏         | 279/15001 [08:56<7:14:41,  1.77s/it, loss=0.133, lr=1e-5]Steps:   2%|▏         | 280/15001 [08:58<7:49:11,  1.91s/it, loss=0.133, lr=1e-5]Steps:   2%|▏         | 280/15001 [08:58<7:49:11,  1.91s/it, loss=0.249, lr=1e-5]Steps:   2%|▏         | 281/15001 [08:59<7:29:30,  1.83s/it, loss=0.249, lr=1e-5]Steps:   2%|▏         | 281/15001 [08:59<7:29:30,  1.83s/it, loss=0.217, lr=1e-5]Steps:   2%|▏         | 282/15001 [09:01<7:19:57,  1.79s/it, loss=0.217, lr=1e-5]Steps:   2%|▏         | 282/15001 [09:01<7:19:57,  1.79s/it, loss=0.105, lr=1e-5]Steps:   2%|▏         | 283/15001 [09:03<7:59:29,  1.95s/it, loss=0.105, lr=1e-5]Steps:   2%|▏         | 283/15001 [09:03<7:59:29,  1.95s/it, loss=0.182, lr=1e-5]Steps:   2%|▏         | 284/15001 [09:05<7:58:18,  1.95s/it, loss=0.182, lr=1e-5]Steps:   2%|▏         | 284/15001 [09:05<7:58:18,  1.95s/it, loss=0.28, lr=1e-5] Steps:   2%|▏         | 285/15001 [09:07<7:35:10,  1.86s/it, loss=0.28, lr=1e-5]Steps:   2%|▏         | 285/15001 [09:07<7:35:10,  1.86s/it, loss=0.34, lr=1e-5]Steps:   2%|▏         | 286/15001 [09:09<7:58:25,  1.95s/it, loss=0.34, lr=1e-5]Steps:   2%|▏         | 286/15001 [09:09<7:58:25,  1.95s/it, loss=0.192, lr=1e-5]Steps:   2%|▏         | 287/15001 [09:11<8:06:58,  1.99s/it, loss=0.192, lr=1e-5]Steps:   2%|▏         | 287/15001 [09:11<8:06:58,  1.99s/it, loss=0.25, lr=1e-5] Steps:   2%|▏         | 288/15001 [09:13<7:56:52,  1.94s/it, loss=0.25, lr=1e-5]Steps:   2%|▏         | 288/15001 [09:13<7:56:52,  1.94s/it, loss=0.151, lr=1e-5]Steps:   2%|▏         | 289/15001 [09:15<7:42:49,  1.89s/it, loss=0.151, lr=1e-5]Steps:   2%|▏         | 289/15001 [09:15<7:42:49,  1.89s/it, loss=0.17, lr=1e-5] Steps:   2%|▏         | 290/15001 [09:16<7:23:51,  1.81s/it, loss=0.17, lr=1e-5]Steps:   2%|▏         | 290/15001 [09:17<7:23:51,  1.81s/it, loss=0.269, lr=1e-5]Steps:   2%|▏         | 291/15001 [09:18<7:47:58,  1.91s/it, loss=0.269, lr=1e-5]Steps:   2%|▏         | 291/15001 [09:19<7:47:58,  1.91s/it, loss=0.112, lr=1e-5]Steps:   2%|▏         | 292/15001 [09:20<7:27:09,  1.82s/it, loss=0.112, lr=1e-5]Steps:   2%|▏         | 292/15001 [09:20<7:27:09,  1.82s/it, loss=0.13, lr=1e-5] Steps:   2%|▏         | 293/15001 [09:22<7:37:08,  1.86s/it, loss=0.13, lr=1e-5]Steps:   2%|▏         | 293/15001 [09:22<7:37:08,  1.86s/it, loss=0.249, lr=1e-5]Steps:   2%|▏         | 294/15001 [09:24<7:22:15,  1.80s/it, loss=0.249, lr=1e-5]Steps:   2%|▏         | 294/15001 [09:24<7:22:15,  1.80s/it, loss=0.336, lr=1e-5]Steps:   2%|▏         | 295/15001 [09:26<7:27:27,  1.83s/it, loss=0.336, lr=1e-5]Steps:   2%|▏         | 295/15001 [09:26<7:27:27,  1.83s/it, loss=0.375, lr=1e-5]Steps:   2%|▏         | 296/15001 [09:28<7:44:42,  1.90s/it, loss=0.375, lr=1e-5]Steps:   2%|▏         | 296/15001 [09:28<7:44:42,  1.90s/it, loss=0.168, lr=1e-5]Steps:   2%|▏         | 297/15001 [09:29<7:36:22,  1.86s/it, loss=0.168, lr=1e-5]Steps:   2%|▏         | 297/15001 [09:29<7:36:22,  1.86s/it, loss=0.272, lr=1e-5]Steps:   2%|▏         | 298/15001 [09:31<7:30:56,  1.84s/it, loss=0.272, lr=1e-5]Steps:   2%|▏         | 298/15001 [09:31<7:30:56,  1.84s/it, loss=0.201, lr=1e-5]Steps:   2%|▏         | 299/15001 [09:33<7:11:15,  1.76s/it, loss=0.201, lr=1e-5]Steps:   2%|▏         | 299/15001 [09:33<7:11:15,  1.76s/it, loss=0.0968, lr=1e-5]Steps:   2%|▏         | 300/15001 [09:35<7:36:48,  1.86s/it, loss=0.0968, lr=1e-5]Steps:   2%|▏         | 300/15001 [09:35<7:36:48,  1.86s/it, loss=0.156, lr=1e-5] Steps:   2%|▏         | 301/15001 [09:36<7:20:44,  1.80s/it, loss=0.156, lr=1e-5]Steps:   2%|▏         | 301/15001 [09:37<7:20:44,  1.80s/it, loss=0.203, lr=1e-5]Steps:   2%|▏         | 302/15001 [09:38<7:34:55,  1.86s/it, loss=0.203, lr=1e-5]Steps:   2%|▏         | 302/15001 [09:39<7:34:55,  1.86s/it, loss=0.166, lr=1e-5]Steps:   2%|▏         | 303/15001 [09:40<7:26:19,  1.82s/it, loss=0.166, lr=1e-5]Steps:   2%|▏         | 303/15001 [09:40<7:26:19,  1.82s/it, loss=0.285, lr=1e-5]Steps:   2%|▏         | 304/15001 [09:42<7:31:59,  1.85s/it, loss=0.285, lr=1e-5]Steps:   2%|▏         | 304/15001 [09:42<7:31:59,  1.85s/it, loss=0.343, lr=1e-5]Steps:   2%|▏         | 305/15001 [09:44<7:36:46,  1.86s/it, loss=0.343, lr=1e-5]Steps:   2%|▏         | 305/15001 [09:44<7:36:46,  1.86s/it, loss=0.273, lr=1e-5]Steps:   2%|▏         | 306/15001 [09:46<7:59:54,  1.96s/it, loss=0.273, lr=1e-5]Steps:   2%|▏         | 306/15001 [09:46<7:59:54,  1.96s/it, loss=0.185, lr=1e-5]Steps:   2%|▏         | 307/15001 [09:48<7:57:07,  1.95s/it, loss=0.185, lr=1e-5]Steps:   2%|▏         | 307/15001 [09:48<7:57:07,  1.95s/it, loss=0.159, lr=1e-5]Steps:   2%|▏         | 308/15001 [09:50<7:55:19,  1.94s/it, loss=0.159, lr=1e-5]Steps:   2%|▏         | 308/15001 [09:50<7:55:19,  1.94s/it, loss=0.0869, lr=1e-5]Steps:   2%|▏         | 309/15001 [09:52<8:06:44,  1.99s/it, loss=0.0869, lr=1e-5]Steps:   2%|▏         | 309/15001 [09:52<8:06:44,  1.99s/it, loss=0.165, lr=1e-5] Steps:   2%|▏         | 310/15001 [09:54<8:14:59,  2.02s/it, loss=0.165, lr=1e-5]Steps:   2%|▏         | 310/15001 [09:54<8:14:59,  2.02s/it, loss=0.179, lr=1e-5]Steps:   2%|▏         | 311/15001 [09:56<7:46:37,  1.91s/it, loss=0.179, lr=1e-5]Steps:   2%|▏         | 311/15001 [09:56<7:46:37,  1.91s/it, loss=0.217, lr=1e-5]Steps:   2%|▏         | 312/15001 [09:58<7:50:12,  1.92s/it, loss=0.217, lr=1e-5]Steps:   2%|▏         | 312/15001 [09:58<7:50:12,  1.92s/it, loss=0.169, lr=1e-5]Steps:   2%|▏         | 313/15001 [10:00<7:38:13,  1.87s/it, loss=0.169, lr=1e-5]Steps:   2%|▏         | 313/15001 [10:00<7:38:13,  1.87s/it, loss=0.244, lr=1e-5]Steps:   2%|▏         | 314/15001 [10:02<7:44:15,  1.90s/it, loss=0.244, lr=1e-5]Steps:   2%|▏         | 314/15001 [10:02<7:44:15,  1.90s/it, loss=0.194, lr=1e-5]Steps:   2%|▏         | 315/15001 [10:03<7:44:28,  1.90s/it, loss=0.194, lr=1e-5]Steps:   2%|▏         | 315/15001 [10:04<7:44:28,  1.90s/it, loss=0.215, lr=1e-5]Steps:   2%|▏         | 316/15001 [10:05<7:23:00,  1.81s/it, loss=0.215, lr=1e-5]Steps:   2%|▏         | 316/15001 [10:05<7:23:00,  1.81s/it, loss=0.0592, lr=1e-5]Steps:   2%|▏         | 317/15001 [10:07<7:44:22,  1.90s/it, loss=0.0592, lr=1e-5]Steps:   2%|▏         | 317/15001 [10:07<7:44:22,  1.90s/it, loss=0.0593, lr=1e-5]Steps:   2%|▏         | 318/15001 [10:09<7:44:20,  1.90s/it, loss=0.0593, lr=1e-5]Steps:   2%|▏         | 318/15001 [10:09<7:44:20,  1.90s/it, loss=0.175, lr=1e-5] Steps:   2%|▏         | 319/15001 [10:11<7:22:34,  1.81s/it, loss=0.175, lr=1e-5]Steps:   2%|▏         | 319/15001 [10:11<7:22:34,  1.81s/it, loss=0.278, lr=1e-5]Steps:   2%|▏         | 320/15001 [10:12<7:22:28,  1.81s/it, loss=0.278, lr=1e-5]Steps:   2%|▏         | 320/15001 [10:13<7:22:28,  1.81s/it, loss=0.114, lr=1e-5]Steps:   2%|▏         | 321/15001 [10:15<7:41:23,  1.89s/it, loss=0.114, lr=1e-5]Steps:   2%|▏         | 321/15001 [10:15<7:41:23,  1.89s/it, loss=0.322, lr=1e-5]Steps:   2%|▏         | 322/15001 [10:16<7:31:35,  1.85s/it, loss=0.322, lr=1e-5]Steps:   2%|▏         | 322/15001 [10:16<7:31:35,  1.85s/it, loss=0.232, lr=1e-5]Steps:   2%|▏         | 323/15001 [10:18<7:29:11,  1.84s/it, loss=0.232, lr=1e-5]Steps:   2%|▏         | 323/15001 [10:18<7:29:11,  1.84s/it, loss=0.139, lr=1e-5]Steps:   2%|▏         | 324/15001 [10:20<7:10:27,  1.76s/it, loss=0.139, lr=1e-5]Steps:   2%|▏         | 324/15001 [10:20<7:10:27,  1.76s/it, loss=0.308, lr=1e-5]Steps:   2%|▏         | 325/15001 [10:22<7:15:30,  1.78s/it, loss=0.308, lr=1e-5]Steps:   2%|▏         | 325/15001 [10:22<7:15:30,  1.78s/it, loss=0.296, lr=1e-5]Steps:   2%|▏         | 326/15001 [10:23<7:22:36,  1.81s/it, loss=0.296, lr=1e-5]Steps:   2%|▏         | 326/15001 [10:24<7:22:36,  1.81s/it, loss=0.142, lr=1e-5]Steps:   2%|▏         | 327/15001 [10:25<7:36:16,  1.87s/it, loss=0.142, lr=1e-5]Steps:   2%|▏         | 327/15001 [10:25<7:36:16,  1.87s/it, loss=0.308, lr=1e-5]Steps:   2%|▏         | 328/15001 [10:27<7:37:23,  1.87s/it, loss=0.308, lr=1e-5]Steps:   2%|▏         | 328/15001 [10:27<7:37:23,  1.87s/it, loss=0.171, lr=1e-5]Steps:   2%|▏         | 329/15001 [10:29<7:34:05,  1.86s/it, loss=0.171, lr=1e-5]Steps:   2%|▏         | 329/15001 [10:29<7:34:05,  1.86s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 330/15001 [10:31<8:01:07,  1.97s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 330/15001 [10:31<8:01:07,  1.97s/it, loss=0.11, lr=1e-5] Steps:   2%|▏         | 331/15001 [10:33<8:06:28,  1.99s/it, loss=0.11, lr=1e-5]Steps:   2%|▏         | 331/15001 [10:33<8:06:28,  1.99s/it, loss=0.0366, lr=1e-5]Steps:   2%|▏         | 332/15001 [10:35<7:53:40,  1.94s/it, loss=0.0366, lr=1e-5]Steps:   2%|▏         | 332/15001 [10:35<7:53:40,  1.94s/it, loss=0.382, lr=1e-5] Steps:   2%|▏         | 333/15001 [10:37<8:12:40,  2.02s/it, loss=0.382, lr=1e-5]Steps:   2%|▏         | 333/15001 [10:37<8:12:40,  2.02s/it, loss=0.139, lr=1e-5]Steps:   2%|▏         | 334/15001 [10:39<8:03:12,  1.98s/it, loss=0.139, lr=1e-5]Steps:   2%|▏         | 334/15001 [10:39<8:03:12,  1.98s/it, loss=0.255, lr=1e-5]Steps:   2%|▏         | 335/15001 [10:41<7:49:06,  1.92s/it, loss=0.255, lr=1e-5]Steps:   2%|▏         | 335/15001 [10:41<7:49:06,  1.92s/it, loss=0.135, lr=1e-5]Steps:   2%|▏         | 336/15001 [10:43<7:39:01,  1.88s/it, loss=0.135, lr=1e-5]Steps:   2%|▏         | 336/15001 [10:43<7:39:01,  1.88s/it, loss=0.103, lr=1e-5]Steps:   2%|▏         | 337/15001 [10:45<7:42:47,  1.89s/it, loss=0.103, lr=1e-5]Steps:   2%|▏         | 337/15001 [10:45<7:42:47,  1.89s/it, loss=0.33, lr=1e-5] Steps:   2%|▏         | 338/15001 [10:46<7:17:47,  1.79s/it, loss=0.33, lr=1e-5]Steps:   2%|▏         | 338/15001 [10:47<7:17:47,  1.79s/it, loss=0.311, lr=1e-5]Steps:   2%|▏         | 339/15001 [10:48<7:28:46,  1.84s/it, loss=0.311, lr=1e-5]Steps:   2%|▏         | 339/15001 [10:48<7:28:46,  1.84s/it, loss=0.225, lr=1e-5]Steps:   2%|▏         | 340/15001 [10:50<7:27:57,  1.83s/it, loss=0.225, lr=1e-5]Steps:   2%|▏         | 340/15001 [10:50<7:27:57,  1.83s/it, loss=0.112, lr=1e-5]Steps:   2%|▏         | 341/15001 [10:52<7:28:13,  1.83s/it, loss=0.112, lr=1e-5]Steps:   2%|▏         | 341/15001 [10:52<7:28:13,  1.83s/it, loss=0.178, lr=1e-5]Steps:   2%|▏         | 342/15001 [10:54<7:25:11,  1.82s/it, loss=0.178, lr=1e-5]Steps:   2%|▏         | 342/15001 [10:54<7:25:11,  1.82s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 343/15001 [10:56<7:29:04,  1.84s/it, loss=0.163, lr=1e-5]Steps:   2%|▏         | 343/15001 [10:56<7:29:04,  1.84s/it, loss=0.07, lr=1e-5] Steps:   2%|▏         | 344/15001 [10:58<7:40:20,  1.88s/it, loss=0.07, lr=1e-5]Steps:   2%|▏         | 344/15001 [10:58<7:40:20,  1.88s/it, loss=0.119, lr=1e-5]Steps:   2%|▏         | 345/15001 [10:59<7:30:55,  1.85s/it, loss=0.119, lr=1e-5]Steps:   2%|▏         | 345/15001 [10:59<7:30:55,  1.85s/it, loss=0.317, lr=1e-5]Steps:   2%|▏         | 346/15001 [11:01<7:24:33,  1.82s/it, loss=0.317, lr=1e-5]Steps:   2%|▏         | 346/15001 [11:01<7:24:33,  1.82s/it, loss=0.221, lr=1e-5]Steps:   2%|▏         | 347/15001 [11:03<7:20:50,  1.81s/it, loss=0.221, lr=1e-5]Steps:   2%|▏         | 347/15001 [11:03<7:20:50,  1.81s/it, loss=0.164, lr=1e-5]Steps:   2%|▏         | 348/15001 [11:05<7:34:12,  1.86s/it, loss=0.164, lr=1e-5]Steps:   2%|▏         | 348/15001 [11:05<7:34:12,  1.86s/it, loss=0.102, lr=1e-5]Steps:   2%|▏         | 349/15001 [11:07<7:33:37,  1.86s/it, loss=0.102, lr=1e-5]Steps:   2%|▏         | 349/15001 [11:07<7:33:37,  1.86s/it, loss=0.0981, lr=1e-5]Steps:   2%|▏         | 350/15001 [11:08<7:04:29,  1.74s/it, loss=0.0981, lr=1e-5]Steps:   2%|▏         | 350/15001 [11:09<7:04:29,  1.74s/it, loss=0.0887, lr=1e-5]Steps:   2%|▏         | 351/15001 [11:10<7:41:47,  1.89s/it, loss=0.0887, lr=1e-5]Steps:   2%|▏         | 351/15001 [11:11<7:41:47,  1.89s/it, loss=0.0839, lr=1e-5]Steps:   2%|▏         | 352/15001 [11:12<7:40:42,  1.89s/it, loss=0.0839, lr=1e-5]Steps:   2%|▏         | 352/15001 [11:13<7:40:42,  1.89s/it, loss=0.115, lr=1e-5] Steps:   2%|▏         | 353/15001 [11:14<7:43:43,  1.90s/it, loss=0.115, lr=1e-5]Steps:   2%|▏         | 353/15001 [11:15<7:43:43,  1.90s/it, loss=0.248, lr=1e-5]Steps:   2%|▏         | 354/15001 [11:16<8:10:27,  2.01s/it, loss=0.248, lr=1e-5]Steps:   2%|▏         | 354/15001 [11:17<8:10:27,  2.01s/it, loss=0.173, lr=1e-5]Steps:   2%|▏         | 355/15001 [11:19<8:14:31,  2.03s/it, loss=0.173, lr=1e-5]Steps:   2%|▏         | 355/15001 [11:19<8:14:31,  2.03s/it, loss=0.224, lr=1e-5]Steps:   2%|▏         | 356/15001 [11:20<8:08:55,  2.00s/it, loss=0.224, lr=1e-5]Steps:   2%|▏         | 356/15001 [11:21<8:08:55,  2.00s/it, loss=0.12, lr=1e-5] Steps:   2%|▏         | 357/15001 [11:22<7:49:34,  1.92s/it, loss=0.12, lr=1e-5]Steps:   2%|▏         | 357/15001 [11:22<7:49:34,  1.92s/it, loss=0.221, lr=1e-5]Steps:   2%|▏         | 358/15001 [11:24<7:33:26,  1.86s/it, loss=0.221, lr=1e-5]Steps:   2%|▏         | 358/15001 [11:24<7:33:26,  1.86s/it, loss=0.232, lr=1e-5]Steps:   2%|▏         | 359/15001 [11:26<7:40:17,  1.89s/it, loss=0.232, lr=1e-5]Steps:   2%|▏         | 359/15001 [11:26<7:40:17,  1.89s/it, loss=0.267, lr=1e-5]Steps:   2%|▏         | 360/15001 [11:28<7:42:26,  1.90s/it, loss=0.267, lr=1e-5]Steps:   2%|▏         | 360/15001 [11:28<7:42:26,  1.90s/it, loss=0.222, lr=1e-5]Steps:   2%|▏         | 361/15001 [11:30<7:32:58,  1.86s/it, loss=0.222, lr=1e-5]Steps:   2%|▏         | 361/15001 [11:30<7:32:58,  1.86s/it, loss=0.0427, lr=1e-5]Steps:   2%|▏         | 362/15001 [11:32<7:51:19,  1.93s/it, loss=0.0427, lr=1e-5]Steps:   2%|▏         | 362/15001 [11:32<7:51:19,  1.93s/it, loss=0.104, lr=1e-5] Steps:   2%|▏         | 363/15001 [11:33<7:42:08,  1.89s/it, loss=0.104, lr=1e-5]Steps:   2%|▏         | 363/15001 [11:34<7:42:08,  1.89s/it, loss=0.0899, lr=1e-5]Steps:   2%|▏         | 364/15001 [11:35<7:37:19,  1.87s/it, loss=0.0899, lr=1e-5]Steps:   2%|▏         | 364/15001 [11:35<7:37:19,  1.87s/it, loss=0.08, lr=1e-5]  Steps:   2%|▏         | 365/15001 [11:37<7:23:56,  1.82s/it, loss=0.08, lr=1e-5]Steps:   2%|▏         | 365/15001 [11:37<7:23:56,  1.82s/it, loss=0.151, lr=1e-5]Steps:   2%|▏         | 366/15001 [11:39<7:30:27,  1.85s/it, loss=0.151, lr=1e-5]Steps:   2%|▏         | 366/15001 [11:39<7:30:27,  1.85s/it, loss=0.047, lr=1e-5]Steps:   2%|▏         | 367/15001 [11:41<7:35:06,  1.87s/it, loss=0.047, lr=1e-5]Steps:   2%|▏         | 367/15001 [11:41<7:35:06,  1.87s/it, loss=0.142, lr=1e-5]Steps:   2%|▏         | 368/15001 [11:42<7:17:16,  1.79s/it, loss=0.142, lr=1e-5]Steps:   2%|▏         | 368/15001 [11:43<7:17:16,  1.79s/it, loss=0.045, lr=1e-5]Steps:   2%|▏         | 369/15001 [11:44<7:22:08,  1.81s/it, loss=0.045, lr=1e-5]Steps:   2%|▏         | 369/15001 [11:44<7:22:08,  1.81s/it, loss=0.218, lr=1e-5]Steps:   2%|▏         | 370/15001 [11:46<7:15:40,  1.79s/it, loss=0.218, lr=1e-5]Steps:   2%|▏         | 370/15001 [11:46<7:15:40,  1.79s/it, loss=0.192, lr=1e-5]Steps:   2%|▏         | 371/15001 [11:48<7:14:09,  1.78s/it, loss=0.192, lr=1e-5]Steps:   2%|▏         | 371/15001 [11:48<7:14:09,  1.78s/it, loss=0.0872, lr=1e-5]Steps:   2%|▏         | 372/15001 [11:50<7:28:19,  1.84s/it, loss=0.0872, lr=1e-5]Steps:   2%|▏         | 372/15001 [11:50<7:28:19,  1.84s/it, loss=0.175, lr=1e-5] Steps:   2%|▏         | 373/15001 [11:52<7:22:49,  1.82s/it, loss=0.175, lr=1e-5]Steps:   2%|▏         | 373/15001 [11:52<7:22:49,  1.82s/it, loss=0.154, lr=1e-5]Steps:   2%|▏         | 374/15001 [11:54<7:53:54,  1.94s/it, loss=0.154, lr=1e-5]Steps:   2%|▏         | 374/15001 [11:54<7:53:54,  1.94s/it, loss=0.116, lr=1e-5]Steps:   2%|▏         | 375/15001 [11:56<7:49:59,  1.93s/it, loss=0.116, lr=1e-5]Steps:   2%|▏         | 375/15001 [11:56<7:49:59,  1.93s/it, loss=0.117, lr=1e-5]Steps:   3%|▎         | 376/15001 [11:58<7:55:38,  1.95s/it, loss=0.117, lr=1e-5]Steps:   3%|▎         | 376/15001 [11:58<7:55:38,  1.95s/it, loss=0.152, lr=1e-5]Steps:   3%|▎         | 377/15001 [12:00<8:07:43,  2.00s/it, loss=0.152, lr=1e-5]Steps:   3%|▎         | 377/15001 [12:00<8:07:43,  2.00s/it, loss=0.284, lr=1e-5]Steps:   3%|▎         | 378/15001 [12:02<8:03:04,  1.98s/it, loss=0.284, lr=1e-5]Steps:   3%|▎         | 378/15001 [12:02<8:03:04,  1.98s/it, loss=0.0889, lr=1e-5]Steps:   3%|▎         | 379/15001 [12:03<7:42:12,  1.90s/it, loss=0.0889, lr=1e-5]Steps:   3%|▎         | 379/15001 [12:04<7:42:12,  1.90s/it, loss=0.0809, lr=1e-5]Steps:   3%|▎         | 380/15001 [12:06<7:59:09,  1.97s/it, loss=0.0809, lr=1e-5]Steps:   3%|▎         | 380/15001 [12:06<7:59:09,  1.97s/it, loss=0.15, lr=1e-5]  Steps:   3%|▎         | 381/15001 [12:07<7:39:15,  1.88s/it, loss=0.15, lr=1e-5]Steps:   3%|▎         | 381/15001 [12:07<7:39:15,  1.88s/it, loss=0.0831, lr=1e-5]Steps:   3%|▎         | 382/15001 [12:09<7:25:49,  1.83s/it, loss=0.0831, lr=1e-5]Steps:   3%|▎         | 382/15001 [12:09<7:25:49,  1.83s/it, loss=0.306, lr=1e-5] Steps:   3%|▎         | 383/15001 [12:11<7:06:55,  1.75s/it, loss=0.306, lr=1e-5]Steps:   3%|▎         | 383/15001 [12:11<7:06:55,  1.75s/it, loss=0.112, lr=1e-5]Steps:   3%|▎         | 384/15001 [12:13<7:39:55,  1.89s/it, loss=0.112, lr=1e-5]Steps:   3%|▎         | 384/15001 [12:13<7:39:55,  1.89s/it, loss=0.203, lr=1e-5]Steps:   3%|▎         | 385/15001 [12:14<7:17:17,  1.80s/it, loss=0.203, lr=1e-5]Steps:   3%|▎         | 385/15001 [12:15<7:17:17,  1.80s/it, loss=0.0761, lr=1e-5]Steps:   3%|▎         | 386/15001 [12:16<7:22:13,  1.82s/it, loss=0.0761, lr=1e-5]Steps:   3%|▎         | 386/15001 [12:17<7:22:13,  1.82s/it, loss=0.311, lr=1e-5] Steps:   3%|▎         | 387/15001 [12:18<7:44:56,  1.91s/it, loss=0.311, lr=1e-5]Steps:   3%|▎         | 387/15001 [12:18<7:44:56,  1.91s/it, loss=0.102, lr=1e-5]Steps:   3%|▎         | 388/15001 [12:20<7:39:37,  1.89s/it, loss=0.102, lr=1e-5]Steps:   3%|▎         | 388/15001 [12:20<7:39:37,  1.89s/it, loss=0.0971, lr=1e-5]Steps:   3%|▎         | 389/15001 [12:22<7:21:21,  1.81s/it, loss=0.0971, lr=1e-5]Steps:   3%|▎         | 389/15001 [12:22<7:21:21,  1.81s/it, loss=0.0706, lr=1e-5]Steps:   3%|▎         | 390/15001 [12:24<7:41:58,  1.90s/it, loss=0.0706, lr=1e-5]Steps:   3%|▎         | 390/15001 [12:24<7:41:58,  1.90s/it, loss=0.157, lr=1e-5] Steps:   3%|▎         | 391/15001 [12:26<7:24:05,  1.82s/it, loss=0.157, lr=1e-5]Steps:   3%|▎         | 391/15001 [12:26<7:24:05,  1.82s/it, loss=0.319, lr=1e-5]Steps:   3%|▎         | 392/15001 [12:27<7:28:49,  1.84s/it, loss=0.319, lr=1e-5]Steps:   3%|▎         | 392/15001 [12:28<7:28:49,  1.84s/it, loss=0.125, lr=1e-5]Steps:   3%|▎         | 393/15001 [12:29<7:17:49,  1.80s/it, loss=0.125, lr=1e-5]Steps:   3%|▎         | 393/15001 [12:29<7:17:49,  1.80s/it, loss=0.271, lr=1e-5]Steps:   3%|▎         | 394/15001 [12:31<7:34:42,  1.87s/it, loss=0.271, lr=1e-5]Steps:   3%|▎         | 394/15001 [12:31<7:34:42,  1.87s/it, loss=0.181, lr=1e-5]Steps:   3%|▎         | 395/15001 [12:33<7:28:40,  1.84s/it, loss=0.181, lr=1e-5]Steps:   3%|▎         | 395/15001 [12:33<7:28:40,  1.84s/it, loss=0.271, lr=1e-5]Steps:   3%|▎         | 396/15001 [12:35<8:02:11,  1.98s/it, loss=0.271, lr=1e-5]Steps:   3%|▎         | 396/15001 [12:35<8:02:11,  1.98s/it, loss=0.226, lr=1e-5]Steps:   3%|▎         | 397/15001 [12:37<7:59:41,  1.97s/it, loss=0.226, lr=1e-5]Steps:   3%|▎         | 397/15001 [12:37<7:59:41,  1.97s/it, loss=0.41, lr=1e-5] Steps:   3%|▎         | 398/15001 [12:39<8:00:55,  1.98s/it, loss=0.41, lr=1e-5]Steps:   3%|▎         | 398/15001 [12:39<8:00:55,  1.98s/it, loss=0.0469, lr=1e-5]Steps:   3%|▎         | 399/15001 [12:41<8:01:20,  1.98s/it, loss=0.0469, lr=1e-5]Steps:   3%|▎         | 399/15001 [12:41<8:01:20,  1.98s/it, loss=0.16, lr=1e-5]  Steps:   3%|▎         | 400/15001 [12:43<8:02:19,  1.98s/it, loss=0.16, lr=1e-5]Steps:   3%|▎         | 400/15001 [12:43<8:02:19,  1.98s/it, loss=0.0575, lr=1e-5]Steps:   3%|▎         | 401/15001 [12:45<8:03:09,  1.99s/it, loss=0.0575, lr=1e-5]Steps:   3%|▎         | 401/15001 [12:45<8:03:09,  1.99s/it, loss=0.184, lr=1e-5] Steps:   3%|▎         | 402/15001 [12:47<7:41:32,  1.90s/it, loss=0.184, lr=1e-5]Steps:   3%|▎         | 402/15001 [12:47<7:41:32,  1.90s/it, loss=0.0991, lr=1e-5]Steps:   3%|▎         | 403/15001 [12:49<7:47:45,  1.92s/it, loss=0.0991, lr=1e-5]Steps:   3%|▎         | 403/15001 [12:49<7:47:45,  1.92s/it, loss=0.264, lr=1e-5] Steps:   3%|▎         | 404/15001 [12:51<7:50:32,  1.93s/it, loss=0.264, lr=1e-5]Steps:   3%|▎         | 404/15001 [12:51<7:50:32,  1.93s/it, loss=0.23, lr=1e-5] Steps:   3%|▎         | 405/15001 [12:52<7:33:39,  1.86s/it, loss=0.23, lr=1e-5]Steps:   3%|▎         | 405/15001 [12:53<7:33:39,  1.86s/it, loss=0.24, lr=1e-5]Steps:   3%|▎         | 406/15001 [12:54<7:37:02,  1.88s/it, loss=0.24, lr=1e-5]Steps:   3%|▎         | 406/15001 [12:55<7:37:02,  1.88s/it, loss=0.0918, lr=1e-5]Steps:   3%|▎         | 407/15001 [12:56<7:40:03,  1.89s/it, loss=0.0918, lr=1e-5]Steps:   3%|▎         | 407/15001 [12:56<7:40:03,  1.89s/it, loss=0.103, lr=1e-5] Steps:   3%|▎         | 408/15001 [12:58<7:17:54,  1.80s/it, loss=0.103, lr=1e-5]Steps:   3%|▎         | 408/15001 [12:58<7:17:54,  1.80s/it, loss=0.225, lr=1e-5]Steps:   3%|▎         | 409/15001 [13:00<7:51:19,  1.94s/it, loss=0.225, lr=1e-5]Steps:   3%|▎         | 409/15001 [13:00<7:51:19,  1.94s/it, loss=0.00666, lr=1e-5]Steps:   3%|▎         | 410/15001 [13:02<7:37:10,  1.88s/it, loss=0.00666, lr=1e-5]Steps:   3%|▎         | 410/15001 [13:02<7:37:10,  1.88s/it, loss=0.174, lr=1e-5]  Steps:   3%|▎         | 411/15001 [13:04<7:33:28,  1.86s/it, loss=0.174, lr=1e-5]Steps:   3%|▎         | 411/15001 [13:04<7:33:28,  1.86s/it, loss=0.356, lr=1e-5]Steps:   3%|▎         | 412/15001 [13:06<7:32:56,  1.86s/it, loss=0.356, lr=1e-5]Steps:   3%|▎         | 412/15001 [13:06<7:32:56,  1.86s/it, loss=0.197, lr=1e-5]Steps:   3%|▎         | 413/15001 [13:07<7:29:17,  1.85s/it, loss=0.197, lr=1e-5]Steps:   3%|▎         | 413/15001 [13:07<7:29:17,  1.85s/it, loss=0.131, lr=1e-5]Steps:   3%|▎         | 414/15001 [13:09<7:25:25,  1.83s/it, loss=0.131, lr=1e-5]Steps:   3%|▎         | 414/15001 [13:09<7:25:25,  1.83s/it, loss=0.0857, lr=1e-5]Steps:   3%|▎         | 415/15001 [13:11<7:17:42,  1.80s/it, loss=0.0857, lr=1e-5]Steps:   3%|▎         | 415/15001 [13:11<7:17:42,  1.80s/it, loss=0.303, lr=1e-5] Steps:   3%|▎         | 416/15001 [13:13<7:32:01,  1.86s/it, loss=0.303, lr=1e-5]Steps:   3%|▎         | 416/15001 [13:13<7:32:01,  1.86s/it, loss=0.148, lr=1e-5]Steps:   3%|▎         | 417/15001 [13:15<7:23:52,  1.83s/it, loss=0.148, lr=1e-5]Steps:   3%|▎         | 417/15001 [13:15<7:23:52,  1.83s/it, loss=0.0725, lr=1e-5]Steps:   3%|▎         | 418/15001 [13:17<7:35:13,  1.87s/it, loss=0.0725, lr=1e-5]Steps:   3%|▎         | 418/15001 [13:17<7:35:13,  1.87s/it, loss=0.142, lr=1e-5] Steps:   3%|▎         | 419/15001 [13:19<7:46:31,  1.92s/it, loss=0.142, lr=1e-5]Steps:   3%|▎         | 419/15001 [13:19<7:46:31,  1.92s/it, loss=0.108, lr=1e-5]Steps:   3%|▎         | 420/15001 [13:21<7:41:44,  1.90s/it, loss=0.108, lr=1e-5]Steps:   3%|▎         | 420/15001 [13:21<7:41:44,  1.90s/it, loss=0.191, lr=1e-5]Steps:   3%|▎         | 421/15001 [13:23<7:50:50,  1.94s/it, loss=0.191, lr=1e-5]Steps:   3%|▎         | 421/15001 [13:23<7:50:50,  1.94s/it, loss=0.155, lr=1e-5]Steps:   3%|▎         | 422/15001 [13:25<8:00:41,  1.98s/it, loss=0.155, lr=1e-5]Steps:   3%|▎         | 422/15001 [13:25<8:00:41,  1.98s/it, loss=0.167, lr=1e-5]Steps:   3%|▎         | 423/15001 [13:27<7:54:33,  1.95s/it, loss=0.167, lr=1e-5]Steps:   3%|���         | 423/15001 [13:27<7:54:33,  1.95s/it, loss=0.0804, lr=1e-5]Steps:   3%|▎         | 424/15001 [13:28<7:29:36,  1.85s/it, loss=0.0804, lr=1e-5]Steps:   3%|▎         | 424/15001 [13:29<7:29:36,  1.85s/it, loss=0.192, lr=1e-5] Steps:   3%|▎         | 425/15001 [13:30<7:39:09,  1.89s/it, loss=0.192, lr=1e-5]Steps:   3%|▎         | 425/15001 [13:31<7:39:09,  1.89s/it, loss=0.357, lr=1e-5]Steps:   3%|▎         | 426/15001 [13:32<7:43:15,  1.91s/it, loss=0.357, lr=1e-5]Steps:   3%|▎         | 426/15001 [13:32<7:43:15,  1.91s/it, loss=0.124, lr=1e-5]Steps:   3%|▎         | 427/15001 [13:34<7:48:51,  1.93s/it, loss=0.124, lr=1e-5]Steps:   3%|▎         | 427/15001 [13:34<7:48:51,  1.93s/it, loss=0.336, lr=1e-5]Steps:   3%|▎         | 428/15001 [13:36<7:28:33,  1.85s/it, loss=0.336, lr=1e-5]Steps:   3%|▎         | 428/15001 [13:36<7:28:33,  1.85s/it, loss=0.127, lr=1e-5]Steps:   3%|▎         | 429/15001 [13:38<7:27:19,  1.84s/it, loss=0.127, lr=1e-5]Steps:   3%|▎         | 429/15001 [13:38<7:27:19,  1.84s/it, loss=0.083, lr=1e-5]Steps:   3%|▎         | 430/15001 [13:39<7:20:50,  1.82s/it, loss=0.083, lr=1e-5]Steps:   3%|▎         | 430/15001 [13:40<7:20:50,  1.82s/it, loss=0.17, lr=1e-5] Steps:   3%|▎         | 431/15001 [13:41<7:41:29,  1.90s/it, loss=0.17, lr=1e-5]Steps:   3%|▎         | 431/15001 [13:41<7:41:29,  1.90s/it, loss=0.101, lr=1e-5]Steps:   3%|▎         | 432/15001 [13:43<7:18:55,  1.81s/it, loss=0.101, lr=1e-5]Steps:   3%|▎         | 432/15001 [13:43<7:18:55,  1.81s/it, loss=0.189, lr=1e-5]Steps:   3%|▎         | 433/15001 [13:45<7:28:09,  1.85s/it, loss=0.189, lr=1e-5]Steps:   3%|▎         | 433/15001 [13:45<7:28:09,  1.85s/it, loss=0.347, lr=1e-5]Steps:   3%|▎         | 434/15001 [13:47<7:25:24,  1.83s/it, loss=0.347, lr=1e-5]Steps:   3%|▎         | 434/15001 [13:47<7:25:24,  1.83s/it, loss=0.0543, lr=1e-5]Steps:   3%|▎         | 435/15001 [13:49<7:42:15,  1.90s/it, loss=0.0543, lr=1e-5]Steps:   3%|▎         | 435/15001 [13:49<7:42:15,  1.90s/it, loss=0.121, lr=1e-5] Steps:   3%|▎         | 436/15001 [13:51<7:53:54,  1.95s/it, loss=0.121, lr=1e-5]Steps:   3%|▎         | 436/15001 [13:51<7:53:54,  1.95s/it, loss=0.0327, lr=1e-5]Steps:   3%|▎         | 437/15001 [13:52<7:29:21,  1.85s/it, loss=0.0327, lr=1e-5]Steps:   3%|▎         | 437/15001 [13:53<7:29:21,  1.85s/it, loss=0.243, lr=1e-5] Steps:   3%|▎         | 438/15001 [13:54<7:14:51,  1.79s/it, loss=0.243, lr=1e-5]Steps:   3%|▎         | 438/15001 [13:55<7:14:51,  1.79s/it, loss=0.185, lr=1e-5]Steps:   3%|▎         | 439/15001 [13:56<7:44:06,  1.91s/it, loss=0.185, lr=1e-5]Steps:   3%|▎         | 439/15001 [13:56<7:44:06,  1.91s/it, loss=0.194, lr=1e-5]Steps:   3%|▎         | 440/15001 [13:58<7:19:35,  1.81s/it, loss=0.194, lr=1e-5]Steps:   3%|▎         | 440/15001 [13:58<7:19:35,  1.81s/it, loss=0.0713, lr=1e-5]Steps:   3%|▎         | 441/15001 [14:00<7:51:31,  1.94s/it, loss=0.0713, lr=1e-5]Steps:   3%|▎         | 441/15001 [14:00<7:51:31,  1.94s/it, loss=0.428, lr=1e-5] Steps:   3%|▎         | 442/15001 [14:02<8:03:39,  1.99s/it, loss=0.428, lr=1e-5]Steps:   3%|▎         | 442/15001 [14:02<8:03:39,  1.99s/it, loss=0.17, lr=1e-5] Steps:   3%|▎         | 443/15001 [14:04<8:01:39,  1.99s/it, loss=0.17, lr=1e-5]Steps:   3%|▎         | 443/15001 [14:05<8:01:39,  1.99s/it, loss=0.0713, lr=1e-5]Steps:   3%|▎         | 444/15001 [14:06<7:58:25,  1.97s/it, loss=0.0713, lr=1e-5]Steps:   3%|▎         | 444/15001 [14:07<7:58:25,  1.97s/it, loss=0.27, lr=1e-5]  Steps:   3%|▎         | 445/15001 [14:08<8:14:52,  2.04s/it, loss=0.27, lr=1e-5]Steps:   3%|▎         | 445/15001 [14:09<8:14:52,  2.04s/it, loss=0.24, lr=1e-5]Steps:   3%|▎         | 446/15001 [14:10<8:18:14,  2.05s/it, loss=0.24, lr=1e-5]Steps:   3%|▎         | 446/15001 [14:10<8:18:14,  2.05s/it, loss=0.185, lr=1e-5]Steps:   3%|▎         | 447/15001 [14:12<7:49:02,  1.93s/it, loss=0.185, lr=1e-5]Steps:   3%|▎         | 447/15001 [14:12<7:49:02,  1.93s/it, loss=0.182, lr=1e-5]Steps:   3%|▎         | 448/15001 [14:14<7:48:31,  1.93s/it, loss=0.182, lr=1e-5]Steps:   3%|▎         | 448/15001 [14:14<7:48:31,  1.93s/it, loss=0.336, lr=1e-5]Steps:   3%|▎         | 449/15001 [14:16<7:46:02,  1.92s/it, loss=0.336, lr=1e-5]Steps:   3%|▎         | 449/15001 [14:16<7:46:02,  1.92s/it, loss=0.118, lr=1e-5]Steps:   3%|▎         | 450/15001 [14:18<7:37:47,  1.89s/it, loss=0.118, lr=1e-5]Steps:   3%|▎         | 450/15001 [14:18<7:37:47,  1.89s/it, loss=0.168, lr=1e-5]Steps:   3%|▎         | 451/15001 [14:19<7:29:39,  1.85s/it, loss=0.168, lr=1e-5]Steps:   3%|▎         | 451/15001 [14:20<7:29:39,  1.85s/it, loss=0.0927, lr=1e-5]Steps:   3%|▎         | 452/15001 [14:21<7:26:43,  1.84s/it, loss=0.0927, lr=1e-5]Steps:   3%|▎         | 452/15001 [14:21<7:26:43,  1.84s/it, loss=0.107, lr=1e-5] Steps:   3%|▎         | 453/15001 [14:23<7:26:29,  1.84s/it, loss=0.107, lr=1e-5]Steps:   3%|▎         | 453/15001 [14:23<7:26:29,  1.84s/it, loss=0.0811, lr=1e-5]Steps:   3%|▎         | 454/15001 [14:25<7:29:13,  1.85s/it, loss=0.0811, lr=1e-5]Steps:   3%|▎         | 454/15001 [14:25<7:29:13,  1.85s/it, loss=0.0768, lr=1e-5]Steps:   3%|▎         | 455/15001 [14:27<7:38:04,  1.89s/it, loss=0.0768, lr=1e-5]Steps:   3%|▎         | 455/15001 [14:27<7:38:04,  1.89s/it, loss=0.213, lr=1e-5] Steps:   3%|▎         | 456/15001 [14:29<7:37:55,  1.89s/it, loss=0.213, lr=1e-5]Steps:   3%|▎         | 456/15001 [14:29<7:37:55,  1.89s/it, loss=0.151, lr=1e-5]Steps:   3%|▎         | 457/15001 [14:31<7:24:38,  1.83s/it, loss=0.151, lr=1e-5]Steps:   3%|▎         | 457/15001 [14:31<7:24:38,  1.83s/it, loss=0.0392, lr=1e-5]Steps:   3%|▎         | 458/15001 [14:33<7:30:56,  1.86s/it, loss=0.0392, lr=1e-5]Steps:   3%|▎         | 458/15001 [14:33<7:30:56,  1.86s/it, loss=0.174, lr=1e-5] Steps:   3%|▎         | 459/15001 [14:35<7:40:26,  1.90s/it, loss=0.174, lr=1e-5]Steps:   3%|▎         | 459/15001 [14:35<7:40:26,  1.90s/it, loss=0.178, lr=1e-5]Steps:   3%|▎         | 460/15001 [14:36<7:26:42,  1.84s/it, loss=0.178, lr=1e-5]Steps:   3%|▎         | 460/15001 [14:36<7:26:42,  1.84s/it, loss=0.207, lr=1e-5]Steps:   3%|▎         | 461/15001 [14:38<7:26:41,  1.84s/it, loss=0.207, lr=1e-5]Steps:   3%|▎         | 461/15001 [14:38<7:26:41,  1.84s/it, loss=0.183, lr=1e-5]Steps:   3%|▎         | 462/15001 [14:40<7:32:38,  1.87s/it, loss=0.183, lr=1e-5]Steps:   3%|▎         | 462/15001 [14:40<7:32:38,  1.87s/it, loss=0.155, lr=1e-5]Steps:   3%|▎         | 463/15001 [14:41<7:00:39,  1.74s/it, loss=0.155, lr=1e-5]Steps:   3%|▎         | 463/15001 [14:42<7:00:39,  1.74s/it, loss=0.074, lr=1e-5]Steps:   3%|▎         | 464/15001 [14:44<7:36:34,  1.88s/it, loss=0.074, lr=1e-5]Steps:   3%|▎         | 464/15001 [14:44<7:36:34,  1.88s/it, loss=0.403, lr=1e-5]Steps:   3%|▎         | 465/15001 [14:46<7:48:45,  1.93s/it, loss=0.403, lr=1e-5]Steps:   3%|▎         | 465/15001 [14:46<7:48:45,  1.93s/it, loss=0.0519, lr=1e-5]Steps:   3%|▎         | 466/15001 [14:48<8:10:03,  2.02s/it, loss=0.0519, lr=1e-5]Steps:   3%|▎         | 466/15001 [14:48<8:10:03,  2.02s/it, loss=0.0765, lr=1e-5]Steps:   3%|▎         | 467/15001 [14:50<8:01:08,  1.99s/it, loss=0.0765, lr=1e-5]Steps:   3%|▎         | 467/15001 [14:50<8:01:08,  1.99s/it, loss=0.297, lr=1e-5] Steps:   3%|▎         | 468/15001 [14:52<8:04:53,  2.00s/it, loss=0.297, lr=1e-5]Steps:   3%|▎         | 468/15001 [14:52<8:04:53,  2.00s/it, loss=0.223, lr=1e-5]Steps:   3%|▎         | 469/15001 [14:54<7:58:03,  1.97s/it, loss=0.223, lr=1e-5]Steps:   3%|▎         | 469/15001 [14:54<7:58:03,  1.97s/it, loss=0.223, lr=1e-5]Steps:   3%|▎         | 470/15001 [14:56<7:52:12,  1.95s/it, loss=0.223, lr=1e-5]Steps:   3%|▎         | 470/15001 [14:56<7:52:12,  1.95s/it, loss=0.215, lr=1e-5]Steps:   3%|▎         | 471/15001 [14:57<7:34:31,  1.88s/it, loss=0.215, lr=1e-5]Steps:   3%|▎         | 471/15001 [14:57<7:34:31,  1.88s/it, loss=0.0704, lr=1e-5]Steps:   3%|▎         | 472/15001 [14:59<7:35:54,  1.88s/it, loss=0.0704, lr=1e-5]Steps:   3%|▎         | 472/15001 [14:59<7:35:54,  1.88s/it, loss=0.0771, lr=1e-5]Steps:   3%|▎         | 473/15001 [15:01<7:39:12,  1.90s/it, loss=0.0771, lr=1e-5]Steps:   3%|▎         | 473/15001 [15:01<7:39:12,  1.90s/it, loss=0.0297, lr=1e-5]Steps:   3%|▎         | 474/15001 [15:03<7:31:53,  1.87s/it, loss=0.0297, lr=1e-5]Steps:   3%|▎         | 474/15001 [15:03<7:31:53,  1.87s/it, loss=0.26, lr=1e-5]  Steps:   3%|▎         | 475/15001 [15:05<7:19:07,  1.81s/it, loss=0.26, lr=1e-5]Steps:   3%|▎         | 475/15001 [15:05<7:19:07,  1.81s/it, loss=0.0172, lr=1e-5]Steps:   3%|▎         | 476/15001 [15:07<7:24:02,  1.83s/it, loss=0.0172, lr=1e-5]Steps:   3%|▎         | 476/15001 [15:07<7:24:02,  1.83s/it, loss=0.382, lr=1e-5] Steps:   3%|▎         | 477/15001 [15:08<7:30:51,  1.86s/it, loss=0.382, lr=1e-5]Steps:   3%|▎         | 477/15001 [15:09<7:30:51,  1.86s/it, loss=0.063, lr=1e-5]Steps:   3%|▎         | 478/15001 [15:10<7:26:52,  1.85s/it, loss=0.063, lr=1e-5]Steps:   3%|▎         | 478/15001 [15:10<7:26:52,  1.85s/it, loss=0.0957, lr=1e-5]Steps:   3%|▎         | 479/15001 [15:12<7:04:19,  1.75s/it, loss=0.0957, lr=1e-5]Steps:   3%|▎         | 479/15001 [15:12<7:04:19,  1.75s/it, loss=0.0803, lr=1e-5]Steps:   3%|▎         | 480/15001 [15:14<7:38:26,  1.89s/it, loss=0.0803, lr=1e-5]Steps:   3%|▎         | 480/15001 [15:14<7:38:26,  1.89s/it, loss=0.0776, lr=1e-5]Steps:   3%|▎         | 481/15001 [15:16<7:21:35,  1.82s/it, loss=0.0776, lr=1e-5]Steps:   3%|▎         | 481/15001 [15:16<7:21:35,  1.82s/it, loss=0.112, lr=1e-5] Steps:   3%|▎         | 482/15001 [15:17<7:13:20,  1.79s/it, loss=0.112, lr=1e-5]Steps:   3%|▎         | 482/15001 [15:18<7:13:20,  1.79s/it, loss=0.0531, lr=1e-5]Steps:   3%|▎         | 483/15001 [15:19<7:16:34,  1.80s/it, loss=0.0531, lr=1e-5]Steps:   3%|▎         | 483/15001 [15:20<7:16:34,  1.80s/it, loss=0.149, lr=1e-5] Steps:   3%|▎         | 484/15001 [15:21<7:22:47,  1.83s/it, loss=0.149, lr=1e-5]Steps:   3%|▎         | 484/15001 [15:21<7:22:47,  1.83s/it, loss=0.27, lr=1e-5] Steps:   3%|▎         | 485/15001 [15:23<7:10:21,  1.78s/it, loss=0.27, lr=1e-5]Steps:   3%|▎         | 485/15001 [15:23<7:10:21,  1.78s/it, loss=0.104, lr=1e-5]Steps:   3%|▎         | 486/15001 [15:25<7:39:50,  1.90s/it, loss=0.104, lr=1e-5]Steps:   3%|▎         | 486/15001 [15:25<7:39:50,  1.90s/it, loss=0.103, lr=1e-5]Steps:   3%|▎         | 487/15001 [15:27<7:47:15,  1.93s/it, loss=0.103, lr=1e-5]Steps:   3%|▎         | 487/15001 [15:27<7:47:15,  1.93s/it, loss=0.0754, lr=1e-5]Steps:   3%|▎         | 488/15001 [15:29<7:53:57,  1.96s/it, loss=0.0754, lr=1e-5]Steps:   3%|▎         | 488/15001 [15:29<7:53:57,  1.96s/it, loss=0.412, lr=1e-5] Steps:   3%|▎         | 489/15001 [15:31<7:45:37,  1.93s/it, loss=0.412, lr=1e-5]Steps:   3%|▎         | 489/15001 [15:31<7:45:37,  1.93s/it, loss=0.201, lr=1e-5]Steps:   3%|▎         | 490/15001 [15:33<7:48:14,  1.94s/it, loss=0.201, lr=1e-5]Steps:   3%|▎         | 490/15001 [15:33<7:48:14,  1.94s/it, loss=0.226, lr=1e-5]Steps:   3%|▎         | 491/15001 [15:35<7:37:56,  1.89s/it, loss=0.226, lr=1e-5]Steps:   3%|▎         | 491/15001 [15:35<7:37:56,  1.89s/it, loss=0.241, lr=1e-5]Steps:   3%|▎         | 492/15001 [15:37<7:44:31,  1.92s/it, loss=0.241, lr=1e-5]Steps:   3%|▎         | 492/15001 [15:37<7:44:31,  1.92s/it, loss=0.243, lr=1e-5]Steps:   3%|▎         | 493/15001 [15:38<7:18:27,  1.81s/it, loss=0.243, lr=1e-5]Steps:   3%|▎         | 493/15001 [15:39<7:18:27,  1.81s/it, loss=0.129, lr=1e-5]Steps:   3%|▎         | 494/15001 [15:40<7:27:59,  1.85s/it, loss=0.129, lr=1e-5]Steps:   3%|▎         | 494/15001 [15:40<7:27:59,  1.85s/it, loss=0.0906, lr=1e-5]Steps:   3%|▎         | 495/15001 [15:42<7:44:24,  1.92s/it, loss=0.0906, lr=1e-5]Steps:   3%|▎         | 495/15001 [15:42<7:44:24,  1.92s/it, loss=0.143, lr=1e-5] Steps:   3%|▎         | 496/15001 [15:44<7:25:19,  1.84s/it, loss=0.143, lr=1e-5]Steps:   3%|▎         | 496/15001 [15:44<7:25:19,  1.84s/it, loss=0.238, lr=1e-5]Steps:   3%|▎         | 497/15001 [15:46<7:36:06,  1.89s/it, loss=0.238, lr=1e-5]Steps:   3%|▎         | 497/15001 [15:46<7:36:06,  1.89s/it, loss=0.211, lr=1e-5]Steps:   3%|▎         | 498/15001 [15:48<7:31:08,  1.87s/it, loss=0.211, lr=1e-5]Steps:   3%|▎         | 498/15001 [15:48<7:31:08,  1.87s/it, loss=0.23, lr=1e-5] Steps:   3%|▎         | 499/15001 [15:50<7:30:56,  1.87s/it, loss=0.23, lr=1e-5]Steps:   3%|▎         | 499/15001 [15:50<7:30:56,  1.87s/it, loss=0.0803, lr=1e-5]Steps:   3%|▎         | 500/15001 [15:51<7:16:04,  1.80s/it, loss=0.0803, lr=1e-5]02/04/2024 13:18:10 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 121.43it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+/cmlscratch/azarei/controlnet_diffusers/NEW/diffusers/src/diffusers/image_processor.py:97: RuntimeWarning: invalid value encountered in cast
+  images = (images * 255).round().astype("uint8")
+Steps:   3%|▎         | 500/15001 [19:36<7:16:04,  1.80s/it, loss=0.28, lr=1e-5]  Steps:   3%|▎         | 501/15001 [19:38<278:49:40, 69.23s/it, loss=0.28, lr=1e-5]Steps:   3%|▎         | 501/15001 [19:38<278:49:40, 69.23s/it, loss=0.214, lr=1e-5]Steps:   3%|▎         | 502/15001 [19:39<197:07:52, 48.95s/it, loss=0.214, lr=1e-5]Steps:   3%|▎         | 502/15001 [19:40<197:07:52, 48.95s/it, loss=0.0919, lr=1e-5]Steps:   3%|▎         | 503/15001 [19:41<140:15:27, 34.83s/it, loss=0.0919, lr=1e-5]Steps:   3%|▎         | 503/15001 [19:42<140:15:27, 34.83s/it, loss=0.0921, lr=1e-5]Steps:   3%|▎         | 504/15001 [19:43<100:25:37, 24.94s/it, loss=0.0921, lr=1e-5]Steps:   3%|▎         | 504/15001 [19:43<100:25:37, 24.94s/it, loss=0.14, lr=1e-5]  Steps:   3%|▎         | 505/15001 [19:45<72:53:06, 18.10s/it, loss=0.14, lr=1e-5] Steps:   3%|▎         | 505/15001 [19:45<72:53:06, 18.10s/it, loss=0.307, lr=1e-5]Steps:   3%|▎         | 506/15001 [19:47<53:10:47, 13.21s/it, loss=0.307, lr=1e-5]Steps:   3%|▎         | 506/15001 [19:47<53:10:47, 13.21s/it, loss=0.109, lr=1e-5]Steps:   3%|▎         | 507/15001 [19:49<39:09:06,  9.72s/it, loss=0.109, lr=1e-5]Steps:   3%|▎         | 507/15001 [19:49<39:09:06,  9.72s/it, loss=0.112, lr=1e-5]Steps:   3%|▎         | 508/15001 [19:51<30:00:53,  7.46s/it, loss=0.112, lr=1e-5]Steps:   3%|▎         | 508/15001 [19:51<30:00:53,  7.46s/it, loss=0.35, lr=1e-5] Steps:   3%|▎         | 509/15001 [19:53<23:15:21,  5.78s/it, loss=0.35, lr=1e-5]Steps:   3%|▎         | 509/15001 [19:53<23:15:21,  5.78s/it, loss=0.105, lr=1e-5]Steps:   3%|▎         | 510/15001 [19:54<18:21:16,  4.56s/it, loss=0.105, lr=1e-5]Steps:   3%|▎         | 510/15001 [19:55<18:21:16,  4.56s/it, loss=0.173, lr=1e-5]Steps:   3%|▎         | 511/15001 [19:56<15:14:06,  3.79s/it, loss=0.173, lr=1e-5]Steps:   3%|▎         | 511/15001 [19:57<15:14:06,  3.79s/it, loss=0.0963, lr=1e-5]Steps:   3%|▎         | 512/15001 [19:58<12:55:33,  3.21s/it, loss=0.0963, lr=1e-5]Steps:   3%|▎         | 512/15001 [19:58<12:55:33,  3.21s/it, loss=0.276, lr=1e-5] Steps:   3%|▎         | 513/15001 [20:00<11:14:33,  2.79s/it, loss=0.276, lr=1e-5]Steps:   3%|▎         | 513/15001 [20:00<11:14:33,  2.79s/it, loss=0.442, lr=1e-5]Steps:   3%|▎         | 514/15001 [20:02<10:23:06,  2.58s/it, loss=0.442, lr=1e-5]Steps:   3%|▎         | 514/15001 [20:02<10:23:06,  2.58s/it, loss=0.0668, lr=1e-5]Steps:   3%|▎         | 515/15001 [20:04<9:38:14,  2.40s/it, loss=0.0668, lr=1e-5] Steps:   3%|▎         | 515/15001 [20:04<9:38:14,  2.40s/it, loss=0.464, lr=1e-5] Steps:   3%|▎         | 516/15001 [20:06<9:19:41,  2.32s/it, loss=0.464, lr=1e-5]Steps:   3%|▎         | 516/15001 [20:06<9:19:41,  2.32s/it, loss=0.042, lr=1e-5]Steps:   3%|▎         | 517/15001 [20:08<9:01:18,  2.24s/it, loss=0.042, lr=1e-5]Steps:   3%|▎         | 517/15001 [20:08<9:01:18,  2.24s/it, loss=0.217, lr=1e-5]Steps:   3%|▎         | 518/15001 [20:10<8:31:40,  2.12s/it, loss=0.217, lr=1e-5]Steps:   3%|▎         | 518/15001 [20:10<8:31:40,  2.12s/it, loss=0.238, lr=1e-5]Steps:   3%|▎         | 519/15001 [20:12<8:17:19,  2.06s/it, loss=0.238, lr=1e-5]Steps:   3%|▎         | 519/15001 [20:12<8:17:19,  2.06s/it, loss=0.247, lr=1e-5]Steps:   3%|▎         | 520/15001 [20:14<8:08:31,  2.02s/it, loss=0.247, lr=1e-5]Steps:   3%|▎         | 520/15001 [20:14<8:08:31,  2.02s/it, loss=0.286, lr=1e-5]Steps:   3%|▎         | 521/15001 [20:16<7:47:59,  1.94s/it, loss=0.286, lr=1e-5]Steps:   3%|▎         | 521/15001 [20:16<7:47:59,  1.94s/it, loss=0.108, lr=1e-5]Steps:   3%|▎         | 522/15001 [20:18<8:03:59,  2.01s/it, loss=0.108, lr=1e-5]Steps:   3%|▎         | 522/15001 [20:18<8:03:59,  2.01s/it, loss=0.264, lr=1e-5]Steps:   3%|▎         | 523/15001 [20:20<7:51:13,  1.95s/it, loss=0.264, lr=1e-5]Steps:   3%|▎         | 523/15001 [20:20<7:51:13,  1.95s/it, loss=0.292, lr=1e-5]Steps:   3%|▎         | 524/15001 [20:21<7:24:23,  1.84s/it, loss=0.292, lr=1e-5]Steps:   3%|▎         | 524/15001 [20:22<7:24:23,  1.84s/it, loss=0.202, lr=1e-5]Steps:   3%|▎         | 525/15001 [20:23<7:33:10,  1.88s/it, loss=0.202, lr=1e-5]Steps:   3%|▎         | 525/15001 [20:23<7:33:10,  1.88s/it, loss=0.116, lr=1e-5]Steps:   4%|▎         | 526/15001 [20:25<7:25:51,  1.85s/it, loss=0.116, lr=1e-5]Steps:   4%|▎         | 526/15001 [20:25<7:25:51,  1.85s/it, loss=0.308, lr=1e-5]Steps:   4%|▎         | 527/15001 [20:27<7:28:11,  1.86s/it, loss=0.308, lr=1e-5]Steps:   4%|▎         | 527/15001 [20:27<7:28:11,  1.86s/it, loss=0.0846, lr=1e-5]Steps:   4%|▎         | 528/15001 [20:29<7:13:59,  1.80s/it, loss=0.0846, lr=1e-5]Steps:   4%|▎         | 528/15001 [20:29<7:13:59,  1.80s/it, loss=0.257, lr=1e-5] Steps:   4%|▎         | 529/15001 [20:31<7:27:26,  1.86s/it, loss=0.257, lr=1e-5]Steps:   4%|▎         | 529/15001 [20:31<7:27:26,  1.86s/it, loss=0.104, lr=1e-5]Steps:   4%|▎         | 530/15001 [20:33<7:34:11,  1.88s/it, loss=0.104, lr=1e-5]Steps:   4%|▎         | 530/15001 [20:33<7:34:11,  1.88s/it, loss=0.046, lr=1e-5]Steps:   4%|▎         | 531/15001 [20:34<7:32:54,  1.88s/it, loss=0.046, lr=1e-5]Steps:   4%|▎         | 531/15001 [20:34<7:32:54,  1.88s/it, loss=0.0992, lr=1e-5]Steps:   4%|▎         | 532/15001 [20:36<7:32:15,  1.88s/it, loss=0.0992, lr=1e-5]Steps:   4%|▎         | 532/15001 [20:36<7:32:15,  1.88s/it, loss=0.142, lr=1e-5] Steps:   4%|▎         | 533/15001 [20:38<7:32:12,  1.88s/it, loss=0.142, lr=1e-5]Steps:   4%|▎         | 533/15001 [20:38<7:32:12,  1.88s/it, loss=0.129, lr=1e-5]Steps:   4%|▎         | 534/15001 [20:40<7:15:46,  1.81s/it, loss=0.129, lr=1e-5]Steps:   4%|▎         | 534/15001 [20:40<7:15:46,  1.81s/it, loss=0.289, lr=1e-5]Steps:   4%|▎         | 535/15001 [20:42<7:27:16,  1.86s/it, loss=0.289, lr=1e-5]Steps:   4%|▎         | 535/15001 [20:42<7:27:16,  1.86s/it, loss=0.0552, lr=1e-5]Steps:   4%|▎         | 536/15001 [20:44<7:24:38,  1.84s/it, loss=0.0552, lr=1e-5]Steps:   4%|▎         | 536/15001 [20:44<7:24:38,  1.84s/it, loss=0.0546, lr=1e-5]Steps:   4%|▎         | 537/15001 [20:46<7:30:34,  1.87s/it, loss=0.0546, lr=1e-5]Steps:   4%|▎         | 537/15001 [20:46<7:30:34,  1.87s/it, loss=0.329, lr=1e-5] Steps:   4%|▎         | 538/15001 [20:48<7:49:49,  1.95s/it, loss=0.329, lr=1e-5]Steps:   4%|▎         | 538/15001 [20:48<7:49:49,  1.95s/it, loss=0.249, lr=1e-5]Steps:   4%|▎         | 539/15001 [20:50<7:55:41,  1.97s/it, loss=0.249, lr=1e-5]Steps:   4%|▎         | 539/15001 [20:50<7:55:41,  1.97s/it, loss=0.148, lr=1e-5]Steps:   4%|▎         | 540/15001 [20:52<8:12:00,  2.04s/it, loss=0.148, lr=1e-5]Steps:   4%|▎         | 540/15001 [20:52<8:12:00,  2.04s/it, loss=0.191, lr=1e-5]Steps:   4%|▎         | 541/15001 [20:54<8:03:52,  2.01s/it, loss=0.191, lr=1e-5]Steps:   4%|▎         | 541/15001 [20:54<8:03:52,  2.01s/it, loss=0.196, lr=1e-5]Steps:   4%|▎         | 542/15001 [20:56<7:49:14,  1.95s/it, loss=0.196, lr=1e-5]Steps:   4%|▎         | 542/15001 [20:56<7:49:14,  1.95s/it, loss=0.331, lr=1e-5]Steps:   4%|▎         | 543/15001 [20:57<7:32:09,  1.88s/it, loss=0.331, lr=1e-5]Steps:   4%|▎         | 543/15001 [20:57<7:32:09,  1.88s/it, loss=0.0909, lr=1e-5]Steps:   4%|▎         | 544/15001 [20:59<7:37:32,  1.90s/it, loss=0.0909, lr=1e-5]Steps:   4%|▎         | 544/15001 [21:00<7:37:32,  1.90s/it, loss=0.303, lr=1e-5] Steps:   4%|▎         | 545/15001 [21:01<7:42:23,  1.92s/it, loss=0.303, lr=1e-5]Steps:   4%|▎         | 545/15001 [21:01<7:42:23,  1.92s/it, loss=0.151, lr=1e-5]Steps:   4%|▎         | 546/15001 [21:03<7:27:18,  1.86s/it, loss=0.151, lr=1e-5]Steps:   4%|▎         | 546/15001 [21:03<7:27:18,  1.86s/it, loss=0.117, lr=1e-5]Steps:   4%|▎         | 547/15001 [21:05<7:07:09,  1.77s/it, loss=0.117, lr=1e-5]Steps:   4%|▎         | 547/15001 [21:05<7:07:09,  1.77s/it, loss=0.035, lr=1e-5]Steps:   4%|▎         | 548/15001 [21:07<7:23:30,  1.84s/it, loss=0.035, lr=1e-5]Steps:   4%|▎         | 548/15001 [21:07<7:23:30,  1.84s/it, loss=0.136, lr=1e-5]Steps:   4%|▎         | 549/15001 [21:08<7:18:28,  1.82s/it, loss=0.136, lr=1e-5]Steps:   4%|▎         | 549/15001 [21:09<7:18:28,  1.82s/it, loss=0.117, lr=1e-5]Steps:   4%|▎         | 550/15001 [21:10<7:29:09,  1.86s/it, loss=0.117, lr=1e-5]Steps:   4%|▎         | 550/15001 [21:10<7:29:09,  1.86s/it, loss=0.0268, lr=1e-5]Steps:   4%|▎         | 551/15001 [21:12<7:29:14,  1.87s/it, loss=0.0268, lr=1e-5]Steps:   4%|▎         | 551/15001 [21:12<7:29:14,  1.87s/it, loss=0.113, lr=1e-5] Steps:   4%|▎         | 552/15001 [21:14<7:40:40,  1.91s/it, loss=0.113, lr=1e-5]Steps:   4%|▎         | 552/15001 [21:14<7:40:40,  1.91s/it, loss=0.253, lr=1e-5]Steps:   4%|▎         | 553/15001 [21:16<7:28:33,  1.86s/it, loss=0.253, lr=1e-5]Steps:   4%|▎         | 553/15001 [21:16<7:28:33,  1.86s/it, loss=0.121, lr=1e-5]Steps:   4%|▎         | 554/15001 [21:18<7:26:11,  1.85s/it, loss=0.121, lr=1e-5]Steps:   4%|▎         | 554/15001 [21:18<7:26:11,  1.85s/it, loss=0.0548, lr=1e-5]Steps:   4%|▎         | 555/15001 [21:19<7:16:03,  1.81s/it, loss=0.0548, lr=1e-5]Steps:   4%|▎         | 555/15001 [21:20<7:16:03,  1.81s/it, loss=0.287, lr=1e-5] Steps:   4%|▎         | 556/15001 [21:21<7:14:49,  1.81s/it, loss=0.287, lr=1e-5]Steps:   4%|▎         | 556/15001 [21:21<7:14:49,  1.81s/it, loss=0.175, lr=1e-5]Steps:   4%|▎         | 557/15001 [21:23<7:06:22,  1.77s/it, loss=0.175, lr=1e-5]Steps:   4%|▎         | 557/15001 [21:23<7:06:22,  1.77s/it, loss=0.155, lr=1e-5]Steps:   4%|▎         | 558/15001 [21:25<7:32:42,  1.88s/it, loss=0.155, lr=1e-5]Steps:   4%|▎         | 558/15001 [21:25<7:32:42,  1.88s/it, loss=0.116, lr=1e-5]Steps:   4%|▎         | 559/15001 [21:27<7:35:19,  1.89s/it, loss=0.116, lr=1e-5]Steps:   4%|▎         | 559/15001 [21:27<7:35:19,  1.89s/it, loss=0.273, lr=1e-5]Steps:   4%|▎         | 560/15001 [21:29<7:55:45,  1.98s/it, loss=0.273, lr=1e-5]Steps:   4%|▎         | 560/15001 [21:29<7:55:45,  1.98s/it, loss=0.267, lr=1e-5]Steps:   4%|▎         | 561/15001 [21:31<8:02:18,  2.00s/it, loss=0.267, lr=1e-5]Steps:   4%|▎         | 561/15001 [21:31<8:02:18,  2.00s/it, loss=0.193, lr=1e-5]Steps:   4%|▎         | 562/15001 [21:33<8:12:46,  2.05s/it, loss=0.193, lr=1e-5]Steps:   4%|▎         | 562/15001 [21:33<8:12:46,  2.05s/it, loss=0.191, lr=1e-5]Steps:   4%|▍         | 563/15001 [21:35<7:54:20,  1.97s/it, loss=0.191, lr=1e-5]Steps:   4%|▍         | 563/15001 [21:35<7:54:20,  1.97s/it, loss=0.3, lr=1e-5]  Steps:   4%|▍         | 564/15001 [21:37<7:41:41,  1.92s/it, loss=0.3, lr=1e-5]Steps:   4%|▍         | 564/15001 [21:37<7:41:41,  1.92s/it, loss=0.139, lr=1e-5]Steps:   4%|▍         | 565/15001 [21:39<7:36:39,  1.90s/it, loss=0.139, lr=1e-5]Steps:   4%|▍         | 565/15001 [21:39<7:36:39,  1.90s/it, loss=0.21, lr=1e-5] Steps:   4%|▍         | 566/15001 [21:41<7:50:01,  1.95s/it, loss=0.21, lr=1e-5]Steps:   4%|▍         | 566/15001 [21:41<7:50:01,  1.95s/it, loss=0.163, lr=1e-5]Steps:   4%|▍         | 567/15001 [21:43<7:40:55,  1.92s/it, loss=0.163, lr=1e-5]Steps:   4%|▍         | 567/15001 [21:43<7:40:55,  1.92s/it, loss=0.215, lr=1e-5]Steps:   4%|▍         | 568/15001 [21:45<7:33:43,  1.89s/it, loss=0.215, lr=1e-5]Steps:   4%|▍         | 568/15001 [21:45<7:33:43,  1.89s/it, loss=0.0799, lr=1e-5]Steps:   4%|▍         | 569/15001 [21:47<7:42:09,  1.92s/it, loss=0.0799, lr=1e-5]Steps:   4%|▍         | 569/15001 [21:47<7:42:09,  1.92s/it, loss=0.207, lr=1e-5] Steps:   4%|▍         | 570/15001 [21:48<7:21:09,  1.83s/it, loss=0.207, lr=1e-5]Steps:   4%|▍         | 570/15001 [21:48<7:21:09,  1.83s/it, loss=0.129, lr=1e-5]Steps:   4%|▍         | 571/15001 [21:50<7:18:54,  1.82s/it, loss=0.129, lr=1e-5]Steps:   4%|▍         | 571/15001 [21:50<7:18:54,  1.82s/it, loss=0.297, lr=1e-5]Steps:   4%|▍         | 572/15001 [21:52<7:17:16,  1.82s/it, loss=0.297, lr=1e-5]Steps:   4%|▍         | 572/15001 [21:52<7:17:16,  1.82s/it, loss=0.383, lr=1e-5]Steps:   4%|▍         | 573/15001 [21:54<7:19:04,  1.83s/it, loss=0.383, lr=1e-5]Steps:   4%|▍         | 573/15001 [21:54<7:19:04,  1.83s/it, loss=0.281, lr=1e-5]Steps:   4%|▍         | 574/15001 [21:56<7:23:45,  1.85s/it, loss=0.281, lr=1e-5]Steps:   4%|▍         | 574/15001 [21:56<7:23:45,  1.85s/it, loss=0.223, lr=1e-5]Steps:   4%|▍         | 575/15001 [21:57<7:26:45,  1.86s/it, loss=0.223, lr=1e-5]Steps:   4%|▍         | 575/15001 [21:58<7:26:45,  1.86s/it, loss=0.418, lr=1e-5]Steps:   4%|▍         | 576/15001 [21:59<7:38:33,  1.91s/it, loss=0.418, lr=1e-5]Steps:   4%|▍         | 576/15001 [21:59<7:38:33,  1.91s/it, loss=0.0852, lr=1e-5]Steps:   4%|▍         | 577/15001 [22:01<7:19:26,  1.83s/it, loss=0.0852, lr=1e-5]Steps:   4%|▍         | 577/15001 [22:01<7:19:26,  1.83s/it, loss=0.222, lr=1e-5] Steps:   4%|▍         | 578/15001 [22:03<7:23:44,  1.85s/it, loss=0.222, lr=1e-5]Steps:   4%|▍         | 578/15001 [22:03<7:23:44,  1.85s/it, loss=0.0981, lr=1e-5]Steps:   4%|▍         | 579/15001 [22:05<7:25:07,  1.85s/it, loss=0.0981, lr=1e-5]Steps:   4%|▍         | 579/15001 [22:05<7:25:07,  1.85s/it, loss=0.222, lr=1e-5] Steps:   4%|▍         | 580/15001 [22:07<7:21:58,  1.84s/it, loss=0.222, lr=1e-5]Steps:   4%|▍         | 580/15001 [22:07<7:21:58,  1.84s/it, loss=0.195, lr=1e-5]Steps:   4%|▍         | 581/15001 [22:09<7:30:22,  1.87s/it, loss=0.195, lr=1e-5]Steps:   4%|▍         | 581/15001 [22:09<7:30:22,  1.87s/it, loss=0.229, lr=1e-5]Steps:   4%|▍         | 582/15001 [22:11<7:49:58,  1.96s/it, loss=0.229, lr=1e-5]Steps:   4%|▍         | 582/15001 [22:11<7:49:58,  1.96s/it, loss=0.292, lr=1e-5]Steps:   4%|▍         | 583/15001 [22:13<8:11:42,  2.05s/it, loss=0.292, lr=1e-5]Steps:   4%|▍         | 583/15001 [22:13<8:11:42,  2.05s/it, loss=0.328, lr=1e-5]Steps:   4%|▍         | 584/15001 [22:15<8:11:03,  2.04s/it, loss=0.328, lr=1e-5]Steps:   4%|▍         | 584/15001 [22:15<8:11:03,  2.04s/it, loss=0.152, lr=1e-5]Steps:   4%|▍         | 585/15001 [22:17<7:58:29,  1.99s/it, loss=0.152, lr=1e-5]Steps:   4%|▍         | 585/15001 [22:17<7:58:29,  1.99s/it, loss=0.11, lr=1e-5] Steps:   4%|▍         | 586/15001 [22:19<7:59:53,  2.00s/it, loss=0.11, lr=1e-5]Steps:   4%|▍         | 586/15001 [22:19<7:59:53,  2.00s/it, loss=0.186, lr=1e-5]Steps:   4%|▍         | 587/15001 [22:21<7:33:22,  1.89s/it, loss=0.186, lr=1e-5]Steps:   4%|▍         | 587/15001 [22:21<7:33:22,  1.89s/it, loss=0.164, lr=1e-5]Steps:   4%|▍         | 588/15001 [22:22<7:35:30,  1.90s/it, loss=0.164, lr=1e-5]Steps:   4%|▍         | 588/15001 [22:23<7:35:30,  1.90s/it, loss=0.358, lr=1e-5]Steps:   4%|▍         | 589/15001 [22:24<7:40:33,  1.92s/it, loss=0.358, lr=1e-5]Steps:   4%|▍         | 589/15001 [22:24<7:40:33,  1.92s/it, loss=0.172, lr=1e-5]Steps:   4%|▍         | 590/15001 [22:26<7:12:52,  1.80s/it, loss=0.172, lr=1e-5]Steps:   4%|▍         | 590/15001 [22:26<7:12:52,  1.80s/it, loss=0.173, lr=1e-5]Steps:   4%|▍         | 591/15001 [22:28<7:16:15,  1.82s/it, loss=0.173, lr=1e-5]Steps:   4%|▍         | 591/15001 [22:28<7:16:15,  1.82s/it, loss=0.262, lr=1e-5]Steps:   4%|▍         | 592/15001 [22:30<7:24:21,  1.85s/it, loss=0.262, lr=1e-5]Steps:   4%|▍         | 592/15001 [22:30<7:24:21,  1.85s/it, loss=0.196, lr=1e-5]Steps:   4%|▍         | 593/15001 [22:32<7:33:29,  1.89s/it, loss=0.196, lr=1e-5]Steps:   4%|▍         | 593/15001 [22:32<7:33:29,  1.89s/it, loss=0.119, lr=1e-5]Steps:   4%|▍         | 594/15001 [22:33<7:01:45,  1.76s/it, loss=0.119, lr=1e-5]Steps:   4%|▍         | 594/15001 [22:34<7:01:45,  1.76s/it, loss=0.0153, lr=1e-5]Steps:   4%|▍         | 595/15001 [22:35<7:36:57,  1.90s/it, loss=0.0153, lr=1e-5]Steps:   4%|▍         | 595/15001 [22:36<7:36:57,  1.90s/it, loss=0.179, lr=1e-5] Steps:   4%|▍         | 596/15001 [22:37<7:19:05,  1.83s/it, loss=0.179, lr=1e-5]Steps:   4%|▍         | 596/15001 [22:37<7:19:05,  1.83s/it, loss=0.147, lr=1e-5]Steps:   4%|▍         | 597/15001 [22:39<7:26:27,  1.86s/it, loss=0.147, lr=1e-5]Steps:   4%|▍         | 597/15001 [22:39<7:26:27,  1.86s/it, loss=0.236, lr=1e-5]Steps:   4%|▍         | 598/15001 [22:41<7:14:19,  1.81s/it, loss=0.236, lr=1e-5]Steps:   4%|▍         | 598/15001 [22:41<7:14:19,  1.81s/it, loss=0.252, lr=1e-5]Steps:   4%|▍         | 599/15001 [22:43<7:24:16,  1.85s/it, loss=0.252, lr=1e-5]Steps:   4%|▍         | 599/15001 [22:43<7:24:16,  1.85s/it, loss=0.28, lr=1e-5] Steps:   4%|▍         | 600/15001 [22:44<7:21:13,  1.84s/it, loss=0.28, lr=1e-5]Steps:   4%|▍         | 600/15001 [22:45<7:21:13,  1.84s/it, loss=0.239, lr=1e-5]Steps:   4%|▍         | 601/15001 [22:46<7:29:27,  1.87s/it, loss=0.239, lr=1e-5]Steps:   4%|▍         | 601/15001 [22:47<7:29:27,  1.87s/it, loss=0.103, lr=1e-5]Steps:   4%|▍         | 602/15001 [22:48<7:34:45,  1.89s/it, loss=0.103, lr=1e-5]Steps:   4%|▍         | 602/15001 [22:48<7:34:45,  1.89s/it, loss=0.272, lr=1e-5]Steps:   4%|▍         | 603/15001 [22:50<7:32:15,  1.88s/it, loss=0.272, lr=1e-5]Steps:   4%|▍         | 603/15001 [22:50<7:32:15,  1.88s/it, loss=0.122, lr=1e-5]Steps:   4%|▍         | 604/15001 [22:52<7:42:25,  1.93s/it, loss=0.122, lr=1e-5]Steps:   4%|▍         | 604/15001 [22:52<7:42:25,  1.93s/it, loss=0.128, lr=1e-5]Steps:   4%|▍         | 605/15001 [22:54<7:53:42,  1.97s/it, loss=0.128, lr=1e-5]Steps:   4%|▍         | 605/15001 [22:54<7:53:42,  1.97s/it, loss=0.225, lr=1e-5]Steps:   4%|▍         | 606/15001 [22:56<7:34:27,  1.89s/it, loss=0.225, lr=1e-5]Steps:   4%|▍         | 606/15001 [22:56<7:34:27,  1.89s/it, loss=0.157, lr=1e-5]Steps:   4%|▍         | 607/15001 [22:58<7:58:50,  2.00s/it, loss=0.157, lr=1e-5]Steps:   4%|▍         | 607/15001 [22:59<7:58:50,  2.00s/it, loss=0.167, lr=1e-5]Steps:   4%|▍         | 608/15001 [23:00<7:53:08,  1.97s/it, loss=0.167, lr=1e-5]Steps:   4%|▍         | 608/15001 [23:01<7:53:08,  1.97s/it, loss=0.034, lr=1e-5]Steps:   4%|▍         | 609/15001 [23:02<8:14:28,  2.06s/it, loss=0.034, lr=1e-5]Steps:   4%|▍         | 609/15001 [23:03<8:14:28,  2.06s/it, loss=0.145, lr=1e-5]Steps:   4%|▍         | 610/15001 [23:04<7:48:24,  1.95s/it, loss=0.145, lr=1e-5]Steps:   4%|▍         | 610/15001 [23:04<7:48:24,  1.95s/it, loss=0.169, lr=1e-5]Steps:   4%|▍         | 611/15001 [23:06<7:36:33,  1.90s/it, loss=0.169, lr=1e-5]Steps:   4%|▍         | 611/15001 [23:06<7:36:33,  1.90s/it, loss=0.212, lr=1e-5]Steps:   4%|▍         | 612/15001 [23:08<7:46:33,  1.95s/it, loss=0.212, lr=1e-5]Steps:   4%|▍         | 612/15001 [23:08<7:46:33,  1.95s/it, loss=0.287, lr=1e-5]Steps:   4%|▍         | 613/15001 [23:10<7:26:35,  1.86s/it, loss=0.287, lr=1e-5]Steps:   4%|▍         | 613/15001 [23:10<7:26:35,  1.86s/it, loss=0.233, lr=1e-5]Steps:   4%|▍         | 614/15001 [23:11<7:15:13,  1.82s/it, loss=0.233, lr=1e-5]Steps:   4%|▍         | 614/15001 [23:12<7:15:13,  1.82s/it, loss=0.161, lr=1e-5]Steps:   4%|▍         | 615/15001 [23:13<7:38:11,  1.91s/it, loss=0.161, lr=1e-5]Steps:   4%|▍         | 615/15001 [23:14<7:38:11,  1.91s/it, loss=0.187, lr=1e-5]Steps:   4%|▍         | 616/15001 [23:15<7:26:09,  1.86s/it, loss=0.187, lr=1e-5]Steps:   4%|▍         | 616/15001 [23:15<7:26:09,  1.86s/it, loss=0.137, lr=1e-5]Steps:   4%|▍         | 617/15001 [23:17<7:04:49,  1.77s/it, loss=0.137, lr=1e-5]Steps:   4%|▍         | 617/15001 [23:17<7:04:49,  1.77s/it, loss=0.0976, lr=1e-5]Steps:   4%|▍         | 618/15001 [23:19<7:28:35,  1.87s/it, loss=0.0976, lr=1e-5]Steps:   4%|▍         | 618/15001 [23:19<7:28:35,  1.87s/it, loss=0.187, lr=1e-5] Steps:   4%|▍         | 619/15001 [23:21<7:23:52,  1.85s/it, loss=0.187, lr=1e-5]Steps:   4%|▍         | 619/15001 [23:21<7:23:52,  1.85s/it, loss=0.184, lr=1e-5]Steps:   4%|▍         | 620/15001 [23:22<6:55:10,  1.73s/it, loss=0.184, lr=1e-5]Steps:   4%|▍         | 620/15001 [23:23<6:55:10,  1.73s/it, loss=0.291, lr=1e-5]Steps:   4%|▍         | 621/15001 [23:24<7:35:38,  1.90s/it, loss=0.291, lr=1e-5]Steps:   4%|▍         | 621/15001 [23:25<7:35:38,  1.90s/it, loss=0.342, lr=1e-5]Steps:   4%|▍         | 622/15001 [23:26<7:40:44,  1.92s/it, loss=0.342, lr=1e-5]Steps:   4%|▍         | 622/15001 [23:26<7:40:44,  1.92s/it, loss=0.126, lr=1e-5]Steps:   4%|▍         | 623/15001 [23:28<7:34:12,  1.90s/it, loss=0.126, lr=1e-5]Steps:   4%|▍         | 623/15001 [23:28<7:34:12,  1.90s/it, loss=0.161, lr=1e-5]Steps:   4%|▍         | 624/15001 [23:30<7:21:37,  1.84s/it, loss=0.161, lr=1e-5]Steps:   4%|▍         | 624/15001 [23:30<7:21:37,  1.84s/it, loss=0.0663, lr=1e-5]Steps:   4%|▍         | 625/15001 [23:32<7:18:48,  1.83s/it, loss=0.0663, lr=1e-5]Steps:   4%|▍         | 625/15001 [23:32<7:18:48,  1.83s/it, loss=0.0687, lr=1e-5]Steps:   4%|▍         | 626/15001 [23:34<7:41:41,  1.93s/it, loss=0.0687, lr=1e-5]Steps:   4%|▍         | 626/15001 [23:34<7:41:41,  1.93s/it, loss=0.0893, lr=1e-5]Steps:   4%|▍         | 627/15001 [23:36<7:54:32,  1.98s/it, loss=0.0893, lr=1e-5]Steps:   4%|▍         | 627/15001 [23:36<7:54:32,  1.98s/it, loss=0.145, lr=1e-5] Steps:   4%|▍         | 628/15001 [23:38<7:47:48,  1.95s/it, loss=0.145, lr=1e-5]Steps:   4%|▍         | 628/15001 [23:38<7:47:48,  1.95s/it, loss=0.218, lr=1e-5]Steps:   4%|▍         | 629/15001 [23:40<7:46:25,  1.95s/it, loss=0.218, lr=1e-5]Steps:   4%|▍         | 629/15001 [23:40<7:46:25,  1.95s/it, loss=0.277, lr=1e-5]Steps:   4%|▍         | 630/15001 [23:42<8:05:41,  2.03s/it, loss=0.277, lr=1e-5]Steps:   4%|▍         | 630/15001 [23:42<8:05:41,  2.03s/it, loss=0.286, lr=1e-5]Steps:   4%|▍         | 631/15001 [23:44<8:03:58,  2.02s/it, loss=0.286, lr=1e-5]Steps:   4%|▍         | 631/15001 [23:44<8:03:58,  2.02s/it, loss=0.155, lr=1e-5]Steps:   4%|▍         | 632/15001 [23:45<7:17:59,  1.83s/it, loss=0.155, lr=1e-5]Steps:   4%|▍         | 632/15001 [23:46<7:17:59,  1.83s/it, loss=0.413, lr=1e-5]Steps:   4%|▍         | 633/15001 [23:47<7:30:06,  1.88s/it, loss=0.413, lr=1e-5]Steps:   4%|▍         | 633/15001 [23:48<7:30:06,  1.88s/it, loss=0.307, lr=1e-5]Steps:   4%|▍         | 634/15001 [23:49<7:35:45,  1.90s/it, loss=0.307, lr=1e-5]Steps:   4%|▍         | 634/15001 [23:50<7:35:45,  1.90s/it, loss=0.086, lr=1e-5]Steps:   4%|▍         | 635/15001 [23:51<7:15:13,  1.82s/it, loss=0.086, lr=1e-5]Steps:   4%|▍         | 635/15001 [23:52<7:15:13,  1.82s/it, loss=0.0688, lr=1e-5]Steps:   4%|▍         | 636/15001 [23:53<7:37:30,  1.91s/it, loss=0.0688, lr=1e-5]Steps:   4%|▍         | 636/15001 [23:53<7:37:30,  1.91s/it, loss=0.189, lr=1e-5] Steps:   4%|▍         | 637/15001 [23:55<7:43:38,  1.94s/it, loss=0.189, lr=1e-5]Steps:   4%|▍         | 637/15001 [23:55<7:43:38,  1.94s/it, loss=0.21, lr=1e-5] Steps:   4%|▍         | 638/15001 [23:57<7:21:57,  1.85s/it, loss=0.21, lr=1e-5]Steps:   4%|▍         | 638/15001 [23:57<7:21:57,  1.85s/it, loss=0.239, lr=1e-5]Steps:   4%|▍         | 639/15001 [23:59<7:44:00,  1.94s/it, loss=0.239, lr=1e-5]Steps:   4%|▍         | 639/15001 [23:59<7:44:00,  1.94s/it, loss=0.226, lr=1e-5]Steps:   4%|▍         | 640/15001 [24:01<7:19:29,  1.84s/it, loss=0.226, lr=1e-5]Steps:   4%|▍         | 640/15001 [24:01<7:19:29,  1.84s/it, loss=0.254, lr=1e-5]Steps:   4%|▍         | 641/15001 [24:03<8:02:13,  2.01s/it, loss=0.254, lr=1e-5]Steps:   4%|▍         | 641/15001 [24:03<8:02:13,  2.01s/it, loss=0.138, lr=1e-5]Steps:   4%|▍         | 642/15001 [24:05<7:48:08,  1.96s/it, loss=0.138, lr=1e-5]Steps:   4%|▍         | 642/15001 [24:05<7:48:08,  1.96s/it, loss=0.041, lr=1e-5]Steps:   4%|▍         | 643/15001 [24:06<7:25:40,  1.86s/it, loss=0.041, lr=1e-5]Steps:   4%|▍         | 643/15001 [24:07<7:25:40,  1.86s/it, loss=0.247, lr=1e-5]Steps:   4%|▍         | 644/15001 [24:08<7:34:37,  1.90s/it, loss=0.247, lr=1e-5]Steps:   4%|▍         | 644/15001 [24:09<7:34:37,  1.90s/it, loss=0.131, lr=1e-5]Steps:   4%|▍         | 645/15001 [24:10<7:13:52,  1.81s/it, loss=0.131, lr=1e-5]Steps:   4%|▍         | 645/15001 [24:10<7:13:52,  1.81s/it, loss=0.216, lr=1e-5]Steps:   4%|▍         | 646/15001 [24:12<7:08:26,  1.79s/it, loss=0.216, lr=1e-5]Steps:   4%|▍         | 646/15001 [24:12<7:08:26,  1.79s/it, loss=0.0804, lr=1e-5]Steps:   4%|▍         | 647/15001 [24:14<7:33:22,  1.90s/it, loss=0.0804, lr=1e-5]Steps:   4%|▍         | 647/15001 [24:14<7:33:22,  1.90s/it, loss=0.21, lr=1e-5]  Steps:   4%|▍         | 648/15001 [24:16<7:37:52,  1.91s/it, loss=0.21, lr=1e-5]Steps:   4%|▍         | 648/15001 [24:16<7:37:52,  1.91s/it, loss=0.0384, lr=1e-5]Steps:   4%|▍         | 649/15001 [24:18<7:47:34,  1.95s/it, loss=0.0384, lr=1e-5]Steps:   4%|▍         | 649/15001 [24:18<7:47:34,  1.95s/it, loss=0.0539, lr=1e-5]Steps:   4%|▍         | 650/15001 [24:20<7:47:17,  1.95s/it, loss=0.0539, lr=1e-5]Steps:   4%|▍         | 650/15001 [24:20<7:47:17,  1.95s/it, loss=0.11, lr=1e-5]  Steps:   4%|▍         | 651/15001 [24:22<7:52:20,  1.97s/it, loss=0.11, lr=1e-5]Steps:   4%|▍         | 651/15001 [24:22<7:52:20,  1.97s/it, loss=0.15, lr=1e-5]Steps:   4%|▍         | 652/15001 [24:24<7:47:02,  1.95s/it, loss=0.15, lr=1e-5]Steps:   4%|▍         | 652/15001 [24:24<7:47:02,  1.95s/it, loss=0.108, lr=1e-5]Steps:   4%|▍         | 653/15001 [24:26<7:53:43,  1.98s/it, loss=0.108, lr=1e-5]Steps:   4%|▍         | 653/15001 [24:26<7:53:43,  1.98s/it, loss=0.164, lr=1e-5]Steps:   4%|▍         | 654/15001 [24:28<7:41:16,  1.93s/it, loss=0.164, lr=1e-5]Steps:   4%|▍         | 654/15001 [24:28<7:41:16,  1.93s/it, loss=0.219, lr=1e-5]Steps:   4%|▍         | 655/15001 [24:29<7:33:35,  1.90s/it, loss=0.219, lr=1e-5]Steps:   4%|▍         | 655/15001 [24:30<7:33:35,  1.90s/it, loss=0.131, lr=1e-5]Steps:   4%|▍         | 656/15001 [24:31<7:37:19,  1.91s/it, loss=0.131, lr=1e-5]Steps:   4%|▍         | 656/15001 [24:31<7:37:19,  1.91s/it, loss=0.0475, lr=1e-5]Steps:   4%|▍         | 657/15001 [24:33<7:28:06,  1.87s/it, loss=0.0475, lr=1e-5]Steps:   4%|▍         | 657/15001 [24:33<7:28:06,  1.87s/it, loss=0.214, lr=1e-5] Steps:   4%|▍         | 658/15001 [24:35<7:08:13,  1.79s/it, loss=0.214, lr=1e-5]Steps:   4%|▍         | 658/15001 [24:35<7:08:13,  1.79s/it, loss=0.23, lr=1e-5] Steps:   4%|▍         | 659/15001 [24:37<7:28:00,  1.87s/it, loss=0.23, lr=1e-5]Steps:   4%|▍         | 659/15001 [24:37<7:28:00,  1.87s/it, loss=0.15, lr=1e-5]Steps:   4%|▍         | 660/15001 [24:39<7:19:07,  1.84s/it, loss=0.15, lr=1e-5]Steps:   4%|▍         | 660/15001 [24:39<7:19:07,  1.84s/it, loss=0.363, lr=1e-5]Steps:   4%|▍         | 661/15001 [24:40<7:15:26,  1.82s/it, loss=0.363, lr=1e-5]Steps:   4%|▍         | 661/15001 [24:41<7:15:26,  1.82s/it, loss=0.0781, lr=1e-5]Steps:   4%|▍         | 662/15001 [24:42<7:25:45,  1.87s/it, loss=0.0781, lr=1e-5]Steps:   4%|▍         | 662/15001 [24:42<7:25:45,  1.87s/it, loss=0.179, lr=1e-5] Steps:   4%|▍         | 663/15001 [24:44<7:16:48,  1.83s/it, loss=0.179, lr=1e-5]Steps:   4%|▍         | 663/15001 [24:44<7:16:48,  1.83s/it, loss=0.304, lr=1e-5]Steps:   4%|▍         | 664/15001 [24:46<7:20:34,  1.84s/it, loss=0.304, lr=1e-5]Steps:   4%|▍         | 664/15001 [24:46<7:20:34,  1.84s/it, loss=0.0861, lr=1e-5]Steps:   4%|▍         | 665/15001 [24:48<7:18:49,  1.84s/it, loss=0.0861, lr=1e-5]Steps:   4%|▍         | 665/15001 [24:48<7:18:49,  1.84s/it, loss=0.301, lr=1e-5] Steps:   4%|▍         | 666/15001 [24:50<7:12:51,  1.81s/it, loss=0.301, lr=1e-5]Steps:   4%|▍         | 666/15001 [24:50<7:12:51,  1.81s/it, loss=0.12, lr=1e-5] Steps:   4%|▍         | 667/15001 [24:52<7:25:37,  1.87s/it, loss=0.12, lr=1e-5]Steps:   4%|▍         | 667/15001 [24:52<7:25:37,  1.87s/it, loss=0.0162, lr=1e-5]Steps:   4%|▍         | 668/15001 [24:53<7:17:34,  1.83s/it, loss=0.0162, lr=1e-5]Steps:   4%|▍         | 668/15001 [24:54<7:17:34,  1.83s/it, loss=0.099, lr=1e-5] Steps:   4%|▍         | 669/15001 [24:55<7:21:22,  1.85s/it, loss=0.099, lr=1e-5]Steps:   4%|▍         | 669/15001 [24:55<7:21:22,  1.85s/it, loss=0.144, lr=1e-5]Steps:   4%|▍         | 670/15001 [24:57<7:05:06,  1.78s/it, loss=0.144, lr=1e-5]Steps:   4%|▍         | 670/15001 [24:57<7:05:06,  1.78s/it, loss=0.107, lr=1e-5]Steps:   4%|▍         | 671/15001 [24:59<7:15:57,  1.83s/it, loss=0.107, lr=1e-5]Steps:   4%|▍         | 671/15001 [24:59<7:15:57,  1.83s/it, loss=0.104, lr=1e-5]Steps:   4%|▍         | 672/15001 [25:01<7:20:59,  1.85s/it, loss=0.104, lr=1e-5]Steps:   4%|▍         | 672/15001 [25:01<7:20:59,  1.85s/it, loss=0.313, lr=1e-5]Steps:   4%|▍         | 673/15001 [25:03<7:53:13,  1.98s/it, loss=0.313, lr=1e-5]Steps:   4%|▍         | 673/15001 [25:03<7:53:13,  1.98s/it, loss=0.144, lr=1e-5]Steps:   4%|▍         | 674/15001 [25:05<7:50:25,  1.97s/it, loss=0.144, lr=1e-5]Steps:   4%|▍         | 674/15001 [25:05<7:50:25,  1.97s/it, loss=0.158, lr=1e-5]Steps:   4%|▍         | 675/15001 [25:07<7:41:41,  1.93s/it, loss=0.158, lr=1e-5]Steps:   4%|▍         | 675/15001 [25:07<7:41:41,  1.93s/it, loss=0.0357, lr=1e-5]Steps:   5%|▍         | 676/15001 [25:09<7:47:00,  1.96s/it, loss=0.0357, lr=1e-5]Steps:   5%|▍         | 676/15001 [25:09<7:47:00,  1.96s/it, loss=0.301, lr=1e-5] Steps:   5%|▍         | 677/15001 [25:11<7:57:57,  2.00s/it, loss=0.301, lr=1e-5]Steps:   5%|▍         | 677/15001 [25:11<7:57:57,  2.00s/it, loss=0.411, lr=1e-5]Steps:   5%|▍         | 678/15001 [25:13<7:42:14,  1.94s/it, loss=0.411, lr=1e-5]Steps:   5%|▍         | 678/15001 [25:13<7:42:14,  1.94s/it, loss=0.134, lr=1e-5]Steps:   5%|▍         | 679/15001 [25:15<7:37:03,  1.91s/it, loss=0.134, lr=1e-5]Steps:   5%|▍         | 679/15001 [25:15<7:37:03,  1.91s/it, loss=0.426, lr=1e-5]Steps:   5%|▍         | 680/15001 [25:17<7:44:54,  1.95s/it, loss=0.426, lr=1e-5]Steps:   5%|▍         | 680/15001 [25:17<7:44:54,  1.95s/it, loss=0.0373, lr=1e-5]Steps:   5%|▍         | 681/15001 [25:18<7:33:13,  1.90s/it, loss=0.0373, lr=1e-5]Steps:   5%|▍         | 681/15001 [25:18<7:33:13,  1.90s/it, loss=0.209, lr=1e-5] Steps:   5%|▍         | 682/15001 [25:20<7:14:23,  1.82s/it, loss=0.209, lr=1e-5]Steps:   5%|▍         | 682/15001 [25:20<7:14:23,  1.82s/it, loss=0.128, lr=1e-5]Steps:   5%|▍         | 683/15001 [25:22<7:21:15,  1.85s/it, loss=0.128, lr=1e-5]Steps:   5%|▍         | 683/15001 [25:22<7:21:15,  1.85s/it, loss=0.366, lr=1e-5]Steps:   5%|▍         | 684/15001 [25:24<7:30:41,  1.89s/it, loss=0.366, lr=1e-5]Steps:   5%|▍         | 684/15001 [25:24<7:30:41,  1.89s/it, loss=0.246, lr=1e-5]Steps:   5%|▍         | 685/15001 [25:26<7:20:37,  1.85s/it, loss=0.246, lr=1e-5]Steps:   5%|▍         | 685/15001 [25:26<7:20:37,  1.85s/it, loss=0.103, lr=1e-5]Steps:   5%|▍         | 686/15001 [25:27<7:21:29,  1.85s/it, loss=0.103, lr=1e-5]Steps:   5%|▍         | 686/15001 [25:28<7:21:29,  1.85s/it, loss=0.135, lr=1e-5]Steps:   5%|▍         | 687/15001 [25:30<7:36:18,  1.91s/it, loss=0.135, lr=1e-5]Steps:   5%|▍         | 687/15001 [25:30<7:36:18,  1.91s/it, loss=0.0983, lr=1e-5]Steps:   5%|▍         | 688/15001 [25:31<7:11:02,  1.81s/it, loss=0.0983, lr=1e-5]Steps:   5%|▍         | 688/15001 [25:31<7:11:02,  1.81s/it, loss=0.258, lr=1e-5] Steps:   5%|▍         | 689/15001 [25:33<7:25:59,  1.87s/it, loss=0.258, lr=1e-5]Steps:   5%|▍         | 689/15001 [25:33<7:25:59,  1.87s/it, loss=0.111, lr=1e-5]Steps:   5%|▍         | 690/15001 [25:35<7:12:17,  1.81s/it, loss=0.111, lr=1e-5]Steps:   5%|▍         | 690/15001 [25:35<7:12:17,  1.81s/it, loss=0.188, lr=1e-5]Steps:   5%|▍         | 691/15001 [25:37<7:13:26,  1.82s/it, loss=0.188, lr=1e-5]Steps:   5%|▍         | 691/15001 [25:37<7:13:26,  1.82s/it, loss=0.218, lr=1e-5]Steps:   5%|▍         | 692/15001 [25:39<7:19:52,  1.84s/it, loss=0.218, lr=1e-5]Steps:   5%|▍         | 692/15001 [25:39<7:19:52,  1.84s/it, loss=0.149, lr=1e-5]Steps:   5%|▍         | 693/15001 [25:40<7:12:18,  1.81s/it, loss=0.149, lr=1e-5]Steps:   5%|▍         | 693/15001 [25:41<7:12:18,  1.81s/it, loss=0.113, lr=1e-5]Steps:   5%|▍         | 694/15001 [25:42<7:35:05,  1.91s/it, loss=0.113, lr=1e-5]Steps:   5%|▍         | 694/15001 [25:43<7:35:05,  1.91s/it, loss=0.0681, lr=1e-5]Steps:   5%|▍         | 695/15001 [25:44<7:28:15,  1.88s/it, loss=0.0681, lr=1e-5]Steps:   5%|▍         | 695/15001 [25:45<7:28:15,  1.88s/it, loss=0.208, lr=1e-5] Steps:   5%|▍         | 696/15001 [25:46<7:46:20,  1.96s/it, loss=0.208, lr=1e-5]Steps:   5%|▍         | 696/15001 [25:47<7:46:20,  1.96s/it, loss=0.109, lr=1e-5]Steps:   5%|▍         | 697/15001 [25:48<7:39:03,  1.93s/it, loss=0.109, lr=1e-5]Steps:   5%|▍         | 697/15001 [25:49<7:39:03,  1.93s/it, loss=0.398, lr=1e-5]Steps:   5%|▍         | 698/15001 [25:50<8:01:55,  2.02s/it, loss=0.398, lr=1e-5]Steps:   5%|▍         | 698/15001 [25:51<8:01:55,  2.02s/it, loss=0.131, lr=1e-5]Steps:   5%|▍         | 699/15001 [25:52<7:55:34,  2.00s/it, loss=0.131, lr=1e-5]Steps:   5%|▍         | 699/15001 [25:53<7:55:34,  2.00s/it, loss=0.276, lr=1e-5]Steps:   5%|▍         | 700/15001 [25:54<7:51:26,  1.98s/it, loss=0.276, lr=1e-5]Steps:   5%|▍         | 700/15001 [25:55<7:51:26,  1.98s/it, loss=0.366, lr=1e-5]Steps:   5%|▍         | 701/15001 [25:56<7:45:46,  1.95s/it, loss=0.366, lr=1e-5]Steps:   5%|▍         | 701/15001 [25:56<7:45:46,  1.95s/it, loss=0.268, lr=1e-5]Steps:   5%|▍         | 702/15001 [25:58<7:49:34,  1.97s/it, loss=0.268, lr=1e-5]Steps:   5%|▍         | 702/15001 [25:58<7:49:34,  1.97s/it, loss=0.221, lr=1e-5]Steps:   5%|▍         | 703/15001 [26:00<7:26:09,  1.87s/it, loss=0.221, lr=1e-5]Steps:   5%|▍         | 703/15001 [26:00<7:26:09,  1.87s/it, loss=0.0681, lr=1e-5]Steps:   5%|▍         | 704/15001 [26:02<7:42:41,  1.94s/it, loss=0.0681, lr=1e-5]Steps:   5%|▍         | 704/15001 [26:02<7:42:41,  1.94s/it, loss=0.144, lr=1e-5] Steps:   5%|▍         | 705/15001 [26:04<7:23:40,  1.86s/it, loss=0.144, lr=1e-5]Steps:   5%|▍         | 705/15001 [26:04<7:23:40,  1.86s/it, loss=0.23, lr=1e-5] Steps:   5%|▍         | 706/15001 [26:05<7:20:30,  1.85s/it, loss=0.23, lr=1e-5]Steps:   5%|▍         | 706/15001 [26:06<7:20:30,  1.85s/it, loss=0.0756, lr=1e-5]Steps:   5%|▍         | 707/15001 [26:07<7:22:06,  1.86s/it, loss=0.0756, lr=1e-5]Steps:   5%|▍         | 707/15001 [26:08<7:22:06,  1.86s/it, loss=0.142, lr=1e-5] Steps:   5%|▍         | 708/15001 [26:09<7:22:15,  1.86s/it, loss=0.142, lr=1e-5]Steps:   5%|▍         | 708/15001 [26:09<7:22:15,  1.86s/it, loss=0.139, lr=1e-5]Steps:   5%|▍         | 709/15001 [26:11<7:08:00,  1.80s/it, loss=0.139, lr=1e-5]Steps:   5%|▍         | 709/15001 [26:11<7:08:00,  1.80s/it, loss=0.0843, lr=1e-5]Steps:   5%|▍         | 710/15001 [26:13<7:29:14,  1.89s/it, loss=0.0843, lr=1e-5]Steps:   5%|▍         | 710/15001 [26:13<7:29:14,  1.89s/it, loss=0.0146, lr=1e-5]Steps:   5%|▍         | 711/15001 [26:15<7:35:52,  1.91s/it, loss=0.0146, lr=1e-5]Steps:   5%|▍         | 711/15001 [26:15<7:35:52,  1.91s/it, loss=0.0695, lr=1e-5]Steps:   5%|▍         | 712/15001 [26:17<7:32:23,  1.90s/it, loss=0.0695, lr=1e-5]Steps:   5%|▍         | 712/15001 [26:17<7:32:23,  1.90s/it, loss=0.177, lr=1e-5] Steps:   5%|▍         | 713/15001 [26:19<7:38:17,  1.92s/it, loss=0.177, lr=1e-5]Steps:   5%|▍         | 713/15001 [26:19<7:38:17,  1.92s/it, loss=0.304, lr=1e-5]Steps:   5%|▍         | 714/15001 [26:21<7:39:36,  1.93s/it, loss=0.304, lr=1e-5]Steps:   5%|▍         | 714/15001 [26:21<7:39:36,  1.93s/it, loss=0.0587, lr=1e-5]Steps:   5%|▍         | 715/15001 [26:22<7:21:54,  1.86s/it, loss=0.0587, lr=1e-5]Steps:   5%|▍         | 715/15001 [26:23<7:21:54,  1.86s/it, loss=0.278, lr=1e-5] Steps:   5%|▍         | 716/15001 [26:24<7:17:18,  1.84s/it, loss=0.278, lr=1e-5]Steps:   5%|▍         | 716/15001 [26:25<7:17:18,  1.84s/it, loss=0.0581, lr=1e-5]Steps:   5%|▍         | 717/15001 [26:26<7:46:49,  1.96s/it, loss=0.0581, lr=1e-5]Steps:   5%|▍         | 717/15001 [26:26<7:46:49,  1.96s/it, loss=0.0446, lr=1e-5]Steps:   5%|▍         | 718/15001 [26:28<7:50:40,  1.98s/it, loss=0.0446, lr=1e-5]Steps:   5%|▍         | 718/15001 [26:29<7:50:40,  1.98s/it, loss=0.113, lr=1e-5] Steps:   5%|▍         | 719/15001 [26:30<7:49:34,  1.97s/it, loss=0.113, lr=1e-5]Steps:   5%|▍         | 719/15001 [26:30<7:49:34,  1.97s/it, loss=0.0982, lr=1e-5]Steps:   5%|▍         | 720/15001 [26:32<7:35:40,  1.91s/it, loss=0.0982, lr=1e-5]Steps:   5%|▍         | 720/15001 [26:32<7:35:40,  1.91s/it, loss=0.158, lr=1e-5] Steps:   5%|▍         | 721/15001 [26:34<7:51:00,  1.98s/it, loss=0.158, lr=1e-5]Steps:   5%|▍         | 721/15001 [26:34<7:51:00,  1.98s/it, loss=0.164, lr=1e-5]Steps:   5%|▍         | 722/15001 [26:36<7:32:14,  1.90s/it, loss=0.164, lr=1e-5]Steps:   5%|▍         | 722/15001 [26:36<7:32:14,  1.90s/it, loss=0.164, lr=1e-5]Steps:   5%|▍         | 723/15001 [26:38<7:32:31,  1.90s/it, loss=0.164, lr=1e-5]Steps:   5%|▍         | 723/15001 [26:38<7:32:31,  1.90s/it, loss=0.181, lr=1e-5]Steps:   5%|▍         | 724/15001 [26:40<7:33:48,  1.91s/it, loss=0.181, lr=1e-5]Steps:   5%|▍         | 724/15001 [26:40<7:33:48,  1.91s/it, loss=0.144, lr=1e-5]Steps:   5%|▍         | 725/15001 [26:42<7:21:40,  1.86s/it, loss=0.144, lr=1e-5]Steps:   5%|▍         | 725/15001 [26:42<7:21:40,  1.86s/it, loss=0.347, lr=1e-5]Steps:   5%|▍         | 726/15001 [26:43<7:22:51,  1.86s/it, loss=0.347, lr=1e-5]Steps:   5%|▍         | 726/15001 [26:44<7:22:51,  1.86s/it, loss=0.115, lr=1e-5]Steps:   5%|▍         | 727/15001 [26:45<7:16:42,  1.84s/it, loss=0.115, lr=1e-5]Steps:   5%|▍         | 727/15001 [26:45<7:16:42,  1.84s/it, loss=0.201, lr=1e-5]Steps:   5%|▍         | 728/15001 [26:47<7:07:28,  1.80s/it, loss=0.201, lr=1e-5]Steps:   5%|▍         | 728/15001 [26:47<7:07:28,  1.80s/it, loss=0.23, lr=1e-5] Steps:   5%|▍         | 729/15001 [26:49<7:06:23,  1.79s/it, loss=0.23, lr=1e-5]Steps:   5%|▍         | 729/15001 [26:49<7:06:23,  1.79s/it, loss=0.281, lr=1e-5]Steps:   5%|▍         | 730/15001 [26:50<7:04:06,  1.78s/it, loss=0.281, lr=1e-5]Steps:   5%|▍         | 730/15001 [26:51<7:04:06,  1.78s/it, loss=0.27, lr=1e-5] Steps:   5%|▍         | 731/15001 [26:52<7:07:08,  1.80s/it, loss=0.27, lr=1e-5]Steps:   5%|▍         | 731/15001 [26:53<7:07:08,  1.80s/it, loss=0.105, lr=1e-5]Steps:   5%|▍         | 732/15001 [26:54<7:18:25,  1.84s/it, loss=0.105, lr=1e-5]Steps:   5%|▍         | 732/15001 [26:54<7:18:25,  1.84s/it, loss=0.185, lr=1e-5]Steps:   5%|▍         | 733/15001 [26:56<7:23:15,  1.86s/it, loss=0.185, lr=1e-5]Steps:   5%|▍         | 733/15001 [26:56<7:23:15,  1.86s/it, loss=0.141, lr=1e-5]Steps:   5%|▍         | 734/15001 [26:58<7:19:08,  1.85s/it, loss=0.141, lr=1e-5]Steps:   5%|▍         | 734/15001 [26:58<7:19:08,  1.85s/it, loss=0.0444, lr=1e-5]Steps:   5%|▍         | 735/15001 [27:00<6:58:50,  1.76s/it, loss=0.0444, lr=1e-5]Steps:   5%|▍         | 735/15001 [27:00<6:58:50,  1.76s/it, loss=0.0976, lr=1e-5]Steps:   5%|▍         | 736/15001 [27:02<7:20:31,  1.85s/it, loss=0.0976, lr=1e-5]Steps:   5%|▍         | 736/15001 [27:02<7:20:31,  1.85s/it, loss=0.055, lr=1e-5] Steps:   5%|▍         | 737/15001 [27:04<7:26:55,  1.88s/it, loss=0.055, lr=1e-5]Steps:   5%|▍         | 737/15001 [27:04<7:26:55,  1.88s/it, loss=0.18, lr=1e-5] Steps:   5%|▍         | 738/15001 [27:05<7:28:21,  1.89s/it, loss=0.18, lr=1e-5]Steps:   5%|▍         | 738/15001 [27:06<7:28:21,  1.89s/it, loss=0.171, lr=1e-5]Steps:   5%|▍         | 739/15001 [27:07<7:29:49,  1.89s/it, loss=0.171, lr=1e-5]Steps:   5%|▍         | 739/15001 [27:08<7:29:49,  1.89s/it, loss=0.254, lr=1e-5]Steps:   5%|▍         | 740/15001 [27:09<7:43:55,  1.95s/it, loss=0.254, lr=1e-5]Steps:   5%|▍         | 740/15001 [27:10<7:43:55,  1.95s/it, loss=0.165, lr=1e-5]Steps:   5%|▍         | 741/15001 [27:12<7:51:29,  1.98s/it, loss=0.165, lr=1e-5]Steps:   5%|▍         | 741/15001 [27:12<7:51:29,  1.98s/it, loss=0.0276, lr=1e-5]Steps:   5%|▍         | 742/15001 [27:14<8:02:40,  2.03s/it, loss=0.0276, lr=1e-5]Steps:   5%|▍         | 742/15001 [27:14<8:02:40,  2.03s/it, loss=0.178, lr=1e-5] Steps:   5%|▍         | 743/15001 [27:16<7:56:52,  2.01s/it, loss=0.178, lr=1e-5]Steps:   5%|▍         | 743/15001 [27:16<7:56:52,  2.01s/it, loss=0.0292, lr=1e-5]Steps:   5%|▍         | 744/15001 [27:18<7:59:39,  2.02s/it, loss=0.0292, lr=1e-5]Steps:   5%|▍         | 744/15001 [27:18<7:59:39,  2.02s/it, loss=0.0841, lr=1e-5]Steps:   5%|▍         | 745/15001 [27:20<7:54:51,  2.00s/it, loss=0.0841, lr=1e-5]Steps:   5%|▍         | 745/15001 [27:20<7:54:51,  2.00s/it, loss=0.377, lr=1e-5] Steps:   5%|▍         | 746/15001 [27:22<7:47:07,  1.97s/it, loss=0.377, lr=1e-5]Steps:   5%|▍         | 746/15001 [27:22<7:47:07,  1.97s/it, loss=0.118, lr=1e-5]Steps:   5%|▍         | 747/15001 [27:23<7:27:52,  1.89s/it, loss=0.118, lr=1e-5]Steps:   5%|▍         | 747/15001 [27:23<7:27:52,  1.89s/it, loss=0.166, lr=1e-5]Steps:   5%|▍         | 748/15001 [27:25<7:03:07,  1.78s/it, loss=0.166, lr=1e-5]Steps:   5%|▍         | 748/15001 [27:25<7:03:07,  1.78s/it, loss=0.187, lr=1e-5]Steps:   5%|▍         | 749/15001 [27:27<7:30:00,  1.89s/it, loss=0.187, lr=1e-5]Steps:   5%|▍         | 749/15001 [27:27<7:30:00,  1.89s/it, loss=0.436, lr=1e-5]Steps:   5%|▍         | 750/15001 [27:28<7:07:09,  1.80s/it, loss=0.436, lr=1e-5]Steps:   5%|▍         | 750/15001 [27:29<7:07:09,  1.80s/it, loss=0.385, lr=1e-5]Steps:   5%|▌         | 751/15001 [27:30<7:20:27,  1.85s/it, loss=0.385, lr=1e-5]Steps:   5%|▌         | 751/15001 [27:31<7:20:27,  1.85s/it, loss=0.0548, lr=1e-5]Steps:   5%|▌         | 752/15001 [27:32<7:10:34,  1.81s/it, loss=0.0548, lr=1e-5]Steps:   5%|▌         | 752/15001 [27:32<7:10:34,  1.81s/it, loss=0.399, lr=1e-5] Steps:   5%|▌         | 753/15001 [27:34<7:21:55,  1.86s/it, loss=0.399, lr=1e-5]Steps:   5%|▌         | 753/15001 [27:34<7:21:55,  1.86s/it, loss=0.142, lr=1e-5]Steps:   5%|▌         | 754/15001 [27:36<7:04:13,  1.79s/it, loss=0.142, lr=1e-5]Steps:   5%|▌         | 754/15001 [27:36<7:04:13,  1.79s/it, loss=0.136, lr=1e-5]Steps:   5%|▌         | 755/15001 [27:38<7:30:48,  1.90s/it, loss=0.136, lr=1e-5]Steps:   5%|▌         | 755/15001 [27:38<7:30:48,  1.90s/it, loss=0.0108, lr=1e-5]Steps:   5%|▌         | 756/15001 [27:39<6:56:40,  1.76s/it, loss=0.0108, lr=1e-5]Steps:   5%|▌         | 756/15001 [27:40<6:56:40,  1.76s/it, loss=0.33, lr=1e-5]  Steps:   5%|▌         | 757/15001 [27:42<7:28:47,  1.89s/it, loss=0.33, lr=1e-5]Steps:   5%|▌         | 757/15001 [27:42<7:28:47,  1.89s/it, loss=0.196, lr=1e-5]Steps:   5%|▌         | 758/15001 [27:43<7:28:19,  1.89s/it, loss=0.196, lr=1e-5]Steps:   5%|▌         | 758/15001 [27:44<7:28:19,  1.89s/it, loss=0.127, lr=1e-5]Steps:   5%|▌         | 759/15001 [27:45<7:32:59,  1.91s/it, loss=0.127, lr=1e-5]Steps:   5%|▌         | 759/15001 [27:46<7:32:59,  1.91s/it, loss=0.0575, lr=1e-5]Steps:   5%|▌         | 760/15001 [27:47<7:33:53,  1.91s/it, loss=0.0575, lr=1e-5]Steps:   5%|▌         | 760/15001 [27:47<7:33:53,  1.91s/it, loss=0.0984, lr=1e-5]Steps:   5%|▌         | 761/15001 [27:49<7:28:46,  1.89s/it, loss=0.0984, lr=1e-5]Steps:   5%|▌         | 761/15001 [27:49<7:28:46,  1.89s/it, loss=0.206, lr=1e-5] Steps:   5%|▌         | 762/15001 [27:51<7:24:16,  1.87s/it, loss=0.206, lr=1e-5]Steps:   5%|▌         | 762/15001 [27:51<7:24:16,  1.87s/it, loss=0.346, lr=1e-5]Steps:   5%|▌         | 763/15001 [27:53<7:34:11,  1.91s/it, loss=0.346, lr=1e-5]Steps:   5%|▌         | 763/15001 [27:53<7:34:11,  1.91s/it, loss=0.126, lr=1e-5]Steps:   5%|▌         | 764/15001 [27:55<7:54:28,  2.00s/it, loss=0.126, lr=1e-5]Steps:   5%|▌         | 764/15001 [27:55<7:54:28,  2.00s/it, loss=0.0402, lr=1e-5]Steps:   5%|▌         | 765/15001 [27:57<8:05:09,  2.04s/it, loss=0.0402, lr=1e-5]Steps:   5%|▌         | 765/15001 [27:57<8:05:09,  2.04s/it, loss=0.185, lr=1e-5] Steps:   5%|▌         | 766/15001 [27:59<7:59:21,  2.02s/it, loss=0.185, lr=1e-5]Steps:   5%|▌         | 766/15001 [28:00<7:59:21,  2.02s/it, loss=0.0662, lr=1e-5]Steps:   5%|▌         | 767/15001 [28:01<7:59:19,  2.02s/it, loss=0.0662, lr=1e-5]Steps:   5%|▌         | 767/15001 [28:01<7:59:19,  2.02s/it, loss=0.0978, lr=1e-5]Steps:   5%|▌         | 768/15001 [28:03<7:39:10,  1.94s/it, loss=0.0978, lr=1e-5]Steps:   5%|▌         | 768/15001 [28:03<7:39:10,  1.94s/it, loss=0.293, lr=1e-5] Steps:   5%|▌         | 769/15001 [28:05<7:29:31,  1.90s/it, loss=0.293, lr=1e-5]Steps:   5%|▌         | 769/15001 [28:05<7:29:31,  1.90s/it, loss=0.174, lr=1e-5]Steps:   5%|▌         | 770/15001 [28:07<7:32:38,  1.91s/it, loss=0.174, lr=1e-5]Steps:   5%|▌         | 770/15001 [28:07<7:32:38,  1.91s/it, loss=0.167, lr=1e-5]Steps:   5%|▌         | 771/15001 [28:09<7:25:19,  1.88s/it, loss=0.167, lr=1e-5]Steps:   5%|▌         | 771/15001 [28:09<7:25:19,  1.88s/it, loss=0.216, lr=1e-5]Steps:   5%|▌         | 772/15001 [28:10<7:15:02,  1.83s/it, loss=0.216, lr=1e-5]Steps:   5%|▌         | 772/15001 [28:10<7:15:02,  1.83s/it, loss=0.124, lr=1e-5]Steps:   5%|▌         | 773/15001 [28:12<6:56:06,  1.75s/it, loss=0.124, lr=1e-5]Steps:   5%|▌         | 773/15001 [28:12<6:56:06,  1.75s/it, loss=0.0494, lr=1e-5]Steps:   5%|▌         | 774/15001 [28:14<7:26:31,  1.88s/it, loss=0.0494, lr=1e-5]Steps:   5%|▌         | 774/15001 [28:14<7:26:31,  1.88s/it, loss=0.131, lr=1e-5] Steps:   5%|▌         | 775/15001 [28:16<7:29:08,  1.89s/it, loss=0.131, lr=1e-5]Steps:   5%|▌         | 775/15001 [28:16<7:29:08,  1.89s/it, loss=0.168, lr=1e-5]Steps:   5%|▌         | 776/15001 [28:18<7:15:58,  1.84s/it, loss=0.168, lr=1e-5]Steps:   5%|▌         | 776/15001 [28:18<7:15:58,  1.84s/it, loss=0.183, lr=1e-5]Steps:   5%|▌         | 777/15001 [28:20<7:22:48,  1.87s/it, loss=0.183, lr=1e-5]Steps:   5%|▌         | 777/15001 [28:20<7:22:48,  1.87s/it, loss=0.113, lr=1e-5]Steps:   5%|▌         | 778/15001 [28:22<7:28:29,  1.89s/it, loss=0.113, lr=1e-5]Steps:   5%|▌         | 778/15001 [28:22<7:28:29,  1.89s/it, loss=0.212, lr=1e-5]Steps:   5%|▌         | 779/15001 [28:23<7:19:09,  1.85s/it, loss=0.212, lr=1e-5]Steps:   5%|▌         | 779/15001 [28:24<7:19:09,  1.85s/it, loss=0.253, lr=1e-5]Steps:   5%|▌         | 780/15001 [28:25<7:00:29,  1.77s/it, loss=0.253, lr=1e-5]Steps:   5%|▌         | 780/15001 [28:25<7:00:29,  1.77s/it, loss=0.226, lr=1e-5]Steps:   5%|▌         | 781/15001 [28:27<7:08:03,  1.81s/it, loss=0.226, lr=1e-5]Steps:   5%|▌         | 781/15001 [28:27<7:08:03,  1.81s/it, loss=0.353, lr=1e-5]Steps:   5%|▌         | 782/15001 [28:29<7:31:57,  1.91s/it, loss=0.353, lr=1e-5]Steps:   5%|▌         | 782/15001 [28:29<7:31:57,  1.91s/it, loss=0.116, lr=1e-5]Steps:   5%|▌         | 783/15001 [28:31<7:06:01,  1.80s/it, loss=0.116, lr=1e-5]Steps:   5%|▌         | 783/15001 [28:31<7:06:01,  1.80s/it, loss=0.207, lr=1e-5]Steps:   5%|▌         | 784/15001 [28:33<7:37:48,  1.93s/it, loss=0.207, lr=1e-5]Steps:   5%|▌         | 784/15001 [28:33<7:37:48,  1.93s/it, loss=0.158, lr=1e-5]Steps:   5%|▌         | 785/15001 [28:35<7:50:43,  1.99s/it, loss=0.158, lr=1e-5]Steps:   5%|▌         | 785/15001 [28:35<7:50:43,  1.99s/it, loss=0.116, lr=1e-5]Steps:   5%|▌         | 786/15001 [28:37<7:58:06,  2.02s/it, loss=0.116, lr=1e-5]Steps:   5%|▌         | 786/15001 [28:37<7:58:06,  2.02s/it, loss=0.0503, lr=1e-5]Steps:   5%|▌         | 787/15001 [28:39<8:01:05,  2.03s/it, loss=0.0503, lr=1e-5]Steps:   5%|▌         | 787/15001 [28:39<8:01:05,  2.03s/it, loss=0.163, lr=1e-5] Steps:   5%|▌         | 788/15001 [28:41<7:52:08,  1.99s/it, loss=0.163, lr=1e-5]Steps:   5%|▌         | 788/15001 [28:41<7:52:08,  1.99s/it, loss=0.283, lr=1e-5]Steps:   5%|▌         | 789/15001 [28:43<7:46:14,  1.97s/it, loss=0.283, lr=1e-5]Steps:   5%|▌         | 789/15001 [28:43<7:46:14,  1.97s/it, loss=0.106, lr=1e-5]Steps:   5%|▌         | 790/15001 [28:45<7:38:41,  1.94s/it, loss=0.106, lr=1e-5]Steps:   5%|▌         | 790/15001 [28:45<7:38:41,  1.94s/it, loss=0.0615, lr=1e-5]Steps:   5%|▌         | 791/15001 [28:46<7:22:01,  1.87s/it, loss=0.0615, lr=1e-5]Steps:   5%|▌         | 791/15001 [28:47<7:22:01,  1.87s/it, loss=0.0353, lr=1e-5]Steps:   5%|▌         | 792/15001 [28:48<7:17:06,  1.85s/it, loss=0.0353, lr=1e-5]Steps:   5%|▌         | 792/15001 [28:48<7:17:06,  1.85s/it, loss=0.239, lr=1e-5] Steps:   5%|▌         | 793/15001 [28:50<7:12:04,  1.82s/it, loss=0.239, lr=1e-5]Steps:   5%|▌         | 793/15001 [28:50<7:12:04,  1.82s/it, loss=0.05, lr=1e-5] Steps:   5%|▌         | 794/15001 [28:52<7:25:01,  1.88s/it, loss=0.05, lr=1e-5]Steps:   5%|▌         | 794/15001 [28:52<7:25:01,  1.88s/it, loss=0.0404, lr=1e-5]Steps:   5%|▌         | 795/15001 [28:54<7:16:50,  1.85s/it, loss=0.0404, lr=1e-5]Steps:   5%|▌         | 795/15001 [28:54<7:16:50,  1.85s/it, loss=0.276, lr=1e-5] Steps:   5%|▌         | 796/15001 [28:56<7:12:45,  1.83s/it, loss=0.276, lr=1e-5]Steps:   5%|▌         | 796/15001 [28:56<7:12:45,  1.83s/it, loss=0.314, lr=1e-5]Steps:   5%|▌         | 797/15001 [28:57<7:03:39,  1.79s/it, loss=0.314, lr=1e-5]Steps:   5%|▌         | 797/15001 [28:58<7:03:39,  1.79s/it, loss=0.118, lr=1e-5]Steps:   5%|▌         | 798/15001 [29:00<7:38:22,  1.94s/it, loss=0.118, lr=1e-5]Steps:   5%|▌         | 798/15001 [29:00<7:38:22,  1.94s/it, loss=0.054, lr=1e-5]Steps:   5%|▌         | 799/15001 [29:01<7:36:47,  1.93s/it, loss=0.054, lr=1e-5]Steps:   5%|▌         | 799/15001 [29:01<7:36:47,  1.93s/it, loss=0.0307, lr=1e-5]Steps:   5%|▌         | 800/15001 [29:03<7:28:56,  1.90s/it, loss=0.0307, lr=1e-5]Steps:   5%|▌         | 800/15001 [29:03<7:28:56,  1.90s/it, loss=0.127, lr=1e-5] Steps:   5%|▌         | 801/15001 [29:05<7:19:05,  1.86s/it, loss=0.127, lr=1e-5]Steps:   5%|▌         | 801/15001 [29:05<7:19:05,  1.86s/it, loss=0.113, lr=1e-5]Steps:   5%|▌         | 802/15001 [29:07<7:01:35,  1.78s/it, loss=0.113, lr=1e-5]Steps:   5%|▌         | 802/15001 [29:07<7:01:35,  1.78s/it, loss=0.172, lr=1e-5]Steps:   5%|▌         | 803/15001 [29:09<7:26:18,  1.89s/it, loss=0.172, lr=1e-5]Steps:   5%|▌         | 803/15001 [29:09<7:26:18,  1.89s/it, loss=0.151, lr=1e-5]Steps:   5%|▌         | 804/15001 [29:11<7:18:24,  1.85s/it, loss=0.151, lr=1e-5]Steps:   5%|▌         | 804/15001 [29:11<7:18:24,  1.85s/it, loss=0.164, lr=1e-5]Steps:   5%|▌         | 805/15001 [29:13<7:27:19,  1.89s/it, loss=0.164, lr=1e-5]Steps:   5%|▌         | 805/15001 [29:13<7:27:19,  1.89s/it, loss=0.134, lr=1e-5]Steps:   5%|▌         | 806/15001 [29:14<7:13:59,  1.83s/it, loss=0.134, lr=1e-5]Steps:   5%|▌         | 806/15001 [29:14<7:13:59,  1.83s/it, loss=0.0402, lr=1e-5]Steps:   5%|▌         | 807/15001 [29:16<7:06:33,  1.80s/it, loss=0.0402, lr=1e-5]Steps:   5%|▌         | 807/15001 [29:17<7:06:33,  1.80s/it, loss=0.183, lr=1e-5] Steps:   5%|▌         | 808/15001 [29:18<7:57:02,  2.02s/it, loss=0.183, lr=1e-5]Steps:   5%|▌         | 808/15001 [29:19<7:57:02,  2.02s/it, loss=0.351, lr=1e-5]Steps:   5%|▌         | 809/15001 [29:20<7:41:42,  1.95s/it, loss=0.351, lr=1e-5]Steps:   5%|▌         | 809/15001 [29:21<7:41:42,  1.95s/it, loss=0.189, lr=1e-5]Steps:   5%|▌         | 810/15001 [29:23<8:10:35,  2.07s/it, loss=0.189, lr=1e-5]Steps:   5%|▌         | 810/15001 [29:23<8:10:35,  2.07s/it, loss=0.0747, lr=1e-5]Steps:   5%|▌         | 811/15001 [29:24<7:47:41,  1.98s/it, loss=0.0747, lr=1e-5]Steps:   5%|▌         | 811/15001 [29:25<7:47:41,  1.98s/it, loss=0.0882, lr=1e-5]Steps:   5%|▌         | 812/15001 [29:26<7:56:34,  2.02s/it, loss=0.0882, lr=1e-5]Steps:   5%|▌         | 812/15001 [29:27<7:56:34,  2.02s/it, loss=0.128, lr=1e-5] Steps:   5%|▌         | 813/15001 [29:28<7:30:37,  1.91s/it, loss=0.128, lr=1e-5]Steps:   5%|▌         | 813/15001 [29:28<7:30:37,  1.91s/it, loss=0.0579, lr=1e-5]Steps:   5%|▌         | 814/15001 [29:30<7:36:04,  1.93s/it, loss=0.0579, lr=1e-5]Steps:   5%|▌         | 814/15001 [29:30<7:36:04,  1.93s/it, loss=0.0461, lr=1e-5]Steps:   5%|▌         | 815/15001 [29:32<7:21:54,  1.87s/it, loss=0.0461, lr=1e-5]Steps:   5%|▌         | 815/15001 [29:32<7:21:54,  1.87s/it, loss=0.165, lr=1e-5] Steps:   5%|▌         | 816/15001 [29:34<7:22:07,  1.87s/it, loss=0.165, lr=1e-5]Steps:   5%|▌         | 816/15001 [29:34<7:22:07,  1.87s/it, loss=0.316, lr=1e-5]Steps:   5%|▌         | 817/15001 [29:35<7:16:03,  1.84s/it, loss=0.316, lr=1e-5]Steps:   5%|▌         | 817/15001 [29:36<7:16:03,  1.84s/it, loss=0.305, lr=1e-5]Steps:   5%|▌         | 818/15001 [29:37<7:09:15,  1.82s/it, loss=0.305, lr=1e-5]Steps:   5%|▌         | 818/15001 [29:37<7:09:15,  1.82s/it, loss=0.133, lr=1e-5]Steps:   5%|▌         | 819/15001 [29:39<7:13:03,  1.83s/it, loss=0.133, lr=1e-5]Steps:   5%|▌         | 819/15001 [29:39<7:13:03,  1.83s/it, loss=0.219, lr=1e-5]Steps:   5%|▌         | 820/15001 [29:41<7:19:25,  1.86s/it, loss=0.219, lr=1e-5]Steps:   5%|▌         | 820/15001 [29:41<7:19:25,  1.86s/it, loss=0.311, lr=1e-5]Steps:   5%|▌         | 821/15001 [29:43<7:12:54,  1.83s/it, loss=0.311, lr=1e-5]Steps:   5%|▌         | 821/15001 [29:43<7:12:54,  1.83s/it, loss=0.132, lr=1e-5]Steps:   5%|▌         | 822/15001 [29:45<7:07:41,  1.81s/it, loss=0.132, lr=1e-5]Steps:   5%|▌         | 822/15001 [29:45<7:07:41,  1.81s/it, loss=0.103, lr=1e-5]Steps:   5%|▌         | 823/15001 [29:46<7:01:48,  1.79s/it, loss=0.103, lr=1e-5]Steps:   5%|▌         | 823/15001 [29:47<7:01:48,  1.79s/it, loss=0.097, lr=1e-5]Steps:   5%|▌         | 824/15001 [29:48<7:11:07,  1.82s/it, loss=0.097, lr=1e-5]Steps:   5%|▌         | 824/15001 [29:48<7:11:07,  1.82s/it, loss=0.208, lr=1e-5]Steps:   5%|▌         | 825/15001 [29:50<7:09:29,  1.82s/it, loss=0.208, lr=1e-5]Steps:   5%|▌         | 825/15001 [29:50<7:09:29,  1.82s/it, loss=0.111, lr=1e-5]Steps:   6%|▌         | 826/15001 [29:52<7:01:30,  1.78s/it, loss=0.111, lr=1e-5]Steps:   6%|▌         | 826/15001 [29:52<7:01:30,  1.78s/it, loss=0.2, lr=1e-5]  Steps:   6%|▌         | 827/15001 [29:54<7:36:14,  1.93s/it, loss=0.2, lr=1e-5]Steps:   6%|▌         | 827/15001 [29:54<7:36:14,  1.93s/it, loss=0.257, lr=1e-5]Steps:   6%|▌         | 828/15001 [29:56<7:27:49,  1.90s/it, loss=0.257, lr=1e-5]Steps:   6%|▌         | 828/15001 [29:56<7:27:49,  1.90s/it, loss=0.106, lr=1e-5]Steps:   6%|▌         | 829/15001 [29:58<7:30:35,  1.91s/it, loss=0.106, lr=1e-5]Steps:   6%|▌         | 829/15001 [29:58<7:30:35,  1.91s/it, loss=0.221, lr=1e-5]Steps:   6%|▌         | 830/15001 [30:00<7:55:21,  2.01s/it, loss=0.221, lr=1e-5]Steps:   6%|▌         | 830/15001 [30:00<7:55:21,  2.01s/it, loss=0.125, lr=1e-5]Steps:   6%|▌         | 831/15001 [30:02<8:10:28,  2.08s/it, loss=0.125, lr=1e-5]Steps:   6%|▌         | 831/15001 [30:02<8:10:28,  2.08s/it, loss=0.0939, lr=1e-5]Steps:   6%|▌         | 832/15001 [30:04<7:46:32,  1.98s/it, loss=0.0939, lr=1e-5]Steps:   6%|▌         | 832/15001 [30:04<7:46:32,  1.98s/it, loss=0.232, lr=1e-5] Steps:   6%|▌         | 833/15001 [30:06<8:00:59,  2.04s/it, loss=0.232, lr=1e-5]Steps:   6%|▌         | 833/15001 [30:06<8:00:59,  2.04s/it, loss=0.182, lr=1e-5]Steps:   6%|▌         | 834/15001 [30:08<7:52:11,  2.00s/it, loss=0.182, lr=1e-5]Steps:   6%|▌         | 834/15001 [30:08<7:52:11,  2.00s/it, loss=0.155, lr=1e-5]Steps:   6%|▌         | 835/15001 [30:10<7:38:01,  1.94s/it, loss=0.155, lr=1e-5]Steps:   6%|▌         | 835/15001 [30:10<7:38:01,  1.94s/it, loss=0.252, lr=1e-5]Steps:   6%|▌         | 836/15001 [30:12<7:27:14,  1.89s/it, loss=0.252, lr=1e-5]Steps:   6%|▌         | 836/15001 [30:12<7:27:14,  1.89s/it, loss=0.165, lr=1e-5]Steps:   6%|▌         | 837/15001 [30:13<7:09:53,  1.82s/it, loss=0.165, lr=1e-5]Steps:   6%|▌         | 837/15001 [30:14<7:09:53,  1.82s/it, loss=0.402, lr=1e-5]Steps:   6%|▌         | 838/15001 [30:15<7:15:59,  1.85s/it, loss=0.402, lr=1e-5]Steps:   6%|▌         | 838/15001 [30:15<7:15:59,  1.85s/it, loss=0.22, lr=1e-5] Steps:   6%|▌         | 839/15001 [30:17<7:02:57,  1.79s/it, loss=0.22, lr=1e-5]Steps:   6%|▌         | 839/15001 [30:17<7:02:57,  1.79s/it, loss=0.212, lr=1e-5]Steps:   6%|▌         | 840/15001 [30:19<7:08:50,  1.82s/it, loss=0.212, lr=1e-5]Steps:   6%|▌         | 840/15001 [30:19<7:08:50,  1.82s/it, loss=0.14, lr=1e-5] Steps:   6%|▌         | 841/15001 [30:21<7:18:00,  1.86s/it, loss=0.14, lr=1e-5]Steps:   6%|▌         | 841/15001 [30:21<7:18:00,  1.86s/it, loss=0.319, lr=1e-5]Steps:   6%|▌         | 842/15001 [30:23<7:26:22,  1.89s/it, loss=0.319, lr=1e-5]Steps:   6%|▌         | 842/15001 [30:23<7:26:22,  1.89s/it, loss=0.146, lr=1e-5]Steps:   6%|▌         | 843/15001 [30:24<7:12:36,  1.83s/it, loss=0.146, lr=1e-5]Steps:   6%|▌         | 843/15001 [30:25<7:12:36,  1.83s/it, loss=0.115, lr=1e-5]Steps:   6%|▌         | 844/15001 [30:26<7:09:35,  1.82s/it, loss=0.115, lr=1e-5]Steps:   6%|▌         | 844/15001 [30:26<7:09:35,  1.82s/it, loss=0.108, lr=1e-5]Steps:   6%|▌         | 845/15001 [30:28<7:15:37,  1.85s/it, loss=0.108, lr=1e-5]Steps:   6%|▌         | 845/15001 [30:28<7:15:37,  1.85s/it, loss=0.187, lr=1e-5]Steps:   6%|▌         | 846/15001 [30:30<7:08:58,  1.82s/it, loss=0.187, lr=1e-5]Steps:   6%|▌         | 846/15001 [30:30<7:08:58,  1.82s/it, loss=0.225, lr=1e-5]Steps:   6%|▌         | 847/15001 [30:32<7:20:04,  1.87s/it, loss=0.225, lr=1e-5]Steps:   6%|▌         | 847/15001 [30:32<7:20:04,  1.87s/it, loss=0.152, lr=1e-5]Steps:   6%|▌         | 848/15001 [30:33<7:07:23,  1.81s/it, loss=0.152, lr=1e-5]Steps:   6%|▌         | 848/15001 [30:34<7:07:23,  1.81s/it, loss=0.336, lr=1e-5]Steps:   6%|▌         | 849/15001 [30:36<7:24:02,  1.88s/it, loss=0.336, lr=1e-5]Steps:   6%|▌         | 849/15001 [30:36<7:24:02,  1.88s/it, loss=0.0705, lr=1e-5]Steps:   6%|▌         | 850/15001 [30:37<7:16:23,  1.85s/it, loss=0.0705, lr=1e-5]Steps:   6%|▌         | 850/15001 [30:37<7:16:23,  1.85s/it, loss=0.104, lr=1e-5] Steps:   6%|▌         | 851/15001 [30:39<7:18:18,  1.86s/it, loss=0.104, lr=1e-5]Steps:   6%|▌         | 851/15001 [30:39<7:18:18,  1.86s/it, loss=0.256, lr=1e-5]Steps:   6%|▌         | 852/15001 [30:41<7:18:18,  1.86s/it, loss=0.256, lr=1e-5]Steps:   6%|▌         | 852/15001 [30:41<7:18:18,  1.86s/it, loss=0.201, lr=1e-5]Steps:   6%|▌         | 853/15001 [30:43<7:34:44,  1.93s/it, loss=0.201, lr=1e-5]Steps:   6%|▌         | 853/15001 [30:43<7:34:44,  1.93s/it, loss=0.123, lr=1e-5]Steps:   6%|▌         | 854/15001 [30:45<8:00:02,  2.04s/it, loss=0.123, lr=1e-5]Steps:   6%|▌         | 854/15001 [30:45<8:00:02,  2.04s/it, loss=0.175, lr=1e-5]Steps:   6%|▌         | 855/15001 [30:47<7:42:27,  1.96s/it, loss=0.175, lr=1e-5]Steps:   6%|▌         | 855/15001 [30:47<7:42:27,  1.96s/it, loss=0.0792, lr=1e-5]Steps:   6%|▌         | 856/15001 [30:49<7:41:40,  1.96s/it, loss=0.0792, lr=1e-5]Steps:   6%|▌         | 856/15001 [30:49<7:41:40,  1.96s/it, loss=0.125, lr=1e-5] Steps:   6%|▌         | 857/15001 [30:51<7:29:41,  1.91s/it, loss=0.125, lr=1e-5]Steps:   6%|▌         | 857/15001 [30:51<7:29:41,  1.91s/it, loss=0.209, lr=1e-5]Steps:   6%|▌         | 858/15001 [30:53<7:45:28,  1.97s/it, loss=0.209, lr=1e-5]Steps:   6%|▌         | 858/15001 [30:53<7:45:28,  1.97s/it, loss=0.122, lr=1e-5]Steps:   6%|▌         | 859/15001 [30:55<7:20:07,  1.87s/it, loss=0.122, lr=1e-5]Steps:   6%|▌         | 859/15001 [30:55<7:20:07,  1.87s/it, loss=0.149, lr=1e-5]Steps:   6%|▌         | 860/15001 [30:57<7:26:26,  1.89s/it, loss=0.149, lr=1e-5]Steps:   6%|▌         | 860/15001 [30:57<7:26:26,  1.89s/it, loss=0.0964, lr=1e-5]Steps:   6%|▌         | 861/15001 [30:58<7:09:38,  1.82s/it, loss=0.0964, lr=1e-5]Steps:   6%|▌         | 861/15001 [30:59<7:09:38,  1.82s/it, loss=0.13, lr=1e-5]  Steps:   6%|▌         | 862/15001 [31:00<7:17:01,  1.85s/it, loss=0.13, lr=1e-5]Steps:   6%|▌         | 862/15001 [31:00<7:17:01,  1.85s/it, loss=0.063, lr=1e-5]Steps:   6%|▌         | 863/15001 [31:02<7:23:39,  1.88s/it, loss=0.063, lr=1e-5]Steps:   6%|▌         | 863/15001 [31:02<7:23:39,  1.88s/it, loss=0.142, lr=1e-5]Steps:   6%|▌         | 864/15001 [31:04<7:27:27,  1.90s/it, loss=0.142, lr=1e-5]Steps:   6%|▌         | 864/15001 [31:04<7:27:27,  1.90s/it, loss=0.115, lr=1e-5]Steps:   6%|▌         | 865/15001 [31:06<7:01:56,  1.79s/it, loss=0.115, lr=1e-5]Steps:   6%|▌         | 865/15001 [31:06<7:01:56,  1.79s/it, loss=0.0989, lr=1e-5]Steps:   6%|▌         | 866/15001 [31:07<7:04:53,  1.80s/it, loss=0.0989, lr=1e-5]Steps:   6%|▌         | 866/15001 [31:08<7:04:53,  1.80s/it, loss=0.0821, lr=1e-5]Steps:   6%|▌         | 867/15001 [31:09<7:14:23,  1.84s/it, loss=0.0821, lr=1e-5]Steps:   6%|▌         | 867/15001 [31:10<7:14:23,  1.84s/it, loss=0.132, lr=1e-5] Steps:   6%|▌         | 868/15001 [31:11<7:15:44,  1.85s/it, loss=0.132, lr=1e-5]Steps:   6%|▌         | 868/15001 [31:11<7:15:44,  1.85s/it, loss=0.0941, lr=1e-5]Steps:   6%|▌         | 869/15001 [31:13<7:08:24,  1.82s/it, loss=0.0941, lr=1e-5]Steps:   6%|▌         | 869/15001 [31:13<7:08:24,  1.82s/it, loss=0.0665, lr=1e-5]Steps:   6%|▌         | 870/15001 [31:15<7:19:52,  1.87s/it, loss=0.0665, lr=1e-5]Steps:   6%|▌         | 870/15001 [31:15<7:19:52,  1.87s/it, loss=0.13, lr=1e-5]  Steps:   6%|▌         | 871/15001 [31:17<7:16:22,  1.85s/it, loss=0.13, lr=1e-5]Steps:   6%|▌         | 871/15001 [31:17<7:16:22,  1.85s/it, loss=0.101, lr=1e-5]Steps:   6%|▌         | 872/15001 [31:19<7:12:19,  1.84s/it, loss=0.101, lr=1e-5]Steps:   6%|▌         | 872/15001 [31:19<7:12:19,  1.84s/it, loss=0.0618, lr=1e-5]Steps:   6%|▌         | 873/15001 [31:20<7:11:13,  1.83s/it, loss=0.0618, lr=1e-5]Steps:   6%|▌         | 873/15001 [31:21<7:11:13,  1.83s/it, loss=0.29, lr=1e-5]  Steps:   6%|▌         | 874/15001 [31:22<7:21:05,  1.87s/it, loss=0.29, lr=1e-5]Steps:   6%|▌         | 874/15001 [31:23<7:21:05,  1.87s/it, loss=0.164, lr=1e-5]Steps:   6%|▌         | 875/15001 [31:24<7:20:40,  1.87s/it, loss=0.164, lr=1e-5]Steps:   6%|▌         | 875/15001 [31:25<7:20:40,  1.87s/it, loss=0.0989, lr=1e-5]Steps:   6%|▌         | 876/15001 [31:27<7:45:59,  1.98s/it, loss=0.0989, lr=1e-5]Steps:   6%|▌         | 876/15001 [31:27<7:45:59,  1.98s/it, loss=0.0993, lr=1e-5]Steps:   6%|▌         | 877/15001 [31:29<7:53:12,  2.01s/it, loss=0.0993, lr=1e-5]Steps:   6%|▌         | 877/15001 [31:29<7:53:12,  2.01s/it, loss=0.123, lr=1e-5] Steps:   6%|▌         | 878/15001 [31:31<8:02:06,  2.05s/it, loss=0.123, lr=1e-5]Steps:   6%|▌         | 878/15001 [31:31<8:02:06,  2.05s/it, loss=0.273, lr=1e-5]Steps:   6%|▌         | 879/15001 [31:33<7:50:11,  2.00s/it, loss=0.273, lr=1e-5]Steps:   6%|▌         | 879/15001 [31:33<7:50:11,  2.00s/it, loss=0.0242, lr=1e-5]Steps:   6%|▌         | 880/15001 [31:34<7:39:45,  1.95s/it, loss=0.0242, lr=1e-5]Steps:   6%|▌         | 880/15001 [31:35<7:39:45,  1.95s/it, loss=0.0861, lr=1e-5]Steps:   6%|▌         | 881/15001 [31:36<7:26:12,  1.90s/it, loss=0.0861, lr=1e-5]Steps:   6%|▌         | 881/15001 [31:36<7:26:12,  1.90s/it, loss=0.185, lr=1e-5] Steps:   6%|▌         | 882/15001 [31:38<7:20:41,  1.87s/it, loss=0.185, lr=1e-5]Steps:   6%|▌         | 882/15001 [31:38<7:20:41,  1.87s/it, loss=0.199, lr=1e-5]Steps:   6%|▌         | 883/15001 [31:40<7:26:48,  1.90s/it, loss=0.199, lr=1e-5]Steps:   6%|▌         | 883/15001 [31:40<7:26:48,  1.90s/it, loss=0.146, lr=1e-5]Steps:   6%|▌         | 884/15001 [31:42<7:19:17,  1.87s/it, loss=0.146, lr=1e-5]Steps:   6%|▌         | 884/15001 [31:42<7:19:17,  1.87s/it, loss=0.0983, lr=1e-5]Steps:   6%|▌         | 885/15001 [31:44<7:12:54,  1.84s/it, loss=0.0983, lr=1e-5]Steps:   6%|▌         | 885/15001 [31:44<7:12:54,  1.84s/it, loss=0.146, lr=1e-5] Steps:   6%|▌         | 886/15001 [31:45<7:08:14,  1.82s/it, loss=0.146, lr=1e-5]Steps:   6%|▌         | 886/15001 [31:45<7:08:14,  1.82s/it, loss=0.208, lr=1e-5]Steps:   6%|▌         | 887/15001 [31:47<7:20:56,  1.87s/it, loss=0.208, lr=1e-5]Steps:   6%|▌         | 887/15001 [31:47<7:20:56,  1.87s/it, loss=0.111, lr=1e-5]Steps:   6%|▌         | 888/15001 [31:49<7:01:20,  1.79s/it, loss=0.111, lr=1e-5]Steps:   6%|▌         | 888/15001 [31:49<7:01:20,  1.79s/it, loss=0.0917, lr=1e-5]Steps:   6%|▌         | 889/15001 [31:51<7:13:28,  1.84s/it, loss=0.0917, lr=1e-5]Steps:   6%|▌         | 889/15001 [31:51<7:13:28,  1.84s/it, loss=0.222, lr=1e-5] Steps:   6%|▌         | 890/15001 [31:53<7:21:02,  1.88s/it, loss=0.222, lr=1e-5]Steps:   6%|▌         | 890/15001 [31:53<7:21:02,  1.88s/it, loss=0.284, lr=1e-5]Steps:   6%|▌         | 891/15001 [31:55<7:19:45,  1.87s/it, loss=0.284, lr=1e-5]Steps:   6%|▌         | 891/15001 [31:55<7:19:45,  1.87s/it, loss=0.0462, lr=1e-5]Steps:   6%|▌         | 892/15001 [31:56<7:06:18,  1.81s/it, loss=0.0462, lr=1e-5]Steps:   6%|▌         | 892/15001 [31:57<7:06:18,  1.81s/it, loss=0.177, lr=1e-5] Steps:   6%|▌         | 893/15001 [31:58<7:01:31,  1.79s/it, loss=0.177, lr=1e-5]Steps:   6%|▌         | 893/15001 [31:59<7:01:31,  1.79s/it, loss=0.163, lr=1e-5]Steps:   6%|▌         | 894/15001 [32:00<7:26:06,  1.90s/it, loss=0.163, lr=1e-5]Steps:   6%|▌         | 894/15001 [32:00<7:26:06,  1.90s/it, loss=0.0595, lr=1e-5]Steps:   6%|▌         | 895/15001 [32:02<7:20:14,  1.87s/it, loss=0.0595, lr=1e-5]Steps:   6%|▌         | 895/15001 [32:02<7:20:14,  1.87s/it, loss=0.155, lr=1e-5] Steps:   6%|▌         | 896/15001 [32:04<7:38:31,  1.95s/it, loss=0.155, lr=1e-5]Steps:   6%|▌         | 896/15001 [32:04<7:38:31,  1.95s/it, loss=0.12, lr=1e-5] Steps:   6%|▌         | 897/15001 [32:06<7:29:54,  1.91s/it, loss=0.12, lr=1e-5]Steps:   6%|▌         | 897/15001 [32:06<7:29:54,  1.91s/it, loss=0.0687, lr=1e-5]Steps:   6%|▌         | 898/15001 [32:08<7:50:50,  2.00s/it, loss=0.0687, lr=1e-5]Steps:   6%|▌         | 898/15001 [32:08<7:50:50,  2.00s/it, loss=0.11, lr=1e-5]  Steps:   6%|▌         | 899/15001 [32:10<7:54:55,  2.02s/it, loss=0.11, lr=1e-5]Steps:   6%|▌         | 899/15001 [32:10<7:54:55,  2.02s/it, loss=0.152, lr=1e-5]Steps:   6%|▌         | 900/15001 [32:12<7:52:47,  2.01s/it, loss=0.152, lr=1e-5]Steps:   6%|▌         | 900/15001 [32:12<7:52:47,  2.01s/it, loss=0.257, lr=1e-5]Steps:   6%|▌         | 901/15001 [32:14<7:37:47,  1.95s/it, loss=0.257, lr=1e-5]Steps:   6%|▌         | 901/15001 [32:14<7:37:47,  1.95s/it, loss=0.052, lr=1e-5]Steps:   6%|▌         | 902/15001 [32:16<7:43:52,  1.97s/it, loss=0.052, lr=1e-5]Steps:   6%|▌         | 902/15001 [32:16<7:43:52,  1.97s/it, loss=0.15, lr=1e-5] Steps:   6%|▌         | 903/15001 [32:18<7:18:20,  1.87s/it, loss=0.15, lr=1e-5]Steps:   6%|▌         | 903/15001 [32:18<7:18:20,  1.87s/it, loss=0.0996, lr=1e-5]Steps:   6%|▌         | 904/15001 [32:20<7:23:53,  1.89s/it, loss=0.0996, lr=1e-5]Steps:   6%|▌         | 904/15001 [32:20<7:23:53,  1.89s/it, loss=0.16, lr=1e-5]  Steps:   6%|▌         | 905/15001 [32:22<7:25:31,  1.90s/it, loss=0.16, lr=1e-5]Steps:   6%|▌         | 905/15001 [32:22<7:25:31,  1.90s/it, loss=0.147, lr=1e-5]Steps:   6%|▌         | 906/15001 [32:24<7:26:16,  1.90s/it, loss=0.147, lr=1e-5]Steps:   6%|▌         | 906/15001 [32:24<7:26:16,  1.90s/it, loss=0.0568, lr=1e-5]Steps:   6%|▌         | 907/15001 [32:25<7:17:52,  1.86s/it, loss=0.0568, lr=1e-5]Steps:   6%|▌         | 907/15001 [32:26<7:17:52,  1.86s/it, loss=0.199, lr=1e-5] Steps:   6%|▌         | 908/15001 [32:27<7:20:52,  1.88s/it, loss=0.199, lr=1e-5]Steps:   6%|▌         | 908/15001 [32:27<7:20:52,  1.88s/it, loss=0.125, lr=1e-5]Steps:   6%|▌         | 909/15001 [32:29<7:10:48,  1.83s/it, loss=0.125, lr=1e-5]Steps:   6%|▌         | 909/15001 [32:29<7:10:48,  1.83s/it, loss=0.199, lr=1e-5]Steps:   6%|▌         | 910/15001 [32:31<7:17:18,  1.86s/it, loss=0.199, lr=1e-5]Steps:   6%|▌         | 910/15001 [32:31<7:17:18,  1.86s/it, loss=0.266, lr=1e-5]Steps:   6%|▌         | 911/15001 [32:33<7:15:28,  1.85s/it, loss=0.266, lr=1e-5]Steps:   6%|▌         | 911/15001 [32:33<7:15:28,  1.85s/it, loss=0.197, lr=1e-5]Steps:   6%|▌         | 912/15001 [32:34<7:04:10,  1.81s/it, loss=0.197, lr=1e-5]Steps:   6%|▌         | 912/15001 [32:35<7:04:10,  1.81s/it, loss=0.138, lr=1e-5]Steps:   6%|▌         | 913/15001 [32:36<7:15:34,  1.86s/it, loss=0.138, lr=1e-5]Steps:   6%|▌         | 913/15001 [32:36<7:15:34,  1.86s/it, loss=0.299, lr=1e-5]Steps:   6%|▌         | 914/15001 [32:38<7:00:06,  1.79s/it, loss=0.299, lr=1e-5]Steps:   6%|▌         | 914/15001 [32:38<7:00:06,  1.79s/it, loss=0.113, lr=1e-5]Steps:   6%|▌         | 915/15001 [32:40<6:58:29,  1.78s/it, loss=0.113, lr=1e-5]Steps:   6%|▌         | 915/15001 [32:40<6:58:29,  1.78s/it, loss=0.0982, lr=1e-5]Steps:   6%|▌         | 916/15001 [32:42<7:10:43,  1.83s/it, loss=0.0982, lr=1e-5]Steps:   6%|▌         | 916/15001 [32:42<7:10:43,  1.83s/it, loss=0.0986, lr=1e-5]Steps:   6%|▌         | 917/15001 [32:44<7:15:03,  1.85s/it, loss=0.0986, lr=1e-5]Steps:   6%|▌         | 917/15001 [32:44<7:15:03,  1.85s/it, loss=0.118, lr=1e-5] Steps:   6%|▌         | 918/15001 [32:45<7:11:15,  1.84s/it, loss=0.118, lr=1e-5]Steps:   6%|▌         | 918/15001 [32:46<7:11:15,  1.84s/it, loss=0.193, lr=1e-5]Steps:   6%|▌         | 919/15001 [32:48<7:29:30,  1.92s/it, loss=0.193, lr=1e-5]Steps:   6%|▌         | 919/15001 [32:48<7:29:30,  1.92s/it, loss=0.164, lr=1e-5]Steps:   6%|▌         | 920/15001 [32:50<7:40:55,  1.96s/it, loss=0.164, lr=1e-5]Steps:   6%|▌         | 920/15001 [32:50<7:40:55,  1.96s/it, loss=0.383, lr=1e-5]Steps:   6%|▌         | 921/15001 [32:52<7:42:52,  1.97s/it, loss=0.383, lr=1e-5]Steps:   6%|▌         | 921/15001 [32:52<7:42:52,  1.97s/it, loss=0.0634, lr=1e-5]Steps:   6%|▌         | 922/15001 [32:54<7:49:06,  2.00s/it, loss=0.0634, lr=1e-5]Steps:   6%|▌         | 922/15001 [32:54<7:49:06,  2.00s/it, loss=0.0572, lr=1e-5]Steps:   6%|▌         | 923/15001 [32:55<7:31:08,  1.92s/it, loss=0.0572, lr=1e-5]Steps:   6%|▌         | 923/15001 [32:56<7:31:08,  1.92s/it, loss=0.142, lr=1e-5] Steps:   6%|▌         | 924/15001 [32:58<7:47:03,  1.99s/it, loss=0.142, lr=1e-5]Steps:   6%|▌         | 924/15001 [32:58<7:47:03,  1.99s/it, loss=0.277, lr=1e-5]Steps:   6%|▌         | 925/15001 [32:59<7:36:06,  1.94s/it, loss=0.277, lr=1e-5]Steps:   6%|▌         | 925/15001 [33:00<7:36:06,  1.94s/it, loss=0.0384, lr=1e-5]Steps:   6%|▌         | 926/15001 [33:01<7:16:35,  1.86s/it, loss=0.0384, lr=1e-5]Steps:   6%|▌         | 926/15001 [33:01<7:16:35,  1.86s/it, loss=0.215, lr=1e-5] Steps:   6%|▌         | 927/15001 [33:03<7:18:35,  1.87s/it, loss=0.215, lr=1e-5]Steps:   6%|▌         | 927/15001 [33:03<7:18:35,  1.87s/it, loss=0.19, lr=1e-5] Steps:   6%|▌         | 928/15001 [33:05<7:19:36,  1.87s/it, loss=0.19, lr=1e-5]Steps:   6%|▌         | 928/15001 [33:05<7:19:36,  1.87s/it, loss=0.141, lr=1e-5]Steps:   6%|▌         | 929/15001 [33:07<7:21:23,  1.88s/it, loss=0.141, lr=1e-5]Steps:   6%|▌         | 929/15001 [33:07<7:21:23,  1.88s/it, loss=0.0872, lr=1e-5]Steps:   6%|▌         | 930/15001 [33:09<7:13:30,  1.85s/it, loss=0.0872, lr=1e-5]Steps:   6%|▌         | 930/15001 [33:09<7:13:30,  1.85s/it, loss=0.125, lr=1e-5] Steps:   6%|▌         | 931/15001 [33:10<7:05:19,  1.81s/it, loss=0.125, lr=1e-5]Steps:   6%|▌         | 931/15001 [33:10<7:05:19,  1.81s/it, loss=0.153, lr=1e-5]Steps:   6%|▌         | 932/15001 [33:12<7:19:22,  1.87s/it, loss=0.153, lr=1e-5]Steps:   6%|▌         | 932/15001 [33:12<7:19:22,  1.87s/it, loss=0.102, lr=1e-5]Steps:   6%|▌         | 933/15001 [33:14<7:24:30,  1.90s/it, loss=0.102, lr=1e-5]Steps:   6%|▌         | 933/15001 [33:14<7:24:30,  1.90s/it, loss=0.184, lr=1e-5]Steps:   6%|▌         | 934/15001 [33:16<6:56:58,  1.78s/it, loss=0.184, lr=1e-5]Steps:   6%|▌         | 934/15001 [33:16<6:56:58,  1.78s/it, loss=0.223, lr=1e-5]Steps:   6%|▌         | 935/15001 [33:18<7:22:11,  1.89s/it, loss=0.223, lr=1e-5]Steps:   6%|▌         | 935/15001 [33:18<7:22:11,  1.89s/it, loss=0.12, lr=1e-5] Steps:   6%|▌         | 936/15001 [33:19<7:00:17,  1.79s/it, loss=0.12, lr=1e-5]Steps:   6%|▌         | 936/15001 [33:20<7:00:17,  1.79s/it, loss=0.185, lr=1e-5]Steps:   6%|▌         | 937/15001 [33:21<7:14:22,  1.85s/it, loss=0.185, lr=1e-5]Steps:   6%|▌         | 937/15001 [33:22<7:14:22,  1.85s/it, loss=0.0671, lr=1e-5]Steps:   6%|▋         | 938/15001 [33:23<7:09:58,  1.83s/it, loss=0.0671, lr=1e-5]Steps:   6%|▋         | 938/15001 [33:23<7:09:58,  1.83s/it, loss=0.181, lr=1e-5] Steps:   6%|▋         | 939/15001 [33:25<7:12:06,  1.84s/it, loss=0.181, lr=1e-5]Steps:   6%|▋         | 939/15001 [33:25<7:12:06,  1.84s/it, loss=0.257, lr=1e-5]Steps:   6%|▋         | 940/15001 [33:27<7:16:29,  1.86s/it, loss=0.257, lr=1e-5]Steps:   6%|▋         | 940/15001 [33:27<7:16:29,  1.86s/it, loss=0.164, lr=1e-5]Steps:   6%|▋         | 941/15001 [33:29<7:35:50,  1.95s/it, loss=0.164, lr=1e-5]Steps:   6%|▋         | 941/15001 [33:29<7:35:50,  1.95s/it, loss=0.15, lr=1e-5] Steps:   6%|▋         | 942/15001 [33:31<7:26:50,  1.91s/it, loss=0.15, lr=1e-5]Steps:   6%|▋         | 942/15001 [33:32<7:26:50,  1.91s/it, loss=0.163, lr=1e-5]Steps:   6%|▋         | 943/15001 [33:33<8:01:57,  2.06s/it, loss=0.163, lr=1e-5]Steps:   6%|▋         | 943/15001 [33:33<8:01:57,  2.06s/it, loss=0.213, lr=1e-5]Steps:   6%|▋         | 944/15001 [33:35<7:36:02,  1.95s/it, loss=0.213, lr=1e-5]Steps:   6%|▋         | 944/15001 [33:36<7:36:02,  1.95s/it, loss=0.221, lr=1e-5]Steps:   6%|▋         | 945/15001 [33:37<8:07:38,  2.08s/it, loss=0.221, lr=1e-5]Steps:   6%|▋         | 945/15001 [33:37<8:07:38,  2.08s/it, loss=0.176, lr=1e-5]Steps:   6%|▋         | 946/15001 [33:39<7:39:58,  1.96s/it, loss=0.176, lr=1e-5]Steps:   6%|▋         | 946/15001 [33:39<7:39:58,  1.96s/it, loss=0.113, lr=1e-5]Steps:   6%|▋         | 947/15001 [33:41<7:47:43,  2.00s/it, loss=0.113, lr=1e-5]Steps:   6%|▋         | 947/15001 [33:41<7:47:43,  2.00s/it, loss=0.21, lr=1e-5] Steps:   6%|▋         | 948/15001 [33:43<7:18:19,  1.87s/it, loss=0.21, lr=1e-5]Steps:   6%|▋         | 948/15001 [33:43<7:18:19,  1.87s/it, loss=0.0799, lr=1e-5]Steps:   6%|▋         | 949/15001 [33:45<7:30:18,  1.92s/it, loss=0.0799, lr=1e-5]Steps:   6%|▋         | 949/15001 [33:45<7:30:18,  1.92s/it, loss=0.327, lr=1e-5] Steps:   6%|▋         | 950/15001 [33:47<7:15:49,  1.86s/it, loss=0.327, lr=1e-5]Steps:   6%|▋         | 950/15001 [33:47<7:15:49,  1.86s/it, loss=0.0835, lr=1e-5]Steps:   6%|▋         | 951/15001 [33:48<7:22:24,  1.89s/it, loss=0.0835, lr=1e-5]Steps:   6%|▋         | 951/15001 [33:49<7:22:24,  1.89s/it, loss=0.146, lr=1e-5] Steps:   6%|▋         | 952/15001 [33:50<7:21:01,  1.88s/it, loss=0.146, lr=1e-5]Steps:   6%|▋         | 952/15001 [33:50<7:21:01,  1.88s/it, loss=0.289, lr=1e-5]Steps:   6%|▋         | 953/15001 [33:52<7:18:10,  1.87s/it, loss=0.289, lr=1e-5]Steps:   6%|▋         | 953/15001 [33:52<7:18:10,  1.87s/it, loss=0.108, lr=1e-5]Steps:   6%|▋         | 954/15001 [33:54<7:00:29,  1.80s/it, loss=0.108, lr=1e-5]Steps:   6%|▋         | 954/15001 [33:54<7:00:29,  1.80s/it, loss=0.121, lr=1e-5]Steps:   6%|▋         | 955/15001 [33:56<7:01:16,  1.80s/it, loss=0.121, lr=1e-5]Steps:   6%|▋         | 955/15001 [33:56<7:01:16,  1.80s/it, loss=0.191, lr=1e-5]Steps:   6%|▋         | 956/15001 [33:58<7:16:55,  1.87s/it, loss=0.191, lr=1e-5]Steps:   6%|▋         | 956/15001 [33:58<7:16:55,  1.87s/it, loss=0.187, lr=1e-5]Steps:   6%|▋         | 957/15001 [33:59<7:12:04,  1.85s/it, loss=0.187, lr=1e-5]Steps:   6%|▋         | 957/15001 [34:00<7:12:04,  1.85s/it, loss=0.177, lr=1e-5]Steps:   6%|▋         | 958/15001 [34:01<6:55:58,  1.78s/it, loss=0.177, lr=1e-5]Steps:   6%|▋         | 958/15001 [34:01<6:55:58,  1.78s/it, loss=0.138, lr=1e-5]Steps:   6%|▋         | 959/15001 [34:03<6:57:15,  1.78s/it, loss=0.138, lr=1e-5]Steps:   6%|▋         | 959/15001 [34:03<6:57:15,  1.78s/it, loss=0.0967, lr=1e-5]Steps:   6%|▋         | 960/15001 [34:05<7:18:41,  1.87s/it, loss=0.0967, lr=1e-5]Steps:   6%|▋         | 960/15001 [34:05<7:18:41,  1.87s/it, loss=0.35, lr=1e-5]  Steps:   6%|▋         | 961/15001 [34:07<7:08:59,  1.83s/it, loss=0.35, lr=1e-5]Steps:   6%|▋         | 961/15001 [34:07<7:08:59,  1.83s/it, loss=0.312, lr=1e-5]Steps:   6%|▋         | 962/15001 [34:09<7:09:29,  1.84s/it, loss=0.312, lr=1e-5]Steps:   6%|▋         | 962/15001 [34:09<7:09:29,  1.84s/it, loss=0.171, lr=1e-5]Steps:   6%|▋         | 963/15001 [34:10<7:01:29,  1.80s/it, loss=0.171, lr=1e-5]Steps:   6%|▋         | 963/15001 [34:11<7:01:29,  1.80s/it, loss=0.184, lr=1e-5]Steps:   6%|▋         | 964/15001 [34:12<7:07:56,  1.83s/it, loss=0.184, lr=1e-5]Steps:   6%|▋         | 964/15001 [34:13<7:07:56,  1.83s/it, loss=0.206, lr=1e-5]Steps:   6%|▋         | 965/15001 [34:14<7:28:11,  1.92s/it, loss=0.206, lr=1e-5]Steps:   6%|▋         | 965/15001 [34:15<7:28:11,  1.92s/it, loss=0.126, lr=1e-5]Steps:   6%|▋         | 966/15001 [34:17<8:01:30,  2.06s/it, loss=0.126, lr=1e-5]Steps:   6%|▋         | 966/15001 [34:17<8:01:30,  2.06s/it, loss=0.228, lr=1e-5]Steps:   6%|▋         | 967/15001 [34:19<7:47:39,  2.00s/it, loss=0.228, lr=1e-5]Steps:   6%|▋         | 967/15001 [34:19<7:47:39,  2.00s/it, loss=0.349, lr=1e-5]Steps:   6%|▋         | 968/15001 [34:21<7:48:52,  2.00s/it, loss=0.349, lr=1e-5]Steps:   6%|▋         | 968/15001 [34:21<7:48:52,  2.00s/it, loss=0.206, lr=1e-5]Steps:   6%|▋         | 969/15001 [34:22<7:31:15,  1.93s/it, loss=0.206, lr=1e-5]Steps:   6%|▋         | 969/15001 [34:23<7:31:15,  1.93s/it, loss=0.0681, lr=1e-5]Steps:   6%|▋         | 970/15001 [34:24<7:37:48,  1.96s/it, loss=0.0681, lr=1e-5]Steps:   6%|▋         | 970/15001 [34:24<7:37:48,  1.96s/it, loss=0.202, lr=1e-5] Steps:   6%|▋         | 971/15001 [34:26<7:31:38,  1.93s/it, loss=0.202, lr=1e-5]Steps:   6%|▋         | 971/15001 [34:26<7:31:38,  1.93s/it, loss=0.2, lr=1e-5]  Steps:   6%|▋         | 972/15001 [34:28<7:23:03,  1.89s/it, loss=0.2, lr=1e-5]Steps:   6%|▋         | 972/15001 [34:28<7:23:03,  1.89s/it, loss=0.0248, lr=1e-5]Steps:   6%|▋         | 973/15001 [34:30<7:04:57,  1.82s/it, loss=0.0248, lr=1e-5]Steps:   6%|▋         | 973/15001 [34:30<7:04:57,  1.82s/it, loss=0.0879, lr=1e-5]Steps:   6%|▋         | 974/15001 [34:32<7:16:51,  1.87s/it, loss=0.0879, lr=1e-5]Steps:   6%|▋         | 974/15001 [34:32<7:16:51,  1.87s/it, loss=0.0814, lr=1e-5]Steps:   6%|▋         | 975/15001 [34:34<7:20:16,  1.88s/it, loss=0.0814, lr=1e-5]Steps:   6%|▋         | 975/15001 [34:34<7:20:16,  1.88s/it, loss=0.175, lr=1e-5] Steps:   7%|▋         | 976/15001 [34:35<7:06:37,  1.83s/it, loss=0.175, lr=1e-5]Steps:   7%|▋         | 976/15001 [34:35<7:06:37,  1.83s/it, loss=0.121, lr=1e-5]Steps:   7%|▋         | 977/15001 [34:37<7:13:35,  1.86s/it, loss=0.121, lr=1e-5]Steps:   7%|▋         | 977/15001 [34:37<7:13:35,  1.86s/it, loss=0.0452, lr=1e-5]Steps:   7%|▋         | 978/15001 [34:39<6:57:08,  1.78s/it, loss=0.0452, lr=1e-5]Steps:   7%|▋         | 978/15001 [34:39<6:57:08,  1.78s/it, loss=0.0455, lr=1e-5]Steps:   7%|▋         | 979/15001 [34:41<7:04:20,  1.82s/it, loss=0.0455, lr=1e-5]Steps:   7%|▋         | 979/15001 [34:41<7:04:20,  1.82s/it, loss=0.0236, lr=1e-5]Steps:   7%|▋         | 980/15001 [34:43<7:14:16,  1.86s/it, loss=0.0236, lr=1e-5]Steps:   7%|▋         | 980/15001 [34:43<7:14:16,  1.86s/it, loss=0.229, lr=1e-5] Steps:   7%|▋         | 981/15001 [34:44<7:12:42,  1.85s/it, loss=0.229, lr=1e-5]Steps:   7%|▋         | 981/15001 [34:45<7:12:42,  1.85s/it, loss=0.396, lr=1e-5]Steps:   7%|▋         | 982/15001 [34:46<6:58:02,  1.79s/it, loss=0.396, lr=1e-5]Steps:   7%|▋         | 982/15001 [34:46<6:58:02,  1.79s/it, loss=0.0601, lr=1e-5]Steps:   7%|▋         | 983/15001 [34:48<7:02:27,  1.81s/it, loss=0.0601, lr=1e-5]Steps:   7%|▋         | 983/15001 [34:48<7:02:27,  1.81s/it, loss=0.307, lr=1e-5] Steps:   7%|▋         | 984/15001 [34:50<7:09:15,  1.84s/it, loss=0.307, lr=1e-5]Steps:   7%|▋         | 984/15001 [34:50<7:09:15,  1.84s/it, loss=0.291, lr=1e-5]Steps:   7%|▋         | 985/15001 [34:52<7:15:54,  1.87s/it, loss=0.291, lr=1e-5]Steps:   7%|▋         | 985/15001 [34:52<7:15:54,  1.87s/it, loss=0.17, lr=1e-5] Steps:   7%|▋         | 986/15001 [34:54<7:41:55,  1.98s/it, loss=0.17, lr=1e-5]Steps:   7%|▋         | 986/15001 [34:54<7:41:55,  1.98s/it, loss=0.205, lr=1e-5]Steps:   7%|▋         | 987/15001 [34:56<7:33:14,  1.94s/it, loss=0.205, lr=1e-5]Steps:   7%|▋         | 987/15001 [34:56<7:33:14,  1.94s/it, loss=0.255, lr=1e-5]Steps:   7%|▋         | 988/15001 [34:58<8:00:26,  2.06s/it, loss=0.255, lr=1e-5]Steps:   7%|▋         | 988/15001 [34:58<8:00:26,  2.06s/it, loss=0.399, lr=1e-5]Steps:   7%|▋         | 989/15001 [35:00<7:55:17,  2.04s/it, loss=0.399, lr=1e-5]Steps:   7%|▋         | 989/15001 [35:00<7:55:17,  2.04s/it, loss=0.288, lr=1e-5]Steps:   7%|▋         | 990/15001 [35:03<8:17:42,  2.13s/it, loss=0.288, lr=1e-5]Steps:   7%|▋         | 990/15001 [35:03<8:17:42,  2.13s/it, loss=0.0864, lr=1e-5]Steps:   7%|▋         | 991/15001 [35:04<7:56:31,  2.04s/it, loss=0.0864, lr=1e-5]Steps:   7%|▋         | 991/15001 [35:04<7:56:31,  2.04s/it, loss=0.364, lr=1e-5] Steps:   7%|▋         | 992/15001 [35:06<7:29:58,  1.93s/it, loss=0.364, lr=1e-5]Steps:   7%|▋         | 992/15001 [35:06<7:29:58,  1.93s/it, loss=0.0669, lr=1e-5]Steps:   7%|▋         | 993/15001 [35:08<7:43:04,  1.98s/it, loss=0.0669, lr=1e-5]Steps:   7%|▋         | 993/15001 [35:08<7:43:04,  1.98s/it, loss=0.257, lr=1e-5] Steps:   7%|▋         | 994/15001 [35:10<7:34:37,  1.95s/it, loss=0.257, lr=1e-5]Steps:   7%|▋         | 994/15001 [35:10<7:34:37,  1.95s/it, loss=0.0997, lr=1e-5]Steps:   7%|▋         | 995/15001 [35:12<7:20:53,  1.89s/it, loss=0.0997, lr=1e-5]Steps:   7%|▋         | 995/15001 [35:12<7:20:53,  1.89s/it, loss=0.138, lr=1e-5] Steps:   7%|▋         | 996/15001 [35:13<6:50:45,  1.76s/it, loss=0.138, lr=1e-5]Steps:   7%|▋         | 996/15001 [35:14<6:50:45,  1.76s/it, loss=0.215, lr=1e-5]Steps:   7%|▋         | 997/15001 [35:15<7:09:19,  1.84s/it, loss=0.215, lr=1e-5]Steps:   7%|▋         | 997/15001 [35:16<7:09:19,  1.84s/it, loss=0.139, lr=1e-5]Steps:   7%|▋         | 998/15001 [35:17<7:07:55,  1.83s/it, loss=0.139, lr=1e-5]Steps:   7%|▋         | 998/15001 [35:17<7:07:55,  1.83s/it, loss=0.259, lr=1e-5]Steps:   7%|▋         | 999/15001 [35:19<7:08:04,  1.83s/it, loss=0.259, lr=1e-5]Steps:   7%|▋         | 999/15001 [35:19<7:08:04,  1.83s/it, loss=0.239, lr=1e-5]Steps:   7%|▋         | 1000/15001 [35:21<7:31:34,  1.94s/it, loss=0.239, lr=1e-5]02/04/2024 13:37:40 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1668.49it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:   7%|▋         | 1000/15001 [39:02<7:31:34,  1.94s/it, loss=0.029, lr=1e-5]Steps:   7%|▋         | 1001/15001 [39:03<264:21:18, 67.98s/it, loss=0.029, lr=1e-5]Steps:   7%|▋         | 1001/15001 [39:03<264:21:18, 67.98s/it, loss=0.173, lr=1e-5]Steps:   7%|▋         | 1002/15001 [39:05<187:12:12, 48.14s/it, loss=0.173, lr=1e-5]Steps:   7%|▋         | 1002/15001 [39:05<187:12:12, 48.14s/it, loss=0.0809, lr=1e-5]Steps:   7%|▋         | 1003/15001 [39:07<133:07:36, 34.24s/it, loss=0.0809, lr=1e-5]Steps:   7%|▋         | 1003/15001 [39:07<133:07:36, 34.24s/it, loss=0.0995, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:   7%|▋         | 1004/15001 [39:09<95:14:55, 24.50s/it, loss=0.0995, lr=1e-5] Steps:   7%|▋         | 1004/15001 [39:09<95:14:55, 24.50s/it, loss=0.138, lr=1e-5] Steps:   7%|▋         | 1005/15001 [39:10<68:47:09, 17.69s/it, loss=0.138, lr=1e-5]Steps:   7%|▋         | 1005/15001 [39:11<68:47:09, 17.69s/it, loss=0.166, lr=1e-5]Steps:   7%|▋         | 1006/15001 [39:12<50:10:24, 12.91s/it, loss=0.166, lr=1e-5]Steps:   7%|▋         | 1006/15001 [39:12<50:10:24, 12.91s/it, loss=0.288, lr=1e-5]Steps:   7%|▋         | 1007/15001 [39:14<37:06:39,  9.55s/it, loss=0.288, lr=1e-5]Steps:   7%|▋         | 1007/15001 [39:14<37:06:39,  9.55s/it, loss=0.0766, lr=1e-5]Steps:   7%|▋         | 1008/15001 [39:16<28:39:10,  7.37s/it, loss=0.0766, lr=1e-5]Steps:   7%|▋         | 1008/15001 [39:16<28:39:10,  7.37s/it, loss=0.227, lr=1e-5] Steps:   7%|▋         | 1009/15001 [39:18<21:55:08,  5.64s/it, loss=0.227, lr=1e-5]Steps:   7%|▋         | 1009/15001 [39:18<21:55:08,  5.64s/it, loss=0.0165, lr=1e-5]Steps:   7%|▋         | 1010/15001 [39:20<17:47:17,  4.58s/it, loss=0.0165, lr=1e-5]Steps:   7%|▋         | 1010/15001 [39:20<17:47:17,  4.58s/it, loss=0.262, lr=1e-5] Steps:   7%|▋         | 1011/15001 [39:21<14:09:48,  3.64s/it, loss=0.262, lr=1e-5]Steps:   7%|▋         | 1011/15001 [39:22<14:09:48,  3.64s/it, loss=0.271, lr=1e-5]Steps:   7%|▋         | 1012/15001 [39:23<12:05:12,  3.11s/it, loss=0.271, lr=1e-5]Steps:   7%|▋         | 1012/15001 [39:24<12:05:12,  3.11s/it, loss=0.0871, lr=1e-5]Steps:   7%|▋         | 1013/15001 [39:25<10:55:50,  2.81s/it, loss=0.0871, lr=1e-5]Steps:   7%|▋         | 1013/15001 [39:25<10:55:50,  2.81s/it, loss=0.127, lr=1e-5] Steps:   7%|▋         | 1014/15001 [39:27<9:53:08,  2.54s/it, loss=0.127, lr=1e-5] Steps:   7%|▋         | 1014/15001 [39:27<9:53:08,  2.54s/it, loss=0.0871, lr=1e-5]Steps:   7%|▋         | 1015/15001 [39:29<9:12:25,  2.37s/it, loss=0.0871, lr=1e-5]Steps:   7%|▋         | 1015/15001 [39:29<9:12:25,  2.37s/it, loss=0.105, lr=1e-5] Steps:   7%|▋         | 1016/15001 [39:31<8:57:51,  2.31s/it, loss=0.105, lr=1e-5]Steps:   7%|▋         | 1016/15001 [39:31<8:57:51,  2.31s/it, loss=0.383, lr=1e-5]Steps:   7%|▋         | 1017/15001 [39:33<8:34:56,  2.21s/it, loss=0.383, lr=1e-5]Steps:   7%|▋         | 1017/15001 [39:33<8:34:56,  2.21s/it, loss=0.0465, lr=1e-5]Steps:   7%|▋         | 1018/15001 [39:35<8:20:56,  2.15s/it, loss=0.0465, lr=1e-5]Steps:   7%|▋         | 1018/15001 [39:35<8:20:56,  2.15s/it, loss=0.141, lr=1e-5] Steps:   7%|▋         | 1019/15001 [39:37<8:05:23,  2.08s/it, loss=0.141, lr=1e-5]Steps:   7%|▋         | 1019/15001 [39:37<8:05:23,  2.08s/it, loss=0.154, lr=1e-5]Steps:   7%|▋         | 1020/15001 [39:39<7:55:59,  2.04s/it, loss=0.154, lr=1e-5]Steps:   7%|▋         | 1020/15001 [39:39<7:55:59,  2.04s/it, loss=0.305, lr=1e-5]Steps:   7%|▋         | 1021/15001 [39:41<7:27:51,  1.92s/it, loss=0.305, lr=1e-5]Steps:   7%|▋         | 1021/15001 [39:41<7:27:51,  1.92s/it, loss=0.203, lr=1e-5]Steps:   7%|▋         | 1022/15001 [39:43<7:31:18,  1.94s/it, loss=0.203, lr=1e-5]Steps:   7%|▋         | 1022/15001 [39:43<7:31:18,  1.94s/it, loss=0.13, lr=1e-5] Steps:   7%|▋         | 1023/15001 [39:44<7:09:54,  1.85s/it, loss=0.13, lr=1e-5]Steps:   7%|▋         | 1023/15001 [39:45<7:09:54,  1.85s/it, loss=0.316, lr=1e-5]Steps:   7%|▋         | 1024/15001 [39:46<7:20:58,  1.89s/it, loss=0.316, lr=1e-5]Steps:   7%|▋         | 1024/15001 [39:47<7:20:58,  1.89s/it, loss=0.226, lr=1e-5]Steps:   7%|▋         | 1025/15001 [39:48<7:10:34,  1.85s/it, loss=0.226, lr=1e-5]Steps:   7%|▋         | 1025/15001 [39:48<7:10:34,  1.85s/it, loss=0.107, lr=1e-5]Steps:   7%|▋         | 1026/15001 [39:50<7:17:08,  1.88s/it, loss=0.107, lr=1e-5]Steps:   7%|▋         | 1026/15001 [39:50<7:17:08,  1.88s/it, loss=0.158, lr=1e-5]Steps:   7%|▋         | 1027/15001 [39:52<7:05:36,  1.83s/it, loss=0.158, lr=1e-5]Steps:   7%|▋         | 1027/15001 [39:52<7:05:36,  1.83s/it, loss=0.0462, lr=1e-5]Steps:   7%|▋         | 1028/15001 [39:54<7:03:19,  1.82s/it, loss=0.0462, lr=1e-5]Steps:   7%|▋         | 1028/15001 [39:54<7:03:19,  1.82s/it, loss=0.11, lr=1e-5]  Steps:   7%|▋         | 1029/15001 [39:56<7:17:01,  1.88s/it, loss=0.11, lr=1e-5]Steps:   7%|▋         | 1029/15001 [39:56<7:17:01,  1.88s/it, loss=0.0886, lr=1e-5]Steps:   7%|▋         | 1030/15001 [39:57<6:55:03,  1.78s/it, loss=0.0886, lr=1e-5]Steps:   7%|▋         | 1030/15001 [39:58<6:55:03,  1.78s/it, loss=0.0936, lr=1e-5]Steps:   7%|▋         | 1031/15001 [39:59<7:24:14,  1.91s/it, loss=0.0936, lr=1e-5]Steps:   7%|▋         | 1031/15001 [39:59<7:24:14,  1.91s/it, loss=0.18, lr=1e-5]  Steps:   7%|▋         | 1032/15001 [40:01<7:24:59,  1.91s/it, loss=0.18, lr=1e-5]Steps:   7%|▋         | 1032/15001 [40:01<7:24:59,  1.91s/it, loss=0.165, lr=1e-5]Steps:   7%|▋         | 1033/15001 [40:03<7:23:18,  1.90s/it, loss=0.165, lr=1e-5]Steps:   7%|▋         | 1033/15001 [40:03<7:23:18,  1.90s/it, loss=0.206, lr=1e-5]Steps:   7%|▋         | 1034/15001 [40:05<7:16:54,  1.88s/it, loss=0.206, lr=1e-5]Steps:   7%|▋         | 1034/15001 [40:05<7:16:54,  1.88s/it, loss=0.248, lr=1e-5]Steps:   7%|▋         | 1035/15001 [40:07<7:13:51,  1.86s/it, loss=0.248, lr=1e-5]Steps:   7%|▋         | 1035/15001 [40:07<7:13:51,  1.86s/it, loss=0.114, lr=1e-5]Steps:   7%|▋         | 1036/15001 [40:09<7:02:18,  1.81s/it, loss=0.114, lr=1e-5]Steps:   7%|▋         | 1036/15001 [40:09<7:02:18,  1.81s/it, loss=0.184, lr=1e-5]Steps:   7%|▋         | 1037/15001 [40:10<6:54:28,  1.78s/it, loss=0.184, lr=1e-5]Steps:   7%|▋         | 1037/15001 [40:11<6:54:28,  1.78s/it, loss=0.141, lr=1e-5]Steps:   7%|▋         | 1038/15001 [40:13<7:25:53,  1.92s/it, loss=0.141, lr=1e-5]Steps:   7%|▋         | 1038/15001 [40:13<7:25:53,  1.92s/it, loss=0.0482, lr=1e-5]Steps:   7%|▋         | 1039/15001 [40:14<7:17:20,  1.88s/it, loss=0.0482, lr=1e-5]Steps:   7%|▋         | 1039/15001 [40:15<7:17:20,  1.88s/it, loss=0.103, lr=1e-5] Steps:   7%|▋         | 1040/15001 [40:16<7:23:07,  1.90s/it, loss=0.103, lr=1e-5]Steps:   7%|▋         | 1040/15001 [40:17<7:23:07,  1.90s/it, loss=0.0105, lr=1e-5]Steps:   7%|▋         | 1041/15001 [40:18<7:43:04,  1.99s/it, loss=0.0105, lr=1e-5]Steps:   7%|▋         | 1041/15001 [40:19<7:43:04,  1.99s/it, loss=0.126, lr=1e-5] Steps:   7%|▋         | 1042/15001 [40:20<7:27:18,  1.92s/it, loss=0.126, lr=1e-5]Steps:   7%|▋         | 1042/15001 [40:21<7:27:18,  1.92s/it, loss=0.0472, lr=1e-5]Steps:   7%|▋         | 1043/15001 [40:22<7:50:22,  2.02s/it, loss=0.0472, lr=1e-5]Steps:   7%|▋         | 1043/15001 [40:23<7:50:22,  2.02s/it, loss=0.118, lr=1e-5] Steps:   7%|▋         | 1044/15001 [40:24<7:34:29,  1.95s/it, loss=0.118, lr=1e-5]Steps:   7%|▋         | 1044/15001 [40:24<7:34:29,  1.95s/it, loss=0.0349, lr=1e-5]Steps:   7%|▋         | 1045/15001 [40:26<7:22:31,  1.90s/it, loss=0.0349, lr=1e-5]Steps:   7%|▋         | 1045/15001 [40:26<7:22:31,  1.90s/it, loss=0.37, lr=1e-5]  Steps:   7%|▋         | 1046/15001 [40:28<7:22:38,  1.90s/it, loss=0.37, lr=1e-5]Steps:   7%|▋         | 1046/15001 [40:28<7:22:38,  1.90s/it, loss=0.0955, lr=1e-5]Steps:   7%|▋         | 1047/15001 [40:30<7:05:30,  1.83s/it, loss=0.0955, lr=1e-5]Steps:   7%|▋         | 1047/15001 [40:30<7:05:30,  1.83s/it, loss=0.264, lr=1e-5] Steps:   7%|▋         | 1048/15001 [40:31<7:04:52,  1.83s/it, loss=0.264, lr=1e-5]Steps:   7%|▋         | 1048/15001 [40:32<7:04:52,  1.83s/it, loss=0.196, lr=1e-5]Steps:   7%|▋         | 1049/15001 [40:33<7:14:45,  1.87s/it, loss=0.196, lr=1e-5]Steps:   7%|▋         | 1049/15001 [40:33<7:14:45,  1.87s/it, loss=0.0358, lr=1e-5]Steps:   7%|▋         | 1050/15001 [40:35<7:07:45,  1.84s/it, loss=0.0358, lr=1e-5]Steps:   7%|▋         | 1050/15001 [40:35<7:07:45,  1.84s/it, loss=0.127, lr=1e-5] Steps:   7%|▋         | 1051/15001 [40:37<6:56:15,  1.79s/it, loss=0.127, lr=1e-5]Steps:   7%|▋         | 1051/15001 [40:37<6:56:15,  1.79s/it, loss=0.233, lr=1e-5]Steps:   7%|▋         | 1052/15001 [40:39<7:11:01,  1.85s/it, loss=0.233, lr=1e-5]Steps:   7%|▋         | 1052/15001 [40:39<7:11:01,  1.85s/it, loss=0.239, lr=1e-5]Steps:   7%|▋         | 1053/15001 [40:41<7:10:03,  1.85s/it, loss=0.239, lr=1e-5]Steps:   7%|▋         | 1053/15001 [40:41<7:10:03,  1.85s/it, loss=0.165, lr=1e-5]Steps:   7%|▋         | 1054/15001 [40:42<6:59:54,  1.81s/it, loss=0.165, lr=1e-5]Steps:   7%|▋         | 1054/15001 [40:43<6:59:54,  1.81s/it, loss=0.254, lr=1e-5]Steps:   7%|▋         | 1055/15001 [40:44<6:57:37,  1.80s/it, loss=0.254, lr=1e-5]Steps:   7%|▋         | 1055/15001 [40:44<6:57:37,  1.80s/it, loss=0.0847, lr=1e-5]Steps:   7%|▋         | 1056/15001 [40:46<7:03:36,  1.82s/it, loss=0.0847, lr=1e-5]Steps:   7%|▋         | 1056/15001 [40:46<7:03:36,  1.82s/it, loss=0.236, lr=1e-5] Steps:   7%|▋         | 1057/15001 [40:48<7:05:56,  1.83s/it, loss=0.236, lr=1e-5]Steps:   7%|▋         | 1057/15001 [40:48<7:05:56,  1.83s/it, loss=0.384, lr=1e-5]Steps:   7%|▋         | 1058/15001 [40:50<7:00:50,  1.81s/it, loss=0.384, lr=1e-5]Steps:   7%|▋         | 1058/15001 [40:50<7:00:50,  1.81s/it, loss=0.142, lr=1e-5]Steps:   7%|▋         | 1059/15001 [40:52<7:08:49,  1.85s/it, loss=0.142, lr=1e-5]Steps:   7%|▋         | 1059/15001 [40:52<7:08:49,  1.85s/it, loss=0.176, lr=1e-5]Steps:   7%|▋         | 1060/15001 [40:53<6:55:19,  1.79s/it, loss=0.176, lr=1e-5]Steps:   7%|▋         | 1060/15001 [40:54<6:55:19,  1.79s/it, loss=0.152, lr=1e-5]Steps:   7%|▋         | 1061/15001 [40:55<7:12:04,  1.86s/it, loss=0.152, lr=1e-5]Steps:   7%|▋         | 1061/15001 [40:56<7:12:04,  1.86s/it, loss=0.28, lr=1e-5] Steps:   7%|▋         | 1062/15001 [40:57<7:32:06,  1.95s/it, loss=0.28, lr=1e-5]Steps:   7%|▋         | 1062/15001 [40:58<7:32:06,  1.95s/it, loss=0.0374, lr=1e-5]Steps:   7%|▋         | 1063/15001 [41:00<7:44:42,  2.00s/it, loss=0.0374, lr=1e-5]Steps:   7%|▋         | 1063/15001 [41:00<7:44:42,  2.00s/it, loss=0.162, lr=1e-5] Steps:   7%|▋         | 1064/15001 [41:02<7:46:36,  2.01s/it, loss=0.162, lr=1e-5]Steps:   7%|▋         | 1064/15001 [41:02<7:46:36,  2.01s/it, loss=0.0461, lr=1e-5]Steps:   7%|▋         | 1065/15001 [41:04<7:41:05,  1.99s/it, loss=0.0461, lr=1e-5]Steps:   7%|▋         | 1065/15001 [41:04<7:41:05,  1.99s/it, loss=0.28, lr=1e-5]  Steps:   7%|▋         | 1066/15001 [41:06<7:41:35,  1.99s/it, loss=0.28, lr=1e-5]Steps:   7%|▋         | 1066/15001 [41:06<7:41:35,  1.99s/it, loss=0.375, lr=1e-5]Steps:   7%|▋         | 1067/15001 [41:07<7:22:24,  1.91s/it, loss=0.375, lr=1e-5]Steps:   7%|▋         | 1067/15001 [41:08<7:22:24,  1.91s/it, loss=0.209, lr=1e-5]Steps:   7%|▋         | 1068/15001 [41:09<7:10:53,  1.86s/it, loss=0.209, lr=1e-5]Steps:   7%|▋         | 1068/15001 [41:09<7:10:53,  1.86s/it, loss=0.199, lr=1e-5]Steps:   7%|▋         | 1069/15001 [41:11<7:33:15,  1.95s/it, loss=0.199, lr=1e-5]Steps:   7%|▋         | 1069/15001 [41:11<7:33:15,  1.95s/it, loss=0.187, lr=1e-5]Steps:   7%|▋         | 1070/15001 [41:13<7:03:26,  1.82s/it, loss=0.187, lr=1e-5]Steps:   7%|▋         | 1070/15001 [41:13<7:03:26,  1.82s/it, loss=0.196, lr=1e-5]Steps:   7%|▋         | 1071/15001 [41:15<7:24:45,  1.92s/it, loss=0.196, lr=1e-5]Steps:   7%|▋         | 1071/15001 [41:15<7:24:45,  1.92s/it, loss=0.125, lr=1e-5]Steps:   7%|▋         | 1072/15001 [41:17<7:22:40,  1.91s/it, loss=0.125, lr=1e-5]Steps:   7%|▋         | 1072/15001 [41:17<7:22:40,  1.91s/it, loss=0.203, lr=1e-5]Steps:   7%|▋         | 1073/15001 [41:18<7:09:12,  1.85s/it, loss=0.203, lr=1e-5]Steps:   7%|▋         | 1073/15001 [41:19<7:09:12,  1.85s/it, loss=0.122, lr=1e-5]Steps:   7%|▋         | 1074/15001 [41:20<7:16:55,  1.88s/it, loss=0.122, lr=1e-5]Steps:   7%|▋         | 1074/15001 [41:20<7:16:55,  1.88s/it, loss=0.09, lr=1e-5] Steps:   7%|▋         | 1075/15001 [41:22<7:09:36,  1.85s/it, loss=0.09, lr=1e-5]Steps:   7%|▋         | 1075/15001 [41:22<7:09:36,  1.85s/it, loss=0.0915, lr=1e-5]Steps:   7%|▋         | 1076/15001 [41:24<7:14:50,  1.87s/it, loss=0.0915, lr=1e-5]Steps:   7%|▋         | 1076/15001 [41:24<7:14:50,  1.87s/it, loss=0.219, lr=1e-5] Steps:   7%|▋         | 1077/15001 [41:26<7:19:57,  1.90s/it, loss=0.219, lr=1e-5]Steps:   7%|▋         | 1077/15001 [41:26<7:19:57,  1.90s/it, loss=0.094, lr=1e-5]Steps:   7%|▋         | 1078/15001 [41:28<7:11:25,  1.86s/it, loss=0.094, lr=1e-5]Steps:   7%|▋         | 1078/15001 [41:28<7:11:25,  1.86s/it, loss=0.104, lr=1e-5]Steps:   7%|▋         | 1079/15001 [41:30<7:12:01,  1.86s/it, loss=0.104, lr=1e-5]Steps:   7%|▋         | 1079/15001 [41:30<7:12:01,  1.86s/it, loss=0.349, lr=1e-5]Steps:   7%|▋         | 1080/15001 [41:31<7:03:18,  1.82s/it, loss=0.349, lr=1e-5]Steps:   7%|▋         | 1080/15001 [41:32<7:03:18,  1.82s/it, loss=0.248, lr=1e-5]Steps:   7%|▋         | 1081/15001 [41:33<7:07:11,  1.84s/it, loss=0.248, lr=1e-5]Steps:   7%|▋         | 1081/15001 [41:33<7:07:11,  1.84s/it, loss=0.2, lr=1e-5]  Steps:   7%|▋         | 1082/15001 [41:35<7:00:47,  1.81s/it, loss=0.2, lr=1e-5]Steps:   7%|▋         | 1082/15001 [41:35<7:00:47,  1.81s/it, loss=0.0863, lr=1e-5]Steps:   7%|▋         | 1083/15001 [41:37<7:07:43,  1.84s/it, loss=0.0863, lr=1e-5]Steps:   7%|▋         | 1083/15001 [41:37<7:07:43,  1.84s/it, loss=0.158, lr=1e-5] Steps:   7%|▋         | 1084/15001 [41:39<7:43:45,  2.00s/it, loss=0.158, lr=1e-5]Steps:   7%|▋         | 1084/15001 [41:39<7:43:45,  2.00s/it, loss=0.256, lr=1e-5]Steps:   7%|▋         | 1085/15001 [41:41<7:47:07,  2.01s/it, loss=0.256, lr=1e-5]Steps:   7%|▋         | 1085/15001 [41:41<7:47:07,  2.01s/it, loss=0.342, lr=1e-5]Steps:   7%|▋         | 1086/15001 [41:43<7:43:52,  2.00s/it, loss=0.342, lr=1e-5]Steps:   7%|▋         | 1086/15001 [41:43<7:43:52,  2.00s/it, loss=0.0555, lr=1e-5]Steps:   7%|▋         | 1087/15001 [41:45<7:33:53,  1.96s/it, loss=0.0555, lr=1e-5]Steps:   7%|▋         | 1087/15001 [41:45<7:33:53,  1.96s/it, loss=0.196, lr=1e-5] Steps:   7%|▋         | 1088/15001 [41:47<7:27:58,  1.93s/it, loss=0.196, lr=1e-5]Steps:   7%|▋         | 1088/15001 [41:47<7:27:58,  1.93s/it, loss=0.0574, lr=1e-5]Steps:   7%|▋         | 1089/15001 [41:49<7:38:50,  1.98s/it, loss=0.0574, lr=1e-5]Steps:   7%|▋         | 1089/15001 [41:49<7:38:50,  1.98s/it, loss=0.118, lr=1e-5] Steps:   7%|▋         | 1090/15001 [41:51<7:27:36,  1.93s/it, loss=0.118, lr=1e-5]Steps:   7%|▋         | 1090/15001 [41:51<7:27:36,  1.93s/it, loss=0.0114, lr=1e-5]Steps:   7%|▋         | 1091/15001 [41:53<7:18:58,  1.89s/it, loss=0.0114, lr=1e-5]Steps:   7%|▋         | 1091/15001 [41:53<7:18:58,  1.89s/it, loss=0.269, lr=1e-5] Steps:   7%|▋         | 1092/15001 [41:55<7:20:18,  1.90s/it, loss=0.269, lr=1e-5]Steps:   7%|▋         | 1092/15001 [41:55<7:20:18,  1.90s/it, loss=0.221, lr=1e-5]Steps:   7%|▋         | 1093/15001 [41:57<7:21:52,  1.91s/it, loss=0.221, lr=1e-5]Steps:   7%|▋         | 1093/15001 [41:57<7:21:52,  1.91s/it, loss=0.181, lr=1e-5]Steps:   7%|▋         | 1094/15001 [41:58<7:04:39,  1.83s/it, loss=0.181, lr=1e-5]Steps:   7%|▋         | 1094/15001 [41:58<7:04:39,  1.83s/it, loss=0.182, lr=1e-5]Steps:   7%|▋         | 1095/15001 [42:00<7:09:01,  1.85s/it, loss=0.182, lr=1e-5]Steps:   7%|▋         | 1095/15001 [42:00<7:09:01,  1.85s/it, loss=0.412, lr=1e-5]Steps:   7%|▋         | 1096/15001 [42:02<7:06:38,  1.84s/it, loss=0.412, lr=1e-5]Steps:   7%|▋         | 1096/15001 [42:02<7:06:38,  1.84s/it, loss=0.117, lr=1e-5]Steps:   7%|▋         | 1097/15001 [42:04<7:10:44,  1.86s/it, loss=0.117, lr=1e-5]Steps:   7%|▋         | 1097/15001 [42:04<7:10:44,  1.86s/it, loss=0.125, lr=1e-5]Steps:   7%|▋         | 1098/15001 [42:05<6:45:41,  1.75s/it, loss=0.125, lr=1e-5]Steps:   7%|▋         | 1098/15001 [42:06<6:45:41,  1.75s/it, loss=0.0575, lr=1e-5]Steps:   7%|▋         | 1099/15001 [42:07<6:55:15,  1.79s/it, loss=0.0575, lr=1e-5]Steps:   7%|▋         | 1099/15001 [42:07<6:55:15,  1.79s/it, loss=0.344, lr=1e-5] Steps:   7%|▋         | 1100/15001 [42:09<7:04:54,  1.83s/it, loss=0.344, lr=1e-5]Steps:   7%|▋         | 1100/15001 [42:09<7:04:54,  1.83s/it, loss=0.316, lr=1e-5]Steps:   7%|▋         | 1101/15001 [42:11<6:53:18,  1.78s/it, loss=0.316, lr=1e-5]Steps:   7%|▋         | 1101/15001 [42:11<6:53:18,  1.78s/it, loss=0.0796, lr=1e-5]Steps:   7%|▋         | 1102/15001 [42:13<6:59:48,  1.81s/it, loss=0.0796, lr=1e-5]Steps:   7%|▋         | 1102/15001 [42:13<6:59:48,  1.81s/it, loss=0.166, lr=1e-5] Steps:   7%|▋         | 1103/15001 [42:14<6:57:01,  1.80s/it, loss=0.166, lr=1e-5]Steps:   7%|▋         | 1103/15001 [42:15<6:57:01,  1.80s/it, loss=0.141, lr=1e-5]Steps:   7%|▋         | 1104/15001 [42:16<7:01:51,  1.82s/it, loss=0.141, lr=1e-5]Steps:   7%|▋         | 1104/15001 [42:17<7:01:51,  1.82s/it, loss=0.137, lr=1e-5]Steps:   7%|▋         | 1105/15001 [42:18<6:59:46,  1.81s/it, loss=0.137, lr=1e-5]Steps:   7%|▋         | 1105/15001 [42:18<6:59:46,  1.81s/it, loss=0.315, lr=1e-5]Steps:   7%|▋         | 1106/15001 [42:20<7:34:39,  1.96s/it, loss=0.315, lr=1e-5]Steps:   7%|▋         | 1106/15001 [42:20<7:34:39,  1.96s/it, loss=0.132, lr=1e-5]Steps:   7%|▋         | 1107/15001 [42:22<7:26:53,  1.93s/it, loss=0.132, lr=1e-5]Steps:   7%|▋         | 1107/15001 [42:22<7:26:53,  1.93s/it, loss=0.206, lr=1e-5]Steps:   7%|▋         | 1108/15001 [42:24<7:32:43,  1.96s/it, loss=0.206, lr=1e-5]Steps:   7%|▋         | 1108/15001 [42:24<7:32:43,  1.96s/it, loss=0.046, lr=1e-5]Steps:   7%|▋         | 1109/15001 [42:26<7:27:15,  1.93s/it, loss=0.046, lr=1e-5]Steps:   7%|▋         | 1109/15001 [42:26<7:27:15,  1.93s/it, loss=0.178, lr=1e-5]Steps:   7%|▋         | 1110/15001 [42:28<7:42:48,  2.00s/it, loss=0.178, lr=1e-5]Steps:   7%|▋         | 1110/15001 [42:28<7:42:48,  2.00s/it, loss=0.13, lr=1e-5] Steps:   7%|▋         | 1111/15001 [42:30<7:32:22,  1.95s/it, loss=0.13, lr=1e-5]Steps:   7%|▋         | 1111/15001 [42:30<7:32:22,  1.95s/it, loss=0.141, lr=1e-5]Steps:   7%|▋         | 1112/15001 [42:32<7:23:32,  1.92s/it, loss=0.141, lr=1e-5]Steps:   7%|▋         | 1112/15001 [42:32<7:23:32,  1.92s/it, loss=0.147, lr=1e-5]Steps:   7%|▋         | 1113/15001 [42:34<7:22:14,  1.91s/it, loss=0.147, lr=1e-5]Steps:   7%|▋         | 1113/15001 [42:34<7:22:14,  1.91s/it, loss=0.0973, lr=1e-5]Steps:   7%|▋         | 1114/15001 [42:36<7:05:15,  1.84s/it, loss=0.0973, lr=1e-5]Steps:   7%|▋         | 1114/15001 [42:36<7:05:15,  1.84s/it, loss=0.0853, lr=1e-5]Steps:   7%|▋         | 1115/15001 [42:38<7:15:03,  1.88s/it, loss=0.0853, lr=1e-5]Steps:   7%|▋         | 1115/15001 [42:38<7:15:03,  1.88s/it, loss=0.318, lr=1e-5] Steps:   7%|▋         | 1116/15001 [42:40<7:19:34,  1.90s/it, loss=0.318, lr=1e-5]Steps:   7%|▋         | 1116/15001 [42:40<7:19:34,  1.90s/it, loss=0.102, lr=1e-5]Steps:   7%|▋         | 1117/15001 [42:41<7:04:29,  1.83s/it, loss=0.102, lr=1e-5]Steps:   7%|▋         | 1117/15001 [42:41<7:04:29,  1.83s/it, loss=0.0957, lr=1e-5]Steps:   7%|▋         | 1118/15001 [42:43<7:07:27,  1.85s/it, loss=0.0957, lr=1e-5]Steps:   7%|▋         | 1118/15001 [42:43<7:07:27,  1.85s/it, loss=0.248, lr=1e-5] Steps:   7%|▋         | 1119/15001 [42:45<7:01:34,  1.82s/it, loss=0.248, lr=1e-5]Steps:   7%|▋         | 1119/15001 [42:45<7:01:34,  1.82s/it, loss=0.161, lr=1e-5]Steps:   7%|▋         | 1120/15001 [42:47<6:50:15,  1.77s/it, loss=0.161, lr=1e-5]Steps:   7%|▋         | 1120/15001 [42:47<6:50:15,  1.77s/it, loss=0.303, lr=1e-5]Steps:   7%|▋         | 1121/15001 [42:48<6:57:57,  1.81s/it, loss=0.303, lr=1e-5]Steps:   7%|▋         | 1121/15001 [42:49<6:57:57,  1.81s/it, loss=0.146, lr=1e-5]Steps:   7%|▋         | 1122/15001 [42:50<7:06:42,  1.84s/it, loss=0.146, lr=1e-5]Steps:   7%|▋         | 1122/15001 [42:50<7:06:42,  1.84s/it, loss=0.0192, lr=1e-5]Steps:   7%|▋         | 1123/15001 [42:52<6:55:11,  1.80s/it, loss=0.0192, lr=1e-5]Steps:   7%|▋         | 1123/15001 [42:52<6:55:11,  1.80s/it, loss=0.186, lr=1e-5] Steps:   7%|▋         | 1124/15001 [42:54<7:16:56,  1.89s/it, loss=0.186, lr=1e-5]Steps:   7%|▋         | 1124/15001 [42:54<7:16:56,  1.89s/it, loss=0.146, lr=1e-5]Steps:   7%|▋         | 1125/15001 [42:56<7:08:57,  1.85s/it, loss=0.146, lr=1e-5]Steps:   7%|▋         | 1125/15001 [42:56<7:08:57,  1.85s/it, loss=0.24, lr=1e-5] Steps:   8%|▊         | 1126/15001 [42:58<7:00:27,  1.82s/it, loss=0.24, lr=1e-5]Steps:   8%|▊         | 1126/15001 [42:58<7:00:27,  1.82s/it, loss=0.0425, lr=1e-5]Steps:   8%|▊         | 1127/15001 [42:59<6:47:55,  1.76s/it, loss=0.0425, lr=1e-5]Steps:   8%|▊         | 1127/15001 [42:59<6:47:55,  1.76s/it, loss=0.116, lr=1e-5] Steps:   8%|▊         | 1128/15001 [43:01<6:57:44,  1.81s/it, loss=0.116, lr=1e-5]Steps:   8%|▊         | 1128/15001 [43:01<6:57:44,  1.81s/it, loss=0.161, lr=1e-5]Steps:   8%|▊         | 1129/15001 [43:03<7:00:01,  1.82s/it, loss=0.161, lr=1e-5]Steps:   8%|▊         | 1129/15001 [43:03<7:00:01,  1.82s/it, loss=0.139, lr=1e-5]Steps:   8%|▊         | 1130/15001 [43:05<7:23:21,  1.92s/it, loss=0.139, lr=1e-5]Steps:   8%|▊         | 1130/15001 [43:05<7:23:21,  1.92s/it, loss=0.137, lr=1e-5]Steps:   8%|▊         | 1131/15001 [43:07<7:03:20,  1.83s/it, loss=0.137, lr=1e-5]Steps:   8%|▊         | 1131/15001 [43:07<7:03:20,  1.83s/it, loss=0.273, lr=1e-5]Steps:   8%|▊         | 1132/15001 [43:09<7:40:28,  1.99s/it, loss=0.273, lr=1e-5]Steps:   8%|▊         | 1132/15001 [43:09<7:40:28,  1.99s/it, loss=0.228, lr=1e-5]Steps:   8%|▊         | 1133/15001 [43:11<7:35:17,  1.97s/it, loss=0.228, lr=1e-5]Steps:   8%|▊         | 1133/15001 [43:11<7:35:17,  1.97s/it, loss=0.0725, lr=1e-5]Steps:   8%|▊         | 1134/15001 [43:13<7:25:37,  1.93s/it, loss=0.0725, lr=1e-5]Steps:   8%|▊         | 1134/15001 [43:13<7:25:37,  1.93s/it, loss=0.099, lr=1e-5] Steps:   8%|▊         | 1135/15001 [43:15<7:37:06,  1.98s/it, loss=0.099, lr=1e-5]Steps:   8%|▊         | 1135/15001 [43:15<7:37:06,  1.98s/it, loss=0.284, lr=1e-5]Steps:   8%|▊         | 1136/15001 [43:17<7:28:51,  1.94s/it, loss=0.284, lr=1e-5]Steps:   8%|▊         | 1136/15001 [43:17<7:28:51,  1.94s/it, loss=0.0942, lr=1e-5]Steps:   8%|▊         | 1137/15001 [43:19<7:11:20,  1.87s/it, loss=0.0942, lr=1e-5]Steps:   8%|▊         | 1137/15001 [43:19<7:11:20,  1.87s/it, loss=0.235, lr=1e-5] Steps:   8%|▊         | 1138/15001 [43:20<7:07:36,  1.85s/it, loss=0.235, lr=1e-5]Steps:   8%|▊         | 1138/15001 [43:21<7:07:36,  1.85s/it, loss=0.292, lr=1e-5]Steps:   8%|▊         | 1139/15001 [43:22<7:01:28,  1.82s/it, loss=0.292, lr=1e-5]Steps:   8%|▊         | 1139/15001 [43:22<7:01:28,  1.82s/it, loss=0.104, lr=1e-5]Steps:   8%|▊         | 1140/15001 [43:24<7:07:01,  1.85s/it, loss=0.104, lr=1e-5]Steps:   8%|▊         | 1140/15001 [43:24<7:07:01,  1.85s/it, loss=0.142, lr=1e-5]Steps:   8%|▊         | 1141/15001 [43:26<6:58:16,  1.81s/it, loss=0.142, lr=1e-5]Steps:   8%|▊         | 1141/15001 [43:26<6:58:16,  1.81s/it, loss=0.196, lr=1e-5]Steps:   8%|▊         | 1142/15001 [43:28<7:07:21,  1.85s/it, loss=0.196, lr=1e-5]Steps:   8%|▊         | 1142/15001 [43:28<7:07:21,  1.85s/it, loss=0.21, lr=1e-5] Steps:   8%|▊         | 1143/15001 [43:30<7:09:58,  1.86s/it, loss=0.21, lr=1e-5]Steps:   8%|▊         | 1143/15001 [43:30<7:09:58,  1.86s/it, loss=0.164, lr=1e-5]Steps:   8%|▊         | 1144/15001 [43:31<6:55:35,  1.80s/it, loss=0.164, lr=1e-5]Steps:   8%|▊         | 1144/15001 [43:32<6:55:35,  1.80s/it, loss=0.36, lr=1e-5] Steps:   8%|▊         | 1145/15001 [43:33<7:00:24,  1.82s/it, loss=0.36, lr=1e-5]Steps:   8%|▊         | 1145/15001 [43:33<7:00:24,  1.82s/it, loss=0.189, lr=1e-5]Steps:   8%|▊         | 1146/15001 [43:35<7:00:37,  1.82s/it, loss=0.189, lr=1e-5]Steps:   8%|▊         | 1146/15001 [43:35<7:00:37,  1.82s/it, loss=0.26, lr=1e-5] Steps:   8%|▊         | 1147/15001 [43:37<6:58:01,  1.81s/it, loss=0.26, lr=1e-5]Steps:   8%|▊         | 1147/15001 [43:37<6:58:01,  1.81s/it, loss=0.0871, lr=1e-5]Steps:   8%|▊         | 1148/15001 [43:39<6:56:52,  1.81s/it, loss=0.0871, lr=1e-5]Steps:   8%|▊         | 1148/15001 [43:39<6:56:52,  1.81s/it, loss=0.0893, lr=1e-5]Steps:   8%|▊         | 1149/15001 [43:41<7:28:29,  1.94s/it, loss=0.0893, lr=1e-5]Steps:   8%|▊         | 1149/15001 [43:41<7:28:29,  1.94s/it, loss=0.17, lr=1e-5]  Steps:   8%|▊         | 1150/15001 [43:43<7:18:53,  1.90s/it, loss=0.17, lr=1e-5]Steps:   8%|▊         | 1150/15001 [43:43<7:18:53,  1.90s/it, loss=0.0381, lr=1e-5]Steps:   8%|▊         | 1151/15001 [43:44<7:10:33,  1.87s/it, loss=0.0381, lr=1e-5]Steps:   8%|▊         | 1151/15001 [43:45<7:10:33,  1.87s/it, loss=0.157, lr=1e-5] Steps:   8%|▊         | 1152/15001 [43:46<7:26:28,  1.93s/it, loss=0.157, lr=1e-5]Steps:   8%|▊         | 1152/15001 [43:47<7:26:28,  1.93s/it, loss=0.0835, lr=1e-5]Steps:   8%|▊         | 1153/15001 [43:48<7:08:54,  1.86s/it, loss=0.0835, lr=1e-5]Steps:   8%|▊         | 1153/15001 [43:49<7:08:54,  1.86s/it, loss=0.0605, lr=1e-5]Steps:   8%|▊         | 1154/15001 [43:50<7:36:15,  1.98s/it, loss=0.0605, lr=1e-5]Steps:   8%|▊         | 1154/15001 [43:51<7:36:15,  1.98s/it, loss=0.0327, lr=1e-5]Steps:   8%|▊         | 1155/15001 [43:53<7:54:45,  2.06s/it, loss=0.0327, lr=1e-5]Steps:   8%|▊         | 1155/15001 [43:53<7:54:45,  2.06s/it, loss=0.345, lr=1e-5] Steps:   8%|▊         | 1156/15001 [43:55<7:49:09,  2.03s/it, loss=0.345, lr=1e-5]Steps:   8%|▊         | 1156/15001 [43:55<7:49:09,  2.03s/it, loss=0.158, lr=1e-5]Steps:   8%|▊         | 1157/15001 [43:57<7:47:03,  2.02s/it, loss=0.158, lr=1e-5]Steps:   8%|▊         | 1157/15001 [43:57<7:47:03,  2.02s/it, loss=0.107, lr=1e-5]Steps:   8%|▊         | 1158/15001 [43:58<7:31:51,  1.96s/it, loss=0.107, lr=1e-5]Steps:   8%|▊         | 1158/15001 [43:59<7:31:51,  1.96s/it, loss=0.0718, lr=1e-5]Steps:   8%|▊         | 1159/15001 [44:00<7:14:34,  1.88s/it, loss=0.0718, lr=1e-5]Steps:   8%|▊         | 1159/15001 [44:00<7:14:34,  1.88s/it, loss=0.3, lr=1e-5]   Steps:   8%|▊         | 1160/15001 [44:02<7:17:55,  1.90s/it, loss=0.3, lr=1e-5]Steps:   8%|▊         | 1160/15001 [44:02<7:17:55,  1.90s/it, loss=0.166, lr=1e-5]Steps:   8%|▊         | 1161/15001 [44:04<7:17:40,  1.90s/it, loss=0.166, lr=1e-5]Steps:   8%|▊         | 1161/15001 [44:04<7:17:40,  1.90s/it, loss=0.105, lr=1e-5]Steps:   8%|▊         | 1162/15001 [44:06<7:14:03,  1.88s/it, loss=0.105, lr=1e-5]Steps:   8%|▊         | 1162/15001 [44:06<7:14:03,  1.88s/it, loss=0.277, lr=1e-5]Steps:   8%|▊         | 1163/15001 [44:08<7:10:30,  1.87s/it, loss=0.277, lr=1e-5]Steps:   8%|▊         | 1163/15001 [44:08<7:10:30,  1.87s/it, loss=0.201, lr=1e-5]Steps:   8%|▊         | 1164/15001 [44:09<7:06:29,  1.85s/it, loss=0.201, lr=1e-5]Steps:   8%|▊         | 1164/15001 [44:09<7:06:29,  1.85s/it, loss=0.118, lr=1e-5]Steps:   8%|▊         | 1165/15001 [44:11<6:52:27,  1.79s/it, loss=0.118, lr=1e-5]Steps:   8%|▊         | 1165/15001 [44:11<6:52:27,  1.79s/it, loss=0.217, lr=1e-5]Steps:   8%|▊         | 1166/15001 [44:13<6:58:57,  1.82s/it, loss=0.217, lr=1e-5]Steps:   8%|▊         | 1166/15001 [44:13<6:58:57,  1.82s/it, loss=0.126, lr=1e-5]Steps:   8%|▊         | 1167/15001 [44:15<7:02:11,  1.83s/it, loss=0.126, lr=1e-5]Steps:   8%|▊         | 1167/15001 [44:15<7:02:11,  1.83s/it, loss=0.103, lr=1e-5]Steps:   8%|▊         | 1168/15001 [44:17<7:02:08,  1.83s/it, loss=0.103, lr=1e-5]Steps:   8%|▊         | 1168/15001 [44:17<7:02:08,  1.83s/it, loss=0.213, lr=1e-5]Steps:   8%|▊         | 1169/15001 [44:19<7:03:22,  1.84s/it, loss=0.213, lr=1e-5]Steps:   8%|▊         | 1169/15001 [44:19<7:03:22,  1.84s/it, loss=0.124, lr=1e-5]Steps:   8%|▊         | 1170/15001 [44:20<6:45:00,  1.76s/it, loss=0.124, lr=1e-5]Steps:   8%|▊         | 1170/15001 [44:20<6:45:00,  1.76s/it, loss=0.274, lr=1e-5]Steps:   8%|▊         | 1171/15001 [44:22<6:57:57,  1.81s/it, loss=0.274, lr=1e-5]Steps:   8%|▊         | 1171/15001 [44:22<6:57:57,  1.81s/it, loss=0.0506, lr=1e-5]Steps:   8%|▊         | 1172/15001 [44:24<7:02:52,  1.83s/it, loss=0.0506, lr=1e-5]Steps:   8%|▊         | 1172/15001 [44:24<7:02:52,  1.83s/it, loss=0.104, lr=1e-5] Steps:   8%|▊         | 1173/15001 [44:26<6:55:15,  1.80s/it, loss=0.104, lr=1e-5]Steps:   8%|▊         | 1173/15001 [44:26<6:55:15,  1.80s/it, loss=0.183, lr=1e-5]Steps:   8%|▊         | 1174/15001 [44:28<7:02:06,  1.83s/it, loss=0.183, lr=1e-5]Steps:   8%|▊         | 1174/15001 [44:28<7:02:06,  1.83s/it, loss=0.262, lr=1e-5]Steps:   8%|▊         | 1175/15001 [44:30<7:20:01,  1.91s/it, loss=0.262, lr=1e-5]Steps:   8%|▊         | 1175/15001 [44:30<7:20:01,  1.91s/it, loss=0.156, lr=1e-5]Steps:   8%|▊         | 1176/15001 [44:32<7:29:20,  1.95s/it, loss=0.156, lr=1e-5]Steps:   8%|▊         | 1176/15001 [44:32<7:29:20,  1.95s/it, loss=0.197, lr=1e-5]Steps:   8%|▊         | 1177/15001 [44:34<7:33:56,  1.97s/it, loss=0.197, lr=1e-5]Steps:   8%|▊         | 1177/15001 [44:34<7:33:56,  1.97s/it, loss=0.0839, lr=1e-5]Steps:   8%|▊         | 1178/15001 [44:36<7:31:52,  1.96s/it, loss=0.0839, lr=1e-5]Steps:   8%|▊         | 1178/15001 [44:36<7:31:52,  1.96s/it, loss=0.24, lr=1e-5]  Steps:   8%|▊         | 1179/15001 [44:38<7:41:20,  2.00s/it, loss=0.24, lr=1e-5]Steps:   8%|▊         | 1179/15001 [44:38<7:41:20,  2.00s/it, loss=0.0524, lr=1e-5]Steps:   8%|▊         | 1180/15001 [44:40<7:30:03,  1.95s/it, loss=0.0524, lr=1e-5]Steps:   8%|▊         | 1180/15001 [44:40<7:30:03,  1.95s/it, loss=0.278, lr=1e-5] Steps:   8%|▊         | 1181/15001 [44:42<7:28:19,  1.95s/it, loss=0.278, lr=1e-5]Steps:   8%|▊         | 1181/15001 [44:42<7:28:19,  1.95s/it, loss=0.072, lr=1e-5]Steps:   8%|▊         | 1182/15001 [44:44<7:42:13,  2.01s/it, loss=0.072, lr=1e-5]Steps:   8%|▊         | 1182/15001 [44:44<7:42:13,  2.01s/it, loss=0.0591, lr=1e-5]Steps:   8%|▊         | 1183/15001 [44:45<7:27:47,  1.94s/it, loss=0.0591, lr=1e-5]Steps:   8%|▊         | 1183/15001 [44:45<7:27:47,  1.94s/it, loss=0.105, lr=1e-5] Steps:   8%|▊         | 1184/15001 [44:47<7:21:55,  1.92s/it, loss=0.105, lr=1e-5]Steps:   8%|▊         | 1184/15001 [44:47<7:21:55,  1.92s/it, loss=0.178, lr=1e-5]Steps:   8%|▊         | 1185/15001 [44:49<7:08:54,  1.86s/it, loss=0.178, lr=1e-5]Steps:   8%|▊         | 1185/15001 [44:49<7:08:54,  1.86s/it, loss=0.161, lr=1e-5]Steps:   8%|▊         | 1186/15001 [44:51<6:56:05,  1.81s/it, loss=0.161, lr=1e-5]Steps:   8%|▊         | 1186/15001 [44:51<6:56:05,  1.81s/it, loss=0.0809, lr=1e-5]Steps:   8%|▊         | 1187/15001 [44:52<6:53:34,  1.80s/it, loss=0.0809, lr=1e-5]Steps:   8%|▊         | 1187/15001 [44:53<6:53:34,  1.80s/it, loss=0.37, lr=1e-5]  Steps:   8%|▊         | 1188/15001 [44:55<7:18:10,  1.90s/it, loss=0.37, lr=1e-5]Steps:   8%|▊         | 1188/15001 [44:55<7:18:10,  1.90s/it, loss=0.0972, lr=1e-5]Steps:   8%|▊         | 1189/15001 [44:56<7:05:22,  1.85s/it, loss=0.0972, lr=1e-5]Steps:   8%|▊         | 1189/15001 [44:57<7:05:22,  1.85s/it, loss=0.323, lr=1e-5] Steps:   8%|▊         | 1190/15001 [44:58<7:23:19,  1.93s/it, loss=0.323, lr=1e-5]Steps:   8%|▊         | 1190/15001 [44:59<7:23:19,  1.93s/it, loss=0.0456, lr=1e-5]Steps:   8%|▊         | 1191/15001 [45:00<7:11:32,  1.87s/it, loss=0.0456, lr=1e-5]Steps:   8%|▊         | 1191/15001 [45:00<7:11:32,  1.87s/it, loss=0.0552, lr=1e-5]Steps:   8%|▊         | 1192/15001 [45:02<6:59:04,  1.82s/it, loss=0.0552, lr=1e-5]Steps:   8%|▊         | 1192/15001 [45:02<6:59:04,  1.82s/it, loss=0.212, lr=1e-5] Steps:   8%|▊         | 1193/15001 [45:04<6:47:54,  1.77s/it, loss=0.212, lr=1e-5]Steps:   8%|▊         | 1193/15001 [45:04<6:47:54,  1.77s/it, loss=0.154, lr=1e-5]Steps:   8%|▊         | 1194/15001 [45:05<6:54:31,  1.80s/it, loss=0.154, lr=1e-5]Steps:   8%|▊         | 1194/15001 [45:06<6:54:31,  1.80s/it, loss=0.155, lr=1e-5]Steps:   8%|▊         | 1195/15001 [45:07<7:02:10,  1.83s/it, loss=0.155, lr=1e-5]Steps:   8%|▊         | 1195/15001 [45:08<7:02:10,  1.83s/it, loss=0.13, lr=1e-5] Steps:   8%|▊         | 1196/15001 [45:09<7:11:07,  1.87s/it, loss=0.13, lr=1e-5]Steps:   8%|▊         | 1196/15001 [45:09<7:11:07,  1.87s/it, loss=0.21, lr=1e-5]Steps:   8%|▊         | 1197/15001 [45:11<7:01:47,  1.83s/it, loss=0.21, lr=1e-5]Steps:   8%|▊         | 1197/15001 [45:11<7:01:47,  1.83s/it, loss=0.198, lr=1e-5]Steps:   8%|▊         | 1198/15001 [45:13<7:24:10,  1.93s/it, loss=0.198, lr=1e-5]Steps:   8%|▊         | 1198/15001 [45:13<7:24:10,  1.93s/it, loss=0.223, lr=1e-5]Steps:   8%|▊         | 1199/15001 [45:15<7:18:17,  1.91s/it, loss=0.223, lr=1e-5]Steps:   8%|▊         | 1199/15001 [45:15<7:18:17,  1.91s/it, loss=0.0431, lr=1e-5]Steps:   8%|▊         | 1200/15001 [45:17<7:39:50,  2.00s/it, loss=0.0431, lr=1e-5]Steps:   8%|▊         | 1200/15001 [45:17<7:39:50,  2.00s/it, loss=0.0941, lr=1e-5]Steps:   8%|▊         | 1201/15001 [45:19<7:40:10,  2.00s/it, loss=0.0941, lr=1e-5]Steps:   8%|▊         | 1201/15001 [45:19<7:40:10,  2.00s/it, loss=0.0993, lr=1e-5]Steps:   8%|▊         | 1202/15001 [45:21<7:45:53,  2.03s/it, loss=0.0993, lr=1e-5]Steps:   8%|▊         | 1202/15001 [45:21<7:45:53,  2.03s/it, loss=0.227, lr=1e-5] Steps:   8%|▊         | 1203/15001 [45:23<7:34:27,  1.98s/it, loss=0.227, lr=1e-5]Steps:   8%|▊         | 1203/15001 [45:23<7:34:27,  1.98s/it, loss=0.143, lr=1e-5]Steps:   8%|▊         | 1204/15001 [45:25<7:15:59,  1.90s/it, loss=0.143, lr=1e-5]Steps:   8%|▊         | 1204/15001 [45:25<7:15:59,  1.90s/it, loss=0.333, lr=1e-5]Steps:   8%|▊         | 1205/15001 [45:27<7:06:09,  1.85s/it, loss=0.333, lr=1e-5]Steps:   8%|▊         | 1205/15001 [45:27<7:06:09,  1.85s/it, loss=0.021, lr=1e-5]Steps:   8%|▊         | 1206/15001 [45:29<7:03:02,  1.84s/it, loss=0.021, lr=1e-5]Steps:   8%|▊         | 1206/15001 [45:29<7:03:02,  1.84s/it, loss=0.396, lr=1e-5]Steps:   8%|▊         | 1207/15001 [45:30<7:02:58,  1.84s/it, loss=0.396, lr=1e-5]Steps:   8%|▊         | 1207/15001 [45:30<7:02:58,  1.84s/it, loss=0.243, lr=1e-5]Steps:   8%|▊         | 1208/15001 [45:32<6:50:11,  1.78s/it, loss=0.243, lr=1e-5]Steps:   8%|▊         | 1208/15001 [45:32<6:50:11,  1.78s/it, loss=0.149, lr=1e-5]Steps:   8%|▊         | 1209/15001 [45:34<6:46:04,  1.77s/it, loss=0.149, lr=1e-5]Steps:   8%|▊         | 1209/15001 [45:34<6:46:04,  1.77s/it, loss=0.107, lr=1e-5]Steps:   8%|▊         | 1210/15001 [45:36<7:00:01,  1.83s/it, loss=0.107, lr=1e-5]Steps:   8%|▊         | 1210/15001 [45:36<7:00:01,  1.83s/it, loss=0.125, lr=1e-5]Steps:   8%|▊         | 1211/15001 [45:38<7:02:54,  1.84s/it, loss=0.125, lr=1e-5]Steps:   8%|▊         | 1211/15001 [45:38<7:02:54,  1.84s/it, loss=0.0775, lr=1e-5]Steps:   8%|▊         | 1212/15001 [45:39<6:45:48,  1.77s/it, loss=0.0775, lr=1e-5]Steps:   8%|▊         | 1212/15001 [45:40<6:45:48,  1.77s/it, loss=0.255, lr=1e-5] Steps:   8%|▊         | 1213/15001 [45:41<6:55:32,  1.81s/it, loss=0.255, lr=1e-5]Steps:   8%|▊         | 1213/15001 [45:41<6:55:32,  1.81s/it, loss=0.113, lr=1e-5]Steps:   8%|▊         | 1214/15001 [45:43<7:07:32,  1.86s/it, loss=0.113, lr=1e-5]Steps:   8%|▊         | 1214/15001 [45:43<7:07:32,  1.86s/it, loss=0.301, lr=1e-5]Steps:   8%|▊         | 1215/15001 [45:45<7:05:07,  1.85s/it, loss=0.301, lr=1e-5]Steps:   8%|▊         | 1215/15001 [45:45<7:05:07,  1.85s/it, loss=0.0278, lr=1e-5]Steps:   8%|▊         | 1216/15001 [45:47<7:21:51,  1.92s/it, loss=0.0278, lr=1e-5]Steps:   8%|▊         | 1216/15001 [45:47<7:21:51,  1.92s/it, loss=0.23, lr=1e-5]  Steps:   8%|▊         | 1217/15001 [45:49<7:12:44,  1.88s/it, loss=0.23, lr=1e-5]Steps:   8%|▊         | 1217/15001 [45:49<7:12:44,  1.88s/it, loss=0.149, lr=1e-5]Steps:   8%|▊         | 1218/15001 [45:50<7:00:55,  1.83s/it, loss=0.149, lr=1e-5]Steps:   8%|▊         | 1218/15001 [45:51<7:00:55,  1.83s/it, loss=0.242, lr=1e-5]Steps:   8%|▊         | 1219/15001 [45:52<7:08:52,  1.87s/it, loss=0.242, lr=1e-5]Steps:   8%|▊         | 1219/15001 [45:53<7:08:52,  1.87s/it, loss=0.0188, lr=1e-5]Steps:   8%|▊         | 1220/15001 [45:54<7:20:06,  1.92s/it, loss=0.0188, lr=1e-5]Steps:   8%|▊         | 1220/15001 [45:55<7:20:06,  1.92s/it, loss=0.117, lr=1e-5] Steps:   8%|▊         | 1221/15001 [45:57<7:43:26,  2.02s/it, loss=0.117, lr=1e-5]Steps:   8%|▊         | 1221/15001 [45:57<7:43:26,  2.02s/it, loss=0.258, lr=1e-5]Steps:   8%|▊         | 1222/15001 [45:58<7:18:08,  1.91s/it, loss=0.258, lr=1e-5]Steps:   8%|▊         | 1222/15001 [45:59<7:18:08,  1.91s/it, loss=0.134, lr=1e-5]Steps:   8%|▊         | 1223/15001 [46:01<7:46:06,  2.03s/it, loss=0.134, lr=1e-5]Steps:   8%|▊         | 1223/15001 [46:01<7:46:06,  2.03s/it, loss=0.122, lr=1e-5]Steps:   8%|▊         | 1224/15001 [46:02<7:27:59,  1.95s/it, loss=0.122, lr=1e-5]Steps:   8%|▊         | 1224/15001 [46:03<7:27:59,  1.95s/it, loss=0.274, lr=1e-5]Steps:   8%|▊         | 1225/15001 [46:04<7:25:23,  1.94s/it, loss=0.274, lr=1e-5]Steps:   8%|▊         | 1225/15001 [46:05<7:25:23,  1.94s/it, loss=0.24, lr=1e-5] Steps:   8%|▊         | 1226/15001 [46:06<7:27:08,  1.95s/it, loss=0.24, lr=1e-5]Steps:   8%|▊         | 1226/15001 [46:07<7:27:08,  1.95s/it, loss=0.0829, lr=1e-5]Steps:   8%|▊         | 1227/15001 [46:08<7:21:46,  1.92s/it, loss=0.0829, lr=1e-5]Steps:   8%|▊         | 1227/15001 [46:09<7:21:46,  1.92s/it, loss=0.118, lr=1e-5] Steps:   8%|▊         | 1228/15001 [46:10<7:31:12,  1.97s/it, loss=0.118, lr=1e-5]Steps:   8%|▊         | 1228/15001 [46:10<7:31:12,  1.97s/it, loss=0.211, lr=1e-5]Steps:   8%|▊         | 1229/15001 [46:12<7:21:36,  1.92s/it, loss=0.211, lr=1e-5]Steps:   8%|▊         | 1229/15001 [46:12<7:21:36,  1.92s/it, loss=0.127, lr=1e-5]Steps:   8%|▊         | 1230/15001 [46:14<7:12:48,  1.89s/it, loss=0.127, lr=1e-5]Steps:   8%|▊         | 1230/15001 [46:14<7:12:48,  1.89s/it, loss=0.0972, lr=1e-5]Steps:   8%|▊         | 1231/15001 [46:15<6:52:01,  1.80s/it, loss=0.0972, lr=1e-5]Steps:   8%|▊         | 1231/15001 [46:16<6:52:01,  1.80s/it, loss=0.0843, lr=1e-5]Steps:   8%|▊         | 1232/15001 [46:17<7:07:35,  1.86s/it, loss=0.0843, lr=1e-5]Steps:   8%|▊         | 1232/15001 [46:18<7:07:35,  1.86s/it, loss=0.193, lr=1e-5] Steps:   8%|▊         | 1233/15001 [46:19<7:03:02,  1.84s/it, loss=0.193, lr=1e-5]Steps:   8%|▊         | 1233/15001 [46:19<7:03:02,  1.84s/it, loss=0.119, lr=1e-5]Steps:   8%|▊         | 1234/15001 [46:21<6:52:57,  1.80s/it, loss=0.119, lr=1e-5]Steps:   8%|▊         | 1234/15001 [46:21<6:52:57,  1.80s/it, loss=0.133, lr=1e-5]Steps:   8%|▊         | 1235/15001 [46:23<7:03:29,  1.85s/it, loss=0.133, lr=1e-5]Steps:   8%|▊         | 1235/15001 [46:23<7:03:29,  1.85s/it, loss=0.313, lr=1e-5]Steps:   8%|▊         | 1236/15001 [46:25<7:03:34,  1.85s/it, loss=0.313, lr=1e-5]Steps:   8%|▊         | 1236/15001 [46:25<7:03:34,  1.85s/it, loss=0.212, lr=1e-5]Steps:   8%|▊         | 1237/15001 [46:27<7:17:14,  1.91s/it, loss=0.212, lr=1e-5]Steps:   8%|▊         | 1237/15001 [46:27<7:17:14,  1.91s/it, loss=0.421, lr=1e-5]Steps:   8%|▊         | 1238/15001 [46:29<7:05:19,  1.85s/it, loss=0.421, lr=1e-5]Steps:   8%|▊         | 1238/15001 [46:29<7:05:19,  1.85s/it, loss=0.0973, lr=1e-5]Steps:   8%|▊         | 1239/15001 [46:30<7:07:16,  1.86s/it, loss=0.0973, lr=1e-5]Steps:   8%|▊         | 1239/15001 [46:31<7:07:16,  1.86s/it, loss=0.126, lr=1e-5] Steps:   8%|▊         | 1240/15001 [46:32<7:02:43,  1.84s/it, loss=0.126, lr=1e-5]Steps:   8%|▊         | 1240/15001 [46:32<7:02:43,  1.84s/it, loss=0.328, lr=1e-5]Steps:   8%|▊         | 1241/15001 [46:34<6:55:36,  1.81s/it, loss=0.328, lr=1e-5]Steps:   8%|▊         | 1241/15001 [46:34<6:55:36,  1.81s/it, loss=0.127, lr=1e-5]Steps:   8%|▊         | 1242/15001 [46:36<7:26:02,  1.95s/it, loss=0.127, lr=1e-5]Steps:   8%|▊         | 1242/15001 [46:36<7:26:02,  1.95s/it, loss=0.18, lr=1e-5] Steps:   8%|▊         | 1243/15001 [46:38<7:39:00,  2.00s/it, loss=0.18, lr=1e-5]Steps:   8%|▊         | 1243/15001 [46:38<7:39:00,  2.00s/it, loss=0.116, lr=1e-5]Steps:   8%|▊         | 1244/15001 [46:40<7:20:48,  1.92s/it, loss=0.116, lr=1e-5]Steps:   8%|▊         | 1244/15001 [46:40<7:20:48,  1.92s/it, loss=0.0973, lr=1e-5]Steps:   8%|▊         | 1245/15001 [46:42<7:15:07,  1.90s/it, loss=0.0973, lr=1e-5]Steps:   8%|▊         | 1245/15001 [46:42<7:15:07,  1.90s/it, loss=0.253, lr=1e-5] Steps:   8%|▊         | 1246/15001 [46:44<7:25:47,  1.94s/it, loss=0.253, lr=1e-5]Steps:   8%|▊         | 1246/15001 [46:44<7:25:47,  1.94s/it, loss=0.0835, lr=1e-5]Steps:   8%|▊         | 1247/15001 [46:46<7:50:26,  2.05s/it, loss=0.0835, lr=1e-5]Steps:   8%|▊         | 1247/15001 [46:47<7:50:26,  2.05s/it, loss=0.106, lr=1e-5] Steps:   8%|▊         | 1248/15001 [46:48<7:36:55,  1.99s/it, loss=0.106, lr=1e-5]Steps:   8%|▊         | 1248/15001 [46:48<7:36:55,  1.99s/it, loss=0.118, lr=1e-5]Steps:   8%|▊         | 1249/15001 [46:50<7:16:44,  1.91s/it, loss=0.118, lr=1e-5]Steps:   8%|▊         | 1249/15001 [46:50<7:16:44,  1.91s/it, loss=0.165, lr=1e-5]Steps:   8%|▊         | 1250/15001 [46:52<7:17:41,  1.91s/it, loss=0.165, lr=1e-5]Steps:   8%|▊         | 1250/15001 [46:52<7:17:41,  1.91s/it, loss=0.188, lr=1e-5]Steps:   8%|▊         | 1251/15001 [46:54<7:21:21,  1.93s/it, loss=0.188, lr=1e-5]Steps:   8%|▊         | 1251/15001 [46:54<7:21:21,  1.93s/it, loss=0.0458, lr=1e-5]Steps:   8%|▊         | 1252/15001 [46:55<6:48:07,  1.78s/it, loss=0.0458, lr=1e-5]Steps:   8%|▊         | 1252/15001 [46:56<6:48:07,  1.78s/it, loss=0.278, lr=1e-5] Steps:   8%|▊         | 1253/15001 [46:57<6:53:20,  1.80s/it, loss=0.278, lr=1e-5]Steps:   8%|▊         | 1253/15001 [46:57<6:53:20,  1.80s/it, loss=0.0551, lr=1e-5]Steps:   8%|▊         | 1254/15001 [46:59<7:04:50,  1.85s/it, loss=0.0551, lr=1e-5]Steps:   8%|▊         | 1254/15001 [46:59<7:04:50,  1.85s/it, loss=0.243, lr=1e-5] Steps:   8%|▊         | 1255/15001 [47:01<7:15:08,  1.90s/it, loss=0.243, lr=1e-5]Steps:   8%|▊         | 1255/15001 [47:01<7:15:08,  1.90s/it, loss=0.222, lr=1e-5]Steps:   8%|▊         | 1256/15001 [47:03<7:02:15,  1.84s/it, loss=0.222, lr=1e-5]Steps:   8%|▊         | 1256/15001 [47:03<7:02:15,  1.84s/it, loss=0.13, lr=1e-5] Steps:   8%|▊         | 1257/15001 [47:05<7:04:26,  1.85s/it, loss=0.13, lr=1e-5]Steps:   8%|▊         | 1257/15001 [47:05<7:04:26,  1.85s/it, loss=0.296, lr=1e-5]Steps:   8%|▊         | 1258/15001 [47:06<6:57:24,  1.82s/it, loss=0.296, lr=1e-5]Steps:   8%|▊         | 1258/15001 [47:06<6:57:24,  1.82s/it, loss=0.213, lr=1e-5]Steps:   8%|▊         | 1259/15001 [47:08<7:03:54,  1.85s/it, loss=0.213, lr=1e-5]Steps:   8%|▊         | 1259/15001 [47:08<7:03:54,  1.85s/it, loss=0.372, lr=1e-5]Steps:   8%|▊         | 1260/15001 [47:10<6:52:41,  1.80s/it, loss=0.372, lr=1e-5]Steps:   8%|▊         | 1260/15001 [47:10<6:52:41,  1.80s/it, loss=0.403, lr=1e-5]Steps:   8%|▊         | 1261/15001 [47:12<6:58:16,  1.83s/it, loss=0.403, lr=1e-5]Steps:   8%|▊         | 1261/15001 [47:12<6:58:16,  1.83s/it, loss=0.0771, lr=1e-5]Steps:   8%|▊         | 1262/15001 [47:14<6:58:20,  1.83s/it, loss=0.0771, lr=1e-5]Steps:   8%|▊         | 1262/15001 [47:14<6:58:20,  1.83s/it, loss=0.245, lr=1e-5] Steps:   8%|▊         | 1263/15001 [47:16<7:10:08,  1.88s/it, loss=0.245, lr=1e-5]Steps:   8%|▊         | 1263/15001 [47:16<7:10:08,  1.88s/it, loss=0.257, lr=1e-5]Steps:   8%|▊         | 1264/15001 [47:17<7:04:11,  1.85s/it, loss=0.257, lr=1e-5]Steps:   8%|▊         | 1264/15001 [47:18<7:04:11,  1.85s/it, loss=0.118, lr=1e-5]Steps:   8%|▊         | 1265/15001 [47:19<6:57:18,  1.82s/it, loss=0.118, lr=1e-5]Steps:   8%|▊         | 1265/15001 [47:20<6:57:18,  1.82s/it, loss=0.195, lr=1e-5]Steps:   8%|▊         | 1266/15001 [47:22<7:43:26,  2.02s/it, loss=0.195, lr=1e-5]Steps:   8%|▊         | 1266/15001 [47:22<7:43:26,  2.02s/it, loss=0.127, lr=1e-5]Steps:   8%|▊         | 1267/15001 [47:24<7:49:09,  2.05s/it, loss=0.127, lr=1e-5]Steps:   8%|▊         | 1267/15001 [47:24<7:49:09,  2.05s/it, loss=0.133, lr=1e-5]Steps:   8%|▊         | 1268/15001 [47:26<7:41:02,  2.01s/it, loss=0.133, lr=1e-5]Steps:   8%|▊         | 1268/15001 [47:26<7:41:02,  2.01s/it, loss=0.25, lr=1e-5] Steps:   8%|▊         | 1269/15001 [47:29<9:13:58,  2.42s/it, loss=0.25, lr=1e-5]Steps:   8%|▊         | 1269/15001 [47:29<9:13:58,  2.42s/it, loss=0.262, lr=1e-5]Steps:   8%|▊         | 1270/15001 [47:31<8:27:23,  2.22s/it, loss=0.262, lr=1e-5]Steps:   8%|▊         | 1270/15001 [47:31<8:27:23,  2.22s/it, loss=0.0638, lr=1e-5]Steps:   8%|▊         | 1271/15001 [47:33<8:03:44,  2.11s/it, loss=0.0638, lr=1e-5]Steps:   8%|▊         | 1271/15001 [47:33<8:03:44,  2.11s/it, loss=0.0362, lr=1e-5]Steps:   8%|▊         | 1272/15001 [47:35<7:43:16,  2.02s/it, loss=0.0362, lr=1e-5]Steps:   8%|▊         | 1272/15001 [47:35<7:43:16,  2.02s/it, loss=0.271, lr=1e-5] Steps:   8%|▊         | 1273/15001 [47:36<7:13:47,  1.90s/it, loss=0.271, lr=1e-5]Steps:   8%|▊         | 1273/15001 [47:36<7:13:47,  1.90s/it, loss=0.207, lr=1e-5]Steps:   8%|▊         | 1274/15001 [47:38<7:28:40,  1.96s/it, loss=0.207, lr=1e-5]Steps:   8%|▊         | 1274/15001 [47:38<7:28:40,  1.96s/it, loss=0.0591, lr=1e-5]Steps:   8%|▊         | 1275/15001 [47:40<7:12:35,  1.89s/it, loss=0.0591, lr=1e-5]Steps:   8%|▊         | 1275/15001 [47:40<7:12:35,  1.89s/it, loss=0.0167, lr=1e-5]Steps:   9%|▊         | 1276/15001 [47:42<7:04:26,  1.86s/it, loss=0.0167, lr=1e-5]Steps:   9%|▊         | 1276/15001 [47:42<7:04:26,  1.86s/it, loss=0.182, lr=1e-5] Steps:   9%|▊         | 1277/15001 [47:43<6:49:12,  1.79s/it, loss=0.182, lr=1e-5]Steps:   9%|▊         | 1277/15001 [47:44<6:49:12,  1.79s/it, loss=0.188, lr=1e-5]Steps:   9%|▊         | 1278/15001 [47:45<6:49:43,  1.79s/it, loss=0.188, lr=1e-5]Steps:   9%|▊         | 1278/15001 [47:45<6:49:43,  1.79s/it, loss=0.213, lr=1e-5]Steps:   9%|▊         | 1279/15001 [47:47<6:59:20,  1.83s/it, loss=0.213, lr=1e-5]Steps:   9%|▊         | 1279/15001 [47:47<6:59:20,  1.83s/it, loss=0.358, lr=1e-5]Steps:   9%|▊         | 1280/15001 [47:49<6:50:39,  1.80s/it, loss=0.358, lr=1e-5]Steps:   9%|▊         | 1280/15001 [47:49<6:50:39,  1.80s/it, loss=0.224, lr=1e-5]Steps:   9%|▊         | 1281/15001 [47:51<7:02:10,  1.85s/it, loss=0.224, lr=1e-5]Steps:   9%|▊         | 1281/15001 [47:51<7:02:10,  1.85s/it, loss=0.137, lr=1e-5]Steps:   9%|▊         | 1282/15001 [47:53<7:20:00,  1.92s/it, loss=0.137, lr=1e-5]Steps:   9%|▊         | 1282/15001 [47:53<7:20:00,  1.92s/it, loss=0.0217, lr=1e-5]Steps:   9%|▊         | 1283/15001 [47:55<7:09:01,  1.88s/it, loss=0.0217, lr=1e-5]Steps:   9%|▊         | 1283/15001 [47:55<7:09:01,  1.88s/it, loss=0.15, lr=1e-5]  Steps:   9%|▊         | 1284/15001 [47:56<7:03:21,  1.85s/it, loss=0.15, lr=1e-5]Steps:   9%|▊         | 1284/15001 [47:57<7:03:21,  1.85s/it, loss=0.182, lr=1e-5]Steps:   9%|▊         | 1285/15001 [47:58<6:58:30,  1.83s/it, loss=0.182, lr=1e-5]Steps:   9%|▊         | 1285/15001 [47:58<6:58:30,  1.83s/it, loss=0.126, lr=1e-5]Steps:   9%|▊         | 1286/15001 [48:00<7:01:13,  1.84s/it, loss=0.126, lr=1e-5]Steps:   9%|▊         | 1286/15001 [48:00<7:01:13,  1.84s/it, loss=0.0956, lr=1e-5]Steps:   9%|▊         | 1287/15001 [48:02<7:19:30,  1.92s/it, loss=0.0956, lr=1e-5]Steps:   9%|▊         | 1287/15001 [48:02<7:19:30,  1.92s/it, loss=0.0667, lr=1e-5]Steps:   9%|▊         | 1288/15001 [48:04<7:21:51,  1.93s/it, loss=0.0667, lr=1e-5]Steps:   9%|▊         | 1288/15001 [48:04<7:21:51,  1.93s/it, loss=0.216, lr=1e-5] Steps:   9%|▊         | 1289/15001 [48:06<7:05:28,  1.86s/it, loss=0.216, lr=1e-5]Steps:   9%|▊         | 1289/15001 [48:06<7:05:28,  1.86s/it, loss=0.127, lr=1e-5]Steps:   9%|▊         | 1290/15001 [48:08<7:26:05,  1.95s/it, loss=0.127, lr=1e-5]Steps:   9%|▊         | 1290/15001 [48:08<7:26:05,  1.95s/it, loss=0.129, lr=1e-5]Steps:   9%|▊         | 1291/15001 [48:10<7:48:02,  2.05s/it, loss=0.129, lr=1e-5]Steps:   9%|▊         | 1291/15001 [48:10<7:48:02,  2.05s/it, loss=0.172, lr=1e-5]Steps:   9%|▊         | 1292/15001 [48:12<7:47:37,  2.05s/it, loss=0.172, lr=1e-5]Steps:   9%|▊         | 1292/15001 [48:13<7:47:37,  2.05s/it, loss=0.298, lr=1e-5]Steps:   9%|▊         | 1293/15001 [48:14<7:39:32,  2.01s/it, loss=0.298, lr=1e-5]Steps:   9%|▊         | 1293/15001 [48:14<7:39:32,  2.01s/it, loss=0.152, lr=1e-5]Steps:   9%|▊         | 1294/15001 [48:16<7:18:03,  1.92s/it, loss=0.152, lr=1e-5]Steps:   9%|▊         | 1294/15001 [48:16<7:18:03,  1.92s/it, loss=0.183, lr=1e-5]Steps:   9%|▊         | 1295/15001 [48:18<7:12:01,  1.89s/it, loss=0.183, lr=1e-5]Steps:   9%|▊         | 1295/15001 [48:18<7:12:01,  1.89s/it, loss=0.168, lr=1e-5]Steps:   9%|▊         | 1296/15001 [48:19<6:56:49,  1.82s/it, loss=0.168, lr=1e-5]Steps:   9%|▊         | 1296/15001 [48:20<6:56:49,  1.82s/it, loss=0.129, lr=1e-5]Steps:   9%|▊         | 1297/15001 [48:21<6:56:07,  1.82s/it, loss=0.129, lr=1e-5]Steps:   9%|▊         | 1297/15001 [48:22<6:56:07,  1.82s/it, loss=0.271, lr=1e-5]Steps:   9%|▊         | 1298/15001 [48:23<6:52:09,  1.80s/it, loss=0.271, lr=1e-5]Steps:   9%|▊         | 1298/15001 [48:23<6:52:09,  1.80s/it, loss=0.0482, lr=1e-5]Steps:   9%|▊         | 1299/15001 [48:25<6:56:24,  1.82s/it, loss=0.0482, lr=1e-5]Steps:   9%|▊         | 1299/15001 [48:25<6:56:24,  1.82s/it, loss=0.0801, lr=1e-5]Steps:   9%|▊         | 1300/15001 [48:27<6:55:33,  1.82s/it, loss=0.0801, lr=1e-5]Steps:   9%|▊         | 1300/15001 [48:27<6:55:33,  1.82s/it, loss=0.128, lr=1e-5] Steps:   9%|▊         | 1301/15001 [48:29<6:56:21,  1.82s/it, loss=0.128, lr=1e-5]Steps:   9%|▊         | 1301/15001 [48:29<6:56:21,  1.82s/it, loss=0.0637, lr=1e-5]Steps:   9%|▊         | 1302/15001 [48:30<6:53:51,  1.81s/it, loss=0.0637, lr=1e-5]Steps:   9%|▊         | 1302/15001 [48:30<6:53:51,  1.81s/it, loss=0.124, lr=1e-5] Steps:   9%|▊         | 1303/15001 [48:32<6:50:56,  1.80s/it, loss=0.124, lr=1e-5]Steps:   9%|▊         | 1303/15001 [48:33<6:50:56,  1.80s/it, loss=0.116, lr=1e-5]Steps:   9%|▊         | 1304/15001 [48:34<7:16:28,  1.91s/it, loss=0.116, lr=1e-5]Steps:   9%|▊         | 1304/15001 [48:34<7:16:28,  1.91s/it, loss=0.0862, lr=1e-5]Steps:   9%|▊         | 1305/15001 [48:36<6:55:32,  1.82s/it, loss=0.0862, lr=1e-5]Steps:   9%|▊         | 1305/15001 [48:36<6:55:32,  1.82s/it, loss=0.223, lr=1e-5] Steps:   9%|▊         | 1306/15001 [48:38<6:46:41,  1.78s/it, loss=0.223, lr=1e-5]Steps:   9%|▊         | 1306/15001 [48:38<6:46:41,  1.78s/it, loss=0.225, lr=1e-5]Steps:   9%|▊         | 1307/15001 [48:40<7:24:04,  1.95s/it, loss=0.225, lr=1e-5]Steps:   9%|▊         | 1307/15001 [48:40<7:24:04,  1.95s/it, loss=0.0763, lr=1e-5]Steps:   9%|▊         | 1308/15001 [48:41<6:56:14,  1.82s/it, loss=0.0763, lr=1e-5]Steps:   9%|▊         | 1308/15001 [48:42<6:56:14,  1.82s/it, loss=0.0695, lr=1e-5]Steps:   9%|▊         | 1309/15001 [48:44<7:23:01,  1.94s/it, loss=0.0695, lr=1e-5]Steps:   9%|▊         | 1309/15001 [48:44<7:23:01,  1.94s/it, loss=0.102, lr=1e-5] Steps:   9%|▊         | 1310/15001 [48:46<7:22:18,  1.94s/it, loss=0.102, lr=1e-5]Steps:   9%|▊         | 1310/15001 [48:46<7:22:18,  1.94s/it, loss=0.0157, lr=1e-5]Steps:   9%|▊         | 1311/15001 [48:48<7:32:13,  1.98s/it, loss=0.0157, lr=1e-5]Steps:   9%|▊         | 1311/15001 [48:48<7:32:13,  1.98s/it, loss=0.309, lr=1e-5] Steps:   9%|▊         | 1312/15001 [48:49<7:14:47,  1.91s/it, loss=0.309, lr=1e-5]Steps:   9%|▊         | 1312/15001 [48:50<7:14:47,  1.91s/it, loss=0.0981, lr=1e-5]Steps:   9%|▉         | 1313/15001 [48:52<7:33:12,  1.99s/it, loss=0.0981, lr=1e-5]Steps:   9%|▉         | 1313/15001 [48:52<7:33:12,  1.99s/it, loss=0.233, lr=1e-5] Steps:   9%|▉         | 1314/15001 [48:54<7:32:51,  1.99s/it, loss=0.233, lr=1e-5]Steps:   9%|▉         | 1314/15001 [48:54<7:32:51,  1.99s/it, loss=0.239, lr=1e-5]Steps:   9%|▉         | 1315/15001 [48:55<7:16:23,  1.91s/it, loss=0.239, lr=1e-5]Steps:   9%|▉         | 1315/15001 [48:56<7:16:23,  1.91s/it, loss=0.117, lr=1e-5]Steps:   9%|▉         | 1316/15001 [48:57<7:15:26,  1.91s/it, loss=0.117, lr=1e-5]Steps:   9%|▉         | 1316/15001 [48:58<7:15:26,  1.91s/it, loss=0.232, lr=1e-5]Steps:   9%|▉         | 1317/15001 [48:59<7:05:29,  1.87s/it, loss=0.232, lr=1e-5]Steps:   9%|▉         | 1317/15001 [48:59<7:05:29,  1.87s/it, loss=0.0745, lr=1e-5]Steps:   9%|▉         | 1318/15001 [49:01<6:57:13,  1.83s/it, loss=0.0745, lr=1e-5]Steps:   9%|▉         | 1318/15001 [49:01<6:57:13,  1.83s/it, loss=0.122, lr=1e-5] Steps:   9%|▉         | 1319/15001 [49:03<7:10:08,  1.89s/it, loss=0.122, lr=1e-5]Steps:   9%|▉         | 1319/15001 [49:03<7:10:08,  1.89s/it, loss=0.0853, lr=1e-5]Steps:   9%|▉         | 1320/15001 [49:04<6:59:13,  1.84s/it, loss=0.0853, lr=1e-5]Steps:   9%|▉         | 1320/15001 [49:05<6:59:13,  1.84s/it, loss=0.1, lr=1e-5]   Steps:   9%|▉         | 1321/15001 [49:06<6:56:42,  1.83s/it, loss=0.1, lr=1e-5]Steps:   9%|▉         | 1321/15001 [49:06<6:56:42,  1.83s/it, loss=0.0477, lr=1e-5]Steps:   9%|▉         | 1322/15001 [49:08<6:48:35,  1.79s/it, loss=0.0477, lr=1e-5]Steps:   9%|▉         | 1322/15001 [49:08<6:48:35,  1.79s/it, loss=0.335, lr=1e-5] Steps:   9%|▉         | 1323/15001 [49:10<6:58:44,  1.84s/it, loss=0.335, lr=1e-5]Steps:   9%|▉         | 1323/15001 [49:10<6:58:44,  1.84s/it, loss=0.243, lr=1e-5]Steps:   9%|▉         | 1324/15001 [49:11<6:38:29,  1.75s/it, loss=0.243, lr=1e-5]Steps:   9%|▉         | 1324/15001 [49:12<6:38:29,  1.75s/it, loss=0.229, lr=1e-5]Steps:   9%|▉         | 1325/15001 [49:13<6:50:39,  1.80s/it, loss=0.229, lr=1e-5]Steps:   9%|▉         | 1325/15001 [49:14<6:50:39,  1.80s/it, loss=0.208, lr=1e-5]Steps:   9%|▉         | 1326/15001 [49:15<6:50:58,  1.80s/it, loss=0.208, lr=1e-5]Steps:   9%|▉         | 1326/15001 [49:15<6:50:58,  1.80s/it, loss=0.172, lr=1e-5]Steps:   9%|▉         | 1327/15001 [49:17<6:48:09,  1.79s/it, loss=0.172, lr=1e-5]Steps:   9%|▉         | 1327/15001 [49:17<6:48:09,  1.79s/it, loss=0.129, lr=1e-5]Steps:   9%|▉         | 1328/15001 [49:19<6:58:20,  1.84s/it, loss=0.129, lr=1e-5]Steps:   9%|▉         | 1328/15001 [49:19<6:58:20,  1.84s/it, loss=0.124, lr=1e-5]Steps:   9%|▉         | 1329/15001 [49:21<7:00:58,  1.85s/it, loss=0.124, lr=1e-5]Steps:   9%|▉         | 1329/15001 [49:21<7:00:58,  1.85s/it, loss=0.121, lr=1e-5]Steps:   9%|▉         | 1330/15001 [49:22<6:50:57,  1.80s/it, loss=0.121, lr=1e-5]Steps:   9%|▉         | 1330/15001 [49:23<6:50:57,  1.80s/it, loss=0.139, lr=1e-5]Steps:   9%|▉         | 1331/15001 [49:25<7:12:31,  1.90s/it, loss=0.139, lr=1e-5]Steps:   9%|▉         | 1331/15001 [49:25<7:12:31,  1.90s/it, loss=0.382, lr=1e-5]Steps:   9%|▉         | 1332/15001 [49:27<7:21:37,  1.94s/it, loss=0.382, lr=1e-5]Steps:   9%|▉         | 1332/15001 [49:27<7:21:37,  1.94s/it, loss=0.155, lr=1e-5]Steps:   9%|▉         | 1333/15001 [49:29<7:26:11,  1.96s/it, loss=0.155, lr=1e-5]Steps:   9%|▉         | 1333/15001 [49:29<7:26:11,  1.96s/it, loss=0.308, lr=1e-5]Steps:   9%|▉         | 1334/15001 [49:31<7:23:11,  1.95s/it, loss=0.308, lr=1e-5]Steps:   9%|▉         | 1334/15001 [49:31<7:23:11,  1.95s/it, loss=0.23, lr=1e-5] Steps:   9%|▉         | 1335/15001 [49:33<7:32:03,  1.98s/it, loss=0.23, lr=1e-5]Steps:   9%|▉         | 1335/15001 [49:33<7:32:03,  1.98s/it, loss=0.125, lr=1e-5]Steps:   9%|▉         | 1336/15001 [49:34<7:19:49,  1.93s/it, loss=0.125, lr=1e-5]Steps:   9%|▉         | 1336/15001 [49:35<7:19:49,  1.93s/it, loss=0.182, lr=1e-5]Steps:   9%|▉         | 1337/15001 [49:36<7:21:11,  1.94s/it, loss=0.182, lr=1e-5]Steps:   9%|▉         | 1337/15001 [49:37<7:21:11,  1.94s/it, loss=0.304, lr=1e-5]Steps:   9%|▉         | 1338/15001 [49:38<7:31:55,  1.98s/it, loss=0.304, lr=1e-5]Steps:   9%|▉         | 1338/15001 [49:39<7:31:55,  1.98s/it, loss=0.111, lr=1e-5]Steps:   9%|▉         | 1339/15001 [49:40<7:23:48,  1.95s/it, loss=0.111, lr=1e-5]Steps:   9%|▉         | 1339/15001 [49:41<7:23:48,  1.95s/it, loss=0.161, lr=1e-5]Steps:   9%|▉         | 1340/15001 [49:42<7:11:11,  1.89s/it, loss=0.161, lr=1e-5]Steps:   9%|▉         | 1340/15001 [49:42<7:11:11,  1.89s/it, loss=0.136, lr=1e-5]Steps:   9%|▉         | 1341/15001 [49:44<7:03:21,  1.86s/it, loss=0.136, lr=1e-5]Steps:   9%|▉         | 1341/15001 [49:44<7:03:21,  1.86s/it, loss=0.171, lr=1e-5]Steps:   9%|▉         | 1342/15001 [49:46<7:10:32,  1.89s/it, loss=0.171, lr=1e-5]Steps:   9%|▉         | 1342/15001 [49:46<7:10:32,  1.89s/it, loss=0.362, lr=1e-5]Steps:   9%|▉         | 1343/15001 [49:48<7:09:18,  1.89s/it, loss=0.362, lr=1e-5]Steps:   9%|▉         | 1343/15001 [49:48<7:09:18,  1.89s/it, loss=0.129, lr=1e-5]Steps:   9%|▉         | 1344/15001 [49:50<7:03:26,  1.86s/it, loss=0.129, lr=1e-5]Steps:   9%|▉         | 1344/15001 [49:50<7:03:26,  1.86s/it, loss=0.292, lr=1e-5]Steps:   9%|▉         | 1345/15001 [49:51<6:56:04,  1.83s/it, loss=0.292, lr=1e-5]Steps:   9%|▉         | 1345/15001 [49:52<6:56:04,  1.83s/it, loss=0.311, lr=1e-5]Steps:   9%|▉         | 1346/15001 [49:53<6:53:06,  1.82s/it, loss=0.311, lr=1e-5]Steps:   9%|▉         | 1346/15001 [49:53<6:53:06,  1.82s/it, loss=0.223, lr=1e-5]Steps:   9%|▉         | 1347/15001 [49:55<6:58:22,  1.84s/it, loss=0.223, lr=1e-5]Steps:   9%|▉         | 1347/15001 [49:55<6:58:22,  1.84s/it, loss=0.366, lr=1e-5]Steps:   9%|▉         | 1348/15001 [49:57<6:55:52,  1.83s/it, loss=0.366, lr=1e-5]Steps:   9%|▉         | 1348/15001 [49:57<6:55:52,  1.83s/it, loss=0.162, lr=1e-5]Steps:   9%|▉         | 1349/15001 [49:59<6:57:24,  1.83s/it, loss=0.162, lr=1e-5]Steps:   9%|▉         | 1349/15001 [49:59<6:57:24,  1.83s/it, loss=0.0651, lr=1e-5]Steps:   9%|▉         | 1350/15001 [50:00<6:51:45,  1.81s/it, loss=0.0651, lr=1e-5]Steps:   9%|▉         | 1350/15001 [50:00<6:51:45,  1.81s/it, loss=0.26, lr=1e-5]  Steps:   9%|▉         | 1351/15001 [50:02<6:54:17,  1.82s/it, loss=0.26, lr=1e-5]Steps:   9%|▉         | 1351/15001 [50:02<6:54:17,  1.82s/it, loss=0.287, lr=1e-5]Steps:   9%|▉         | 1352/15001 [50:04<6:40:33,  1.76s/it, loss=0.287, lr=1e-5]Steps:   9%|▉         | 1352/15001 [50:04<6:40:33,  1.76s/it, loss=0.167, lr=1e-5]Steps:   9%|▉         | 1353/15001 [50:06<6:52:38,  1.81s/it, loss=0.167, lr=1e-5]Steps:   9%|▉         | 1353/15001 [50:06<6:52:38,  1.81s/it, loss=0.16, lr=1e-5] Steps:   9%|▉         | 1354/15001 [50:08<6:57:42,  1.84s/it, loss=0.16, lr=1e-5]Steps:   9%|▉         | 1354/15001 [50:08<6:57:42,  1.84s/it, loss=0.236, lr=1e-5]Steps:   9%|▉         | 1355/15001 [50:10<7:02:02,  1.86s/it, loss=0.236, lr=1e-5]Steps:   9%|▉         | 1355/15001 [50:10<7:02:02,  1.86s/it, loss=0.268, lr=1e-5]Steps:   9%|▉         | 1356/15001 [50:12<7:08:18,  1.88s/it, loss=0.268, lr=1e-5]Steps:   9%|▉         | 1356/15001 [50:12<7:08:18,  1.88s/it, loss=0.0459, lr=1e-5]Steps:   9%|▉         | 1357/15001 [50:14<7:32:37,  1.99s/it, loss=0.0459, lr=1e-5]Steps:   9%|▉         | 1357/15001 [50:14<7:32:37,  1.99s/it, loss=0.195, lr=1e-5] Steps:   9%|▉         | 1358/15001 [50:16<7:38:19,  2.02s/it, loss=0.195, lr=1e-5]Steps:   9%|▉         | 1358/15001 [50:16<7:38:19,  2.02s/it, loss=0.222, lr=1e-5]Steps:   9%|▉         | 1359/15001 [50:18<7:30:58,  1.98s/it, loss=0.222, lr=1e-5]Steps:   9%|▉         | 1359/15001 [50:18<7:30:58,  1.98s/it, loss=0.189, lr=1e-5]Steps:   9%|▉         | 1360/15001 [50:20<7:23:06,  1.95s/it, loss=0.189, lr=1e-5]Steps:   9%|▉         | 1360/15001 [50:20<7:23:06,  1.95s/it, loss=0.0769, lr=1e-5]Steps:   9%|▉         | 1361/15001 [50:22<7:18:34,  1.93s/it, loss=0.0769, lr=1e-5]Steps:   9%|▉         | 1361/15001 [50:22<7:18:34,  1.93s/it, loss=0.0913, lr=1e-5]Steps:   9%|▉         | 1362/15001 [50:24<7:32:24,  1.99s/it, loss=0.0913, lr=1e-5]Steps:   9%|▉         | 1362/15001 [50:24<7:32:24,  1.99s/it, loss=0.129, lr=1e-5] Steps:   9%|▉         | 1363/15001 [50:25<7:14:39,  1.91s/it, loss=0.129, lr=1e-5]Steps:   9%|▉         | 1363/15001 [50:25<7:14:39,  1.91s/it, loss=0.152, lr=1e-5]Steps:   9%|▉         | 1364/15001 [50:27<7:12:42,  1.90s/it, loss=0.152, lr=1e-5]Steps:   9%|▉         | 1364/15001 [50:27<7:12:42,  1.90s/it, loss=0.221, lr=1e-5]Steps:   9%|▉         | 1365/15001 [50:29<7:09:44,  1.89s/it, loss=0.221, lr=1e-5]Steps:   9%|▉         | 1365/15001 [50:29<7:09:44,  1.89s/it, loss=0.115, lr=1e-5]Steps:   9%|▉         | 1366/15001 [50:31<7:00:35,  1.85s/it, loss=0.115, lr=1e-5]Steps:   9%|▉         | 1366/15001 [50:31<7:00:35,  1.85s/it, loss=0.201, lr=1e-5]Steps:   9%|▉         | 1367/15001 [50:33<7:01:03,  1.85s/it, loss=0.201, lr=1e-5]Steps:   9%|▉         | 1367/15001 [50:33<7:01:03,  1.85s/it, loss=0.292, lr=1e-5]Steps:   9%|▉         | 1368/15001 [50:35<7:07:21,  1.88s/it, loss=0.292, lr=1e-5]Steps:   9%|▉         | 1368/15001 [50:35<7:07:21,  1.88s/it, loss=0.226, lr=1e-5]Steps:   9%|▉         | 1369/15001 [50:36<7:01:32,  1.86s/it, loss=0.226, lr=1e-5]Steps:   9%|▉         | 1369/15001 [50:37<7:01:32,  1.86s/it, loss=0.246, lr=1e-5]Steps:   9%|▉         | 1370/15001 [50:38<6:45:04,  1.78s/it, loss=0.246, lr=1e-5]Steps:   9%|▉         | 1370/15001 [50:38<6:45:04,  1.78s/it, loss=0.0898, lr=1e-5]Steps:   9%|▉         | 1371/15001 [50:40<7:00:06,  1.85s/it, loss=0.0898, lr=1e-5]Steps:   9%|▉         | 1371/15001 [50:40<7:00:06,  1.85s/it, loss=0.195, lr=1e-5] Steps:   9%|▉         | 1372/15001 [50:42<6:59:59,  1.85s/it, loss=0.195, lr=1e-5]Steps:   9%|▉         | 1372/15001 [50:42<6:59:59,  1.85s/it, loss=0.15, lr=1e-5] Steps:   9%|▉         | 1373/15001 [50:44<6:54:19,  1.82s/it, loss=0.15, lr=1e-5]Steps:   9%|▉         | 1373/15001 [50:44<6:54:19,  1.82s/it, loss=0.145, lr=1e-5]Steps:   9%|▉         | 1374/15001 [50:45<6:43:41,  1.78s/it, loss=0.145, lr=1e-5]Steps:   9%|▉         | 1374/15001 [50:46<6:43:41,  1.78s/it, loss=0.0241, lr=1e-5]Steps:   9%|▉         | 1375/15001 [50:47<6:39:13,  1.76s/it, loss=0.0241, lr=1e-5]Steps:   9%|▉         | 1375/15001 [50:47<6:39:13,  1.76s/it, loss=0.334, lr=1e-5] Steps:   9%|▉         | 1376/15001 [50:49<6:46:09,  1.79s/it, loss=0.334, lr=1e-5]Steps:   9%|▉         | 1376/15001 [50:49<6:46:09,  1.79s/it, loss=0.119, lr=1e-5]Steps:   9%|▉         | 1377/15001 [50:51<7:00:56,  1.85s/it, loss=0.119, lr=1e-5]Steps:   9%|▉         | 1377/15001 [50:51<7:00:56,  1.85s/it, loss=0.222, lr=1e-5]Steps:   9%|▉         | 1378/15001 [50:53<7:14:44,  1.91s/it, loss=0.222, lr=1e-5]Steps:   9%|▉         | 1378/15001 [50:53<7:14:44,  1.91s/it, loss=0.282, lr=1e-5]Steps:   9%|▉         | 1379/15001 [50:55<7:19:57,  1.94s/it, loss=0.282, lr=1e-5]Steps:   9%|▉         | 1379/15001 [50:55<7:19:57,  1.94s/it, loss=0.0876, lr=1e-5]Steps:   9%|▉         | 1380/15001 [50:57<7:16:49,  1.92s/it, loss=0.0876, lr=1e-5]Steps:   9%|▉         | 1380/15001 [50:57<7:16:49,  1.92s/it, loss=0.0682, lr=1e-5]Steps:   9%|▉         | 1381/15001 [50:59<7:24:54,  1.96s/it, loss=0.0682, lr=1e-5]Steps:   9%|▉         | 1381/15001 [50:59<7:24:54,  1.96s/it, loss=0.0733, lr=1e-5]Steps:   9%|▉         | 1382/15001 [51:01<7:44:58,  2.05s/it, loss=0.0733, lr=1e-5]Steps:   9%|▉         | 1382/15001 [51:01<7:44:58,  2.05s/it, loss=0.0413, lr=1e-5]Steps:   9%|▉         | 1383/15001 [51:03<7:27:16,  1.97s/it, loss=0.0413, lr=1e-5]Steps:   9%|▉         | 1383/15001 [51:03<7:27:16,  1.97s/it, loss=0.159, lr=1e-5] Steps:   9%|▉         | 1384/15001 [51:05<7:23:51,  1.96s/it, loss=0.159, lr=1e-5]Steps:   9%|▉         | 1384/15001 [51:05<7:23:51,  1.96s/it, loss=0.178, lr=1e-5]Steps:   9%|▉         | 1385/15001 [51:07<7:01:32,  1.86s/it, loss=0.178, lr=1e-5]Steps:   9%|▉         | 1385/15001 [51:07<7:01:32,  1.86s/it, loss=0.286, lr=1e-5]Steps:   9%|▉         | 1386/15001 [51:08<7:03:59,  1.87s/it, loss=0.286, lr=1e-5]Steps:   9%|▉         | 1386/15001 [51:09<7:03:59,  1.87s/it, loss=0.123, lr=1e-5]Steps:   9%|▉         | 1387/15001 [51:11<7:19:13,  1.94s/it, loss=0.123, lr=1e-5]Steps:   9%|▉         | 1387/15001 [51:11<7:19:13,  1.94s/it, loss=0.1, lr=1e-5]  Steps:   9%|▉         | 1388/15001 [51:12<7:16:04,  1.92s/it, loss=0.1, lr=1e-5]Steps:   9%|▉         | 1388/15001 [51:13<7:16:04,  1.92s/it, loss=0.283, lr=1e-5]Steps:   9%|▉         | 1389/15001 [51:14<7:11:14,  1.90s/it, loss=0.283, lr=1e-5]Steps:   9%|▉         | 1389/15001 [51:14<7:11:14,  1.90s/it, loss=0.267, lr=1e-5]Steps:   9%|▉         | 1390/15001 [51:16<7:02:39,  1.86s/it, loss=0.267, lr=1e-5]Steps:   9%|▉         | 1390/15001 [51:16<7:02:39,  1.86s/it, loss=0.0829, lr=1e-5]Steps:   9%|▉         | 1391/15001 [51:18<7:03:33,  1.87s/it, loss=0.0829, lr=1e-5]Steps:   9%|▉         | 1391/15001 [51:18<7:03:33,  1.87s/it, loss=0.131, lr=1e-5] Steps:   9%|▉         | 1392/15001 [51:20<6:49:25,  1.81s/it, loss=0.131, lr=1e-5]Steps:   9%|▉         | 1392/15001 [51:20<6:49:25,  1.81s/it, loss=0.12, lr=1e-5] Steps:   9%|▉         | 1393/15001 [51:22<7:04:02,  1.87s/it, loss=0.12, lr=1e-5]Steps:   9%|▉         | 1393/15001 [51:22<7:04:02,  1.87s/it, loss=0.305, lr=1e-5]Steps:   9%|▉         | 1394/15001 [51:23<6:57:40,  1.84s/it, loss=0.305, lr=1e-5]Steps:   9%|▉         | 1394/15001 [51:24<6:57:40,  1.84s/it, loss=0.105, lr=1e-5]Steps:   9%|▉         | 1395/15001 [51:25<6:59:42,  1.85s/it, loss=0.105, lr=1e-5]Steps:   9%|▉         | 1395/15001 [51:26<6:59:42,  1.85s/it, loss=0.173, lr=1e-5]Steps:   9%|▉         | 1396/15001 [51:27<7:13:58,  1.91s/it, loss=0.173, lr=1e-5]Steps:   9%|▉         | 1396/15001 [51:27<7:13:58,  1.91s/it, loss=0.238, lr=1e-5]Steps:   9%|▉         | 1397/15001 [51:29<7:01:34,  1.86s/it, loss=0.238, lr=1e-5]Steps:   9%|▉         | 1397/15001 [51:29<7:01:34,  1.86s/it, loss=0.0872, lr=1e-5]Steps:   9%|▉         | 1398/15001 [51:31<7:03:36,  1.87s/it, loss=0.0872, lr=1e-5]Steps:   9%|▉         | 1398/15001 [51:31<7:03:36,  1.87s/it, loss=0.248, lr=1e-5] Steps:   9%|▉         | 1399/15001 [51:33<6:51:58,  1.82s/it, loss=0.248, lr=1e-5]Steps:   9%|▉         | 1399/15001 [51:33<6:51:58,  1.82s/it, loss=0.127, lr=1e-5]Steps:   9%|▉         | 1400/15001 [51:35<6:59:23,  1.85s/it, loss=0.127, lr=1e-5]Steps:   9%|▉         | 1400/15001 [51:35<6:59:23,  1.85s/it, loss=0.184, lr=1e-5]Steps:   9%|▉         | 1401/15001 [51:37<7:19:31,  1.94s/it, loss=0.184, lr=1e-5]Steps:   9%|▉         | 1401/15001 [51:37<7:19:31,  1.94s/it, loss=0.133, lr=1e-5]Steps:   9%|▉         | 1402/15001 [51:39<7:35:34,  2.01s/it, loss=0.133, lr=1e-5]Steps:   9%|▉         | 1402/15001 [51:39<7:35:34,  2.01s/it, loss=0.0632, lr=1e-5]Steps:   9%|▉         | 1403/15001 [51:41<7:24:26,  1.96s/it, loss=0.0632, lr=1e-5]Steps:   9%|▉         | 1403/15001 [51:41<7:24:26,  1.96s/it, loss=0.158, lr=1e-5] Steps:   9%|▉         | 1404/15001 [51:43<7:41:25,  2.04s/it, loss=0.158, lr=1e-5]Steps:   9%|▉         | 1404/15001 [51:43<7:41:25,  2.04s/it, loss=0.107, lr=1e-5]Steps:   9%|▉         | 1405/15001 [51:45<7:25:52,  1.97s/it, loss=0.107, lr=1e-5]Steps:   9%|▉         | 1405/15001 [51:45<7:25:52,  1.97s/it, loss=0.239, lr=1e-5]Steps:   9%|▉         | 1406/15001 [51:47<7:31:12,  1.99s/it, loss=0.239, lr=1e-5]Steps:   9%|▉         | 1406/15001 [51:47<7:31:12,  1.99s/it, loss=0.241, lr=1e-5]Steps:   9%|▉         | 1407/15001 [51:49<7:13:44,  1.91s/it, loss=0.241, lr=1e-5]Steps:   9%|▉         | 1407/15001 [51:49<7:13:44,  1.91s/it, loss=0.138, lr=1e-5]Steps:   9%|▉         | 1408/15001 [51:50<7:12:28,  1.91s/it, loss=0.138, lr=1e-5]Steps:   9%|▉         | 1408/15001 [51:51<7:12:28,  1.91s/it, loss=0.102, lr=1e-5]Steps:   9%|▉         | 1409/15001 [51:52<7:13:58,  1.92s/it, loss=0.102, lr=1e-5]Steps:   9%|▉         | 1409/15001 [51:52<7:13:58,  1.92s/it, loss=0.214, lr=1e-5]Steps:   9%|▉         | 1410/15001 [51:54<7:07:39,  1.89s/it, loss=0.214, lr=1e-5]Steps:   9%|▉         | 1410/15001 [51:54<7:07:39,  1.89s/it, loss=0.259, lr=1e-5]Steps:   9%|▉         | 1411/15001 [51:56<6:52:43,  1.82s/it, loss=0.259, lr=1e-5]Steps:   9%|▉         | 1411/15001 [51:56<6:52:43,  1.82s/it, loss=0.361, lr=1e-5]Steps:   9%|▉         | 1412/15001 [51:58<6:59:17,  1.85s/it, loss=0.361, lr=1e-5]Steps:   9%|▉         | 1412/15001 [51:58<6:59:17,  1.85s/it, loss=0.0869, lr=1e-5]Steps:   9%|▉         | 1413/15001 [51:59<6:47:39,  1.80s/it, loss=0.0869, lr=1e-5]Steps:   9%|▉         | 1413/15001 [52:00<6:47:39,  1.80s/it, loss=0.203, lr=1e-5] Steps:   9%|▉         | 1414/15001 [52:02<7:06:16,  1.88s/it, loss=0.203, lr=1e-5]Steps:   9%|▉         | 1414/15001 [52:02<7:06:16,  1.88s/it, loss=0.27, lr=1e-5] Steps:   9%|▉         | 1415/15001 [52:03<6:56:07,  1.84s/it, loss=0.27, lr=1e-5]Steps:   9%|▉         | 1415/15001 [52:03<6:56:07,  1.84s/it, loss=0.264, lr=1e-5]Steps:   9%|▉         | 1416/15001 [52:05<7:07:42,  1.89s/it, loss=0.264, lr=1e-5]Steps:   9%|▉         | 1416/15001 [52:05<7:07:42,  1.89s/it, loss=0.0767, lr=1e-5]Steps:   9%|▉         | 1417/15001 [52:07<7:04:14,  1.87s/it, loss=0.0767, lr=1e-5]Steps:   9%|▉         | 1417/15001 [52:07<7:04:14,  1.87s/it, loss=0.213, lr=1e-5] Steps:   9%|▉         | 1418/15001 [52:09<6:47:07,  1.80s/it, loss=0.213, lr=1e-5]Steps:   9%|▉         | 1418/15001 [52:09<6:47:07,  1.80s/it, loss=0.103, lr=1e-5]Steps:   9%|▉         | 1419/15001 [52:11<6:58:09,  1.85s/it, loss=0.103, lr=1e-5]Steps:   9%|▉         | 1419/15001 [52:11<6:58:09,  1.85s/it, loss=0.0766, lr=1e-5]Steps:   9%|▉         | 1420/15001 [52:13<7:07:45,  1.89s/it, loss=0.0766, lr=1e-5]Steps:   9%|▉         | 1420/15001 [52:13<7:07:45,  1.89s/it, loss=0.119, lr=1e-5] Steps:   9%|▉         | 1421/15001 [52:14<6:43:45,  1.78s/it, loss=0.119, lr=1e-5]Steps:   9%|▉         | 1421/15001 [52:14<6:43:45,  1.78s/it, loss=0.0936, lr=1e-5]Steps:   9%|▉         | 1422/15001 [52:16<6:56:51,  1.84s/it, loss=0.0936, lr=1e-5]Steps:   9%|▉         | 1422/15001 [52:16<6:56:51,  1.84s/it, loss=0.167, lr=1e-5] Steps:   9%|▉         | 1423/15001 [52:18<7:00:46,  1.86s/it, loss=0.167, lr=1e-5]Steps:   9%|▉         | 1423/15001 [52:18<7:00:46,  1.86s/it, loss=0.164, lr=1e-5]Steps:   9%|▉         | 1424/15001 [52:20<7:14:53,  1.92s/it, loss=0.164, lr=1e-5]Steps:   9%|▉         | 1424/15001 [52:20<7:14:53,  1.92s/it, loss=0.0241, lr=1e-5]Steps:   9%|▉         | 1425/15001 [52:22<7:34:22,  2.01s/it, loss=0.0241, lr=1e-5]Steps:   9%|▉         | 1425/15001 [52:22<7:34:22,  2.01s/it, loss=0.0562, lr=1e-5]Steps:  10%|▉         | 1426/15001 [52:24<7:30:33,  1.99s/it, loss=0.0562, lr=1e-5]Steps:  10%|▉         | 1426/15001 [52:24<7:30:33,  1.99s/it, loss=0.113, lr=1e-5] Steps:  10%|▉         | 1427/15001 [52:26<7:28:33,  1.98s/it, loss=0.113, lr=1e-5]Steps:  10%|▉         | 1427/15001 [52:26<7:28:33,  1.98s/it, loss=0.0688, lr=1e-5]Steps:  10%|▉         | 1428/15001 [52:28<7:32:24,  2.00s/it, loss=0.0688, lr=1e-5]Steps:  10%|▉         | 1428/15001 [52:28<7:32:24,  2.00s/it, loss=0.295, lr=1e-5] Steps:  10%|▉         | 1429/15001 [52:30<7:14:58,  1.92s/it, loss=0.295, lr=1e-5]Steps:  10%|▉         | 1429/15001 [52:30<7:14:58,  1.92s/it, loss=0.218, lr=1e-5]Steps:  10%|▉         | 1430/15001 [52:32<6:57:20,  1.85s/it, loss=0.218, lr=1e-5]Steps:  10%|▉         | 1430/15001 [52:32<6:57:20,  1.85s/it, loss=0.306, lr=1e-5]Steps:  10%|▉         | 1431/15001 [52:34<7:03:28,  1.87s/it, loss=0.306, lr=1e-5]Steps:  10%|▉         | 1431/15001 [52:34<7:03:28,  1.87s/it, loss=0.279, lr=1e-5]Steps:  10%|▉         | 1432/15001 [52:35<6:51:49,  1.82s/it, loss=0.279, lr=1e-5]Steps:  10%|▉         | 1432/15001 [52:36<6:51:49,  1.82s/it, loss=0.183, lr=1e-5]Steps:  10%|▉         | 1433/15001 [52:37<7:04:00,  1.88s/it, loss=0.183, lr=1e-5]Steps:  10%|▉         | 1433/15001 [52:38<7:04:00,  1.88s/it, loss=0.281, lr=1e-5]Steps:  10%|▉         | 1434/15001 [52:39<7:00:57,  1.86s/it, loss=0.281, lr=1e-5]Steps:  10%|▉         | 1434/15001 [52:39<7:00:57,  1.86s/it, loss=0.188, lr=1e-5]Steps:  10%|▉         | 1435/15001 [52:41<6:58:41,  1.85s/it, loss=0.188, lr=1e-5]Steps:  10%|▉         | 1435/15001 [52:41<6:58:41,  1.85s/it, loss=0.188, lr=1e-5]Steps:  10%|▉         | 1436/15001 [52:43<7:02:51,  1.87s/it, loss=0.188, lr=1e-5]Steps:  10%|▉         | 1436/15001 [52:43<7:02:51,  1.87s/it, loss=0.148, lr=1e-5]Steps:  10%|▉         | 1437/15001 [52:45<6:48:34,  1.81s/it, loss=0.148, lr=1e-5]Steps:  10%|▉         | 1437/15001 [52:46<6:48:34,  1.81s/it, loss=0.0734, lr=1e-5]Steps:  10%|▉         | 1438/15001 [52:47<8:03:08,  2.14s/it, loss=0.0734, lr=1e-5]Steps:  10%|▉         | 1438/15001 [52:48<8:03:08,  2.14s/it, loss=0.129, lr=1e-5] Steps:  10%|▉         | 1439/15001 [52:50<7:55:31,  2.10s/it, loss=0.129, lr=1e-5]Steps:  10%|▉         | 1439/15001 [52:50<7:55:31,  2.10s/it, loss=0.151, lr=1e-5]Steps:  10%|▉         | 1440/15001 [52:51<7:29:47,  1.99s/it, loss=0.151, lr=1e-5]Steps:  10%|▉         | 1440/15001 [52:51<7:29:47,  1.99s/it, loss=0.354, lr=1e-5]Steps:  10%|▉         | 1441/15001 [52:53<7:18:33,  1.94s/it, loss=0.354, lr=1e-5]Steps:  10%|▉         | 1441/15001 [52:53<7:18:33,  1.94s/it, loss=0.129, lr=1e-5]Steps:  10%|▉         | 1442/15001 [52:55<7:10:11,  1.90s/it, loss=0.129, lr=1e-5]Steps:  10%|▉         | 1442/15001 [52:55<7:10:11,  1.90s/it, loss=0.314, lr=1e-5]Steps:  10%|▉         | 1443/15001 [52:57<7:07:53,  1.89s/it, loss=0.314, lr=1e-5]Steps:  10%|▉         | 1443/15001 [52:57<7:07:53,  1.89s/it, loss=0.163, lr=1e-5]Steps:  10%|▉         | 1444/15001 [52:58<6:47:26,  1.80s/it, loss=0.163, lr=1e-5]Steps:  10%|▉         | 1444/15001 [52:59<6:47:26,  1.80s/it, loss=0.419, lr=1e-5]Steps:  10%|▉         | 1445/15001 [53:01<7:18:39,  1.94s/it, loss=0.419, lr=1e-5]Steps:  10%|▉         | 1445/15001 [53:01<7:18:39,  1.94s/it, loss=0.143, lr=1e-5]Steps:  10%|▉         | 1446/15001 [53:03<7:32:44,  2.00s/it, loss=0.143, lr=1e-5]Steps:  10%|▉         | 1446/15001 [53:03<7:32:44,  2.00s/it, loss=0.108, lr=1e-5]Steps:  10%|▉         | 1447/15001 [53:05<7:31:36,  2.00s/it, loss=0.108, lr=1e-5]Steps:  10%|▉         | 1447/15001 [53:05<7:31:36,  2.00s/it, loss=0.197, lr=1e-5]Steps:  10%|▉         | 1448/15001 [53:07<7:23:16,  1.96s/it, loss=0.197, lr=1e-5]Steps:  10%|▉         | 1448/15001 [53:07<7:23:16,  1.96s/it, loss=0.177, lr=1e-5]Steps:  10%|▉         | 1449/15001 [53:09<7:36:49,  2.02s/it, loss=0.177, lr=1e-5]Steps:  10%|▉         | 1449/15001 [53:09<7:36:49,  2.02s/it, loss=0.198, lr=1e-5]Steps:  10%|▉         | 1450/15001 [53:11<7:46:42,  2.07s/it, loss=0.198, lr=1e-5]Steps:  10%|▉         | 1450/15001 [53:11<7:46:42,  2.07s/it, loss=0.0586, lr=1e-5]Steps:  10%|▉         | 1451/15001 [53:13<7:13:37,  1.92s/it, loss=0.0586, lr=1e-5]Steps:  10%|▉         | 1451/15001 [53:13<7:13:37,  1.92s/it, loss=0.359, lr=1e-5] Steps:  10%|▉         | 1452/15001 [53:14<7:12:19,  1.91s/it, loss=0.359, lr=1e-5]Steps:  10%|▉         | 1452/15001 [53:15<7:12:19,  1.91s/it, loss=0.206, lr=1e-5]Steps:  10%|▉         | 1453/15001 [53:16<7:06:13,  1.89s/it, loss=0.206, lr=1e-5]Steps:  10%|▉         | 1453/15001 [53:17<7:06:13,  1.89s/it, loss=0.126, lr=1e-5]Steps:  10%|▉         | 1454/15001 [53:18<7:14:44,  1.93s/it, loss=0.126, lr=1e-5]Steps:  10%|▉         | 1454/15001 [53:18<7:14:44,  1.93s/it, loss=0.0999, lr=1e-5]Steps:  10%|▉         | 1455/15001 [53:20<7:08:51,  1.90s/it, loss=0.0999, lr=1e-5]Steps:  10%|▉         | 1455/15001 [53:20<7:08:51,  1.90s/it, loss=0.0429, lr=1e-5]Steps:  10%|▉         | 1456/15001 [53:22<6:44:18,  1.79s/it, loss=0.0429, lr=1e-5]Steps:  10%|▉         | 1456/15001 [53:22<6:44:18,  1.79s/it, loss=0.0981, lr=1e-5]Steps:  10%|▉         | 1457/15001 [53:24<7:06:24,  1.89s/it, loss=0.0981, lr=1e-5]Steps:  10%|▉         | 1457/15001 [53:24<7:06:24,  1.89s/it, loss=0.119, lr=1e-5] Steps:  10%|▉         | 1458/15001 [53:25<6:43:30,  1.79s/it, loss=0.119, lr=1e-5]Steps:  10%|▉         | 1458/15001 [53:26<6:43:30,  1.79s/it, loss=0.166, lr=1e-5]Steps:  10%|▉         | 1459/15001 [53:27<7:00:51,  1.86s/it, loss=0.166, lr=1e-5]Steps:  10%|▉         | 1459/15001 [53:28<7:00:51,  1.86s/it, loss=0.0573, lr=1e-5]Steps:  10%|▉         | 1460/15001 [53:29<6:55:27,  1.84s/it, loss=0.0573, lr=1e-5]Steps:  10%|▉         | 1460/15001 [53:29<6:55:27,  1.84s/it, loss=0.219, lr=1e-5] Steps:  10%|▉         | 1461/15001 [53:31<6:57:49,  1.85s/it, loss=0.219, lr=1e-5]Steps:  10%|▉         | 1461/15001 [53:31<6:57:49,  1.85s/it, loss=0.0364, lr=1e-5]Steps:  10%|▉         | 1462/15001 [53:33<7:02:13,  1.87s/it, loss=0.0364, lr=1e-5]Steps:  10%|▉         | 1462/15001 [53:33<7:02:13,  1.87s/it, loss=0.331, lr=1e-5] Steps:  10%|▉         | 1463/15001 [53:35<7:07:50,  1.90s/it, loss=0.331, lr=1e-5]Steps:  10%|▉         | 1463/15001 [53:35<7:07:50,  1.90s/it, loss=0.116, lr=1e-5]Steps:  10%|▉         | 1464/15001 [53:37<7:02:54,  1.87s/it, loss=0.116, lr=1e-5]Steps:  10%|▉         | 1464/15001 [53:37<7:02:54,  1.87s/it, loss=0.0145, lr=1e-5]Steps:  10%|▉         | 1465/15001 [53:38<6:40:56,  1.78s/it, loss=0.0145, lr=1e-5]Steps:  10%|▉         | 1465/15001 [53:39<6:40:56,  1.78s/it, loss=0.0347, lr=1e-5]Steps:  10%|▉         | 1466/15001 [53:40<6:49:07,  1.81s/it, loss=0.0347, lr=1e-5]Steps:  10%|▉         | 1466/15001 [53:41<6:49:07,  1.81s/it, loss=0.187, lr=1e-5] Steps:  10%|▉         | 1467/15001 [53:42<7:13:08,  1.92s/it, loss=0.187, lr=1e-5]Steps:  10%|▉         | 1467/15001 [53:43<7:13:08,  1.92s/it, loss=0.101, lr=1e-5]Steps:  10%|▉         | 1468/15001 [53:44<7:18:31,  1.94s/it, loss=0.101, lr=1e-5]Steps:  10%|▉         | 1468/15001 [53:44<7:18:31,  1.94s/it, loss=0.204, lr=1e-5]Steps:  10%|▉         | 1469/15001 [53:46<7:08:44,  1.90s/it, loss=0.204, lr=1e-5]Steps:  10%|▉         | 1469/15001 [53:46<7:08:44,  1.90s/it, loss=0.129, lr=1e-5]Steps:  10%|▉         | 1470/15001 [53:48<7:26:26,  1.98s/it, loss=0.129, lr=1e-5]Steps:  10%|▉         | 1470/15001 [53:48<7:26:26,  1.98s/it, loss=0.072, lr=1e-5]Steps:  10%|▉         | 1471/15001 [53:50<7:32:02,  2.00s/it, loss=0.072, lr=1e-5]Steps:  10%|▉         | 1471/15001 [53:50<7:32:02,  2.00s/it, loss=0.173, lr=1e-5]Steps:  10%|▉         | 1472/15001 [53:52<7:35:26,  2.02s/it, loss=0.173, lr=1e-5]Steps:  10%|▉         | 1472/15001 [53:52<7:35:26,  2.02s/it, loss=0.15, lr=1e-5] Steps:  10%|▉         | 1473/15001 [53:54<7:24:23,  1.97s/it, loss=0.15, lr=1e-5]Steps:  10%|▉         | 1473/15001 [53:54<7:24:23,  1.97s/it, loss=0.25, lr=1e-5]Steps:  10%|▉         | 1474/15001 [53:56<7:11:35,  1.91s/it, loss=0.25, lr=1e-5]Steps:  10%|▉         | 1474/15001 [53:56<7:11:35,  1.91s/it, loss=0.188, lr=1e-5]Steps:  10%|▉         | 1475/15001 [53:58<6:46:25,  1.80s/it, loss=0.188, lr=1e-5]Steps:  10%|▉         | 1475/15001 [53:58<6:46:25,  1.80s/it, loss=0.075, lr=1e-5]Steps:  10%|▉         | 1476/15001 [54:00<6:54:38,  1.84s/it, loss=0.075, lr=1e-5]Steps:  10%|▉         | 1476/15001 [54:00<6:54:38,  1.84s/it, loss=0.0881, lr=1e-5]Steps:  10%|▉         | 1477/15001 [54:01<6:52:47,  1.83s/it, loss=0.0881, lr=1e-5]Steps:  10%|▉         | 1477/15001 [54:02<6:52:47,  1.83s/it, loss=0.141, lr=1e-5] Steps:  10%|▉         | 1478/15001 [54:03<6:55:01,  1.84s/it, loss=0.141, lr=1e-5]Steps:  10%|▉         | 1478/15001 [54:04<6:55:01,  1.84s/it, loss=0.151, lr=1e-5]Steps:  10%|▉         | 1479/15001 [54:05<7:03:26,  1.88s/it, loss=0.151, lr=1e-5]Steps:  10%|▉         | 1479/15001 [54:05<7:03:26,  1.88s/it, loss=0.285, lr=1e-5]Steps:  10%|▉         | 1480/15001 [54:07<7:01:37,  1.87s/it, loss=0.285, lr=1e-5]Steps:  10%|▉         | 1480/15001 [54:07<7:01:37,  1.87s/it, loss=0.0762, lr=1e-5]Steps:  10%|▉         | 1481/15001 [54:09<6:57:59,  1.86s/it, loss=0.0762, lr=1e-5]Steps:  10%|▉         | 1481/15001 [54:09<6:57:59,  1.86s/it, loss=0.194, lr=1e-5] Steps:  10%|▉         | 1482/15001 [54:11<6:56:02,  1.85s/it, loss=0.194, lr=1e-5]Steps:  10%|▉         | 1482/15001 [54:11<6:56:02,  1.85s/it, loss=0.107, lr=1e-5]Steps:  10%|▉         | 1483/15001 [54:13<7:12:21,  1.92s/it, loss=0.107, lr=1e-5]Steps:  10%|▉         | 1483/15001 [54:13<7:12:21,  1.92s/it, loss=0.173, lr=1e-5]Steps:  10%|▉         | 1484/15001 [54:14<6:50:39,  1.82s/it, loss=0.173, lr=1e-5]Steps:  10%|▉         | 1484/15001 [54:15<6:50:39,  1.82s/it, loss=0.13, lr=1e-5] Steps:  10%|▉         | 1485/15001 [54:16<6:53:56,  1.84s/it, loss=0.13, lr=1e-5]Steps:  10%|▉         | 1485/15001 [54:16<6:53:56,  1.84s/it, loss=0.114, lr=1e-5]Steps:  10%|▉         | 1486/15001 [54:18<6:54:56,  1.84s/it, loss=0.114, lr=1e-5]Steps:  10%|▉         | 1486/15001 [54:18<6:54:56,  1.84s/it, loss=0.161, lr=1e-5]Steps:  10%|▉         | 1487/15001 [54:20<6:54:38,  1.84s/it, loss=0.161, lr=1e-5]Steps:  10%|▉         | 1487/15001 [54:20<6:54:38,  1.84s/it, loss=0.0375, lr=1e-5]Steps:  10%|▉         | 1488/15001 [54:22<7:03:44,  1.88s/it, loss=0.0375, lr=1e-5]Steps:  10%|▉         | 1488/15001 [54:22<7:03:44,  1.88s/it, loss=0.0654, lr=1e-5]Steps:  10%|▉         | 1489/15001 [54:24<7:04:19,  1.88s/it, loss=0.0654, lr=1e-5]Steps:  10%|▉         | 1489/15001 [54:24<7:04:19,  1.88s/it, loss=0.0899, lr=1e-5]Steps:  10%|▉         | 1490/15001 [54:26<7:04:47,  1.89s/it, loss=0.0899, lr=1e-5]Steps:  10%|▉         | 1490/15001 [54:26<7:04:47,  1.89s/it, loss=0.202, lr=1e-5] Steps:  10%|▉         | 1491/15001 [54:28<7:09:37,  1.91s/it, loss=0.202, lr=1e-5]Steps:  10%|▉         | 1491/15001 [54:28<7:09:37,  1.91s/it, loss=0.0853, lr=1e-5]Steps:  10%|▉         | 1492/15001 [54:30<7:28:46,  1.99s/it, loss=0.0853, lr=1e-5]Steps:  10%|▉         | 1492/15001 [54:30<7:28:46,  1.99s/it, loss=0.13, lr=1e-5]  Steps:  10%|▉         | 1493/15001 [54:32<7:27:56,  1.99s/it, loss=0.13, lr=1e-5]Steps:  10%|▉         | 1493/15001 [54:32<7:27:56,  1.99s/it, loss=0.149, lr=1e-5]Steps:  10%|▉         | 1494/15001 [54:34<7:30:20,  2.00s/it, loss=0.149, lr=1e-5]Steps:  10%|▉         | 1494/15001 [54:34<7:30:20,  2.00s/it, loss=0.0952, lr=1e-5]Steps:  10%|▉         | 1495/15001 [54:36<7:29:30,  2.00s/it, loss=0.0952, lr=1e-5]Steps:  10%|▉         | 1495/15001 [54:36<7:29:30,  2.00s/it, loss=0.179, lr=1e-5] Steps:  10%|▉         | 1496/15001 [54:37<7:04:14,  1.88s/it, loss=0.179, lr=1e-5]Steps:  10%|▉         | 1496/15001 [54:38<7:04:14,  1.88s/it, loss=0.0933, lr=1e-5]Steps:  10%|▉         | 1497/15001 [54:39<7:14:16,  1.93s/it, loss=0.0933, lr=1e-5]Steps:  10%|▉         | 1497/15001 [54:40<7:14:16,  1.93s/it, loss=0.21, lr=1e-5]  Steps:  10%|▉         | 1498/15001 [54:41<6:54:09,  1.84s/it, loss=0.21, lr=1e-5]Steps:  10%|▉         | 1498/15001 [54:42<6:54:09,  1.84s/it, loss=0.185, lr=1e-5]Steps:  10%|▉         | 1499/15001 [54:43<7:14:03,  1.93s/it, loss=0.185, lr=1e-5]Steps:  10%|▉         | 1499/15001 [54:43<7:14:03,  1.93s/it, loss=0.279, lr=1e-5]Steps:  10%|▉         | 1500/15001 [54:45<7:00:53,  1.87s/it, loss=0.279, lr=1e-5]02/04/2024 13:57:04 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1597.42it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  10%|▉         | 1500/15001 [58:24<7:00:53,  1.87s/it, loss=0.0679, lr=1e-5]Steps:  10%|█         | 1501/15001 [58:26<253:23:52, 67.57s/it, loss=0.0679, lr=1e-5]Steps:  10%|█         | 1501/15001 [58:26<253:23:52, 67.57s/it, loss=0.271, lr=1e-5] Steps:  10%|█         | 1502/15001 [58:28<179:30:48, 47.87s/it, loss=0.271, lr=1e-5]Steps:  10%|█         | 1502/15001 [58:28<179:30:48, 47.87s/it, loss=0.0904, lr=1e-5]Steps:  10%|█         | 1503/15001 [58:30<128:09:11, 34.18s/it, loss=0.0904, lr=1e-5]Steps:  10%|█         | 1503/15001 [58:30<128:09:11, 34.18s/it, loss=0.0787, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  10%|█         | 1504/15001 [58:32<91:46:35, 24.48s/it, loss=0.0787, lr=1e-5] Steps:  10%|█         | 1504/15001 [58:32<91:46:35, 24.48s/it, loss=0.229, lr=1e-5] Steps:  10%|█         | 1505/15001 [58:34<66:19:03, 17.69s/it, loss=0.229, lr=1e-5]Steps:  10%|█         | 1505/15001 [58:34<66:19:03, 17.69s/it, loss=0.182, lr=1e-5]Steps:  10%|█         | 1506/15001 [58:35<48:25:03, 12.92s/it, loss=0.182, lr=1e-5]Steps:  10%|█         | 1506/15001 [58:36<48:25:03, 12.92s/it, loss=0.185, lr=1e-5]Steps:  10%|█         | 1507/15001 [58:37<35:57:30,  9.59s/it, loss=0.185, lr=1e-5]Steps:  10%|█         | 1507/15001 [58:37<35:57:30,  9.59s/it, loss=0.0226, lr=1e-5]Steps:  10%|█         | 1508/15001 [58:39<27:03:02,  7.22s/it, loss=0.0226, lr=1e-5]Steps:  10%|█         | 1508/15001 [58:39<27:03:02,  7.22s/it, loss=0.098, lr=1e-5] Steps:  10%|█         | 1509/15001 [58:41<20:50:25,  5.56s/it, loss=0.098, lr=1e-5]Steps:  10%|█         | 1509/15001 [58:41<20:50:25,  5.56s/it, loss=0.127, lr=1e-5]Steps:  10%|█         | 1510/15001 [58:43<17:14:12,  4.60s/it, loss=0.127, lr=1e-5]Steps:  10%|█         | 1510/15001 [58:43<17:14:12,  4.60s/it, loss=0.155, lr=1e-5]Steps:  10%|█         | 1511/15001 [58:45<14:07:01,  3.77s/it, loss=0.155, lr=1e-5]Steps:  10%|█         | 1511/15001 [58:45<14:07:01,  3.77s/it, loss=0.086, lr=1e-5]Steps:  10%|█         | 1512/15001 [58:47<11:45:24,  3.14s/it, loss=0.086, lr=1e-5]Steps:  10%|█         | 1512/15001 [58:47<11:45:24,  3.14s/it, loss=0.0549, lr=1e-5]Steps:  10%|█         | 1513/15001 [58:48<10:23:51,  2.78s/it, loss=0.0549, lr=1e-5]Steps:  10%|█         | 1513/15001 [58:49<10:23:51,  2.78s/it, loss=0.135, lr=1e-5] Steps:  10%|█         | 1514/15001 [58:50<9:16:36,  2.48s/it, loss=0.135, lr=1e-5] Steps:  10%|█         | 1514/15001 [58:50<9:16:36,  2.48s/it, loss=0.0519, lr=1e-5]Steps:  10%|█         | 1515/15001 [58:52<8:15:06,  2.20s/it, loss=0.0519, lr=1e-5]Steps:  10%|█         | 1515/15001 [58:52<8:15:06,  2.20s/it, loss=0.261, lr=1e-5] Steps:  10%|█         | 1516/15001 [58:54<7:53:44,  2.11s/it, loss=0.261, lr=1e-5]Steps:  10%|█         | 1516/15001 [58:54<7:53:44,  2.11s/it, loss=0.11, lr=1e-5] Steps:  10%|█         | 1517/15001 [58:56<7:43:26,  2.06s/it, loss=0.11, lr=1e-5]Steps:  10%|█         | 1517/15001 [58:56<7:43:26,  2.06s/it, loss=0.21, lr=1e-5]Steps:  10%|█         | 1518/15001 [58:58<7:38:10,  2.04s/it, loss=0.21, lr=1e-5]Steps:  10%|█         | 1518/15001 [58:58<7:38:10,  2.04s/it, loss=0.157, lr=1e-5]Steps:  10%|█         | 1519/15001 [59:00<7:31:42,  2.01s/it, loss=0.157, lr=1e-5]Steps:  10%|█         | 1519/15001 [59:00<7:31:42,  2.01s/it, loss=0.0165, lr=1e-5]Steps:  10%|█         | 1520/15001 [59:01<7:13:04,  1.93s/it, loss=0.0165, lr=1e-5]Steps:  10%|█         | 1520/15001 [59:01<7:13:04,  1.93s/it, loss=0.19, lr=1e-5]  Steps:  10%|█         | 1521/15001 [59:03<7:23:41,  1.97s/it, loss=0.19, lr=1e-5]Steps:  10%|█         | 1521/15001 [59:04<7:23:41,  1.97s/it, loss=0.0924, lr=1e-5]Steps:  10%|█         | 1522/15001 [59:05<7:19:26,  1.96s/it, loss=0.0924, lr=1e-5]Steps:  10%|█         | 1522/15001 [59:05<7:19:26,  1.96s/it, loss=0.159, lr=1e-5] Steps:  10%|█         | 1523/15001 [59:07<7:30:52,  2.01s/it, loss=0.159, lr=1e-5]Steps:  10%|█         | 1523/15001 [59:07<7:30:52,  2.01s/it, loss=0.0223, lr=1e-5]Steps:  10%|█         | 1524/15001 [59:09<7:31:42,  2.01s/it, loss=0.0223, lr=1e-5]Steps:  10%|█         | 1524/15001 [59:10<7:31:42,  2.01s/it, loss=0.0946, lr=1e-5]Steps:  10%|█         | 1525/15001 [59:11<7:23:17,  1.97s/it, loss=0.0946, lr=1e-5]Steps:  10%|█         | 1525/15001 [59:12<7:23:17,  1.97s/it, loss=0.0784, lr=1e-5]Steps:  10%|█         | 1526/15001 [59:13<7:33:27,  2.02s/it, loss=0.0784, lr=1e-5]Steps:  10%|█         | 1526/15001 [59:14<7:33:27,  2.02s/it, loss=0.284, lr=1e-5] Steps:  10%|█         | 1527/15001 [59:15<7:13:17,  1.93s/it, loss=0.284, lr=1e-5]Steps:  10%|█         | 1527/15001 [59:15<7:13:17,  1.93s/it, loss=0.163, lr=1e-5]Steps:  10%|█         | 1528/15001 [59:17<7:18:57,  1.95s/it, loss=0.163, lr=1e-5]Steps:  10%|█         | 1528/15001 [59:17<7:18:57,  1.95s/it, loss=0.158, lr=1e-5]Steps:  10%|█         | 1529/15001 [59:19<7:11:05,  1.92s/it, loss=0.158, lr=1e-5]Steps:  10%|█         | 1529/15001 [59:19<7:11:05,  1.92s/it, loss=0.199, lr=1e-5]Steps:  10%|█         | 1530/15001 [59:21<6:58:16,  1.86s/it, loss=0.199, lr=1e-5]Steps:  10%|█         | 1530/15001 [59:21<6:58:16,  1.86s/it, loss=0.293, lr=1e-5]Steps:  10%|█         | 1531/15001 [59:23<7:19:49,  1.96s/it, loss=0.293, lr=1e-5]Steps:  10%|█         | 1531/15001 [59:23<7:19:49,  1.96s/it, loss=0.0729, lr=1e-5]Steps:  10%|█         | 1532/15001 [59:25<6:57:11,  1.86s/it, loss=0.0729, lr=1e-5]Steps:  10%|█         | 1532/15001 [59:25<6:57:11,  1.86s/it, loss=0.261, lr=1e-5] Steps:  10%|█         | 1533/15001 [59:26<6:58:26,  1.86s/it, loss=0.261, lr=1e-5]Steps:  10%|█         | 1533/15001 [59:27<6:58:26,  1.86s/it, loss=0.37, lr=1e-5] Steps:  10%|█         | 1534/15001 [59:28<7:05:46,  1.90s/it, loss=0.37, lr=1e-5]Steps:  10%|█         | 1534/15001 [59:29<7:05:46,  1.90s/it, loss=0.186, lr=1e-5]Steps:  10%|█         | 1535/15001 [59:30<6:59:57,  1.87s/it, loss=0.186, lr=1e-5]Steps:  10%|█         | 1535/15001 [59:30<6:59:57,  1.87s/it, loss=0.00941, lr=1e-5]Steps:  10%|█         | 1536/15001 [59:32<6:44:31,  1.80s/it, loss=0.00941, lr=1e-5]Steps:  10%|█         | 1536/15001 [59:32<6:44:31,  1.80s/it, loss=0.0807, lr=1e-5] Steps:  10%|█         | 1537/15001 [59:34<6:45:39,  1.81s/it, loss=0.0807, lr=1e-5]Steps:  10%|█         | 1537/15001 [59:34<6:45:39,  1.81s/it, loss=0.18, lr=1e-5]  Steps:  10%|█         | 1538/15001 [59:35<6:42:37,  1.79s/it, loss=0.18, lr=1e-5]Steps:  10%|█         | 1538/15001 [59:36<6:42:37,  1.79s/it, loss=0.0644, lr=1e-5]Steps:  10%|█         | 1539/15001 [59:37<6:56:07,  1.85s/it, loss=0.0644, lr=1e-5]Steps:  10%|█         | 1539/15001 [59:38<6:56:07,  1.85s/it, loss=0.15, lr=1e-5]  Steps:  10%|█         | 1540/15001 [59:39<6:53:38,  1.84s/it, loss=0.15, lr=1e-5]Steps:  10%|█         | 1540/15001 [59:39<6:53:38,  1.84s/it, loss=0.0512, lr=1e-5]Steps:  10%|█         | 1541/15001 [59:41<6:41:27,  1.79s/it, loss=0.0512, lr=1e-5]Steps:  10%|█         | 1541/15001 [59:41<6:41:27,  1.79s/it, loss=0.0948, lr=1e-5]Steps:  10%|█         | 1542/15001 [59:43<6:42:23,  1.79s/it, loss=0.0948, lr=1e-5]Steps:  10%|█         | 1542/15001 [59:43<6:42:23,  1.79s/it, loss=0.171, lr=1e-5] Steps:  10%|█         | 1543/15001 [59:45<7:04:43,  1.89s/it, loss=0.171, lr=1e-5]Steps:  10%|█         | 1543/15001 [59:45<7:04:43,  1.89s/it, loss=0.213, lr=1e-5]Steps:  10%|█         | 1544/15001 [59:47<7:02:27,  1.88s/it, loss=0.213, lr=1e-5]Steps:  10%|█         | 1544/15001 [59:47<7:02:27,  1.88s/it, loss=0.217, lr=1e-5]Steps:  10%|█         | 1545/15001 [59:49<7:25:32,  1.99s/it, loss=0.217, lr=1e-5]Steps:  10%|█         | 1545/15001 [59:49<7:25:32,  1.99s/it, loss=0.247, lr=1e-5]Steps:  10%|█         | 1546/15001 [59:51<7:22:25,  1.97s/it, loss=0.247, lr=1e-5]Steps:  10%|█         | 1546/15001 [59:51<7:22:25,  1.97s/it, loss=0.102, lr=1e-5]Steps:  10%|█         | 1547/15001 [59:53<7:08:38,  1.91s/it, loss=0.102, lr=1e-5]Steps:  10%|█         | 1547/15001 [59:53<7:08:38,  1.91s/it, loss=0.199, lr=1e-5]Steps:  10%|█         | 1548/15001 [59:55<7:26:14,  1.99s/it, loss=0.199, lr=1e-5]Steps:  10%|█         | 1548/15001 [59:55<7:26:14,  1.99s/it, loss=0.0713, lr=1e-5]Steps:  10%|█         | 1549/15001 [59:57<7:26:27,  1.99s/it, loss=0.0713, lr=1e-5]Steps:  10%|█         | 1549/15001 [59:57<7:26:27,  1.99s/it, loss=0.0947, lr=1e-5]Steps:  10%|█         | 1550/15001 [59:59<7:18:30,  1.96s/it, loss=0.0947, lr=1e-5]Steps:  10%|█         | 1550/15001 [59:59<7:18:30,  1.96s/it, loss=0.145, lr=1e-5] Steps:  10%|█         | 1551/15001 [1:00:00<6:52:19,  1.84s/it, loss=0.145, lr=1e-5]Steps:  10%|█         | 1551/15001 [1:00:01<6:52:19,  1.84s/it, loss=0.214, lr=1e-5]Steps:  10%|█         | 1552/15001 [1:00:02<7:01:48,  1.88s/it, loss=0.214, lr=1e-5]Steps:  10%|█         | 1552/15001 [1:00:03<7:01:48,  1.88s/it, loss=0.137, lr=1e-5]Steps:  10%|█         | 1553/15001 [1:00:04<7:14:18,  1.94s/it, loss=0.137, lr=1e-5]Steps:  10%|█         | 1553/15001 [1:00:04<7:14:18,  1.94s/it, loss=0.0384, lr=1e-5]Steps:  10%|█         | 1554/15001 [1:00:06<7:12:47,  1.93s/it, loss=0.0384, lr=1e-5]Steps:  10%|█         | 1554/15001 [1:00:06<7:12:47,  1.93s/it, loss=0.14, lr=1e-5]  Steps:  10%|█         | 1555/15001 [1:00:08<7:07:33,  1.91s/it, loss=0.14, lr=1e-5]Steps:  10%|█         | 1555/15001 [1:00:08<7:07:33,  1.91s/it, loss=0.0213, lr=1e-5]Steps:  10%|█         | 1556/15001 [1:00:10<7:08:31,  1.91s/it, loss=0.0213, lr=1e-5]Steps:  10%|█         | 1556/15001 [1:00:10<7:08:31,  1.91s/it, loss=0.139, lr=1e-5] Steps:  10%|█         | 1557/15001 [1:00:12<7:00:31,  1.88s/it, loss=0.139, lr=1e-5]Steps:  10%|█         | 1557/15001 [1:00:12<7:00:31,  1.88s/it, loss=0.189, lr=1e-5]Steps:  10%|█         | 1558/15001 [1:00:14<6:53:05,  1.84s/it, loss=0.189, lr=1e-5]Steps:  10%|█         | 1558/15001 [1:00:14<6:53:05,  1.84s/it, loss=0.337, lr=1e-5]Steps:  10%|█         | 1559/15001 [1:00:15<6:41:14,  1.79s/it, loss=0.337, lr=1e-5]Steps:  10%|█         | 1559/15001 [1:00:15<6:41:14,  1.79s/it, loss=0.368, lr=1e-5]Steps:  10%|█         | 1560/15001 [1:00:17<6:31:14,  1.75s/it, loss=0.368, lr=1e-5]Steps:  10%|█         | 1560/15001 [1:00:17<6:31:14,  1.75s/it, loss=0.101, lr=1e-5]Steps:  10%|█         | 1561/15001 [1:00:19<6:52:27,  1.84s/it, loss=0.101, lr=1e-5]Steps:  10%|█         | 1561/15001 [1:00:19<6:52:27,  1.84s/it, loss=0.288, lr=1e-5]Steps:  10%|█         | 1562/15001 [1:00:21<6:52:59,  1.84s/it, loss=0.288, lr=1e-5]Steps:  10%|█         | 1562/15001 [1:00:21<6:52:59,  1.84s/it, loss=0.118, lr=1e-5]Steps:  10%|█         | 1563/15001 [1:00:23<6:49:51,  1.83s/it, loss=0.118, lr=1e-5]Steps:  10%|█         | 1563/15001 [1:00:23<6:49:51,  1.83s/it, loss=0.169, lr=1e-5]Steps:  10%|█         | 1564/15001 [1:00:24<6:33:03,  1.76s/it, loss=0.169, lr=1e-5]Steps:  10%|█         | 1564/15001 [1:00:25<6:33:03,  1.76s/it, loss=0.138, lr=1e-5]Steps:  10%|█         | 1565/15001 [1:00:26<6:54:02,  1.85s/it, loss=0.138, lr=1e-5]Steps:  10%|█         | 1565/15001 [1:00:26<6:54:02,  1.85s/it, loss=0.28, lr=1e-5] Steps:  10%|█         | 1566/15001 [1:00:28<7:07:44,  1.91s/it, loss=0.28, lr=1e-5]Steps:  10%|█         | 1566/15001 [1:00:29<7:07:44,  1.91s/it, loss=0.165, lr=1e-5]Steps:  10%|█         | 1567/15001 [1:00:30<7:22:32,  1.98s/it, loss=0.165, lr=1e-5]Steps:  10%|█         | 1567/15001 [1:00:30<7:22:32,  1.98s/it, loss=0.157, lr=1e-5]Steps:  10%|█         | 1568/15001 [1:00:32<7:03:44,  1.89s/it, loss=0.157, lr=1e-5]Steps:  10%|█         | 1568/15001 [1:00:33<7:03:44,  1.89s/it, loss=0.294, lr=1e-5]Steps:  10%|█         | 1569/15001 [1:00:34<7:35:44,  2.04s/it, loss=0.294, lr=1e-5]Steps:  10%|█         | 1569/15001 [1:00:35<7:35:44,  2.04s/it, loss=0.0837, lr=1e-5]Steps:  10%|█         | 1570/15001 [1:00:36<7:30:42,  2.01s/it, loss=0.0837, lr=1e-5]Steps:  10%|█         | 1570/15001 [1:00:37<7:30:42,  2.01s/it, loss=0.167, lr=1e-5] Steps:  10%|█         | 1571/15001 [1:00:38<7:24:27,  1.99s/it, loss=0.167, lr=1e-5]Steps:  10%|█         | 1571/15001 [1:00:39<7:24:27,  1.99s/it, loss=0.161, lr=1e-5]Steps:  10%|█         | 1572/15001 [1:00:40<7:16:54,  1.95s/it, loss=0.161, lr=1e-5]Steps:  10%|█         | 1572/15001 [1:00:41<7:16:54,  1.95s/it, loss=0.232, lr=1e-5]Steps:  10%|█         | 1573/15001 [1:00:42<7:23:39,  1.98s/it, loss=0.232, lr=1e-5]Steps:  10%|█         | 1573/15001 [1:00:42<7:23:39,  1.98s/it, loss=0.0598, lr=1e-5]Steps:  10%|█         | 1574/15001 [1:00:44<7:07:35,  1.91s/it, loss=0.0598, lr=1e-5]Steps:  10%|█         | 1574/15001 [1:00:44<7:07:35,  1.91s/it, loss=0.0943, lr=1e-5]Steps:  10%|█         | 1575/15001 [1:00:46<6:52:50,  1.84s/it, loss=0.0943, lr=1e-5]Steps:  10%|█         | 1575/15001 [1:00:46<6:52:50,  1.84s/it, loss=0.225, lr=1e-5] Steps:  11%|█         | 1576/15001 [1:00:47<6:45:39,  1.81s/it, loss=0.225, lr=1e-5]Steps:  11%|█         | 1576/15001 [1:00:48<6:45:39,  1.81s/it, loss=0.302, lr=1e-5]Steps:  11%|█         | 1577/15001 [1:00:49<6:59:13,  1.87s/it, loss=0.302, lr=1e-5]Steps:  11%|█         | 1577/15001 [1:00:50<6:59:13,  1.87s/it, loss=0.249, lr=1e-5]Steps:  11%|█         | 1578/15001 [1:00:51<6:49:47,  1.83s/it, loss=0.249, lr=1e-5]Steps:  11%|█         | 1578/15001 [1:00:51<6:49:47,  1.83s/it, loss=0.0801, lr=1e-5]Steps:  11%|█         | 1579/15001 [1:00:53<6:55:08,  1.86s/it, loss=0.0801, lr=1e-5]Steps:  11%|█         | 1579/15001 [1:00:53<6:55:08,  1.86s/it, loss=0.0274, lr=1e-5]Steps:  11%|█         | 1580/15001 [1:00:55<6:39:52,  1.79s/it, loss=0.0274, lr=1e-5]Steps:  11%|█         | 1580/15001 [1:00:55<6:39:52,  1.79s/it, loss=0.338, lr=1e-5] Steps:  11%|█         | 1581/15001 [1:00:57<6:52:41,  1.85s/it, loss=0.338, lr=1e-5]Steps:  11%|█         | 1581/15001 [1:00:57<6:52:41,  1.85s/it, loss=0.0213, lr=1e-5]Steps:  11%|█         | 1582/15001 [1:00:58<6:46:23,  1.82s/it, loss=0.0213, lr=1e-5]Steps:  11%|█         | 1582/15001 [1:00:59<6:46:23,  1.82s/it, loss=0.183, lr=1e-5] Steps:  11%|█         | 1583/15001 [1:01:00<6:58:36,  1.87s/it, loss=0.183, lr=1e-5]Steps:  11%|█         | 1583/15001 [1:01:01<6:58:36,  1.87s/it, loss=0.169, lr=1e-5]Steps:  11%|█         | 1584/15001 [1:01:02<6:56:17,  1.86s/it, loss=0.169, lr=1e-5]Steps:  11%|█         | 1584/15001 [1:01:02<6:56:17,  1.86s/it, loss=0.289, lr=1e-5]Steps:  11%|█         | 1585/15001 [1:01:04<6:43:07,  1.80s/it, loss=0.289, lr=1e-5]Steps:  11%|█         | 1585/15001 [1:01:04<6:43:07,  1.80s/it, loss=0.452, lr=1e-5]Steps:  11%|█         | 1586/15001 [1:01:06<6:38:35,  1.78s/it, loss=0.452, lr=1e-5]Steps:  11%|█         | 1586/15001 [1:01:06<6:38:35,  1.78s/it, loss=0.257, lr=1e-5]Steps:  11%|█         | 1587/15001 [1:01:08<6:48:36,  1.83s/it, loss=0.257, lr=1e-5]Steps:  11%|█         | 1587/15001 [1:01:08<6:48:36,  1.83s/it, loss=0.117, lr=1e-5]Steps:  11%|█         | 1588/15001 [1:01:10<6:59:03,  1.87s/it, loss=0.117, lr=1e-5]Steps:  11%|█         | 1588/15001 [1:01:10<6:59:03,  1.87s/it, loss=0.205, lr=1e-5]Steps:  11%|█         | 1589/15001 [1:01:12<7:05:34,  1.90s/it, loss=0.205, lr=1e-5]Steps:  11%|█         | 1589/15001 [1:01:12<7:05:34,  1.90s/it, loss=0.169, lr=1e-5]Steps:  11%|█         | 1590/15001 [1:01:13<6:51:40,  1.84s/it, loss=0.169, lr=1e-5]Steps:  11%|█         | 1590/15001 [1:01:14<6:51:40,  1.84s/it, loss=0.14, lr=1e-5] Steps:  11%|█         | 1591/15001 [1:01:16<7:14:56,  1.95s/it, loss=0.14, lr=1e-5]Steps:  11%|█         | 1591/15001 [1:01:16<7:14:56,  1.95s/it, loss=0.278, lr=1e-5]Steps:  11%|█         | 1592/15001 [1:01:18<7:23:25,  1.98s/it, loss=0.278, lr=1e-5]Steps:  11%|█         | 1592/15001 [1:01:18<7:23:25,  1.98s/it, loss=0.148, lr=1e-5]Steps:  11%|█         | 1593/15001 [1:01:19<7:00:20,  1.88s/it, loss=0.148, lr=1e-5]Steps:  11%|█         | 1593/15001 [1:01:20<7:00:20,  1.88s/it, loss=0.16, lr=1e-5] Steps:  11%|█         | 1594/15001 [1:01:22<7:38:33,  2.05s/it, loss=0.16, lr=1e-5]Steps:  11%|█         | 1594/15001 [1:01:22<7:38:33,  2.05s/it, loss=0.0387, lr=1e-5]Steps:  11%|█         | 1595/15001 [1:01:23<7:20:36,  1.97s/it, loss=0.0387, lr=1e-5]Steps:  11%|█         | 1595/15001 [1:01:24<7:20:36,  1.97s/it, loss=0.0666, lr=1e-5]Steps:  11%|█         | 1596/15001 [1:01:25<7:00:59,  1.88s/it, loss=0.0666, lr=1e-5]Steps:  11%|█         | 1596/15001 [1:01:25<7:00:59,  1.88s/it, loss=0.31, lr=1e-5]  Steps:  11%|█         | 1597/15001 [1:01:27<6:56:05,  1.86s/it, loss=0.31, lr=1e-5]Steps:  11%|█         | 1597/15001 [1:01:27<6:56:05,  1.86s/it, loss=0.174, lr=1e-5]Steps:  11%|█         | 1598/15001 [1:01:29<6:46:01,  1.82s/it, loss=0.174, lr=1e-5]Steps:  11%|█         | 1598/15001 [1:01:29<6:46:01,  1.82s/it, loss=0.113, lr=1e-5]Steps:  11%|█         | 1599/15001 [1:01:31<7:04:15,  1.90s/it, loss=0.113, lr=1e-5]Steps:  11%|█         | 1599/15001 [1:01:31<7:04:15,  1.90s/it, loss=0.236, lr=1e-5]Steps:  11%|█         | 1600/15001 [1:01:32<6:54:01,  1.85s/it, loss=0.236, lr=1e-5]Steps:  11%|█         | 1600/15001 [1:01:33<6:54:01,  1.85s/it, loss=0.0454, lr=1e-5]Steps:  11%|█         | 1601/15001 [1:01:34<6:36:34,  1.78s/it, loss=0.0454, lr=1e-5]Steps:  11%|█         | 1601/15001 [1:01:35<6:36:34,  1.78s/it, loss=0.165, lr=1e-5] Steps:  11%|█         | 1602/15001 [1:01:36<7:05:01,  1.90s/it, loss=0.165, lr=1e-5]Steps:  11%|█         | 1602/15001 [1:01:36<7:05:01,  1.90s/it, loss=0.101, lr=1e-5]Steps:  11%|█         | 1603/15001 [1:01:38<6:45:22,  1.82s/it, loss=0.101, lr=1e-5]Steps:  11%|█         | 1603/15001 [1:01:38<6:45:22,  1.82s/it, loss=0.269, lr=1e-5]Steps:  11%|█         | 1604/15001 [1:01:40<6:40:44,  1.79s/it, loss=0.269, lr=1e-5]Steps:  11%|█         | 1604/15001 [1:01:40<6:40:44,  1.79s/it, loss=0.0975, lr=1e-5]Steps:  11%|█         | 1605/15001 [1:01:42<6:53:05,  1.85s/it, loss=0.0975, lr=1e-5]Steps:  11%|█         | 1605/15001 [1:01:42<6:53:05,  1.85s/it, loss=0.158, lr=1e-5] Steps:  11%|█         | 1606/15001 [1:01:44<7:01:16,  1.89s/it, loss=0.158, lr=1e-5]Steps:  11%|█         | 1606/15001 [1:01:44<7:01:16,  1.89s/it, loss=0.132, lr=1e-5]Steps:  11%|█         | 1607/15001 [1:01:45<6:45:43,  1.82s/it, loss=0.132, lr=1e-5]Steps:  11%|█         | 1607/15001 [1:01:45<6:45:43,  1.82s/it, loss=0.17, lr=1e-5] Steps:  11%|█         | 1608/15001 [1:01:47<6:30:49,  1.75s/it, loss=0.17, lr=1e-5]Steps:  11%|█         | 1608/15001 [1:01:47<6:30:49,  1.75s/it, loss=0.132, lr=1e-5]Steps:  11%|█         | 1609/15001 [1:01:49<6:46:30,  1.82s/it, loss=0.132, lr=1e-5]Steps:  11%|█         | 1609/15001 [1:01:49<6:46:30,  1.82s/it, loss=0.0777, lr=1e-5]Steps:  11%|█         | 1610/15001 [1:01:50<6:34:34,  1.77s/it, loss=0.0777, lr=1e-5]Steps:  11%|█         | 1610/15001 [1:01:51<6:34:34,  1.77s/it, loss=0.121, lr=1e-5] Steps:  11%|█         | 1611/15001 [1:01:53<7:10:17,  1.93s/it, loss=0.121, lr=1e-5]Steps:  11%|█         | 1611/15001 [1:01:53<7:10:17,  1.93s/it, loss=0.189, lr=1e-5]Steps:  11%|█         | 1612/15001 [1:01:55<7:14:24,  1.95s/it, loss=0.189, lr=1e-5]Steps:  11%|█         | 1612/15001 [1:01:55<7:14:24,  1.95s/it, loss=0.458, lr=1e-5]Steps:  11%|█         | 1613/15001 [1:01:57<7:20:57,  1.98s/it, loss=0.458, lr=1e-5]Steps:  11%|█         | 1613/15001 [1:01:57<7:20:57,  1.98s/it, loss=0.0682, lr=1e-5]Steps:  11%|█         | 1614/15001 [1:01:59<7:12:27,  1.94s/it, loss=0.0682, lr=1e-5]Steps:  11%|█         | 1614/15001 [1:01:59<7:12:27,  1.94s/it, loss=0.167, lr=1e-5] Steps:  11%|█         | 1615/15001 [1:02:01<7:12:25,  1.94s/it, loss=0.167, lr=1e-5]Steps:  11%|█         | 1615/15001 [1:02:01<7:12:25,  1.94s/it, loss=0.198, lr=1e-5]Steps:  11%|█         | 1616/15001 [1:02:03<7:40:24,  2.06s/it, loss=0.198, lr=1e-5]Steps:  11%|█         | 1616/15001 [1:02:03<7:40:24,  2.06s/it, loss=0.178, lr=1e-5]Steps:  11%|█         | 1617/15001 [1:02:05<7:31:34,  2.02s/it, loss=0.178, lr=1e-5]Steps:  11%|█         | 1617/15001 [1:02:05<7:31:34,  2.02s/it, loss=0.174, lr=1e-5]Steps:  11%|█         | 1618/15001 [1:02:07<7:15:14,  1.95s/it, loss=0.174, lr=1e-5]Steps:  11%|█         | 1618/15001 [1:02:07<7:15:14,  1.95s/it, loss=0.0904, lr=1e-5]Steps:  11%|█         | 1619/15001 [1:02:08<7:05:19,  1.91s/it, loss=0.0904, lr=1e-5]Steps:  11%|█         | 1619/15001 [1:02:09<7:05:19,  1.91s/it, loss=0.109, lr=1e-5] Steps:  11%|█         | 1620/15001 [1:02:10<6:53:12,  1.85s/it, loss=0.109, lr=1e-5]Steps:  11%|█         | 1620/15001 [1:02:10<6:53:12,  1.85s/it, loss=0.0815, lr=1e-5]Steps:  11%|█         | 1621/15001 [1:02:12<6:49:07,  1.83s/it, loss=0.0815, lr=1e-5]Steps:  11%|█         | 1621/15001 [1:02:12<6:49:07,  1.83s/it, loss=0.222, lr=1e-5] Steps:  11%|█         | 1622/15001 [1:02:14<6:46:02,  1.82s/it, loss=0.222, lr=1e-5]Steps:  11%|█         | 1622/15001 [1:02:14<6:46:02,  1.82s/it, loss=0.0941, lr=1e-5]Steps:  11%|█         | 1623/15001 [1:02:16<6:50:29,  1.84s/it, loss=0.0941, lr=1e-5]Steps:  11%|█         | 1623/15001 [1:02:16<6:50:29,  1.84s/it, loss=0.111, lr=1e-5] Steps:  11%|█         | 1624/15001 [1:02:17<6:41:12,  1.80s/it, loss=0.111, lr=1e-5]Steps:  11%|█         | 1624/15001 [1:02:18<6:41:12,  1.80s/it, loss=0.0745, lr=1e-5]Steps:  11%|█         | 1625/15001 [1:02:19<6:47:08,  1.83s/it, loss=0.0745, lr=1e-5]Steps:  11%|█         | 1625/15001 [1:02:20<6:47:08,  1.83s/it, loss=0.472, lr=1e-5] Steps:  11%|█         | 1626/15001 [1:02:21<6:43:41,  1.81s/it, loss=0.472, lr=1e-5]Steps:  11%|█         | 1626/15001 [1:02:21<6:43:41,  1.81s/it, loss=0.112, lr=1e-5]Steps:  11%|█         | 1627/15001 [1:02:23<6:54:58,  1.86s/it, loss=0.112, lr=1e-5]Steps:  11%|█         | 1627/15001 [1:02:23<6:54:58,  1.86s/it, loss=0.187, lr=1e-5]Steps:  11%|█         | 1628/15001 [1:02:25<6:45:14,  1.82s/it, loss=0.187, lr=1e-5]Steps:  11%|█         | 1628/15001 [1:02:25<6:45:14,  1.82s/it, loss=0.118, lr=1e-5]Steps:  11%|█         | 1629/15001 [1:02:27<7:00:10,  1.89s/it, loss=0.118, lr=1e-5]Steps:  11%|█         | 1629/15001 [1:02:27<7:00:10,  1.89s/it, loss=0.391, lr=1e-5]Steps:  11%|█         | 1630/15001 [1:02:29<6:58:24,  1.88s/it, loss=0.391, lr=1e-5]Steps:  11%|█         | 1630/15001 [1:02:29<6:58:24,  1.88s/it, loss=0.204, lr=1e-5]Steps:  11%|█         | 1631/15001 [1:02:31<7:00:31,  1.89s/it, loss=0.204, lr=1e-5]Steps:  11%|█         | 1631/15001 [1:02:31<7:00:31,  1.89s/it, loss=0.126, lr=1e-5]Steps:  11%|█         | 1632/15001 [1:02:32<6:57:41,  1.87s/it, loss=0.126, lr=1e-5]Steps:  11%|█         | 1632/15001 [1:02:32<6:57:41,  1.87s/it, loss=0.11, lr=1e-5] Steps:  11%|█         | 1633/15001 [1:02:34<6:49:24,  1.84s/it, loss=0.11, lr=1e-5]Steps:  11%|█         | 1633/15001 [1:02:34<6:49:24,  1.84s/it, loss=0.145, lr=1e-5]Steps:  11%|█         | 1634/15001 [1:02:36<6:49:08,  1.84s/it, loss=0.145, lr=1e-5]Steps:  11%|█         | 1634/15001 [1:02:36<6:49:08,  1.84s/it, loss=0.0812, lr=1e-5]Steps:  11%|█         | 1635/15001 [1:02:38<7:07:12,  1.92s/it, loss=0.0812, lr=1e-5]Steps:  11%|█         | 1635/15001 [1:02:38<7:07:12,  1.92s/it, loss=0.112, lr=1e-5] Steps:  11%|█         | 1636/15001 [1:02:40<7:09:25,  1.93s/it, loss=0.112, lr=1e-5]Steps:  11%|█         | 1636/15001 [1:02:40<7:09:25,  1.93s/it, loss=0.228, lr=1e-5]Steps:  11%|█         | 1637/15001 [1:02:42<7:09:17,  1.93s/it, loss=0.228, lr=1e-5]Steps:  11%|█         | 1637/15001 [1:02:42<7:09:17,  1.93s/it, loss=0.239, lr=1e-5]Steps:  11%|█         | 1638/15001 [1:02:44<7:35:29,  2.05s/it, loss=0.239, lr=1e-5]Steps:  11%|█         | 1638/15001 [1:02:44<7:35:29,  2.05s/it, loss=0.161, lr=1e-5]Steps:  11%|█         | 1639/15001 [1:02:46<7:26:01,  2.00s/it, loss=0.161, lr=1e-5]Steps:  11%|█         | 1639/15001 [1:02:46<7:26:01,  2.00s/it, loss=0.138, lr=1e-5]Steps:  11%|█         | 1640/15001 [1:02:48<7:10:45,  1.93s/it, loss=0.138, lr=1e-5]Steps:  11%|█         | 1640/15001 [1:02:48<7:10:45,  1.93s/it, loss=0.172, lr=1e-5]Steps:  11%|█         | 1641/15001 [1:02:50<7:22:22,  1.99s/it, loss=0.172, lr=1e-5]Steps:  11%|█         | 1641/15001 [1:02:50<7:22:22,  1.99s/it, loss=0.145, lr=1e-5]Steps:  11%|█         | 1642/15001 [1:02:52<7:05:58,  1.91s/it, loss=0.145, lr=1e-5]Steps:  11%|█         | 1642/15001 [1:02:52<7:05:58,  1.91s/it, loss=0.241, lr=1e-5]Steps:  11%|█         | 1643/15001 [1:02:54<6:53:08,  1.86s/it, loss=0.241, lr=1e-5]Steps:  11%|█         | 1643/15001 [1:02:54<6:53:08,  1.86s/it, loss=0.0271, lr=1e-5]Steps:  11%|█         | 1644/15001 [1:02:56<7:01:16,  1.89s/it, loss=0.0271, lr=1e-5]Steps:  11%|█         | 1644/15001 [1:02:56<7:01:16,  1.89s/it, loss=0.167, lr=1e-5] Steps:  11%|█         | 1645/15001 [1:02:57<6:46:11,  1.82s/it, loss=0.167, lr=1e-5]Steps:  11%|█         | 1645/15001 [1:02:58<6:46:11,  1.82s/it, loss=0.0158, lr=1e-5]Steps:  11%|█         | 1646/15001 [1:02:59<7:08:17,  1.92s/it, loss=0.0158, lr=1e-5]Steps:  11%|█         | 1646/15001 [1:02:59<7:08:17,  1.92s/it, loss=0.128, lr=1e-5] Steps:  11%|█         | 1647/15001 [1:03:01<6:52:15,  1.85s/it, loss=0.128, lr=1e-5]Steps:  11%|█         | 1647/15001 [1:03:01<6:52:15,  1.85s/it, loss=0.128, lr=1e-5]Steps:  11%|█         | 1648/15001 [1:03:03<7:05:21,  1.91s/it, loss=0.128, lr=1e-5]Steps:  11%|█         | 1648/15001 [1:03:03<7:05:21,  1.91s/it, loss=0.262, lr=1e-5]Steps:  11%|█         | 1649/15001 [1:03:05<6:59:42,  1.89s/it, loss=0.262, lr=1e-5]Steps:  11%|█         | 1649/15001 [1:03:05<6:59:42,  1.89s/it, loss=0.216, lr=1e-5]Steps:  11%|█         | 1650/15001 [1:03:06<6:36:44,  1.78s/it, loss=0.216, lr=1e-5]Steps:  11%|█         | 1650/15001 [1:03:07<6:36:44,  1.78s/it, loss=0.183, lr=1e-5]Steps:  11%|█         | 1651/15001 [1:03:08<6:54:46,  1.86s/it, loss=0.183, lr=1e-5]Steps:  11%|█         | 1651/15001 [1:03:09<6:54:46,  1.86s/it, loss=0.347, lr=1e-5]Steps:  11%|█         | 1652/15001 [1:03:10<6:47:57,  1.83s/it, loss=0.347, lr=1e-5]Steps:  11%|█         | 1652/15001 [1:03:10<6:47:57,  1.83s/it, loss=0.129, lr=1e-5]Steps:  11%|█         | 1653/15001 [1:03:12<6:48:02,  1.83s/it, loss=0.129, lr=1e-5]Steps:  11%|█         | 1653/15001 [1:03:12<6:48:02,  1.83s/it, loss=0.164, lr=1e-5]Steps:  11%|█         | 1654/15001 [1:03:14<6:46:38,  1.83s/it, loss=0.164, lr=1e-5]Steps:  11%|█         | 1654/15001 [1:03:14<6:46:38,  1.83s/it, loss=0.231, lr=1e-5]Steps:  11%|█         | 1655/15001 [1:03:15<6:29:09,  1.75s/it, loss=0.231, lr=1e-5]Steps:  11%|█         | 1655/15001 [1:03:16<6:29:09,  1.75s/it, loss=0.107, lr=1e-5]Steps:  11%|█         | 1656/15001 [1:03:17<6:26:35,  1.74s/it, loss=0.107, lr=1e-5]Steps:  11%|█         | 1656/15001 [1:03:18<6:26:35,  1.74s/it, loss=0.185, lr=1e-5]Steps:  11%|█         | 1657/15001 [1:03:19<7:04:49,  1.91s/it, loss=0.185, lr=1e-5]Steps:  11%|█         | 1657/15001 [1:03:20<7:04:49,  1.91s/it, loss=0.206, lr=1e-5]Steps:  11%|█         | 1658/15001 [1:03:21<6:48:47,  1.84s/it, loss=0.206, lr=1e-5]Steps:  11%|█         | 1658/15001 [1:03:22<6:48:47,  1.84s/it, loss=0.0797, lr=1e-5]Steps:  11%|█         | 1659/15001 [1:03:23<7:21:24,  1.99s/it, loss=0.0797, lr=1e-5]Steps:  11%|█         | 1659/15001 [1:03:24<7:21:24,  1.99s/it, loss=0.241, lr=1e-5] Steps:  11%|█         | 1660/15001 [1:03:26<7:26:47,  2.01s/it, loss=0.241, lr=1e-5]Steps:  11%|█         | 1660/15001 [1:03:26<7:26:47,  2.01s/it, loss=0.305, lr=1e-5]Steps:  11%|█         | 1661/15001 [1:03:28<7:30:46,  2.03s/it, loss=0.305, lr=1e-5]Steps:  11%|█         | 1661/15001 [1:03:28<7:30:46,  2.03s/it, loss=0.166, lr=1e-5]Steps:  11%|█         | 1662/15001 [1:03:30<7:35:21,  2.05s/it, loss=0.166, lr=1e-5]Steps:  11%|█         | 1662/15001 [1:03:30<7:35:21,  2.05s/it, loss=0.163, lr=1e-5]Steps:  11%|█         | 1663/15001 [1:03:32<7:23:24,  1.99s/it, loss=0.163, lr=1e-5]Steps:  11%|█         | 1663/15001 [1:03:32<7:23:24,  1.99s/it, loss=0.21, lr=1e-5] Steps:  11%|█         | 1664/15001 [1:03:33<6:57:06,  1.88s/it, loss=0.21, lr=1e-5]Steps:  11%|█         | 1664/15001 [1:03:34<6:57:06,  1.88s/it, loss=0.242, lr=1e-5]Steps:  11%|█         | 1665/15001 [1:03:35<6:52:22,  1.86s/it, loss=0.242, lr=1e-5]Steps:  11%|█         | 1665/15001 [1:03:35<6:52:22,  1.86s/it, loss=0.173, lr=1e-5]Steps:  11%|█         | 1666/15001 [1:03:37<7:04:33,  1.91s/it, loss=0.173, lr=1e-5]Steps:  11%|█         | 1666/15001 [1:03:37<7:04:33,  1.91s/it, loss=0.239, lr=1e-5]Steps:  11%|█         | 1667/15001 [1:03:39<6:46:38,  1.83s/it, loss=0.239, lr=1e-5]Steps:  11%|█         | 1667/15001 [1:03:39<6:46:38,  1.83s/it, loss=0.109, lr=1e-5]Steps:  11%|█         | 1668/15001 [1:03:41<6:46:48,  1.83s/it, loss=0.109, lr=1e-5]Steps:  11%|█         | 1668/15001 [1:03:41<6:46:48,  1.83s/it, loss=0.209, lr=1e-5]Steps:  11%|█         | 1669/15001 [1:03:42<6:51:42,  1.85s/it, loss=0.209, lr=1e-5]Steps:  11%|█         | 1669/15001 [1:03:43<6:51:42,  1.85s/it, loss=0.171, lr=1e-5]Steps:  11%|█         | 1670/15001 [1:03:44<6:55:54,  1.87s/it, loss=0.171, lr=1e-5]Steps:  11%|█         | 1670/15001 [1:03:44<6:55:54,  1.87s/it, loss=0.241, lr=1e-5]Steps:  11%|█         | 1671/15001 [1:03:46<6:51:25,  1.85s/it, loss=0.241, lr=1e-5]Steps:  11%|█         | 1671/15001 [1:03:46<6:51:25,  1.85s/it, loss=0.16, lr=1e-5] Steps:  11%|█         | 1672/15001 [1:03:48<6:40:39,  1.80s/it, loss=0.16, lr=1e-5]Steps:  11%|█         | 1672/15001 [1:03:48<6:40:39,  1.80s/it, loss=0.242, lr=1e-5]Steps:  11%|█         | 1673/15001 [1:03:50<6:49:56,  1.85s/it, loss=0.242, lr=1e-5]Steps:  11%|█         | 1673/15001 [1:03:50<6:49:56,  1.85s/it, loss=0.187, lr=1e-5]Steps:  11%|█         | 1674/15001 [1:03:52<6:54:44,  1.87s/it, loss=0.187, lr=1e-5]Steps:  11%|█         | 1674/15001 [1:03:52<6:54:44,  1.87s/it, loss=0.18, lr=1e-5] Steps:  11%|█         | 1675/15001 [1:03:54<6:54:22,  1.87s/it, loss=0.18, lr=1e-5]Steps:  11%|█         | 1675/15001 [1:03:54<6:54:22,  1.87s/it, loss=0.205, lr=1e-5]Steps:  11%|█         | 1676/15001 [1:03:55<6:50:54,  1.85s/it, loss=0.205, lr=1e-5]Steps:  11%|█         | 1676/15001 [1:03:56<6:50:54,  1.85s/it, loss=0.145, lr=1e-5]Steps:  11%|█         | 1677/15001 [1:03:57<7:02:23,  1.90s/it, loss=0.145, lr=1e-5]Steps:  11%|█         | 1677/15001 [1:03:58<7:02:23,  1.90s/it, loss=0.101, lr=1e-5]Steps:  11%|█         | 1678/15001 [1:03:59<7:01:41,  1.90s/it, loss=0.101, lr=1e-5]Steps:  11%|█         | 1678/15001 [1:03:59<7:01:41,  1.90s/it, loss=0.275, lr=1e-5]Steps:  11%|█         | 1679/15001 [1:04:01<6:50:58,  1.85s/it, loss=0.275, lr=1e-5]Steps:  11%|█         | 1679/15001 [1:04:01<6:50:58,  1.85s/it, loss=0.183, lr=1e-5]Steps:  11%|█         | 1680/15001 [1:04:03<7:15:19,  1.96s/it, loss=0.183, lr=1e-5]Steps:  11%|█         | 1680/15001 [1:04:03<7:15:19,  1.96s/it, loss=0.119, lr=1e-5]Steps:  11%|█         | 1681/15001 [1:04:05<7:24:57,  2.00s/it, loss=0.119, lr=1e-5]Steps:  11%|█         | 1681/15001 [1:04:05<7:24:57,  2.00s/it, loss=0.0633, lr=1e-5]Steps:  11%|█         | 1682/15001 [1:04:07<7:26:14,  2.01s/it, loss=0.0633, lr=1e-5]Steps:  11%|█         | 1682/15001 [1:04:07<7:26:14,  2.01s/it, loss=0.201, lr=1e-5] Steps:  11%|█         | 1683/15001 [1:04:09<7:08:05,  1.93s/it, loss=0.201, lr=1e-5]Steps:  11%|█         | 1683/15001 [1:04:10<7:08:05,  1.93s/it, loss=0.0505, lr=1e-5]Steps:  11%|█         | 1684/15001 [1:04:11<7:37:03,  2.06s/it, loss=0.0505, lr=1e-5]Steps:  11%|█         | 1684/15001 [1:04:12<7:37:03,  2.06s/it, loss=0.239, lr=1e-5] Steps:  11%|█         | 1685/15001 [1:04:14<7:35:28,  2.05s/it, loss=0.239, lr=1e-5]Steps:  11%|█         | 1685/15001 [1:04:14<7:35:28,  2.05s/it, loss=0.136, lr=1e-5]Steps:  11%|█         | 1686/15001 [1:04:15<7:26:27,  2.01s/it, loss=0.136, lr=1e-5]Steps:  11%|█         | 1686/15001 [1:04:15<7:26:27,  2.01s/it, loss=0.111, lr=1e-5]Steps:  11%|█         | 1687/15001 [1:04:17<6:51:00,  1.85s/it, loss=0.111, lr=1e-5]Steps:  11%|█         | 1687/15001 [1:04:17<6:51:00,  1.85s/it, loss=0.114, lr=1e-5]Steps:  11%|█▏        | 1688/15001 [1:04:19<7:08:32,  1.93s/it, loss=0.114, lr=1e-5]Steps:  11%|█▏        | 1688/15001 [1:04:19<7:08:32,  1.93s/it, loss=0.181, lr=1e-5]Steps:  11%|█▏        | 1689/15001 [1:04:21<7:06:40,  1.92s/it, loss=0.181, lr=1e-5]Steps:  11%|█▏        | 1689/15001 [1:04:21<7:06:40,  1.92s/it, loss=0.241, lr=1e-5]Steps:  11%|█▏        | 1690/15001 [1:04:23<6:46:34,  1.83s/it, loss=0.241, lr=1e-5]Steps:  11%|█▏        | 1690/15001 [1:04:23<6:46:34,  1.83s/it, loss=0.134, lr=1e-5]Steps:  11%|█▏        | 1691/15001 [1:04:24<6:52:02,  1.86s/it, loss=0.134, lr=1e-5]Steps:  11%|█▏        | 1691/15001 [1:04:25<6:52:02,  1.86s/it, loss=0.138, lr=1e-5]Steps:  11%|█▏        | 1692/15001 [1:04:26<6:50:46,  1.85s/it, loss=0.138, lr=1e-5]Steps:  11%|█▏        | 1692/15001 [1:04:26<6:50:46,  1.85s/it, loss=0.186, lr=1e-5]Steps:  11%|█▏        | 1693/15001 [1:04:28<6:53:46,  1.87s/it, loss=0.186, lr=1e-5]Steps:  11%|█▏        | 1693/15001 [1:04:28<6:53:46,  1.87s/it, loss=0.0585, lr=1e-5]Steps:  11%|█▏        | 1694/15001 [1:04:30<6:47:01,  1.84s/it, loss=0.0585, lr=1e-5]Steps:  11%|█▏        | 1694/15001 [1:04:30<6:47:01,  1.84s/it, loss=0.144, lr=1e-5] Steps:  11%|█▏        | 1695/15001 [1:04:32<6:50:14,  1.85s/it, loss=0.144, lr=1e-5]Steps:  11%|█▏        | 1695/15001 [1:04:32<6:50:14,  1.85s/it, loss=0.103, lr=1e-5]Steps:  11%|█▏        | 1696/15001 [1:04:34<7:05:35,  1.92s/it, loss=0.103, lr=1e-5]Steps:  11%|█▏        | 1696/15001 [1:04:34<7:05:35,  1.92s/it, loss=0.209, lr=1e-5]Steps:  11%|█▏        | 1697/15001 [1:04:36<6:52:17,  1.86s/it, loss=0.209, lr=1e-5]Steps:  11%|█▏        | 1697/15001 [1:04:36<6:52:17,  1.86s/it, loss=0.139, lr=1e-5]Steps:  11%|█▏        | 1698/15001 [1:04:37<6:46:35,  1.83s/it, loss=0.139, lr=1e-5]Steps:  11%|█▏        | 1698/15001 [1:04:38<6:46:35,  1.83s/it, loss=0.285, lr=1e-5]Steps:  11%|█▏        | 1699/15001 [1:04:39<6:42:08,  1.81s/it, loss=0.285, lr=1e-5]Steps:  11%|█▏        | 1699/15001 [1:04:39<6:42:08,  1.81s/it, loss=0.135, lr=1e-5]Steps:  11%|█▏        | 1700/15001 [1:04:41<6:46:19,  1.83s/it, loss=0.135, lr=1e-5]Steps:  11%|█▏        | 1700/15001 [1:04:41<6:46:19,  1.83s/it, loss=0.246, lr=1e-5]Steps:  11%|█▏        | 1701/15001 [1:04:43<6:40:00,  1.80s/it, loss=0.246, lr=1e-5]Steps:  11%|█▏        | 1701/15001 [1:04:43<6:40:00,  1.80s/it, loss=0.0414, lr=1e-5]Steps:  11%|█▏        | 1702/15001 [1:04:45<6:52:23,  1.86s/it, loss=0.0414, lr=1e-5]Steps:  11%|█▏        | 1702/15001 [1:04:45<6:52:23,  1.86s/it, loss=0.0908, lr=1e-5]Steps:  11%|█▏        | 1703/15001 [1:04:47<7:03:07,  1.91s/it, loss=0.0908, lr=1e-5]Steps:  11%|█▏        | 1703/15001 [1:04:47<7:03:07,  1.91s/it, loss=0.139, lr=1e-5] Steps:  11%|█▏        | 1704/15001 [1:04:49<7:09:15,  1.94s/it, loss=0.139, lr=1e-5]Steps:  11%|█▏        | 1704/15001 [1:04:49<7:09:15,  1.94s/it, loss=0.217, lr=1e-5]Steps:  11%|█▏        | 1705/15001 [1:04:51<7:12:54,  1.95s/it, loss=0.217, lr=1e-5]Steps:  11%|█▏        | 1705/15001 [1:04:51<7:12:54,  1.95s/it, loss=0.0372, lr=1e-5]Steps:  11%|█▏        | 1706/15001 [1:04:53<7:30:33,  2.03s/it, loss=0.0372, lr=1e-5]Steps:  11%|█▏        | 1706/15001 [1:04:53<7:30:33,  2.03s/it, loss=0.284, lr=1e-5] Steps:  11%|█▏        | 1707/15001 [1:04:55<7:13:02,  1.95s/it, loss=0.284, lr=1e-5]Steps:  11%|█▏        | 1707/15001 [1:04:55<7:13:02,  1.95s/it, loss=0.236, lr=1e-5]Steps:  11%|█▏        | 1708/15001 [1:04:57<7:12:54,  1.95s/it, loss=0.236, lr=1e-5]Steps:  11%|█▏        | 1708/15001 [1:04:57<7:12:54,  1.95s/it, loss=0.112, lr=1e-5]Steps:  11%|█▏        | 1709/15001 [1:04:59<6:59:06,  1.89s/it, loss=0.112, lr=1e-5]Steps:  11%|█▏        | 1709/15001 [1:04:59<6:59:06,  1.89s/it, loss=0.17, lr=1e-5] Steps:  11%|█▏        | 1710/15001 [1:05:00<7:00:17,  1.90s/it, loss=0.17, lr=1e-5]Steps:  11%|█▏        | 1710/15001 [1:05:00<7:00:17,  1.90s/it, loss=0.104, lr=1e-5]Steps:  11%|█▏        | 1711/15001 [1:05:02<7:04:01,  1.91s/it, loss=0.104, lr=1e-5]Steps:  11%|█▏        | 1711/15001 [1:05:02<7:04:01,  1.91s/it, loss=0.0729, lr=1e-5]Steps:  11%|█▏        | 1712/15001 [1:05:04<6:54:11,  1.87s/it, loss=0.0729, lr=1e-5]Steps:  11%|█▏        | 1712/15001 [1:05:04<6:54:11,  1.87s/it, loss=0.159, lr=1e-5] Steps:  11%|█▏        | 1713/15001 [1:05:06<6:43:06,  1.82s/it, loss=0.159, lr=1e-5]Steps:  11%|█▏        | 1713/15001 [1:05:06<6:43:06,  1.82s/it, loss=0.226, lr=1e-5]Steps:  11%|█▏        | 1714/15001 [1:05:08<6:37:50,  1.80s/it, loss=0.226, lr=1e-5]Steps:  11%|█▏        | 1714/15001 [1:05:08<6:37:50,  1.80s/it, loss=0.169, lr=1e-5]Steps:  11%|█▏        | 1715/15001 [1:05:09<6:42:33,  1.82s/it, loss=0.169, lr=1e-5]Steps:  11%|█▏        | 1715/15001 [1:05:10<6:42:33,  1.82s/it, loss=0.139, lr=1e-5]Steps:  11%|█▏        | 1716/15001 [1:05:12<7:01:06,  1.90s/it, loss=0.139, lr=1e-5]Steps:  11%|█▏        | 1716/15001 [1:05:12<7:01:06,  1.90s/it, loss=0.126, lr=1e-5]Steps:  11%|█▏        | 1717/15001 [1:05:13<6:57:49,  1.89s/it, loss=0.126, lr=1e-5]Steps:  11%|█▏        | 1717/15001 [1:05:13<6:57:49,  1.89s/it, loss=0.368, lr=1e-5]Steps:  11%|█▏        | 1718/15001 [1:05:15<6:54:23,  1.87s/it, loss=0.368, lr=1e-5]Steps:  11%|█▏        | 1718/15001 [1:05:15<6:54:23,  1.87s/it, loss=0.105, lr=1e-5]Steps:  11%|█▏        | 1719/15001 [1:05:17<6:46:45,  1.84s/it, loss=0.105, lr=1e-5]Steps:  11%|█▏        | 1719/15001 [1:05:17<6:46:45,  1.84s/it, loss=0.164, lr=1e-5]Steps:  11%|█▏        | 1720/15001 [1:05:19<6:46:03,  1.83s/it, loss=0.164, lr=1e-5]Steps:  11%|█▏        | 1720/15001 [1:05:19<6:46:03,  1.83s/it, loss=0.294, lr=1e-5]Steps:  11%|█▏        | 1721/15001 [1:05:20<6:35:01,  1.78s/it, loss=0.294, lr=1e-5]Steps:  11%|█▏        | 1721/15001 [1:05:21<6:35:01,  1.78s/it, loss=0.235, lr=1e-5]Steps:  11%|█▏        | 1722/15001 [1:05:22<6:29:13,  1.76s/it, loss=0.235, lr=1e-5]Steps:  11%|█▏        | 1722/15001 [1:05:23<6:29:13,  1.76s/it, loss=0.114, lr=1e-5]Steps:  11%|█▏        | 1723/15001 [1:05:24<6:31:36,  1.77s/it, loss=0.114, lr=1e-5]Steps:  11%|█▏        | 1723/15001 [1:05:24<6:31:36,  1.77s/it, loss=0.0807, lr=1e-5]Steps:  11%|█▏        | 1724/15001 [1:05:26<6:46:25,  1.84s/it, loss=0.0807, lr=1e-5]Steps:  11%|█▏        | 1724/15001 [1:05:26<6:46:25,  1.84s/it, loss=0.359, lr=1e-5] Steps:  11%|█▏        | 1725/15001 [1:05:28<6:56:23,  1.88s/it, loss=0.359, lr=1e-5]Steps:  11%|█▏        | 1725/15001 [1:05:28<6:56:23,  1.88s/it, loss=0.131, lr=1e-5]Steps:  12%|█▏        | 1726/15001 [1:05:30<6:43:43,  1.82s/it, loss=0.131, lr=1e-5]Steps:  12%|█▏        | 1726/15001 [1:05:30<6:43:43,  1.82s/it, loss=0.143, lr=1e-5]Steps:  12%|█▏        | 1727/15001 [1:05:32<7:21:57,  2.00s/it, loss=0.143, lr=1e-5]Steps:  12%|█▏        | 1727/15001 [1:05:32<7:21:57,  2.00s/it, loss=0.111, lr=1e-5]Steps:  12%|█▏        | 1728/15001 [1:05:34<7:27:25,  2.02s/it, loss=0.111, lr=1e-5]Steps:  12%|█▏        | 1728/15001 [1:05:34<7:27:25,  2.02s/it, loss=0.0484, lr=1e-5]Steps:  12%|█▏        | 1729/15001 [1:05:36<7:34:07,  2.05s/it, loss=0.0484, lr=1e-5]Steps:  12%|█▏        | 1729/15001 [1:05:36<7:34:07,  2.05s/it, loss=0.1, lr=1e-5]   Steps:  12%|█▏        | 1730/15001 [1:05:38<7:24:09,  2.01s/it, loss=0.1, lr=1e-5]Steps:  12%|█▏        | 1730/15001 [1:05:38<7:24:09,  2.01s/it, loss=0.331, lr=1e-5]Steps:  12%|█▏        | 1731/15001 [1:05:40<7:08:50,  1.94s/it, loss=0.331, lr=1e-5]Steps:  12%|█▏        | 1731/15001 [1:05:40<7:08:50,  1.94s/it, loss=0.201, lr=1e-5]Steps:  12%|█▏        | 1732/15001 [1:05:42<7:09:46,  1.94s/it, loss=0.201, lr=1e-5]Steps:  12%|█▏        | 1732/15001 [1:05:42<7:09:46,  1.94s/it, loss=0.112, lr=1e-5]Steps:  12%|█▏        | 1733/15001 [1:05:44<7:14:28,  1.96s/it, loss=0.112, lr=1e-5]Steps:  12%|█▏        | 1733/15001 [1:05:44<7:14:28,  1.96s/it, loss=0.116, lr=1e-5]Steps:  12%|█▏        | 1734/15001 [1:05:46<7:09:08,  1.94s/it, loss=0.116, lr=1e-5]Steps:  12%|█▏        | 1734/15001 [1:05:46<7:09:08,  1.94s/it, loss=0.156, lr=1e-5]Steps:  12%|█▏        | 1735/15001 [1:05:47<6:52:46,  1.87s/it, loss=0.156, lr=1e-5]Steps:  12%|█▏        | 1735/15001 [1:05:48<6:52:46,  1.87s/it, loss=0.161, lr=1e-5]Steps:  12%|█▏        | 1736/15001 [1:05:49<6:42:07,  1.82s/it, loss=0.161, lr=1e-5]Steps:  12%|█▏        | 1736/15001 [1:05:49<6:42:07,  1.82s/it, loss=0.0217, lr=1e-5]Steps:  12%|█▏        | 1737/15001 [1:05:51<6:43:06,  1.82s/it, loss=0.0217, lr=1e-5]Steps:  12%|█▏        | 1737/15001 [1:05:51<6:43:06,  1.82s/it, loss=0.0734, lr=1e-5]Steps:  12%|█▏        | 1738/15001 [1:05:53<7:02:04,  1.91s/it, loss=0.0734, lr=1e-5]Steps:  12%|█▏        | 1738/15001 [1:05:53<7:02:04,  1.91s/it, loss=0.124, lr=1e-5] Steps:  12%|█▏        | 1739/15001 [1:05:55<6:49:01,  1.85s/it, loss=0.124, lr=1e-5]Steps:  12%|█▏        | 1739/15001 [1:05:55<6:49:01,  1.85s/it, loss=0.0867, lr=1e-5]Steps:  12%|█▏        | 1740/15001 [1:05:56<6:32:07,  1.77s/it, loss=0.0867, lr=1e-5]Steps:  12%|█▏        | 1740/15001 [1:05:57<6:32:07,  1.77s/it, loss=0.331, lr=1e-5] Steps:  12%|█▏        | 1741/15001 [1:05:59<7:00:09,  1.90s/it, loss=0.331, lr=1e-5]Steps:  12%|█▏        | 1741/15001 [1:05:59<7:00:09,  1.90s/it, loss=0.304, lr=1e-5]Steps:  12%|█▏        | 1742/15001 [1:06:00<6:31:33,  1.77s/it, loss=0.304, lr=1e-5]Steps:  12%|█▏        | 1742/15001 [1:06:01<6:31:33,  1.77s/it, loss=0.0775, lr=1e-5]Steps:  12%|█▏        | 1743/15001 [1:06:02<6:59:41,  1.90s/it, loss=0.0775, lr=1e-5]Steps:  12%|█▏        | 1743/15001 [1:06:02<6:59:41,  1.90s/it, loss=0.211, lr=1e-5] Steps:  12%|█▏        | 1744/15001 [1:06:04<6:32:08,  1.77s/it, loss=0.211, lr=1e-5]Steps:  12%|█▏        | 1744/15001 [1:06:04<6:32:08,  1.77s/it, loss=0.168, lr=1e-5]Steps:  12%|█▏        | 1745/15001 [1:06:06<6:37:07,  1.80s/it, loss=0.168, lr=1e-5]Steps:  12%|█▏        | 1745/15001 [1:06:06<6:37:07,  1.80s/it, loss=0.194, lr=1e-5]Steps:  12%|█▏        | 1746/15001 [1:06:08<6:41:45,  1.82s/it, loss=0.194, lr=1e-5]Steps:  12%|█▏        | 1746/15001 [1:06:08<6:41:45,  1.82s/it, loss=0.148, lr=1e-5]Steps:  12%|█▏        | 1747/15001 [1:06:10<7:01:07,  1.91s/it, loss=0.148, lr=1e-5]Steps:  12%|█▏        | 1747/15001 [1:06:10<7:01:07,  1.91s/it, loss=0.173, lr=1e-5]Steps:  12%|█▏        | 1748/15001 [1:06:12<7:06:03,  1.93s/it, loss=0.173, lr=1e-5]Steps:  12%|█▏        | 1748/15001 [1:06:12<7:06:03,  1.93s/it, loss=0.247, lr=1e-5]Steps:  12%|█▏        | 1749/15001 [1:06:13<7:01:19,  1.91s/it, loss=0.247, lr=1e-5]Steps:  12%|█▏        | 1749/15001 [1:06:14<7:01:19,  1.91s/it, loss=0.212, lr=1e-5]Steps:  12%|█▏        | 1750/15001 [1:06:15<7:08:31,  1.94s/it, loss=0.212, lr=1e-5]Steps:  12%|█▏        | 1750/15001 [1:06:16<7:08:31,  1.94s/it, loss=0.391, lr=1e-5]Steps:  12%|█▏        | 1751/15001 [1:06:18<7:25:03,  2.02s/it, loss=0.391, lr=1e-5]Steps:  12%|█▏        | 1751/15001 [1:06:18<7:25:03,  2.02s/it, loss=0.0885, lr=1e-5]Steps:  12%|█▏        | 1752/15001 [1:06:20<7:39:44,  2.08s/it, loss=0.0885, lr=1e-5]Steps:  12%|█▏        | 1752/15001 [1:06:20<7:39:44,  2.08s/it, loss=0.0899, lr=1e-5]Steps:  12%|█▏        | 1753/15001 [1:06:22<7:32:57,  2.05s/it, loss=0.0899, lr=1e-5]Steps:  12%|█▏        | 1753/15001 [1:06:22<7:32:57,  2.05s/it, loss=0.258, lr=1e-5] Steps:  12%|█▏        | 1754/15001 [1:06:24<7:07:21,  1.94s/it, loss=0.258, lr=1e-5]Steps:  12%|█▏        | 1754/15001 [1:06:24<7:07:21,  1.94s/it, loss=0.129, lr=1e-5]Steps:  12%|█▏        | 1755/15001 [1:06:26<7:10:31,  1.95s/it, loss=0.129, lr=1e-5]Steps:  12%|█▏        | 1755/15001 [1:06:26<7:10:31,  1.95s/it, loss=0.155, lr=1e-5]Steps:  12%|█▏        | 1756/15001 [1:06:27<6:58:34,  1.90s/it, loss=0.155, lr=1e-5]Steps:  12%|█▏        | 1756/15001 [1:06:27<6:58:34,  1.90s/it, loss=0.146, lr=1e-5]Steps:  12%|█▏        | 1757/15001 [1:06:29<7:00:05,  1.90s/it, loss=0.146, lr=1e-5]Steps:  12%|█▏        | 1757/15001 [1:06:29<7:00:05,  1.90s/it, loss=0.12, lr=1e-5] Steps:  12%|█▏        | 1758/15001 [1:06:31<6:42:39,  1.82s/it, loss=0.12, lr=1e-5]Steps:  12%|█▏        | 1758/15001 [1:06:31<6:42:39,  1.82s/it, loss=0.298, lr=1e-5]Steps:  12%|█▏        | 1759/15001 [1:06:33<6:49:32,  1.86s/it, loss=0.298, lr=1e-5]Steps:  12%|█▏        | 1759/15001 [1:06:33<6:49:32,  1.86s/it, loss=0.253, lr=1e-5]Steps:  12%|█▏        | 1760/15001 [1:06:35<6:46:16,  1.84s/it, loss=0.253, lr=1e-5]Steps:  12%|█▏        | 1760/15001 [1:06:35<6:46:16,  1.84s/it, loss=0.166, lr=1e-5]Steps:  12%|█▏        | 1761/15001 [1:06:36<6:42:30,  1.82s/it, loss=0.166, lr=1e-5]Steps:  12%|█▏        | 1761/15001 [1:06:37<6:42:30,  1.82s/it, loss=0.199, lr=1e-5]Steps:  12%|█▏        | 1762/15001 [1:06:38<6:39:36,  1.81s/it, loss=0.199, lr=1e-5]Steps:  12%|█▏        | 1762/15001 [1:06:39<6:39:36,  1.81s/it, loss=0.26, lr=1e-5] Steps:  12%|█▏        | 1763/15001 [1:06:40<7:04:59,  1.93s/it, loss=0.26, lr=1e-5]Steps:  12%|█▏        | 1763/15001 [1:06:41<7:04:59,  1.93s/it, loss=0.121, lr=1e-5]Steps:  12%|█▏        | 1764/15001 [1:06:42<6:51:14,  1.86s/it, loss=0.121, lr=1e-5]Steps:  12%|█▏        | 1764/15001 [1:06:42<6:51:14,  1.86s/it, loss=0.184, lr=1e-5]Steps:  12%|█▏        | 1765/15001 [1:06:44<6:37:30,  1.80s/it, loss=0.184, lr=1e-5]Steps:  12%|█▏        | 1765/15001 [1:06:44<6:37:30,  1.80s/it, loss=0.0652, lr=1e-5]Steps:  12%|█▏        | 1766/15001 [1:06:46<7:02:38,  1.92s/it, loss=0.0652, lr=1e-5]Steps:  12%|█▏        | 1766/15001 [1:06:46<7:02:38,  1.92s/it, loss=0.36, lr=1e-5]  Steps:  12%|█▏        | 1767/15001 [1:06:48<6:40:49,  1.82s/it, loss=0.36, lr=1e-5]Steps:  12%|█▏        | 1767/15001 [1:06:48<6:40:49,  1.82s/it, loss=0.165, lr=1e-5]Steps:  12%|█▏        | 1768/15001 [1:06:50<7:04:45,  1.93s/it, loss=0.165, lr=1e-5]Steps:  12%|█▏        | 1768/15001 [1:06:50<7:04:45,  1.93s/it, loss=0.0936, lr=1e-5]Steps:  12%|█▏        | 1769/15001 [1:06:51<6:36:02,  1.80s/it, loss=0.0936, lr=1e-5]Steps:  12%|█▏        | 1769/15001 [1:06:51<6:36:02,  1.80s/it, loss=0.0841, lr=1e-5]Steps:  12%|█▏        | 1770/15001 [1:06:53<6:52:47,  1.87s/it, loss=0.0841, lr=1e-5]Steps:  12%|█▏        | 1770/15001 [1:06:53<6:52:47,  1.87s/it, loss=0.246, lr=1e-5] Steps:  12%|█▏        | 1771/15001 [1:06:55<6:55:12,  1.88s/it, loss=0.246, lr=1e-5]Steps:  12%|█▏        | 1771/15001 [1:06:55<6:55:12,  1.88s/it, loss=0.238, lr=1e-5]Steps:  12%|█▏        | 1772/15001 [1:06:57<6:58:27,  1.90s/it, loss=0.238, lr=1e-5]Steps:  12%|█▏        | 1772/15001 [1:06:57<6:58:27,  1.90s/it, loss=0.0687, lr=1e-5]Steps:  12%|█▏        | 1773/15001 [1:06:59<7:05:11,  1.93s/it, loss=0.0687, lr=1e-5]Steps:  12%|█▏        | 1773/15001 [1:06:59<7:05:11,  1.93s/it, loss=0.158, lr=1e-5] Steps:  12%|█▏        | 1774/15001 [1:07:01<7:21:09,  2.00s/it, loss=0.158, lr=1e-5]Steps:  12%|█▏        | 1774/15001 [1:07:01<7:21:09,  2.00s/it, loss=0.157, lr=1e-5]Steps:  12%|█▏        | 1775/15001 [1:07:03<6:55:06,  1.88s/it, loss=0.157, lr=1e-5]Steps:  12%|█▏        | 1775/15001 [1:07:03<6:55:06,  1.88s/it, loss=0.111, lr=1e-5]Steps:  12%|█▏        | 1776/15001 [1:07:05<7:01:10,  1.91s/it, loss=0.111, lr=1e-5]Steps:  12%|█▏        | 1776/15001 [1:07:05<7:01:10,  1.91s/it, loss=0.285, lr=1e-5]Steps:  12%|█▏        | 1777/15001 [1:07:07<6:55:45,  1.89s/it, loss=0.285, lr=1e-5]Steps:  12%|█▏        | 1777/15001 [1:07:07<6:55:45,  1.89s/it, loss=0.0734, lr=1e-5]Steps:  12%|█▏        | 1778/15001 [1:07:08<6:49:27,  1.86s/it, loss=0.0734, lr=1e-5]Steps:  12%|█▏        | 1778/15001 [1:07:09<6:49:27,  1.86s/it, loss=0.172, lr=1e-5] Steps:  12%|█▏        | 1779/15001 [1:07:11<7:08:19,  1.94s/it, loss=0.172, lr=1e-5]Steps:  12%|█▏        | 1779/15001 [1:07:11<7:08:19,  1.94s/it, loss=0.146, lr=1e-5]Steps:  12%|█▏        | 1780/15001 [1:07:12<6:52:09,  1.87s/it, loss=0.146, lr=1e-5]Steps:  12%|█▏        | 1780/15001 [1:07:13<6:52:09,  1.87s/it, loss=0.0822, lr=1e-5]Steps:  12%|█▏        | 1781/15001 [1:07:14<7:12:34,  1.96s/it, loss=0.0822, lr=1e-5]Steps:  12%|█▏        | 1781/15001 [1:07:15<7:12:34,  1.96s/it, loss=0.116, lr=1e-5] Steps:  12%|█▏        | 1782/15001 [1:07:16<7:05:51,  1.93s/it, loss=0.116, lr=1e-5]Steps:  12%|█▏        | 1782/15001 [1:07:16<7:05:51,  1.93s/it, loss=0.155, lr=1e-5]Steps:  12%|█▏        | 1783/15001 [1:07:18<6:54:04,  1.88s/it, loss=0.155, lr=1e-5]Steps:  12%|█▏        | 1783/15001 [1:07:18<6:54:04,  1.88s/it, loss=0.253, lr=1e-5]Steps:  12%|█▏        | 1784/15001 [1:07:20<6:57:41,  1.90s/it, loss=0.253, lr=1e-5]Steps:  12%|█▏        | 1784/15001 [1:07:20<6:57:41,  1.90s/it, loss=0.224, lr=1e-5]Steps:  12%|█▏        | 1785/15001 [1:07:22<6:49:26,  1.86s/it, loss=0.224, lr=1e-5]Steps:  12%|█▏        | 1785/15001 [1:07:22<6:49:26,  1.86s/it, loss=0.247, lr=1e-5]Steps:  12%|█▏        | 1786/15001 [1:07:24<6:51:03,  1.87s/it, loss=0.247, lr=1e-5]Steps:  12%|█▏        | 1786/15001 [1:07:24<6:51:03,  1.87s/it, loss=0.151, lr=1e-5]Steps:  12%|█▏        | 1787/15001 [1:07:25<6:44:36,  1.84s/it, loss=0.151, lr=1e-5]Steps:  12%|█▏        | 1787/15001 [1:07:26<6:44:36,  1.84s/it, loss=0.214, lr=1e-5]Steps:  12%|█▏        | 1788/15001 [1:07:27<6:49:40,  1.86s/it, loss=0.214, lr=1e-5]Steps:  12%|█▏        | 1788/15001 [1:07:27<6:49:40,  1.86s/it, loss=0.0597, lr=1e-5]Steps:  12%|█▏        | 1789/15001 [1:07:29<6:30:50,  1.77s/it, loss=0.0597, lr=1e-5]Steps:  12%|█▏        | 1789/15001 [1:07:29<6:30:50,  1.77s/it, loss=0.0549, lr=1e-5]Steps:  12%|█▏        | 1790/15001 [1:07:31<7:03:49,  1.92s/it, loss=0.0549, lr=1e-5]Steps:  12%|█▏        | 1790/15001 [1:07:31<7:03:49,  1.92s/it, loss=0.281, lr=1e-5] Steps:  12%|█▏        | 1791/15001 [1:07:33<6:37:37,  1.81s/it, loss=0.281, lr=1e-5]Steps:  12%|█▏        | 1791/15001 [1:07:33<6:37:37,  1.81s/it, loss=0.104, lr=1e-5]Steps:  12%|█▏        | 1792/15001 [1:07:35<6:58:50,  1.90s/it, loss=0.104, lr=1e-5]Steps:  12%|█▏        | 1792/15001 [1:07:35<6:58:50,  1.90s/it, loss=0.393, lr=1e-5]Steps:  12%|█▏        | 1793/15001 [1:07:37<6:51:20,  1.87s/it, loss=0.393, lr=1e-5]Steps:  12%|█▏        | 1793/15001 [1:07:37<6:51:20,  1.87s/it, loss=0.253, lr=1e-5]Steps:  12%|█▏        | 1794/15001 [1:07:39<7:12:35,  1.97s/it, loss=0.253, lr=1e-5]Steps:  12%|█▏        | 1794/15001 [1:07:39<7:12:35,  1.97s/it, loss=0.131, lr=1e-5]Steps:  12%|█▏        | 1795/15001 [1:07:41<7:21:26,  2.01s/it, loss=0.131, lr=1e-5]Steps:  12%|█▏        | 1795/15001 [1:07:41<7:21:26,  2.01s/it, loss=0.216, lr=1e-5]Steps:  12%|█▏        | 1796/15001 [1:07:43<7:15:18,  1.98s/it, loss=0.216, lr=1e-5]Steps:  12%|█▏        | 1796/15001 [1:07:43<7:15:18,  1.98s/it, loss=0.144, lr=1e-5]Steps:  12%|█▏        | 1797/15001 [1:07:45<7:20:34,  2.00s/it, loss=0.144, lr=1e-5]Steps:  12%|█▏        | 1797/15001 [1:07:45<7:20:34,  2.00s/it, loss=0.167, lr=1e-5]Steps:  12%|█▏        | 1798/15001 [1:07:47<7:13:17,  1.97s/it, loss=0.167, lr=1e-5]Steps:  12%|█▏        | 1798/15001 [1:07:47<7:13:17,  1.97s/it, loss=0.364, lr=1e-5]Steps:  12%|█▏        | 1799/15001 [1:07:49<7:14:04,  1.97s/it, loss=0.364, lr=1e-5]Steps:  12%|█▏        | 1799/15001 [1:07:49<7:14:04,  1.97s/it, loss=0.128, lr=1e-5]Steps:  12%|█▏        | 1800/15001 [1:07:51<6:59:17,  1.91s/it, loss=0.128, lr=1e-5]Steps:  12%|█▏        | 1800/15001 [1:07:51<6:59:17,  1.91s/it, loss=0.0912, lr=1e-5]Steps:  12%|█▏        | 1801/15001 [1:07:52<7:01:10,  1.91s/it, loss=0.0912, lr=1e-5]Steps:  12%|█▏        | 1801/15001 [1:07:53<7:01:10,  1.91s/it, loss=0.0695, lr=1e-5]Steps:  12%|█▏        | 1802/15001 [1:07:54<6:51:45,  1.87s/it, loss=0.0695, lr=1e-5]Steps:  12%|█▏        | 1802/15001 [1:07:54<6:51:45,  1.87s/it, loss=0.122, lr=1e-5] Steps:  12%|█▏        | 1803/15001 [1:07:56<6:42:29,  1.83s/it, loss=0.122, lr=1e-5]Steps:  12%|█▏        | 1803/15001 [1:07:56<6:42:29,  1.83s/it, loss=0.219, lr=1e-5]Steps:  12%|█▏        | 1804/15001 [1:07:58<6:49:15,  1.86s/it, loss=0.219, lr=1e-5]Steps:  12%|█▏        | 1804/15001 [1:07:58<6:49:15,  1.86s/it, loss=0.357, lr=1e-5]Steps:  12%|█▏        | 1805/15001 [1:08:00<6:52:55,  1.88s/it, loss=0.357, lr=1e-5]Steps:  12%|█▏        | 1805/15001 [1:08:00<6:52:55,  1.88s/it, loss=0.187, lr=1e-5]Steps:  12%|█▏        | 1806/15001 [1:08:01<6:31:21,  1.78s/it, loss=0.187, lr=1e-5]Steps:  12%|█▏        | 1806/15001 [1:08:02<6:31:21,  1.78s/it, loss=0.234, lr=1e-5]Steps:  12%|█▏        | 1807/15001 [1:08:03<6:45:04,  1.84s/it, loss=0.234, lr=1e-5]Steps:  12%|█▏        | 1807/15001 [1:08:04<6:45:04,  1.84s/it, loss=0.208, lr=1e-5]Steps:  12%|█▏        | 1808/15001 [1:08:05<6:52:29,  1.88s/it, loss=0.208, lr=1e-5]Steps:  12%|█▏        | 1808/15001 [1:08:05<6:52:29,  1.88s/it, loss=0.117, lr=1e-5]Steps:  12%|█▏        | 1809/15001 [1:08:07<6:34:45,  1.80s/it, loss=0.117, lr=1e-5]Steps:  12%|█▏        | 1809/15001 [1:08:07<6:34:45,  1.80s/it, loss=0.209, lr=1e-5]Steps:  12%|█▏        | 1810/15001 [1:08:09<6:34:35,  1.79s/it, loss=0.209, lr=1e-5]Steps:  12%|█▏        | 1810/15001 [1:08:09<6:34:35,  1.79s/it, loss=0.136, lr=1e-5]Steps:  12%|█▏        | 1811/15001 [1:08:11<6:55:29,  1.89s/it, loss=0.136, lr=1e-5]Steps:  12%|���▏        | 1811/15001 [1:08:11<6:55:29,  1.89s/it, loss=0.16, lr=1e-5] Steps:  12%|█▏        | 1812/15001 [1:08:13<6:49:56,  1.86s/it, loss=0.16, lr=1e-5]Steps:  12%|█▏        | 1812/15001 [1:08:13<6:49:56,  1.86s/it, loss=0.0521, lr=1e-5]Steps:  12%|█▏        | 1813/15001 [1:08:14<6:45:38,  1.85s/it, loss=0.0521, lr=1e-5]Steps:  12%|█▏        | 1813/15001 [1:08:14<6:45:38,  1.85s/it, loss=0.169, lr=1e-5] Steps:  12%|█▏        | 1814/15001 [1:08:16<6:33:52,  1.79s/it, loss=0.169, lr=1e-5]Steps:  12%|█▏        | 1814/15001 [1:08:16<6:33:52,  1.79s/it, loss=0.202, lr=1e-5]Steps:  12%|█▏        | 1815/15001 [1:08:18<6:30:03,  1.77s/it, loss=0.202, lr=1e-5]Steps:  12%|█▏        | 1815/15001 [1:08:18<6:30:03,  1.77s/it, loss=0.265, lr=1e-5]Steps:  12%|█▏        | 1816/15001 [1:08:20<6:38:30,  1.81s/it, loss=0.265, lr=1e-5]Steps:  12%|█▏        | 1816/15001 [1:08:20<6:38:30,  1.81s/it, loss=0.0401, lr=1e-5]Steps:  12%|█▏        | 1817/15001 [1:08:22<6:53:37,  1.88s/it, loss=0.0401, lr=1e-5]Steps:  12%|█▏        | 1817/15001 [1:08:22<6:53:37,  1.88s/it, loss=0.0303, lr=1e-5]Steps:  12%|█▏        | 1818/15001 [1:08:24<7:06:56,  1.94s/it, loss=0.0303, lr=1e-5]Steps:  12%|█▏        | 1818/15001 [1:08:24<7:06:56,  1.94s/it, loss=0.0357, lr=1e-5]Steps:  12%|█▏        | 1819/15001 [1:08:26<6:49:31,  1.86s/it, loss=0.0357, lr=1e-5]Steps:  12%|█▏        | 1819/15001 [1:08:26<6:49:31,  1.86s/it, loss=0.328, lr=1e-5] Steps:  12%|█▏        | 1820/15001 [1:08:28<7:10:39,  1.96s/it, loss=0.328, lr=1e-5]Steps:  12%|█▏        | 1820/15001 [1:08:28<7:10:39,  1.96s/it, loss=0.188, lr=1e-5]Steps:  12%|█▏        | 1821/15001 [1:08:30<7:14:50,  1.98s/it, loss=0.188, lr=1e-5]Steps:  12%|█▏        | 1821/15001 [1:08:30<7:14:50,  1.98s/it, loss=0.0732, lr=1e-5]Steps:  12%|█▏        | 1822/15001 [1:08:32<7:15:09,  1.98s/it, loss=0.0732, lr=1e-5]Steps:  12%|█▏        | 1822/15001 [1:08:32<7:15:09,  1.98s/it, loss=0.0142, lr=1e-5]Steps:  12%|█▏        | 1823/15001 [1:08:33<6:59:01,  1.91s/it, loss=0.0142, lr=1e-5]Steps:  12%|█▏        | 1823/15001 [1:08:34<6:59:01,  1.91s/it, loss=0.0621, lr=1e-5]Steps:  12%|█▏        | 1824/15001 [1:08:35<6:54:13,  1.89s/it, loss=0.0621, lr=1e-5]Steps:  12%|█▏        | 1824/15001 [1:08:36<6:54:13,  1.89s/it, loss=0.0581, lr=1e-5]Steps:  12%|█▏        | 1825/15001 [1:08:37<6:40:47,  1.83s/it, loss=0.0581, lr=1e-5]Steps:  12%|█▏        | 1825/15001 [1:08:37<6:40:47,  1.83s/it, loss=0.21, lr=1e-5]  Steps:  12%|█▏        | 1826/15001 [1:08:39<6:46:53,  1.85s/it, loss=0.21, lr=1e-5]Steps:  12%|█▏        | 1826/15001 [1:08:39<6:46:53,  1.85s/it, loss=0.0726, lr=1e-5]Steps:  12%|█▏        | 1827/15001 [1:08:41<6:41:03,  1.83s/it, loss=0.0726, lr=1e-5]Steps:  12%|█▏        | 1827/15001 [1:08:41<6:41:03,  1.83s/it, loss=0.0348, lr=1e-5]Steps:  12%|█▏        | 1828/15001 [1:08:43<6:52:22,  1.88s/it, loss=0.0348, lr=1e-5]Steps:  12%|█▏        | 1828/15001 [1:08:43<6:52:22,  1.88s/it, loss=0.229, lr=1e-5] Steps:  12%|█▏        | 1829/15001 [1:08:45<6:56:34,  1.90s/it, loss=0.229, lr=1e-5]Steps:  12%|█▏        | 1829/15001 [1:08:45<6:56:34,  1.90s/it, loss=0.113, lr=1e-5]Steps:  12%|█▏        | 1830/15001 [1:08:46<6:48:15,  1.86s/it, loss=0.113, lr=1e-5]Steps:  12%|█▏        | 1830/15001 [1:08:46<6:48:15,  1.86s/it, loss=0.366, lr=1e-5]Steps:  12%|█▏        | 1831/15001 [1:08:48<6:32:51,  1.79s/it, loss=0.366, lr=1e-5]Steps:  12%|█▏        | 1831/15001 [1:08:48<6:32:51,  1.79s/it, loss=0.138, lr=1e-5]Steps:  12%|█▏        | 1832/15001 [1:08:50<6:48:13,  1.86s/it, loss=0.138, lr=1e-5]Steps:  12%|█▏        | 1832/15001 [1:08:50<6:48:13,  1.86s/it, loss=0.165, lr=1e-5]Steps:  12%|█▏        | 1833/15001 [1:08:52<6:37:08,  1.81s/it, loss=0.165, lr=1e-5]Steps:  12%|█▏        | 1833/15001 [1:08:52<6:37:08,  1.81s/it, loss=0.152, lr=1e-5]Steps:  12%|█▏        | 1834/15001 [1:08:53<6:25:47,  1.76s/it, loss=0.152, lr=1e-5]Steps:  12%|█▏        | 1834/15001 [1:08:54<6:25:47,  1.76s/it, loss=0.129, lr=1e-5]Steps:  12%|█▏        | 1835/15001 [1:08:55<6:49:14,  1.87s/it, loss=0.129, lr=1e-5]Steps:  12%|█▏        | 1835/15001 [1:08:56<6:49:14,  1.87s/it, loss=0.0891, lr=1e-5]Steps:  12%|█▏        | 1836/15001 [1:08:57<6:41:19,  1.83s/it, loss=0.0891, lr=1e-5]Steps:  12%|█▏        | 1836/15001 [1:08:57<6:41:19,  1.83s/it, loss=0.0608, lr=1e-5]Steps:  12%|█▏        | 1837/15001 [1:08:59<6:36:39,  1.81s/it, loss=0.0608, lr=1e-5]Steps:  12%|█▏        | 1837/15001 [1:08:59<6:36:39,  1.81s/it, loss=0.219, lr=1e-5] Steps:  12%|█▏        | 1838/15001 [1:09:01<6:32:41,  1.79s/it, loss=0.219, lr=1e-5]Steps:  12%|█▏        | 1838/15001 [1:09:01<6:32:41,  1.79s/it, loss=0.296, lr=1e-5]Steps:  12%|█▏        | 1839/15001 [1:09:03<6:53:05,  1.88s/it, loss=0.296, lr=1e-5]Steps:  12%|█▏        | 1839/15001 [1:09:03<6:53:05,  1.88s/it, loss=0.134, lr=1e-5]Steps:  12%|█▏        | 1840/15001 [1:09:05<7:00:47,  1.92s/it, loss=0.134, lr=1e-5]Steps:  12%|█▏        | 1840/15001 [1:09:05<7:00:47,  1.92s/it, loss=0.112, lr=1e-5]Steps:  12%|█▏        | 1841/15001 [1:09:07<7:05:01,  1.94s/it, loss=0.112, lr=1e-5]Steps:  12%|█▏        | 1841/15001 [1:09:07<7:05:01,  1.94s/it, loss=0.155, lr=1e-5]Steps:  12%|█▏        | 1842/15001 [1:09:09<7:18:04,  2.00s/it, loss=0.155, lr=1e-5]Steps:  12%|█▏        | 1842/15001 [1:09:09<7:18:04,  2.00s/it, loss=0.117, lr=1e-5]Steps:  12%|█▏        | 1843/15001 [1:09:11<6:59:27,  1.91s/it, loss=0.117, lr=1e-5]Steps:  12%|█▏        | 1843/15001 [1:09:11<6:59:27,  1.91s/it, loss=0.126, lr=1e-5]Steps:  12%|█▏        | 1844/15001 [1:09:13<7:14:19,  1.98s/it, loss=0.126, lr=1e-5]Steps:  12%|█▏        | 1844/15001 [1:09:13<7:14:19,  1.98s/it, loss=0.226, lr=1e-5]Steps:  12%|█▏        | 1845/15001 [1:09:15<7:15:51,  1.99s/it, loss=0.226, lr=1e-5]Steps:  12%|█▏        | 1845/15001 [1:09:15<7:15:51,  1.99s/it, loss=0.0685, lr=1e-5]Steps:  12%|█▏        | 1846/15001 [1:09:17<7:07:24,  1.95s/it, loss=0.0685, lr=1e-5]Steps:  12%|█▏        | 1846/15001 [1:09:17<7:07:24,  1.95s/it, loss=0.184, lr=1e-5] Steps:  12%|█▏        | 1847/15001 [1:09:18<6:53:17,  1.89s/it, loss=0.184, lr=1e-5]Steps:  12%|█▏        | 1847/15001 [1:09:18<6:53:17,  1.89s/it, loss=0.265, lr=1e-5]Steps:  12%|█▏        | 1848/15001 [1:09:20<6:42:10,  1.83s/it, loss=0.265, lr=1e-5]Steps:  12%|█▏        | 1848/15001 [1:09:20<6:42:10,  1.83s/it, loss=0.254, lr=1e-5]Steps:  12%|█▏        | 1849/15001 [1:09:22<6:34:59,  1.80s/it, loss=0.254, lr=1e-5]Steps:  12%|█▏        | 1849/15001 [1:09:22<6:34:59,  1.80s/it, loss=0.121, lr=1e-5]Steps:  12%|█▏        | 1850/15001 [1:09:24<6:34:11,  1.80s/it, loss=0.121, lr=1e-5]Steps:  12%|█▏        | 1850/15001 [1:09:24<6:34:11,  1.80s/it, loss=0.152, lr=1e-5]Steps:  12%|█▏        | 1851/15001 [1:09:25<6:36:31,  1.81s/it, loss=0.152, lr=1e-5]Steps:  12%|█▏        | 1851/15001 [1:09:26<6:36:31,  1.81s/it, loss=0.127, lr=1e-5]Steps:  12%|█▏        | 1852/15001 [1:09:28<6:58:02,  1.91s/it, loss=0.127, lr=1e-5]Steps:  12%|█▏        | 1852/15001 [1:09:28<6:58:02,  1.91s/it, loss=0.409, lr=1e-5]Steps:  12%|█▏        | 1853/15001 [1:09:29<6:49:29,  1.87s/it, loss=0.409, lr=1e-5]Steps:  12%|█▏        | 1853/15001 [1:09:29<6:49:29,  1.87s/it, loss=0.142, lr=1e-5]Steps:  12%|█▏        | 1854/15001 [1:09:31<6:42:15,  1.84s/it, loss=0.142, lr=1e-5]Steps:  12%|█▏        | 1854/15001 [1:09:31<6:42:15,  1.84s/it, loss=0.0347, lr=1e-5]Steps:  12%|█▏        | 1855/15001 [1:09:33<6:48:38,  1.87s/it, loss=0.0347, lr=1e-5]Steps:  12%|█▏        | 1855/15001 [1:09:33<6:48:38,  1.87s/it, loss=0.204, lr=1e-5] Steps:  12%|█▏        | 1856/15001 [1:09:35<6:44:46,  1.85s/it, loss=0.204, lr=1e-5]Steps:  12%|█▏        | 1856/15001 [1:09:35<6:44:46,  1.85s/it, loss=0.0616, lr=1e-5]Steps:  12%|█▏        | 1857/15001 [1:09:37<6:36:56,  1.81s/it, loss=0.0616, lr=1e-5]Steps:  12%|█▏        | 1857/15001 [1:09:37<6:36:56,  1.81s/it, loss=0.156, lr=1e-5] Steps:  12%|█▏        | 1858/15001 [1:09:39<6:43:23,  1.84s/it, loss=0.156, lr=1e-5]Steps:  12%|█▏        | 1858/15001 [1:09:39<6:43:23,  1.84s/it, loss=0.0682, lr=1e-5]Steps:  12%|█▏        | 1859/15001 [1:09:40<6:48:05,  1.86s/it, loss=0.0682, lr=1e-5]Steps:  12%|█▏        | 1859/15001 [1:09:40<6:48:05,  1.86s/it, loss=0.166, lr=1e-5] Steps:  12%|█▏        | 1860/15001 [1:09:42<6:47:05,  1.86s/it, loss=0.166, lr=1e-5]Steps:  12%|█▏        | 1860/15001 [1:09:42<6:47:05,  1.86s/it, loss=0.171, lr=1e-5]Steps:  12%|█▏        | 1861/15001 [1:09:44<6:39:00,  1.82s/it, loss=0.171, lr=1e-5]Steps:  12%|█▏        | 1861/15001 [1:09:44<6:39:00,  1.82s/it, loss=0.139, lr=1e-5]Steps:  12%|█▏        | 1862/15001 [1:09:46<6:49:57,  1.87s/it, loss=0.139, lr=1e-5]Steps:  12%|█▏        | 1862/15001 [1:09:46<6:49:57,  1.87s/it, loss=0.22, lr=1e-5] Steps:  12%|█▏        | 1863/15001 [1:09:48<6:56:43,  1.90s/it, loss=0.22, lr=1e-5]Steps:  12%|█▏        | 1863/15001 [1:09:48<6:56:43,  1.90s/it, loss=0.0907, lr=1e-5]Steps:  12%|█▏        | 1864/15001 [1:09:50<7:06:01,  1.95s/it, loss=0.0907, lr=1e-5]Steps:  12%|█▏        | 1864/15001 [1:09:50<7:06:01,  1.95s/it, loss=0.192, lr=1e-5] Steps:  12%|█▏        | 1865/15001 [1:09:52<7:11:31,  1.97s/it, loss=0.192, lr=1e-5]Steps:  12%|█▏        | 1865/15001 [1:09:52<7:11:31,  1.97s/it, loss=0.129, lr=1e-5]Steps:  12%|█▏        | 1866/15001 [1:09:54<7:15:10,  1.99s/it, loss=0.129, lr=1e-5]Steps:  12%|█▏        | 1866/15001 [1:09:54<7:15:10,  1.99s/it, loss=0.369, lr=1e-5]Steps:  12%|█▏        | 1867/15001 [1:09:56<7:19:15,  2.01s/it, loss=0.369, lr=1e-5]Steps:  12%|█▏        | 1867/15001 [1:09:56<7:19:15,  2.01s/it, loss=0.185, lr=1e-5]Steps:  12%|█▏        | 1868/15001 [1:09:58<7:03:39,  1.94s/it, loss=0.185, lr=1e-5]Steps:  12%|█▏        | 1868/15001 [1:09:58<7:03:39,  1.94s/it, loss=0.1, lr=1e-5]  Steps:  12%|█▏        | 1869/15001 [1:10:00<6:47:10,  1.86s/it, loss=0.1, lr=1e-5]Steps:  12%|█▏        | 1869/15001 [1:10:00<6:47:10,  1.86s/it, loss=0.0204, lr=1e-5]Steps:  12%|█▏        | 1870/15001 [1:10:02<6:57:58,  1.91s/it, loss=0.0204, lr=1e-5]Steps:  12%|█▏        | 1870/15001 [1:10:02<6:57:58,  1.91s/it, loss=0.293, lr=1e-5] Steps:  12%|█▏        | 1871/15001 [1:10:03<6:35:04,  1.81s/it, loss=0.293, lr=1e-5]Steps:  12%|█▏        | 1871/15001 [1:10:04<6:35:04,  1.81s/it, loss=0.237, lr=1e-5]Steps:  12%|█▏        | 1872/15001 [1:10:05<6:37:50,  1.82s/it, loss=0.237, lr=1e-5]Steps:  12%|█▏        | 1872/15001 [1:10:05<6:37:50,  1.82s/it, loss=0.051, lr=1e-5]Steps:  12%|█▏        | 1873/15001 [1:10:07<6:42:15,  1.84s/it, loss=0.051, lr=1e-5]Steps:  12%|█▏        | 1873/15001 [1:10:07<6:42:15,  1.84s/it, loss=0.184, lr=1e-5]Steps:  12%|█▏        | 1874/15001 [1:10:09<6:45:38,  1.85s/it, loss=0.184, lr=1e-5]Steps:  12%|█▏        | 1874/15001 [1:10:09<6:45:38,  1.85s/it, loss=0.112, lr=1e-5]Steps:  12%|█▏        | 1875/15001 [1:10:10<6:30:56,  1.79s/it, loss=0.112, lr=1e-5]Steps:  12%|█▏        | 1875/15001 [1:10:11<6:30:56,  1.79s/it, loss=0.174, lr=1e-5]Steps:  13%|█▎        | 1876/15001 [1:10:12<6:35:19,  1.81s/it, loss=0.174, lr=1e-5]Steps:  13%|█▎        | 1876/15001 [1:10:13<6:35:19,  1.81s/it, loss=0.111, lr=1e-5]Steps:  13%|█▎        | 1877/15001 [1:10:14<6:31:21,  1.79s/it, loss=0.111, lr=1e-5]Steps:  13%|█▎        | 1877/15001 [1:10:14<6:31:21,  1.79s/it, loss=0.122, lr=1e-5]Steps:  13%|█▎        | 1878/15001 [1:10:16<6:58:44,  1.91s/it, loss=0.122, lr=1e-5]Steps:  13%|█▎        | 1878/15001 [1:10:16<6:58:44,  1.91s/it, loss=0.158, lr=1e-5]Steps:  13%|█▎        | 1879/15001 [1:10:18<6:31:58,  1.79s/it, loss=0.158, lr=1e-5]Steps:  13%|█▎        | 1879/15001 [1:10:18<6:31:58,  1.79s/it, loss=0.145, lr=1e-5]Steps:  13%|█▎        | 1880/15001 [1:10:20<6:46:27,  1.86s/it, loss=0.145, lr=1e-5]Steps:  13%|█▎        | 1880/15001 [1:10:20<6:46:27,  1.86s/it, loss=0.0981, lr=1e-5]Steps:  13%|█▎        | 1881/15001 [1:10:22<6:40:29,  1.83s/it, loss=0.0981, lr=1e-5]Steps:  13%|█▎        | 1881/15001 [1:10:22<6:40:29,  1.83s/it, loss=0.347, lr=1e-5] Steps:  13%|█▎        | 1882/15001 [1:10:23<6:44:47,  1.85s/it, loss=0.347, lr=1e-5]Steps:  13%|█▎        | 1882/15001 [1:10:24<6:44:47,  1.85s/it, loss=0.245, lr=1e-5]Steps:  13%|█▎        | 1883/15001 [1:10:25<6:32:46,  1.80s/it, loss=0.245, lr=1e-5]Steps:  13%|█▎        | 1883/15001 [1:10:26<6:32:46,  1.80s/it, loss=0.145, lr=1e-5]Steps:  13%|█▎        | 1884/15001 [1:10:27<6:48:15,  1.87s/it, loss=0.145, lr=1e-5]Steps:  13%|█▎        | 1884/15001 [1:10:27<6:48:15,  1.87s/it, loss=0.0456, lr=1e-5]Steps:  13%|█▎        | 1885/15001 [1:10:29<6:46:17,  1.86s/it, loss=0.0456, lr=1e-5]Steps:  13%|█▎        | 1885/15001 [1:10:30<6:46:17,  1.86s/it, loss=0.268, lr=1e-5] Steps:  13%|█▎        | 1886/15001 [1:10:31<7:21:59,  2.02s/it, loss=0.268, lr=1e-5]Steps:  13%|█▎        | 1886/15001 [1:10:31<7:21:59,  2.02s/it, loss=0.439, lr=1e-5]Steps:  13%|█▎        | 1887/15001 [1:10:33<7:03:43,  1.94s/it, loss=0.439, lr=1e-5]Steps:  13%|█▎        | 1887/15001 [1:10:34<7:03:43,  1.94s/it, loss=0.305, lr=1e-5]Steps:  13%|█▎        | 1888/15001 [1:10:35<7:14:19,  1.99s/it, loss=0.305, lr=1e-5]Steps:  13%|█▎        | 1888/15001 [1:10:36<7:14:19,  1.99s/it, loss=0.183, lr=1e-5]Steps:  13%|█▎        | 1889/15001 [1:10:38<7:37:14,  2.09s/it, loss=0.183, lr=1e-5]Steps:  13%|█▎        | 1889/15001 [1:10:38<7:37:14,  2.09s/it, loss=0.133, lr=1e-5]Steps:  13%|█▎        | 1890/15001 [1:10:40<7:32:33,  2.07s/it, loss=0.133, lr=1e-5]Steps:  13%|█▎        | 1890/15001 [1:10:40<7:32:33,  2.07s/it, loss=0.215, lr=1e-5]Steps:  13%|█▎        | 1891/15001 [1:10:42<7:23:19,  2.03s/it, loss=0.215, lr=1e-5]Steps:  13%|█▎        | 1891/15001 [1:10:42<7:23:19,  2.03s/it, loss=0.388, lr=1e-5]Steps:  13%|█▎        | 1892/15001 [1:10:43<7:13:48,  1.99s/it, loss=0.388, lr=1e-5]Steps:  13%|█▎        | 1892/15001 [1:10:43<7:13:48,  1.99s/it, loss=0.14, lr=1e-5] Steps:  13%|█▎        | 1893/15001 [1:10:45<6:59:27,  1.92s/it, loss=0.14, lr=1e-5]Steps:  13%|█▎        | 1893/15001 [1:10:45<6:59:27,  1.92s/it, loss=0.127, lr=1e-5]Steps:  13%|█▎        | 1894/15001 [1:10:47<6:45:14,  1.86s/it, loss=0.127, lr=1e-5]Steps:  13%|█▎        | 1894/15001 [1:10:47<6:45:14,  1.86s/it, loss=0.324, lr=1e-5]Steps:  13%|█▎        | 1895/15001 [1:10:49<6:30:58,  1.79s/it, loss=0.324, lr=1e-5]Steps:  13%|█▎        | 1895/15001 [1:10:49<6:30:58,  1.79s/it, loss=0.0616, lr=1e-5]Steps:  13%|█▎        | 1896/15001 [1:10:51<6:50:50,  1.88s/it, loss=0.0616, lr=1e-5]Steps:  13%|█▎        | 1896/15001 [1:10:51<6:50:50,  1.88s/it, loss=0.098, lr=1e-5] Steps:  13%|█▎        | 1897/15001 [1:10:52<6:46:44,  1.86s/it, loss=0.098, lr=1e-5]Steps:  13%|█▎        | 1897/15001 [1:10:53<6:46:44,  1.86s/it, loss=0.12, lr=1e-5] Steps:  13%|█▎        | 1898/15001 [1:10:54<6:30:49,  1.79s/it, loss=0.12, lr=1e-5]Steps:  13%|█▎        | 1898/15001 [1:10:54<6:30:49,  1.79s/it, loss=0.218, lr=1e-5]Steps:  13%|█▎        | 1899/15001 [1:10:56<6:37:53,  1.82s/it, loss=0.218, lr=1e-5]Steps:  13%|█▎        | 1899/15001 [1:10:56<6:37:53,  1.82s/it, loss=0.188, lr=1e-5]Steps:  13%|█▎        | 1900/15001 [1:10:58<6:49:18,  1.87s/it, loss=0.188, lr=1e-5]Steps:  13%|█▎        | 1900/15001 [1:10:58<6:49:18,  1.87s/it, loss=0.263, lr=1e-5]Steps:  13%|█▎        | 1901/15001 [1:11:00<6:53:18,  1.89s/it, loss=0.263, lr=1e-5]Steps:  13%|█▎        | 1901/15001 [1:11:00<6:53:18,  1.89s/it, loss=0.2, lr=1e-5]  Steps:  13%|█▎        | 1902/15001 [1:11:02<6:46:01,  1.86s/it, loss=0.2, lr=1e-5]Steps:  13%|█▎        | 1902/15001 [1:11:02<6:46:01,  1.86s/it, loss=0.188, lr=1e-5]Steps:  13%|█▎        | 1903/15001 [1:11:03<6:20:48,  1.74s/it, loss=0.188, lr=1e-5]Steps:  13%|█▎        | 1903/15001 [1:11:03<6:20:48,  1.74s/it, loss=0.143, lr=1e-5]Steps:  13%|█▎        | 1904/15001 [1:11:05<6:43:08,  1.85s/it, loss=0.143, lr=1e-5]Steps:  13%|█▎        | 1904/15001 [1:11:05<6:43:08,  1.85s/it, loss=0.189, lr=1e-5]Steps:  13%|█▎        | 1905/15001 [1:11:07<6:16:22,  1.72s/it, loss=0.189, lr=1e-5]Steps:  13%|█▎        | 1905/15001 [1:11:07<6:16:22,  1.72s/it, loss=0.234, lr=1e-5]Steps:  13%|█▎        | 1906/15001 [1:11:09<6:46:07,  1.86s/it, loss=0.234, lr=1e-5]Steps:  13%|█▎        | 1906/15001 [1:11:09<6:46:07,  1.86s/it, loss=0.287, lr=1e-5]Steps:  13%|█▎        | 1907/15001 [1:11:10<6:24:16,  1.76s/it, loss=0.287, lr=1e-5]Steps:  13%|█▎        | 1907/15001 [1:11:11<6:24:16,  1.76s/it, loss=0.0294, lr=1e-5]Steps:  13%|█▎        | 1908/15001 [1:11:13<7:05:00,  1.95s/it, loss=0.0294, lr=1e-5]Steps:  13%|█▎        | 1908/15001 [1:11:13<7:05:00,  1.95s/it, loss=0.19, lr=1e-5]  Steps:  13%|█▎        | 1909/15001 [1:11:15<7:23:20,  2.03s/it, loss=0.19, lr=1e-5]Steps:  13%|█▎        | 1909/15001 [1:11:15<7:23:20,  2.03s/it, loss=0.142, lr=1e-5]Steps:  13%|█▎        | 1910/15001 [1:11:17<7:14:33,  1.99s/it, loss=0.142, lr=1e-5]Steps:  13%|█▎        | 1910/15001 [1:11:17<7:14:33,  1.99s/it, loss=0.0587, lr=1e-5]Steps:  13%|█▎        | 1911/15001 [1:11:19<7:13:07,  1.99s/it, loss=0.0587, lr=1e-5]Steps:  13%|█▎        | 1911/15001 [1:11:19<7:13:07,  1.99s/it, loss=0.083, lr=1e-5] Steps:  13%|█▎        | 1912/15001 [1:11:21<6:53:14,  1.89s/it, loss=0.083, lr=1e-5]Steps:  13%|█▎        | 1912/15001 [1:11:21<6:53:14,  1.89s/it, loss=0.167, lr=1e-5]Steps:  13%|█▎        | 1913/15001 [1:11:23<7:05:17,  1.95s/it, loss=0.167, lr=1e-5]Steps:  13%|█▎        | 1913/15001 [1:11:23<7:05:17,  1.95s/it, loss=0.107, lr=1e-5]Steps:  13%|█▎        | 1914/15001 [1:11:24<6:59:01,  1.92s/it, loss=0.107, lr=1e-5]Steps:  13%|█▎        | 1914/15001 [1:11:25<6:59:01,  1.92s/it, loss=0.122, lr=1e-5]Steps:  13%|█▎        | 1915/15001 [1:11:26<6:39:26,  1.83s/it, loss=0.122, lr=1e-5]Steps:  13%|█▎        | 1915/15001 [1:11:27<6:39:26,  1.83s/it, loss=0.138, lr=1e-5]Steps:  13%|█▎        | 1916/15001 [1:11:28<6:50:10,  1.88s/it, loss=0.138, lr=1e-5]Steps:  13%|█▎        | 1916/15001 [1:11:28<6:50:10,  1.88s/it, loss=0.0501, lr=1e-5]Steps:  13%|█▎        | 1917/15001 [1:11:30<7:04:12,  1.95s/it, loss=0.0501, lr=1e-5]Steps:  13%|█▎        | 1917/15001 [1:11:30<7:04:12,  1.95s/it, loss=0.0783, lr=1e-5]Steps:  13%|█▎        | 1918/15001 [1:11:32<6:44:24,  1.85s/it, loss=0.0783, lr=1e-5]Steps:  13%|█▎        | 1918/15001 [1:11:32<6:44:24,  1.85s/it, loss=0.0618, lr=1e-5]Steps:  13%|█▎        | 1919/15001 [1:11:34<6:49:53,  1.88s/it, loss=0.0618, lr=1e-5]Steps:  13%|█▎        | 1919/15001 [1:11:34<6:49:53,  1.88s/it, loss=0.376, lr=1e-5] Steps:  13%|█▎        | 1920/15001 [1:11:35<6:39:51,  1.83s/it, loss=0.376, lr=1e-5]Steps:  13%|█▎        | 1920/15001 [1:11:36<6:39:51,  1.83s/it, loss=0.161, lr=1e-5]Steps:  13%|█▎        | 1921/15001 [1:11:37<6:45:43,  1.86s/it, loss=0.161, lr=1e-5]Steps:  13%|█▎        | 1921/15001 [1:11:38<6:45:43,  1.86s/it, loss=0.18, lr=1e-5] Steps:  13%|█▎        | 1922/15001 [1:11:39<6:35:04,  1.81s/it, loss=0.18, lr=1e-5]Steps:  13%|█▎        | 1922/15001 [1:11:39<6:35:04,  1.81s/it, loss=0.184, lr=1e-5]Steps:  13%|█▎        | 1923/15001 [1:11:41<6:47:55,  1.87s/it, loss=0.184, lr=1e-5]Steps:  13%|█▎        | 1923/15001 [1:11:41<6:47:55,  1.87s/it, loss=0.208, lr=1e-5]Steps:  13%|█▎        | 1924/15001 [1:11:43<6:23:06,  1.76s/it, loss=0.208, lr=1e-5]Steps:  13%|█▎        | 1924/15001 [1:11:43<6:23:06,  1.76s/it, loss=0.169, lr=1e-5]Steps:  13%|█▎        | 1925/15001 [1:11:45<6:49:31,  1.88s/it, loss=0.169, lr=1e-5]Steps:  13%|█▎        | 1925/15001 [1:11:45<6:49:31,  1.88s/it, loss=0.203, lr=1e-5]Steps:  13%|█▎        | 1926/15001 [1:11:47<6:50:01,  1.88s/it, loss=0.203, lr=1e-5]Steps:  13%|█▎        | 1926/15001 [1:11:47<6:50:01,  1.88s/it, loss=0.0498, lr=1e-5]Steps:  13%|█▎        | 1927/15001 [1:11:48<6:43:59,  1.85s/it, loss=0.0498, lr=1e-5]Steps:  13%|█▎        | 1927/15001 [1:11:49<6:43:59,  1.85s/it, loss=0.129, lr=1e-5] Steps:  13%|█▎        | 1928/15001 [1:11:50<6:28:49,  1.78s/it, loss=0.129, lr=1e-5]Steps:  13%|█▎        | 1928/15001 [1:11:50<6:28:49,  1.78s/it, loss=0.19, lr=1e-5] Steps:  13%|█▎        | 1929/15001 [1:11:52<6:41:19,  1.84s/it, loss=0.19, lr=1e-5]Steps:  13%|█▎        | 1929/15001 [1:11:52<6:41:19,  1.84s/it, loss=0.126, lr=1e-5]Steps:  13%|█▎        | 1930/15001 [1:11:54<6:40:07,  1.84s/it, loss=0.126, lr=1e-5]Steps:  13%|█▎        | 1930/15001 [1:11:54<6:40:07,  1.84s/it, loss=0.125, lr=1e-5]Steps:  13%|█▎        | 1931/15001 [1:11:56<6:51:11,  1.89s/it, loss=0.125, lr=1e-5]Steps:  13%|█▎        | 1931/15001 [1:11:56<6:51:11,  1.89s/it, loss=0.126, lr=1e-5]Steps:  13%|█▎        | 1932/15001 [1:11:58<6:44:08,  1.86s/it, loss=0.126, lr=1e-5]Steps:  13%|█▎        | 1932/15001 [1:11:58<6:44:08,  1.86s/it, loss=0.221, lr=1e-5]Steps:  13%|█▎        | 1933/15001 [1:12:00<7:14:45,  2.00s/it, loss=0.221, lr=1e-5]Steps:  13%|█▎        | 1933/15001 [1:12:00<7:14:45,  2.00s/it, loss=0.137, lr=1e-5]Steps:  13%|█▎        | 1934/15001 [1:12:02<6:56:40,  1.91s/it, loss=0.137, lr=1e-5]Steps:  13%|█▎        | 1934/15001 [1:12:02<6:56:40,  1.91s/it, loss=0.202, lr=1e-5]Steps:  13%|█▎        | 1935/15001 [1:12:04<7:20:27,  2.02s/it, loss=0.202, lr=1e-5]Steps:  13%|█▎        | 1935/15001 [1:12:04<7:20:27,  2.02s/it, loss=0.019, lr=1e-5]Steps:  13%|█▎        | 1936/15001 [1:12:06<7:15:02,  2.00s/it, loss=0.019, lr=1e-5]Steps:  13%|█▎        | 1936/15001 [1:12:06<7:15:02,  2.00s/it, loss=0.123, lr=1e-5]Steps:  13%|█▎        | 1937/15001 [1:12:08<7:10:29,  1.98s/it, loss=0.123, lr=1e-5]Steps:  13%|█▎        | 1937/15001 [1:12:08<7:10:29,  1.98s/it, loss=0.129, lr=1e-5]Steps:  13%|█▎        | 1938/15001 [1:12:10<7:10:17,  1.98s/it, loss=0.129, lr=1e-5]Steps:  13%|█▎        | 1938/15001 [1:12:10<7:10:17,  1.98s/it, loss=0.261, lr=1e-5]Steps:  13%|█▎        | 1939/15001 [1:12:11<6:43:33,  1.85s/it, loss=0.261, lr=1e-5]Steps:  13%|█▎        | 1939/15001 [1:12:12<6:43:33,  1.85s/it, loss=0.243, lr=1e-5]Steps:  13%|█▎        | 1940/15001 [1:12:13<6:42:33,  1.85s/it, loss=0.243, lr=1e-5]Steps:  13%|█▎        | 1940/15001 [1:12:14<6:42:33,  1.85s/it, loss=0.0882, lr=1e-5]Steps:  13%|█▎        | 1941/15001 [1:12:15<6:44:39,  1.86s/it, loss=0.0882, lr=1e-5]Steps:  13%|█▎        | 1941/15001 [1:12:15<6:44:39,  1.86s/it, loss=0.0617, lr=1e-5]Steps:  13%|█▎        | 1942/15001 [1:12:17<6:53:39,  1.90s/it, loss=0.0617, lr=1e-5]Steps:  13%|█▎        | 1942/15001 [1:12:17<6:53:39,  1.90s/it, loss=0.352, lr=1e-5] Steps:  13%|█▎        | 1943/15001 [1:12:19<6:52:08,  1.89s/it, loss=0.352, lr=1e-5]Steps:  13%|█▎        | 1943/15001 [1:12:19<6:52:08,  1.89s/it, loss=0.174, lr=1e-5]Steps:  13%|█▎        | 1944/15001 [1:12:21<6:33:27,  1.81s/it, loss=0.174, lr=1e-5]Steps:  13%|█▎        | 1944/15001 [1:12:21<6:33:27,  1.81s/it, loss=0.143, lr=1e-5]Steps:  13%|█▎        | 1945/15001 [1:12:22<6:27:28,  1.78s/it, loss=0.143, lr=1e-5]Steps:  13%|█▎        | 1945/15001 [1:12:23<6:27:28,  1.78s/it, loss=0.131, lr=1e-5]Steps:  13%|█▎        | 1946/15001 [1:12:25<7:00:11,  1.93s/it, loss=0.131, lr=1e-5]Steps:  13%|█▎        | 1946/15001 [1:12:25<7:00:11,  1.93s/it, loss=0.151, lr=1e-5]Steps:  13%|█▎        | 1947/15001 [1:12:26<6:39:54,  1.84s/it, loss=0.151, lr=1e-5]Steps:  13%|█▎        | 1947/15001 [1:12:26<6:39:54,  1.84s/it, loss=0.094, lr=1e-5]Steps:  13%|█▎        | 1948/15001 [1:12:28<6:48:47,  1.88s/it, loss=0.094, lr=1e-5]Steps:  13%|█▎        | 1948/15001 [1:12:28<6:48:47,  1.88s/it, loss=0.345, lr=1e-5]Steps:  13%|█▎        | 1949/15001 [1:12:30<6:52:52,  1.90s/it, loss=0.345, lr=1e-5]Steps:  13%|█▎        | 1949/15001 [1:12:30<6:52:52,  1.90s/it, loss=0.133, lr=1e-5]Steps:  13%|█▎        | 1950/15001 [1:12:32<6:45:40,  1.87s/it, loss=0.133, lr=1e-5]Steps:  13%|█▎        | 1950/15001 [1:12:32<6:45:40,  1.87s/it, loss=0.26, lr=1e-5] Steps:  13%|█▎        | 1951/15001 [1:12:34<6:31:29,  1.80s/it, loss=0.26, lr=1e-5]Steps:  13%|█▎        | 1951/15001 [1:12:34<6:31:29,  1.80s/it, loss=0.0892, lr=1e-5]Steps:  13%|█▎        | 1952/15001 [1:12:35<6:35:06,  1.82s/it, loss=0.0892, lr=1e-5]Steps:  13%|█▎        | 1952/15001 [1:12:36<6:35:06,  1.82s/it, loss=0.112, lr=1e-5] Steps:  13%|█▎        | 1953/15001 [1:12:37<6:36:05,  1.82s/it, loss=0.112, lr=1e-5]Steps:  13%|█▎        | 1953/15001 [1:12:37<6:36:05,  1.82s/it, loss=0.14, lr=1e-5] Steps:  13%|█▎        | 1954/15001 [1:12:39<6:56:22,  1.91s/it, loss=0.14, lr=1e-5]Steps:  13%|█▎        | 1954/15001 [1:12:40<6:56:22,  1.91s/it, loss=0.262, lr=1e-5]Steps:  13%|█▎        | 1955/15001 [1:12:41<6:54:38,  1.91s/it, loss=0.262, lr=1e-5]Steps:  13%|█▎        | 1955/15001 [1:12:42<6:54:38,  1.91s/it, loss=0.0922, lr=1e-5]Steps:  13%|█▎        | 1956/15001 [1:12:43<6:52:19,  1.90s/it, loss=0.0922, lr=1e-5]Steps:  13%|█▎        | 1956/15001 [1:12:44<6:52:19,  1.90s/it, loss=0.349, lr=1e-5] Steps:  13%|█▎        | 1957/15001 [1:12:45<7:07:51,  1.97s/it, loss=0.349, lr=1e-5]Steps:  13%|█▎        | 1957/15001 [1:12:45<7:07:51,  1.97s/it, loss=0.342, lr=1e-5]Steps:  13%|█▎        | 1958/15001 [1:12:47<6:57:18,  1.92s/it, loss=0.342, lr=1e-5]Steps:  13%|█▎        | 1958/15001 [1:12:47<6:57:18,  1.92s/it, loss=0.304, lr=1e-5]Steps:  13%|█▎        | 1959/15001 [1:12:49<7:17:37,  2.01s/it, loss=0.304, lr=1e-5]Steps:  13%|█▎        | 1959/15001 [1:12:49<7:17:37,  2.01s/it, loss=0.135, lr=1e-5]Steps:  13%|█▎        | 1960/15001 [1:12:51<6:57:31,  1.92s/it, loss=0.135, lr=1e-5]Steps:  13%|█▎        | 1960/15001 [1:12:51<6:57:31,  1.92s/it, loss=0.128, lr=1e-5]Steps:  13%|█▎        | 1961/15001 [1:12:53<6:43:41,  1.86s/it, loss=0.128, lr=1e-5]Steps:  13%|█▎        | 1961/15001 [1:12:53<6:43:41,  1.86s/it, loss=0.102, lr=1e-5]Steps:  13%|█▎        | 1962/15001 [1:12:55<6:49:04,  1.88s/it, loss=0.102, lr=1e-5]Steps:  13%|█▎        | 1962/15001 [1:12:55<6:49:04,  1.88s/it, loss=0.117, lr=1e-5]Steps:  13%|█▎        | 1963/15001 [1:12:57<6:54:44,  1.91s/it, loss=0.117, lr=1e-5]Steps:  13%|█▎        | 1963/15001 [1:12:57<6:54:44,  1.91s/it, loss=0.13, lr=1e-5] Steps:  13%|█▎        | 1964/15001 [1:12:59<6:52:10,  1.90s/it, loss=0.13, lr=1e-5]Steps:  13%|█▎        | 1964/15001 [1:12:59<6:52:10,  1.90s/it, loss=0.137, lr=1e-5]Steps:  13%|█▎        | 1965/15001 [1:13:00<6:35:01,  1.82s/it, loss=0.137, lr=1e-5]Steps:  13%|█▎        | 1965/15001 [1:13:00<6:35:01,  1.82s/it, loss=0.232, lr=1e-5]Steps:  13%|█▎        | 1966/15001 [1:13:02<6:45:14,  1.87s/it, loss=0.232, lr=1e-5]Steps:  13%|█▎        | 1966/15001 [1:13:02<6:45:14,  1.87s/it, loss=0.0973, lr=1e-5]Steps:  13%|█▎        | 1967/15001 [1:13:04<6:46:21,  1.87s/it, loss=0.0973, lr=1e-5]Steps:  13%|█▎        | 1967/15001 [1:13:04<6:46:21,  1.87s/it, loss=0.311, lr=1e-5] Steps:  13%|█▎        | 1968/15001 [1:13:06<6:53:36,  1.90s/it, loss=0.311, lr=1e-5]Steps:  13%|█▎        | 1968/15001 [1:13:06<6:53:36,  1.90s/it, loss=0.0653, lr=1e-5]Steps:  13%|█▎        | 1969/15001 [1:13:08<6:44:39,  1.86s/it, loss=0.0653, lr=1e-5]Steps:  13%|█▎        | 1969/15001 [1:13:08<6:44:39,  1.86s/it, loss=0.127, lr=1e-5] Steps:  13%|█▎        | 1970/15001 [1:13:10<6:47:22,  1.88s/it, loss=0.127, lr=1e-5]Steps:  13%|█▎        | 1970/15001 [1:13:10<6:47:22,  1.88s/it, loss=0.239, lr=1e-5]Steps:  13%|█▎        | 1971/15001 [1:13:11<6:43:36,  1.86s/it, loss=0.239, lr=1e-5]Steps:  13%|█▎        | 1971/15001 [1:13:12<6:43:36,  1.86s/it, loss=0.0963, lr=1e-5]Steps:  13%|█▎        | 1972/15001 [1:13:13<6:33:38,  1.81s/it, loss=0.0963, lr=1e-5]Steps:  13%|█▎        | 1972/15001 [1:13:13<6:33:38,  1.81s/it, loss=0.0329, lr=1e-5]Steps:  13%|█▎        | 1973/15001 [1:13:15<6:23:56,  1.77s/it, loss=0.0329, lr=1e-5]Steps:  13%|█▎        | 1973/15001 [1:13:15<6:23:56,  1.77s/it, loss=0.103, lr=1e-5] Steps:  13%|█▎        | 1974/15001 [1:13:17<6:43:31,  1.86s/it, loss=0.103, lr=1e-5]Steps:  13%|█▎        | 1974/15001 [1:13:17<6:43:31,  1.86s/it, loss=0.32, lr=1e-5] Steps:  13%|█▎        | 1975/15001 [1:13:19<6:31:22,  1.80s/it, loss=0.32, lr=1e-5]Steps:  13%|█▎        | 1975/15001 [1:13:19<6:31:22,  1.80s/it, loss=0.158, lr=1e-5]Steps:  13%|█▎        | 1976/15001 [1:13:20<6:34:00,  1.81s/it, loss=0.158, lr=1e-5]Steps:  13%|█▎        | 1976/15001 [1:13:21<6:34:00,  1.81s/it, loss=0.301, lr=1e-5]Steps:  13%|█▎        | 1977/15001 [1:13:22<6:34:46,  1.82s/it, loss=0.301, lr=1e-5]Steps:  13%|█▎        | 1977/15001 [1:13:23<6:34:46,  1.82s/it, loss=0.0824, lr=1e-5]Steps:  13%|█▎        | 1978/15001 [1:13:25<7:09:31,  1.98s/it, loss=0.0824, lr=1e-5]Steps:  13%|█▎        | 1978/15001 [1:13:25<7:09:31,  1.98s/it, loss=0.258, lr=1e-5] Steps:  13%|█▎        | 1979/15001 [1:13:27<7:12:53,  1.99s/it, loss=0.258, lr=1e-5]Steps:  13%|█▎        | 1979/15001 [1:13:27<7:12:53,  1.99s/it, loss=0.0568, lr=1e-5]Steps:  13%|█▎        | 1980/15001 [1:13:28<6:55:32,  1.91s/it, loss=0.0568, lr=1e-5]Steps:  13%|█▎        | 1980/15001 [1:13:29<6:55:32,  1.91s/it, loss=0.138, lr=1e-5] Steps:  13%|█▎        | 1981/15001 [1:13:30<7:02:35,  1.95s/it, loss=0.138, lr=1e-5]Steps:  13%|█▎        | 1981/15001 [1:13:31<7:02:35,  1.95s/it, loss=0.266, lr=1e-5]Steps:  13%|█▎        | 1982/15001 [1:13:32<6:58:44,  1.93s/it, loss=0.266, lr=1e-5]Steps:  13%|█▎        | 1982/15001 [1:13:32<6:58:44,  1.93s/it, loss=0.171, lr=1e-5]Steps:  13%|█▎        | 1983/15001 [1:13:34<6:45:21,  1.87s/it, loss=0.171, lr=1e-5]Steps:  13%|█▎        | 1983/15001 [1:13:34<6:45:21,  1.87s/it, loss=0.0214, lr=1e-5]Steps:  13%|█▎        | 1984/15001 [1:13:36<6:47:05,  1.88s/it, loss=0.0214, lr=1e-5]Steps:  13%|█▎        | 1984/15001 [1:13:36<6:47:05,  1.88s/it, loss=0.191, lr=1e-5] Steps:  13%|█▎        | 1985/15001 [1:13:38<6:51:48,  1.90s/it, loss=0.191, lr=1e-5]Steps:  13%|█▎        | 1985/15001 [1:13:38<6:51:48,  1.90s/it, loss=0.0891, lr=1e-5]Steps:  13%|█▎        | 1986/15001 [1:13:40<6:37:03,  1.83s/it, loss=0.0891, lr=1e-5]Steps:  13%|█▎        | 1986/15001 [1:13:40<6:37:03,  1.83s/it, loss=0.334, lr=1e-5] Steps:  13%|█▎        | 1987/15001 [1:13:41<6:38:39,  1.84s/it, loss=0.334, lr=1e-5]Steps:  13%|█▎        | 1987/15001 [1:13:42<6:38:39,  1.84s/it, loss=0.144, lr=1e-5]Steps:  13%|█▎        | 1988/15001 [1:13:43<6:50:51,  1.89s/it, loss=0.144, lr=1e-5]Steps:  13%|█▎        | 1988/15001 [1:13:44<6:50:51,  1.89s/it, loss=0.157, lr=1e-5]Steps:  13%|█▎        | 1989/15001 [1:13:45<6:47:58,  1.88s/it, loss=0.157, lr=1e-5]Steps:  13%|█▎        | 1989/15001 [1:13:45<6:47:58,  1.88s/it, loss=0.0932, lr=1e-5]Steps:  13%|█▎        | 1990/15001 [1:13:47<6:44:03,  1.86s/it, loss=0.0932, lr=1e-5]Steps:  13%|█▎        | 1990/15001 [1:13:47<6:44:03,  1.86s/it, loss=0.172, lr=1e-5] Steps:  13%|█▎        | 1991/15001 [1:13:49<6:44:10,  1.86s/it, loss=0.172, lr=1e-5]Steps:  13%|█▎        | 1991/15001 [1:13:49<6:44:10,  1.86s/it, loss=0.185, lr=1e-5]Steps:  13%|█▎        | 1992/15001 [1:13:51<6:30:51,  1.80s/it, loss=0.185, lr=1e-5]Steps:  13%|█▎        | 1992/15001 [1:13:51<6:30:51,  1.80s/it, loss=0.143, lr=1e-5]Steps:  13%|█▎        | 1993/15001 [1:13:53<6:40:51,  1.85s/it, loss=0.143, lr=1e-5]Steps:  13%|█▎        | 1993/15001 [1:13:53<6:40:51,  1.85s/it, loss=0.381, lr=1e-5]Steps:  13%|█▎        | 1994/15001 [1:13:54<6:21:28,  1.76s/it, loss=0.381, lr=1e-5]Steps:  13%|█▎        | 1994/15001 [1:13:55<6:21:28,  1.76s/it, loss=0.179, lr=1e-5]Steps:  13%|█▎        | 1995/15001 [1:13:56<6:35:54,  1.83s/it, loss=0.179, lr=1e-5]Steps:  13%|█▎        | 1995/15001 [1:13:56<6:35:54,  1.83s/it, loss=0.449, lr=1e-5]Steps:  13%|█▎        | 1996/15001 [1:13:58<6:45:55,  1.87s/it, loss=0.449, lr=1e-5]Steps:  13%|█▎        | 1996/15001 [1:13:58<6:45:55,  1.87s/it, loss=0.204, lr=1e-5]Steps:  13%|█▎        | 1997/15001 [1:14:00<6:52:32,  1.90s/it, loss=0.204, lr=1e-5]Steps:  13%|█▎        | 1997/15001 [1:14:00<6:52:32,  1.90s/it, loss=0.156, lr=1e-5]Steps:  13%|█▎        | 1998/15001 [1:14:02<6:32:23,  1.81s/it, loss=0.156, lr=1e-5]Steps:  13%|█▎        | 1998/15001 [1:14:02<6:32:23,  1.81s/it, loss=0.145, lr=1e-5]Steps:  13%|█▎        | 1999/15001 [1:14:04<6:50:10,  1.89s/it, loss=0.145, lr=1e-5]Steps:  13%|█▎        | 1999/15001 [1:14:04<6:50:10,  1.89s/it, loss=0.113, lr=1e-5]Steps:  13%|█▎        | 2000/15001 [1:14:06<6:45:43,  1.87s/it, loss=0.113, lr=1e-5]02/04/2024 14:16:25 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1663.31it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  13%|█▎        | 2000/15001 [1:17:45<6:45:43,  1.87s/it, loss=0.263, lr=1e-5]Steps:  13%|█▎        | 2001/15001 [1:17:47<244:07:07, 67.60s/it, loss=0.263, lr=1e-5]Steps:  13%|█▎        | 2001/15001 [1:17:47<244:07:07, 67.60s/it, loss=0.0207, lr=1e-5]Steps:  13%|█▎        | 2002/15001 [1:17:48<172:39:41, 47.82s/it, loss=0.0207, lr=1e-5]Steps:  13%|█▎        | 2002/15001 [1:17:49<172:39:41, 47.82s/it, loss=0.0688, lr=1e-5]Steps:  13%|█▎        | 2003/15001 [1:17:50<122:55:37, 34.05s/it, loss=0.0688, lr=1e-5]Steps:  13%|█▎        | 2003/15001 [1:17:50<122:55:37, 34.05s/it, loss=0.113, lr=1e-5] Steps:  13%|█▎        | 2004/15001 [1:17:52<88:21:17, 24.47s/it, loss=0.113, lr=1e-5] Steps:  13%|█▎        | 2004/15001 [1:17:52<88:21:17, 24.47s/it, loss=0.26, lr=1e-5] Steps:  13%|█▎        | 2005/15001 [1:17:54<63:59:21, 17.73s/it, loss=0.26, lr=1e-5]Steps:  13%|█▎        | 2005/15001 [1:17:54<63:59:21, 17.73s/it, loss=0.103, lr=1e-5]Steps:  13%|█▎        | 2006/15001 [1:17:56<46:35:43, 12.91s/it, loss=0.103, lr=1e-5]Steps:  13%|█▎        | 2006/15001 [1:17:56<46:35:43, 12.91s/it, loss=0.34, lr=1e-5] Steps:  13%|█▎        | 2007/15001 [1:17:58<34:38:58,  9.60s/it, loss=0.34, lr=1e-5]Steps:  13%|█▎        | 2007/15001 [1:17:58<34:38:58,  9.60s/it, loss=0.268, lr=1e-5]Steps:  13%|█▎        | 2008/15001 [1:18:00<26:23:51,  7.31s/it, loss=0.268, lr=1e-5]Steps:  13%|█▎        | 2008/15001 [1:18:00<26:23:51,  7.31s/it, loss=0.0632, lr=1e-5]Steps:  13%|█▎        | 2009/15001 [1:18:02<20:45:27,  5.75s/it, loss=0.0632, lr=1e-5]Steps:  13%|█▎        | 2009/15001 [1:18:02<20:45:27,  5.75s/it, loss=0.1, lr=1e-5]   Steps:  13%|█▎        | 2010/15001 [1:18:04<16:42:57,  4.63s/it, loss=0.1, lr=1e-5]Steps:  13%|█▎        | 2010/15001 [1:18:04<16:42:57,  4.63s/it, loss=0.223, lr=1e-5]Steps:  13%|█▎        | 2011/15001 [1:18:06<14:00:52,  3.88s/it, loss=0.223, lr=1e-5]Steps:  13%|█▎        | 2011/15001 [1:18:06<14:00:52,  3.88s/it, loss=0.115, lr=1e-5]Steps:  13%|█▎        | 2012/15001 [1:18:08<11:51:44,  3.29s/it, loss=0.115, lr=1e-5]Steps:  13%|█▎        | 2012/15001 [1:18:08<11:51:44,  3.29s/it, loss=0.22, lr=1e-5] Steps:  13%|█▎        | 2013/15001 [1:18:10<10:13:54,  2.84s/it, loss=0.22, lr=1e-5]Steps:  13%|█▎        | 2013/15001 [1:18:10<10:13:54,  2.84s/it, loss=0.239, lr=1e-5]Steps:  13%|█▎        | 2014/15001 [1:18:12<9:11:40,  2.55s/it, loss=0.239, lr=1e-5] Steps:  13%|█▎        | 2014/15001 [1:18:12<9:11:40,  2.55s/it, loss=0.0957, lr=1e-5]Steps:  13%|█▎        | 2015/15001 [1:18:13<8:26:45,  2.34s/it, loss=0.0957, lr=1e-5]Steps:  13%|█▎        | 2015/15001 [1:18:14<8:26:45,  2.34s/it, loss=0.214, lr=1e-5] Steps:  13%|█▎        | 2016/15001 [1:18:15<7:44:47,  2.15s/it, loss=0.214, lr=1e-5]Steps:  13%|█▎        | 2016/15001 [1:18:15<7:44:47,  2.15s/it, loss=0.0188, lr=1e-5]Steps:  13%|█▎        | 2017/15001 [1:18:17<7:38:30,  2.12s/it, loss=0.0188, lr=1e-5]Steps:  13%|█▎        | 2017/15001 [1:18:17<7:38:30,  2.12s/it, loss=0.149, lr=1e-5] Steps:  13%|█▎        | 2018/15001 [1:18:19<7:13:43,  2.00s/it, loss=0.149, lr=1e-5]Steps:  13%|█▎        | 2018/15001 [1:18:19<7:13:43,  2.00s/it, loss=0.0957, lr=1e-5]Steps:  13%|█▎        | 2019/15001 [1:18:21<6:50:17,  1.90s/it, loss=0.0957, lr=1e-5]Steps:  13%|█▎        | 2019/15001 [1:18:21<6:50:17,  1.90s/it, loss=0.133, lr=1e-5] Steps:  13%|█▎        | 2020/15001 [1:18:22<6:46:03,  1.88s/it, loss=0.133, lr=1e-5]Steps:  13%|█▎        | 2020/15001 [1:18:23<6:46:03,  1.88s/it, loss=0.217, lr=1e-5]Steps:  13%|█▎        | 2021/15001 [1:18:24<6:48:25,  1.89s/it, loss=0.217, lr=1e-5]Steps:  13%|█▎        | 2021/15001 [1:18:25<6:48:25,  1.89s/it, loss=0.182, lr=1e-5]Steps:  13%|█▎        | 2022/15001 [1:18:26<6:30:45,  1.81s/it, loss=0.182, lr=1e-5]Steps:  13%|█▎        | 2022/15001 [1:18:26<6:30:45,  1.81s/it, loss=0.184, lr=1e-5]Steps:  13%|█▎        | 2023/15001 [1:18:28<6:40:02,  1.85s/it, loss=0.184, lr=1e-5]Steps:  13%|█▎        | 2023/15001 [1:18:28<6:40:02,  1.85s/it, loss=0.251, lr=1e-5]Steps:  13%|█▎        | 2024/15001 [1:18:30<6:58:10,  1.93s/it, loss=0.251, lr=1e-5]Steps:  13%|█▎        | 2024/15001 [1:18:30<6:58:10,  1.93s/it, loss=0.0898, lr=1e-5]Steps:  13%|█▎        | 2025/15001 [1:18:32<6:57:22,  1.93s/it, loss=0.0898, lr=1e-5]Steps:  13%|█▎        | 2025/15001 [1:18:32<6:57:22,  1.93s/it, loss=0.0538, lr=1e-5]Steps:  14%|█▎        | 2026/15001 [1:18:34<6:49:05,  1.89s/it, loss=0.0538, lr=1e-5]Steps:  14%|█▎        | 2026/15001 [1:18:34<6:49:05,  1.89s/it, loss=0.134, lr=1e-5] Steps:  14%|█▎        | 2027/15001 [1:18:36<6:46:28,  1.88s/it, loss=0.134, lr=1e-5]Steps:  14%|█▎        | 2027/15001 [1:18:36<6:46:28,  1.88s/it, loss=0.254, lr=1e-5]Steps:  14%|█▎        | 2028/15001 [1:18:38<6:50:19,  1.90s/it, loss=0.254, lr=1e-5]Steps:  14%|█▎        | 2028/15001 [1:18:38<6:50:19,  1.90s/it, loss=0.089, lr=1e-5]Steps:  14%|█▎        | 2029/15001 [1:18:39<6:46:27,  1.88s/it, loss=0.089, lr=1e-5]Steps:  14%|█▎        | 2029/15001 [1:18:39<6:46:27,  1.88s/it, loss=0.0909, lr=1e-5]Steps:  14%|█▎        | 2030/15001 [1:18:41<6:48:24,  1.89s/it, loss=0.0909, lr=1e-5]Steps:  14%|█▎        | 2030/15001 [1:18:41<6:48:24,  1.89s/it, loss=0.184, lr=1e-5] Steps:  14%|█▎        | 2031/15001 [1:18:43<6:51:13,  1.90s/it, loss=0.184, lr=1e-5]Steps:  14%|█▎        | 2031/15001 [1:18:43<6:51:13,  1.90s/it, loss=0.116, lr=1e-5]Steps:  14%|█▎        | 2032/15001 [1:18:45<6:54:31,  1.92s/it, loss=0.116, lr=1e-5]Steps:  14%|█▎        | 2032/15001 [1:18:45<6:54:31,  1.92s/it, loss=0.012, lr=1e-5]Steps:  14%|█▎        | 2033/15001 [1:18:47<7:06:02,  1.97s/it, loss=0.012, lr=1e-5]Steps:  14%|█▎        | 2033/15001 [1:18:47<7:06:02,  1.97s/it, loss=0.115, lr=1e-5]Steps:  14%|█▎        | 2034/15001 [1:18:49<7:07:10,  1.98s/it, loss=0.115, lr=1e-5]Steps:  14%|█▎        | 2034/15001 [1:18:49<7:07:10,  1.98s/it, loss=0.355, lr=1e-5]Steps:  14%|█▎        | 2035/15001 [1:18:51<7:00:05,  1.94s/it, loss=0.355, lr=1e-5]Steps:  14%|█▎        | 2035/15001 [1:18:51<7:00:05,  1.94s/it, loss=0.107, lr=1e-5]Steps:  14%|█▎        | 2036/15001 [1:18:53<7:01:19,  1.95s/it, loss=0.107, lr=1e-5]Steps:  14%|█▎        | 2036/15001 [1:18:53<7:01:19,  1.95s/it, loss=0.164, lr=1e-5]Steps:  14%|█▎        | 2037/15001 [1:18:55<7:10:00,  1.99s/it, loss=0.164, lr=1e-5]Steps:  14%|█▎        | 2037/15001 [1:18:55<7:10:00,  1.99s/it, loss=0.232, lr=1e-5]Steps:  14%|█▎        | 2038/15001 [1:18:57<6:41:58,  1.86s/it, loss=0.232, lr=1e-5]Steps:  14%|█▎        | 2038/15001 [1:18:57<6:41:58,  1.86s/it, loss=0.154, lr=1e-5]Steps:  14%|█▎        | 2039/15001 [1:18:59<7:00:37,  1.95s/it, loss=0.154, lr=1e-5]Steps:  14%|█▎        | 2039/15001 [1:18:59<7:00:37,  1.95s/it, loss=0.181, lr=1e-5]Steps:  14%|█▎        | 2040/15001 [1:19:01<6:55:25,  1.92s/it, loss=0.181, lr=1e-5]Steps:  14%|█▎        | 2040/15001 [1:19:01<6:55:25,  1.92s/it, loss=0.346, lr=1e-5]Steps:  14%|█▎        | 2041/15001 [1:19:02<6:36:33,  1.84s/it, loss=0.346, lr=1e-5]Steps:  14%|█▎        | 2041/15001 [1:19:03<6:36:33,  1.84s/it, loss=0.222, lr=1e-5]Steps:  14%|█▎        | 2042/15001 [1:19:04<6:41:11,  1.86s/it, loss=0.222, lr=1e-5]Steps:  14%|█▎        | 2042/15001 [1:19:04<6:41:11,  1.86s/it, loss=0.146, lr=1e-5]Steps:  14%|█▎        | 2043/15001 [1:19:06<6:36:56,  1.84s/it, loss=0.146, lr=1e-5]Steps:  14%|█▎        | 2043/15001 [1:19:06<6:36:56,  1.84s/it, loss=0.2, lr=1e-5]  Steps:  14%|█▎        | 2044/15001 [1:19:08<6:40:12,  1.85s/it, loss=0.2, lr=1e-5]Steps:  14%|█▎        | 2044/15001 [1:19:08<6:40:12,  1.85s/it, loss=0.142, lr=1e-5]Steps:  14%|█▎        | 2045/15001 [1:19:10<6:36:04,  1.83s/it, loss=0.142, lr=1e-5]Steps:  14%|█▎        | 2045/15001 [1:19:10<6:36:04,  1.83s/it, loss=0.155, lr=1e-5]Steps:  14%|█▎        | 2046/15001 [1:19:12<6:32:53,  1.82s/it, loss=0.155, lr=1e-5]Steps:  14%|█▎        | 2046/15001 [1:19:12<6:32:53,  1.82s/it, loss=0.215, lr=1e-5]Steps:  14%|█▎        | 2047/15001 [1:19:13<6:29:41,  1.80s/it, loss=0.215, lr=1e-5]Steps:  14%|█▎        | 2047/15001 [1:19:13<6:29:41,  1.80s/it, loss=0.189, lr=1e-5]Steps:  14%|█▎        | 2048/15001 [1:19:15<6:35:58,  1.83s/it, loss=0.189, lr=1e-5]Steps:  14%|█▎        | 2048/15001 [1:19:15<6:35:58,  1.83s/it, loss=0.166, lr=1e-5]Steps:  14%|█▎        | 2049/15001 [1:19:17<6:21:41,  1.77s/it, loss=0.166, lr=1e-5]Steps:  14%|█▎        | 2049/15001 [1:19:17<6:21:41,  1.77s/it, loss=0.162, lr=1e-5]Steps:  14%|█▎        | 2050/15001 [1:19:19<6:38:56,  1.85s/it, loss=0.162, lr=1e-5]Steps:  14%|█▎        | 2050/15001 [1:19:19<6:38:56,  1.85s/it, loss=0.226, lr=1e-5]Steps:  14%|█▎        | 2051/15001 [1:19:21<6:30:29,  1.81s/it, loss=0.226, lr=1e-5]Steps:  14%|█▎        | 2051/15001 [1:19:21<6:30:29,  1.81s/it, loss=0.133, lr=1e-5]Steps:  14%|█▎        | 2052/15001 [1:19:22<6:21:40,  1.77s/it, loss=0.133, lr=1e-5]Steps:  14%|█▎        | 2052/15001 [1:19:23<6:21:40,  1.77s/it, loss=0.26, lr=1e-5] Steps:  14%|█▎        | 2053/15001 [1:19:24<6:33:41,  1.82s/it, loss=0.26, lr=1e-5]Steps:  14%|█▎        | 2053/15001 [1:19:25<6:33:41,  1.82s/it, loss=0.308, lr=1e-5]Steps:  14%|█▎        | 2054/15001 [1:19:26<6:45:56,  1.88s/it, loss=0.308, lr=1e-5]Steps:  14%|█▎        | 2054/15001 [1:19:27<6:45:56,  1.88s/it, loss=0.243, lr=1e-5]Steps:  14%|█▎        | 2055/15001 [1:19:28<6:55:15,  1.92s/it, loss=0.243, lr=1e-5]Steps:  14%|█▎        | 2055/15001 [1:19:29<6:55:15,  1.92s/it, loss=0.127, lr=1e-5]Steps:  14%|█▎        | 2056/15001 [1:19:30<7:02:40,  1.96s/it, loss=0.127, lr=1e-5]Steps:  14%|█▎        | 2056/15001 [1:19:31<7:02:40,  1.96s/it, loss=0.282, lr=1e-5]Steps:  14%|█▎        | 2057/15001 [1:19:32<6:58:15,  1.94s/it, loss=0.282, lr=1e-5]Steps:  14%|█▎        | 2057/15001 [1:19:33<6:58:15,  1.94s/it, loss=0.119, lr=1e-5]Steps:  14%|█▎        | 2058/15001 [1:19:34<7:22:44,  2.05s/it, loss=0.119, lr=1e-5]Steps:  14%|█▎        | 2058/15001 [1:19:35<7:22:44,  2.05s/it, loss=0.134, lr=1e-5]Steps:  14%|█▎        | 2059/15001 [1:19:36<7:05:09,  1.97s/it, loss=0.134, lr=1e-5]Steps:  14%|█▎        | 2059/15001 [1:19:37<7:05:09,  1.97s/it, loss=0.218, lr=1e-5]Steps:  14%|█▎        | 2060/15001 [1:19:38<7:03:55,  1.97s/it, loss=0.218, lr=1e-5]Steps:  14%|█▎        | 2060/15001 [1:19:38<7:03:55,  1.97s/it, loss=0.186, lr=1e-5]Steps:  14%|█▎        | 2061/15001 [1:19:40<6:59:04,  1.94s/it, loss=0.186, lr=1e-5]Steps:  14%|█▎        | 2061/15001 [1:19:40<6:59:04,  1.94s/it, loss=0.0157, lr=1e-5]Steps:  14%|█▎        | 2062/15001 [1:19:42<6:50:08,  1.90s/it, loss=0.0157, lr=1e-5]Steps:  14%|█▎        | 2062/15001 [1:19:42<6:50:08,  1.90s/it, loss=0.178, lr=1e-5] Steps:  14%|█▍        | 2063/15001 [1:19:44<6:43:59,  1.87s/it, loss=0.178, lr=1e-5]Steps:  14%|█▍        | 2063/15001 [1:19:44<6:43:59,  1.87s/it, loss=0.163, lr=1e-5]Steps:  14%|█▍        | 2064/15001 [1:19:46<6:44:48,  1.88s/it, loss=0.163, lr=1e-5]Steps:  14%|█▍        | 2064/15001 [1:19:46<6:44:48,  1.88s/it, loss=0.199, lr=1e-5]Steps:  14%|█▍        | 2065/15001 [1:19:47<6:27:22,  1.80s/it, loss=0.199, lr=1e-5]Steps:  14%|█▍        | 2065/15001 [1:19:47<6:27:22,  1.80s/it, loss=0.1, lr=1e-5]  Steps:  14%|█▍        | 2066/15001 [1:19:49<6:30:57,  1.81s/it, loss=0.1, lr=1e-5]Steps:  14%|█▍        | 2066/15001 [1:19:49<6:30:57,  1.81s/it, loss=0.0282, lr=1e-5]Steps:  14%|█▍        | 2067/15001 [1:19:51<6:28:31,  1.80s/it, loss=0.0282, lr=1e-5]Steps:  14%|█▍        | 2067/15001 [1:19:51<6:28:31,  1.80s/it, loss=0.157, lr=1e-5] Steps:  14%|█▍        | 2068/15001 [1:19:53<6:28:56,  1.80s/it, loss=0.157, lr=1e-5]Steps:  14%|█▍        | 2068/15001 [1:19:53<6:28:56,  1.80s/it, loss=0.173, lr=1e-5]Steps:  14%|█▍        | 2069/15001 [1:19:55<6:38:22,  1.85s/it, loss=0.173, lr=1e-5]Steps:  14%|█▍        | 2069/15001 [1:19:55<6:38:22,  1.85s/it, loss=0.243, lr=1e-5]Steps:  14%|█▍        | 2070/15001 [1:19:56<6:36:22,  1.84s/it, loss=0.243, lr=1e-5]Steps:  14%|█▍        | 2070/15001 [1:19:57<6:36:22,  1.84s/it, loss=0.0949, lr=1e-5]Steps:  14%|█▍        | 2071/15001 [1:19:59<6:54:23,  1.92s/it, loss=0.0949, lr=1e-5]Steps:  14%|█▍        | 2071/15001 [1:19:59<6:54:23,  1.92s/it, loss=0.224, lr=1e-5] Steps:  14%|█▍        | 2072/15001 [1:20:00<6:30:46,  1.81s/it, loss=0.224, lr=1e-5]Steps:  14%|█▍        | 2072/15001 [1:20:00<6:30:46,  1.81s/it, loss=0.279, lr=1e-5]Steps:  14%|█▍        | 2073/15001 [1:20:02<6:34:26,  1.83s/it, loss=0.279, lr=1e-5]Steps:  14%|█▍        | 2073/15001 [1:20:02<6:34:26,  1.83s/it, loss=0.102, lr=1e-5]Steps:  14%|█▍        | 2074/15001 [1:20:04<6:21:19,  1.77s/it, loss=0.102, lr=1e-5]Steps:  14%|█▍        | 2074/15001 [1:20:04<6:21:19,  1.77s/it, loss=0.111, lr=1e-5]Steps:  14%|█▍        | 2075/15001 [1:20:06<6:42:52,  1.87s/it, loss=0.111, lr=1e-5]Steps:  14%|█▍        | 2075/15001 [1:20:06<6:42:52,  1.87s/it, loss=0.0443, lr=1e-5]Steps:  14%|█▍        | 2076/15001 [1:20:08<6:48:11,  1.89s/it, loss=0.0443, lr=1e-5]Steps:  14%|█▍        | 2076/15001 [1:20:08<6:48:11,  1.89s/it, loss=0.312, lr=1e-5] Steps:  14%|█▍        | 2077/15001 [1:20:10<6:55:54,  1.93s/it, loss=0.312, lr=1e-5]Steps:  14%|█▍        | 2077/15001 [1:20:10<6:55:54,  1.93s/it, loss=0.218, lr=1e-5]Steps:  14%|█▍        | 2078/15001 [1:20:12<6:57:22,  1.94s/it, loss=0.218, lr=1e-5]Steps:  14%|█▍        | 2078/15001 [1:20:12<6:57:22,  1.94s/it, loss=0.275, lr=1e-5]Steps:  14%|█▍        | 2079/15001 [1:20:14<6:55:50,  1.93s/it, loss=0.275, lr=1e-5]Steps:  14%|█▍        | 2079/15001 [1:20:14<6:55:50,  1.93s/it, loss=0.176, lr=1e-5]Steps:  14%|█▍        | 2080/15001 [1:20:15<6:53:16,  1.92s/it, loss=0.176, lr=1e-5]Steps:  14%|█▍        | 2080/15001 [1:20:16<6:53:16,  1.92s/it, loss=0.178, lr=1e-5]Steps:  14%|█▍        | 2081/15001 [1:20:18<7:13:32,  2.01s/it, loss=0.178, lr=1e-5]Steps:  14%|█▍        | 2081/15001 [1:20:18<7:13:32,  2.01s/it, loss=0.274, lr=1e-5]Steps:  14%|█▍        | 2082/15001 [1:20:20<7:02:20,  1.96s/it, loss=0.274, lr=1e-5]Steps:  14%|█▍        | 2082/15001 [1:20:20<7:02:20,  1.96s/it, loss=0.117, lr=1e-5]Steps:  14%|█▍        | 2083/15001 [1:20:21<6:44:05,  1.88s/it, loss=0.117, lr=1e-5]Steps:  14%|█▍        | 2083/15001 [1:20:21<6:44:05,  1.88s/it, loss=0.191, lr=1e-5]Steps:  14%|█▍        | 2084/15001 [1:20:23<6:43:53,  1.88s/it, loss=0.191, lr=1e-5]Steps:  14%|█▍        | 2084/15001 [1:20:23<6:43:53,  1.88s/it, loss=0.121, lr=1e-5]Steps:  14%|█▍        | 2085/15001 [1:20:25<6:41:49,  1.87s/it, loss=0.121, lr=1e-5]Steps:  14%|█▍        | 2085/15001 [1:20:25<6:41:49,  1.87s/it, loss=0.0995, lr=1e-5]Steps:  14%|█▍        | 2086/15001 [1:20:27<6:35:57,  1.84s/it, loss=0.0995, lr=1e-5]Steps:  14%|█▍        | 2086/15001 [1:20:27<6:35:57,  1.84s/it, loss=0.104, lr=1e-5] Steps:  14%|█▍        | 2087/15001 [1:20:28<6:29:37,  1.81s/it, loss=0.104, lr=1e-5]Steps:  14%|█▍        | 2087/15001 [1:20:29<6:29:37,  1.81s/it, loss=0.0935, lr=1e-5]Steps:  14%|█▍        | 2088/15001 [1:20:30<6:37:56,  1.85s/it, loss=0.0935, lr=1e-5]Steps:  14%|█▍        | 2088/15001 [1:20:30<6:37:56,  1.85s/it, loss=0.0913, lr=1e-5]Steps:  14%|█▍        | 2089/15001 [1:20:32<6:21:45,  1.77s/it, loss=0.0913, lr=1e-5]Steps:  14%|█▍        | 2089/15001 [1:20:32<6:21:45,  1.77s/it, loss=0.0437, lr=1e-5]Steps:  14%|█▍        | 2090/15001 [1:20:34<6:21:14,  1.77s/it, loss=0.0437, lr=1e-5]Steps:  14%|█▍        | 2090/15001 [1:20:34<6:21:14,  1.77s/it, loss=0.243, lr=1e-5] Steps:  14%|█▍        | 2091/15001 [1:20:35<6:20:27,  1.77s/it, loss=0.243, lr=1e-5]Steps:  14%|█▍        | 2091/15001 [1:20:36<6:20:27,  1.77s/it, loss=0.0412, lr=1e-5]Steps:  14%|█▍        | 2092/15001 [1:20:37<6:19:35,  1.76s/it, loss=0.0412, lr=1e-5]Steps:  14%|█▍        | 2092/15001 [1:20:38<6:19:35,  1.76s/it, loss=0.121, lr=1e-5] Steps:  14%|█▍        | 2093/15001 [1:20:39<6:38:37,  1.85s/it, loss=0.121, lr=1e-5]Steps:  14%|█▍        | 2093/15001 [1:20:40<6:38:37,  1.85s/it, loss=0.191, lr=1e-5]Steps:  14%|█▍        | 2094/15001 [1:20:41<6:50:36,  1.91s/it, loss=0.191, lr=1e-5]Steps:  14%|█▍        | 2094/15001 [1:20:41<6:50:36,  1.91s/it, loss=0.218, lr=1e-5]Steps:  14%|█▍        | 2095/15001 [1:20:43<6:44:38,  1.88s/it, loss=0.218, lr=1e-5]Steps:  14%|█▍        | 2095/15001 [1:20:43<6:44:38,  1.88s/it, loss=0.1, lr=1e-5]  Steps:  14%|█▍        | 2096/15001 [1:20:45<6:34:11,  1.83s/it, loss=0.1, lr=1e-5]Steps:  14%|█▍        | 2096/15001 [1:20:45<6:34:11,  1.83s/it, loss=0.117, lr=1e-5]Steps:  14%|█▍        | 2097/15001 [1:20:47<6:36:42,  1.84s/it, loss=0.117, lr=1e-5]Steps:  14%|█▍        | 2097/15001 [1:20:47<6:36:42,  1.84s/it, loss=0.252, lr=1e-5]Steps:  14%|█▍        | 2098/15001 [1:20:49<6:39:35,  1.86s/it, loss=0.252, lr=1e-5]Steps:  14%|█▍        | 2098/15001 [1:20:49<6:39:35,  1.86s/it, loss=0.232, lr=1e-5]Steps:  14%|█▍        | 2099/15001 [1:20:51<6:47:58,  1.90s/it, loss=0.232, lr=1e-5]Steps:  14%|█▍        | 2099/15001 [1:20:51<6:47:58,  1.90s/it, loss=0.0106, lr=1e-5]Steps:  14%|█▍        | 2100/15001 [1:20:52<6:43:10,  1.88s/it, loss=0.0106, lr=1e-5]Steps:  14%|█▍        | 2100/15001 [1:20:53<6:43:10,  1.88s/it, loss=0.216, lr=1e-5] Steps:  14%|█▍        | 2101/15001 [1:20:55<6:58:01,  1.94s/it, loss=0.216, lr=1e-5]Steps:  14%|█▍        | 2101/15001 [1:20:55<6:58:01,  1.94s/it, loss=0.314, lr=1e-5]Steps:  14%|█▍        | 2102/15001 [1:20:57<7:14:08,  2.02s/it, loss=0.314, lr=1e-5]Steps:  14%|█▍        | 2102/15001 [1:20:57<7:14:08,  2.02s/it, loss=0.0573, lr=1e-5]Steps:  14%|█▍        | 2103/15001 [1:20:59<7:14:52,  2.02s/it, loss=0.0573, lr=1e-5]Steps:  14%|█▍        | 2103/15001 [1:20:59<7:14:52,  2.02s/it, loss=0.101, lr=1e-5] Steps:  14%|█▍        | 2104/15001 [1:21:01<7:06:55,  1.99s/it, loss=0.101, lr=1e-5]Steps:  14%|█▍        | 2104/15001 [1:21:01<7:06:55,  1.99s/it, loss=0.351, lr=1e-5]Steps:  14%|█▍        | 2105/15001 [1:21:02<6:46:54,  1.89s/it, loss=0.351, lr=1e-5]Steps:  14%|█▍        | 2105/15001 [1:21:03<6:46:54,  1.89s/it, loss=0.0895, lr=1e-5]Steps:  14%|█▍        | 2106/15001 [1:21:04<6:45:33,  1.89s/it, loss=0.0895, lr=1e-5]Steps:  14%|█▍        | 2106/15001 [1:21:05<6:45:33,  1.89s/it, loss=0.0405, lr=1e-5]Steps:  14%|█▍        | 2107/15001 [1:21:06<6:44:33,  1.88s/it, loss=0.0405, lr=1e-5]Steps:  14%|█▍        | 2107/15001 [1:21:06<6:44:33,  1.88s/it, loss=0.239, lr=1e-5] Steps:  14%|█▍        | 2108/15001 [1:21:08<7:01:12,  1.96s/it, loss=0.239, lr=1e-5]Steps:  14%|█▍        | 2108/15001 [1:21:08<7:01:12,  1.96s/it, loss=0.146, lr=1e-5]Steps:  14%|█▍        | 2109/15001 [1:21:10<6:51:10,  1.91s/it, loss=0.146, lr=1e-5]Steps:  14%|█▍        | 2109/15001 [1:21:10<6:51:10,  1.91s/it, loss=0.115, lr=1e-5]Steps:  14%|█▍        | 2110/15001 [1:21:12<6:39:37,  1.86s/it, loss=0.115, lr=1e-5]Steps:  14%|█▍        | 2110/15001 [1:21:12<6:39:37,  1.86s/it, loss=0.426, lr=1e-5]Steps:  14%|█▍        | 2111/15001 [1:21:13<6:26:16,  1.80s/it, loss=0.426, lr=1e-5]Steps:  14%|█▍        | 2111/15001 [1:21:14<6:26:16,  1.80s/it, loss=0.288, lr=1e-5]Steps:  14%|█▍        | 2112/15001 [1:21:15<6:41:58,  1.87s/it, loss=0.288, lr=1e-5]Steps:  14%|█▍        | 2112/15001 [1:21:16<6:41:58,  1.87s/it, loss=0.199, lr=1e-5]Steps:  14%|█▍        | 2113/15001 [1:21:17<6:28:40,  1.81s/it, loss=0.199, lr=1e-5]Steps:  14%|█▍        | 2113/15001 [1:21:18<6:28:40,  1.81s/it, loss=0.242, lr=1e-5]Steps:  14%|█▍        | 2114/15001 [1:21:19<7:01:06,  1.96s/it, loss=0.242, lr=1e-5]Steps:  14%|█▍        | 2114/15001 [1:21:20<7:01:06,  1.96s/it, loss=0.139, lr=1e-5]Steps:  14%|█▍        | 2115/15001 [1:21:21<6:46:36,  1.89s/it, loss=0.139, lr=1e-5]Steps:  14%|█▍        | 2115/15001 [1:21:21<6:46:36,  1.89s/it, loss=0.278, lr=1e-5]Steps:  14%|█▍        | 2116/15001 [1:21:23<6:40:58,  1.87s/it, loss=0.278, lr=1e-5]Steps:  14%|█▍        | 2116/15001 [1:21:23<6:40:58,  1.87s/it, loss=0.209, lr=1e-5]Steps:  14%|█▍        | 2117/15001 [1:21:25<6:26:16,  1.80s/it, loss=0.209, lr=1e-5]Steps:  14%|█▍        | 2117/15001 [1:21:25<6:26:16,  1.80s/it, loss=0.151, lr=1e-5]Steps:  14%|█▍        | 2118/15001 [1:21:27<6:43:47,  1.88s/it, loss=0.151, lr=1e-5]Steps:  14%|█▍        | 2118/15001 [1:21:27<6:43:47,  1.88s/it, loss=0.223, lr=1e-5]Steps:  14%|█▍        | 2119/15001 [1:21:28<6:31:41,  1.82s/it, loss=0.223, lr=1e-5]Steps:  14%|█▍        | 2119/15001 [1:21:29<6:31:41,  1.82s/it, loss=0.0843, lr=1e-5]Steps:  14%|█▍        | 2120/15001 [1:21:30<6:32:32,  1.83s/it, loss=0.0843, lr=1e-5]Steps:  14%|█▍        | 2120/15001 [1:21:30<6:32:32,  1.83s/it, loss=0.237, lr=1e-5] Steps:  14%|█▍        | 2121/15001 [1:21:32<6:31:17,  1.82s/it, loss=0.237, lr=1e-5]Steps:  14%|█▍        | 2121/15001 [1:21:32<6:31:17,  1.82s/it, loss=0.225, lr=1e-5]Steps:  14%|█▍        | 2122/15001 [1:21:34<6:49:42,  1.91s/it, loss=0.225, lr=1e-5]Steps:  14%|█▍        | 2122/15001 [1:21:34<6:49:42,  1.91s/it, loss=0.171, lr=1e-5]Steps:  14%|█▍        | 2123/15001 [1:21:36<6:44:58,  1.89s/it, loss=0.171, lr=1e-5]Steps:  14%|█▍        | 2123/15001 [1:21:36<6:44:58,  1.89s/it, loss=0.19, lr=1e-5] Steps:  14%|█▍        | 2124/15001 [1:21:38<6:47:13,  1.90s/it, loss=0.19, lr=1e-5]Steps:  14%|█▍        | 2124/15001 [1:21:38<6:47:13,  1.90s/it, loss=0.321, lr=1e-5]Steps:  14%|█▍        | 2125/15001 [1:21:40<6:52:29,  1.92s/it, loss=0.321, lr=1e-5]Steps:  14%|█▍        | 2125/15001 [1:21:40<6:52:29,  1.92s/it, loss=0.223, lr=1e-5]Steps:  14%|█▍        | 2126/15001 [1:21:42<7:09:48,  2.00s/it, loss=0.223, lr=1e-5]Steps:  14%|█▍        | 2126/15001 [1:21:42<7:09:48,  2.00s/it, loss=0.0671, lr=1e-5]Steps:  14%|█▍        | 2127/15001 [1:21:44<7:14:30,  2.03s/it, loss=0.0671, lr=1e-5]Steps:  14%|█▍        | 2127/15001 [1:21:44<7:14:30,  2.03s/it, loss=0.0893, lr=1e-5]Steps:  14%|█▍        | 2128/15001 [1:21:46<6:59:04,  1.95s/it, loss=0.0893, lr=1e-5]Steps:  14%|█▍        | 2128/15001 [1:21:46<6:59:04,  1.95s/it, loss=0.3, lr=1e-5]   Steps:  14%|█▍        | 2129/15001 [1:21:48<6:37:54,  1.85s/it, loss=0.3, lr=1e-5]Steps:  14%|█▍        | 2129/15001 [1:21:48<6:37:54,  1.85s/it, loss=0.119, lr=1e-5]Steps:  14%|█▍        | 2130/15001 [1:21:49<6:39:34,  1.86s/it, loss=0.119, lr=1e-5]Steps:  14%|█▍        | 2130/15001 [1:21:50<6:39:34,  1.86s/it, loss=0.137, lr=1e-5]Steps:  14%|█▍        | 2131/15001 [1:21:51<6:48:47,  1.91s/it, loss=0.137, lr=1e-5]Steps:  14%|█▍        | 2131/15001 [1:21:52<6:48:47,  1.91s/it, loss=0.0548, lr=1e-5]Steps:  14%|█▍        | 2132/15001 [1:21:53<6:42:35,  1.88s/it, loss=0.0548, lr=1e-5]Steps:  14%|█▍        | 2132/15001 [1:21:53<6:42:35,  1.88s/it, loss=0.0724, lr=1e-5]Steps:  14%|█▍        | 2133/15001 [1:21:55<6:27:09,  1.81s/it, loss=0.0724, lr=1e-5]Steps:  14%|█▍        | 2133/15001 [1:21:55<6:27:09,  1.81s/it, loss=0.256, lr=1e-5] Steps:  14%|█▍        | 2134/15001 [1:21:57<6:42:37,  1.88s/it, loss=0.256, lr=1e-5]Steps:  14%|█▍        | 2134/15001 [1:21:57<6:42:37,  1.88s/it, loss=0.0938, lr=1e-5]Steps:  14%|█▍        | 2135/15001 [1:21:59<6:22:22,  1.78s/it, loss=0.0938, lr=1e-5]Steps:  14%|█▍        | 2135/15001 [1:21:59<6:22:22,  1.78s/it, loss=0.119, lr=1e-5] Steps:  14%|█▍        | 2136/15001 [1:22:01<6:40:59,  1.87s/it, loss=0.119, lr=1e-5]Steps:  14%|█▍        | 2136/15001 [1:22:01<6:40:59,  1.87s/it, loss=0.0711, lr=1e-5]Steps:  14%|█▍        | 2137/15001 [1:22:02<6:24:29,  1.79s/it, loss=0.0711, lr=1e-5]Steps:  14%|█▍        | 2137/15001 [1:22:03<6:24:29,  1.79s/it, loss=0.129, lr=1e-5] Steps:  14%|█▍        | 2138/15001 [1:22:04<6:46:32,  1.90s/it, loss=0.129, lr=1e-5]Steps:  14%|█▍        | 2138/15001 [1:22:04<6:46:32,  1.90s/it, loss=0.0419, lr=1e-5]Steps:  14%|█▍        | 2139/15001 [1:22:06<6:28:24,  1.81s/it, loss=0.0419, lr=1e-5]Steps:  14%|█▍        | 2139/15001 [1:22:06<6:28:24,  1.81s/it, loss=0.0703, lr=1e-5]Steps:  14%|█▍        | 2140/15001 [1:22:08<6:24:03,  1.79s/it, loss=0.0703, lr=1e-5]Steps:  14%|█▍        | 2140/15001 [1:22:08<6:24:03,  1.79s/it, loss=0.145, lr=1e-5] Steps:  14%|█▍        | 2141/15001 [1:22:09<6:17:02,  1.76s/it, loss=0.145, lr=1e-5]Steps:  14%|█▍        | 2141/15001 [1:22:10<6:17:02,  1.76s/it, loss=0.137, lr=1e-5]Steps:  14%|█▍        | 2142/15001 [1:22:12<6:43:27,  1.88s/it, loss=0.137, lr=1e-5]Steps:  14%|█▍        | 2142/15001 [1:22:12<6:43:27,  1.88s/it, loss=0.085, lr=1e-5]Steps:  14%|█▍        | 2143/15001 [1:22:13<6:27:55,  1.81s/it, loss=0.085, lr=1e-5]Steps:  14%|█▍        | 2143/15001 [1:22:13<6:27:55,  1.81s/it, loss=0.185, lr=1e-5]Steps:  14%|█▍        | 2144/15001 [1:22:15<6:39:43,  1.87s/it, loss=0.185, lr=1e-5]Steps:  14%|█▍        | 2144/15001 [1:22:15<6:39:43,  1.87s/it, loss=0.25, lr=1e-5] Steps:  14%|█▍        | 2145/15001 [1:22:17<6:45:44,  1.89s/it, loss=0.25, lr=1e-5]Steps:  14%|█▍        | 2145/15001 [1:22:17<6:45:44,  1.89s/it, loss=0.152, lr=1e-5]Steps:  14%|█▍        | 2146/15001 [1:22:19<6:57:15,  1.95s/it, loss=0.152, lr=1e-5]Steps:  14%|█▍        | 2146/15001 [1:22:19<6:57:15,  1.95s/it, loss=0.202, lr=1e-5]Steps:  14%|█▍        | 2147/15001 [1:22:21<6:55:51,  1.94s/it, loss=0.202, lr=1e-5]Steps:  14%|█▍        | 2147/15001 [1:22:21<6:55:51,  1.94s/it, loss=0.155, lr=1e-5]Steps:  14%|█▍        | 2148/15001 [1:22:23<7:05:13,  1.98s/it, loss=0.155, lr=1e-5]Steps:  14%|█▍        | 2148/15001 [1:22:23<7:05:13,  1.98s/it, loss=0.00838, lr=1e-5]Steps:  14%|█▍        | 2149/15001 [1:22:25<6:54:37,  1.94s/it, loss=0.00838, lr=1e-5]Steps:  14%|█▍        | 2149/15001 [1:22:25<6:54:37,  1.94s/it, loss=0.146, lr=1e-5]  Steps:  14%|█▍        | 2150/15001 [1:22:27<6:53:47,  1.93s/it, loss=0.146, lr=1e-5]Steps:  14%|█▍        | 2150/15001 [1:22:27<6:53:47,  1.93s/it, loss=0.287, lr=1e-5]Steps:  14%|█▍        | 2151/15001 [1:22:29<7:01:36,  1.97s/it, loss=0.287, lr=1e-5]Steps:  14%|█▍        | 2151/15001 [1:22:29<7:01:36,  1.97s/it, loss=0.14, lr=1e-5] Steps:  14%|█▍        | 2152/15001 [1:22:31<6:53:24,  1.93s/it, loss=0.14, lr=1e-5]Steps:  14%|█▍        | 2152/15001 [1:22:31<6:53:24,  1.93s/it, loss=0.165, lr=1e-5]Steps:  14%|█▍        | 2153/15001 [1:22:33<6:41:00,  1.87s/it, loss=0.165, lr=1e-5]Steps:  14%|█▍        | 2153/15001 [1:22:33<6:41:00,  1.87s/it, loss=0.0867, lr=1e-5]Steps:  14%|█▍        | 2154/15001 [1:22:34<6:36:54,  1.85s/it, loss=0.0867, lr=1e-5]Steps:  14%|█▍        | 2154/15001 [1:22:35<6:36:54,  1.85s/it, loss=0.159, lr=1e-5] Steps:  14%|█▍        | 2155/15001 [1:22:36<6:34:58,  1.84s/it, loss=0.159, lr=1e-5]Steps:  14%|█▍        | 2155/15001 [1:22:36<6:34:58,  1.84s/it, loss=0.199, lr=1e-5]Steps:  14%|█▍        | 2156/15001 [1:22:38<6:48:52,  1.91s/it, loss=0.199, lr=1e-5]Steps:  14%|█▍        | 2156/15001 [1:22:38<6:48:52,  1.91s/it, loss=0.375, lr=1e-5]Steps:  14%|█▍        | 2157/15001 [1:22:40<6:35:29,  1.85s/it, loss=0.375, lr=1e-5]Steps:  14%|█▍        | 2157/15001 [1:22:40<6:35:29,  1.85s/it, loss=0.072, lr=1e-5]Steps:  14%|█▍        | 2158/15001 [1:22:42<6:41:16,  1.87s/it, loss=0.072, lr=1e-5]Steps:  14%|█▍        | 2158/15001 [1:22:42<6:41:16,  1.87s/it, loss=0.266, lr=1e-5]Steps:  14%|█▍        | 2159/15001 [1:22:44<6:24:16,  1.80s/it, loss=0.266, lr=1e-5]Steps:  14%|█▍        | 2159/15001 [1:22:44<6:24:16,  1.80s/it, loss=0.125, lr=1e-5]Steps:  14%|█▍        | 2160/15001 [1:22:45<6:25:32,  1.80s/it, loss=0.125, lr=1e-5]Steps:  14%|█▍        | 2160/15001 [1:22:46<6:25:32,  1.80s/it, loss=0.136, lr=1e-5]Steps:  14%|█▍        | 2161/15001 [1:22:48<6:48:53,  1.91s/it, loss=0.136, lr=1e-5]Steps:  14%|█▍        | 2161/15001 [1:22:48<6:48:53,  1.91s/it, loss=0.292, lr=1e-5]Steps:  14%|█▍        | 2162/15001 [1:22:49<6:46:29,  1.90s/it, loss=0.292, lr=1e-5]Steps:  14%|█▍        | 2162/15001 [1:22:50<6:46:29,  1.90s/it, loss=0.145, lr=1e-5]Steps:  14%|█▍        | 2163/15001 [1:22:51<6:43:31,  1.89s/it, loss=0.145, lr=1e-5]Steps:  14%|█▍        | 2163/15001 [1:22:51<6:43:31,  1.89s/it, loss=0.278, lr=1e-5]Steps:  14%|█▍        | 2164/15001 [1:22:53<6:34:19,  1.84s/it, loss=0.278, lr=1e-5]Steps:  14%|█▍        | 2164/15001 [1:22:53<6:34:19,  1.84s/it, loss=0.175, lr=1e-5]Steps:  14%|█▍        | 2165/15001 [1:22:55<6:38:33,  1.86s/it, loss=0.175, lr=1e-5]Steps:  14%|█▍        | 2165/15001 [1:22:55<6:38:33,  1.86s/it, loss=0.19, lr=1e-5] Steps:  14%|█▍        | 2166/15001 [1:22:57<6:33:43,  1.84s/it, loss=0.19, lr=1e-5]Steps:  14%|█▍        | 2166/15001 [1:22:57<6:33:43,  1.84s/it, loss=0.0561, lr=1e-5]Steps:  14%|█▍        | 2167/15001 [1:22:59<6:38:51,  1.86s/it, loss=0.0561, lr=1e-5]Steps:  14%|█▍        | 2167/15001 [1:22:59<6:38:51,  1.86s/it, loss=0.241, lr=1e-5] Steps:  14%|█▍        | 2168/15001 [1:23:01<6:48:51,  1.91s/it, loss=0.241, lr=1e-5]Steps:  14%|█▍        | 2168/15001 [1:23:01<6:48:51,  1.91s/it, loss=0.086, lr=1e-5]Steps:  14%|█▍        | 2169/15001 [1:23:03<7:02:45,  1.98s/it, loss=0.086, lr=1e-5]Steps:  14%|█▍        | 2169/15001 [1:23:03<7:02:45,  1.98s/it, loss=0.0967, lr=1e-5]Steps:  14%|█▍        | 2170/15001 [1:23:05<6:53:11,  1.93s/it, loss=0.0967, lr=1e-5]Steps:  14%|█▍        | 2170/15001 [1:23:05<6:53:11,  1.93s/it, loss=0.0612, lr=1e-5]Steps:  14%|█▍        | 2171/15001 [1:23:07<7:04:18,  1.98s/it, loss=0.0612, lr=1e-5]Steps:  14%|█▍        | 2171/15001 [1:23:07<7:04:18,  1.98s/it, loss=0.28, lr=1e-5]  Steps:  14%|█▍        | 2172/15001 [1:23:09<6:52:35,  1.93s/it, loss=0.28, lr=1e-5]Steps:  14%|█▍        | 2172/15001 [1:23:09<6:52:35,  1.93s/it, loss=0.0672, lr=1e-5]Steps:  14%|█▍        | 2173/15001 [1:23:10<6:44:15,  1.89s/it, loss=0.0672, lr=1e-5]Steps:  14%|█▍        | 2173/15001 [1:23:11<6:44:15,  1.89s/it, loss=0.119, lr=1e-5] Steps:  14%|█▍        | 2174/15001 [1:23:12<6:49:56,  1.92s/it, loss=0.119, lr=1e-5]Steps:  14%|█▍        | 2174/15001 [1:23:12<6:49:56,  1.92s/it, loss=0.311, lr=1e-5]Steps:  14%|█▍        | 2175/15001 [1:23:14<6:52:25,  1.93s/it, loss=0.311, lr=1e-5]Steps:  14%|█▍        | 2175/15001 [1:23:14<6:52:25,  1.93s/it, loss=0.161, lr=1e-5]Steps:  15%|█▍        | 2176/15001 [1:23:16<6:42:13,  1.88s/it, loss=0.161, lr=1e-5]Steps:  15%|█▍        | 2176/15001 [1:23:16<6:42:13,  1.88s/it, loss=0.0982, lr=1e-5]Steps:  15%|█▍        | 2177/15001 [1:23:18<6:48:57,  1.91s/it, loss=0.0982, lr=1e-5]Steps:  15%|█▍        | 2177/15001 [1:23:18<6:48:57,  1.91s/it, loss=0.215, lr=1e-5] Steps:  15%|█▍        | 2178/15001 [1:23:20<6:37:41,  1.86s/it, loss=0.215, lr=1e-5]Steps:  15%|█▍        | 2178/15001 [1:23:20<6:37:41,  1.86s/it, loss=0.127, lr=1e-5]Steps:  15%|█▍        | 2179/15001 [1:23:22<6:36:46,  1.86s/it, loss=0.127, lr=1e-5]Steps:  15%|█▍        | 2179/15001 [1:23:22<6:36:46,  1.86s/it, loss=0.15, lr=1e-5] Steps:  15%|█▍        | 2180/15001 [1:23:23<6:34:29,  1.85s/it, loss=0.15, lr=1e-5]Steps:  15%|█▍        | 2180/15001 [1:23:24<6:34:29,  1.85s/it, loss=0.062, lr=1e-5]Steps:  15%|█▍        | 2181/15001 [1:23:25<6:43:26,  1.89s/it, loss=0.062, lr=1e-5]Steps:  15%|█▍        | 2181/15001 [1:23:25<6:43:26,  1.89s/it, loss=0.175, lr=1e-5]Steps:  15%|█▍        | 2182/15001 [1:23:27<6:37:36,  1.86s/it, loss=0.175, lr=1e-5]Steps:  15%|█▍        | 2182/15001 [1:23:27<6:37:36,  1.86s/it, loss=0.0798, lr=1e-5]Steps:  15%|█▍        | 2183/15001 [1:23:29<6:27:20,  1.81s/it, loss=0.0798, lr=1e-5]Steps:  15%|█▍        | 2183/15001 [1:23:29<6:27:20,  1.81s/it, loss=0.207, lr=1e-5] Steps:  15%|█▍        | 2184/15001 [1:23:31<6:31:50,  1.83s/it, loss=0.207, lr=1e-5]Steps:  15%|█▍        | 2184/15001 [1:23:31<6:31:50,  1.83s/it, loss=0.105, lr=1e-5]Steps:  15%|█▍        | 2185/15001 [1:23:33<6:24:26,  1.80s/it, loss=0.105, lr=1e-5]Steps:  15%|█▍        | 2185/15001 [1:23:33<6:24:26,  1.80s/it, loss=0.0967, lr=1e-5]Steps:  15%|█▍        | 2186/15001 [1:23:34<6:36:04,  1.85s/it, loss=0.0967, lr=1e-5]Steps:  15%|█▍        | 2186/15001 [1:23:35<6:36:04,  1.85s/it, loss=0.0603, lr=1e-5]Steps:  15%|█▍        | 2187/15001 [1:23:36<6:17:40,  1.77s/it, loss=0.0603, lr=1e-5]Steps:  15%|█▍        | 2187/15001 [1:23:36<6:17:40,  1.77s/it, loss=0.226, lr=1e-5] Steps:  15%|█▍        | 2188/15001 [1:23:38<6:40:53,  1.88s/it, loss=0.226, lr=1e-5]Steps:  15%|█▍        | 2188/15001 [1:23:38<6:40:53,  1.88s/it, loss=0.0427, lr=1e-5]Steps:  15%|█▍        | 2189/15001 [1:23:40<6:30:51,  1.83s/it, loss=0.0427, lr=1e-5]Steps:  15%|█▍        | 2189/15001 [1:23:40<6:30:51,  1.83s/it, loss=0.259, lr=1e-5] Steps:  15%|█▍        | 2190/15001 [1:23:42<6:50:41,  1.92s/it, loss=0.259, lr=1e-5]Steps:  15%|█▍        | 2190/15001 [1:23:42<6:50:41,  1.92s/it, loss=0.224, lr=1e-5]Steps:  15%|█▍        | 2191/15001 [1:23:44<6:49:55,  1.92s/it, loss=0.224, lr=1e-5]Steps:  15%|█▍        | 2191/15001 [1:23:44<6:49:55,  1.92s/it, loss=0.326, lr=1e-5]Steps:  15%|█▍        | 2192/15001 [1:23:46<6:47:13,  1.91s/it, loss=0.326, lr=1e-5]Steps:  15%|█▍        | 2192/15001 [1:23:46<6:47:13,  1.91s/it, loss=0.144, lr=1e-5]Steps:  15%|█▍        | 2193/15001 [1:23:48<7:08:57,  2.01s/it, loss=0.144, lr=1e-5]Steps:  15%|█▍        | 2193/15001 [1:23:48<7:08:57,  2.01s/it, loss=0.198, lr=1e-5]Steps:  15%|█▍        | 2194/15001 [1:23:50<7:02:18,  1.98s/it, loss=0.198, lr=1e-5]Steps:  15%|█▍        | 2194/15001 [1:23:50<7:02:18,  1.98s/it, loss=0.203, lr=1e-5]Steps:  15%|█▍        | 2195/15001 [1:23:52<7:14:59,  2.04s/it, loss=0.203, lr=1e-5]Steps:  15%|█▍        | 2195/15001 [1:23:52<7:14:59,  2.04s/it, loss=0.0918, lr=1e-5]Steps:  15%|█▍        | 2196/15001 [1:23:54<6:56:43,  1.95s/it, loss=0.0918, lr=1e-5]Steps:  15%|█▍        | 2196/15001 [1:23:54<6:56:43,  1.95s/it, loss=0.218, lr=1e-5] Steps:  15%|█▍        | 2197/15001 [1:23:56<6:34:15,  1.85s/it, loss=0.218, lr=1e-5]Steps:  15%|█▍        | 2197/15001 [1:23:56<6:34:15,  1.85s/it, loss=0.126, lr=1e-5]Steps:  15%|█▍        | 2198/15001 [1:23:58<6:50:41,  1.92s/it, loss=0.126, lr=1e-5]Steps:  15%|█▍        | 2198/15001 [1:23:58<6:50:41,  1.92s/it, loss=0.0755, lr=1e-5]Steps:  15%|█▍        | 2199/15001 [1:24:00<6:51:34,  1.93s/it, loss=0.0755, lr=1e-5]Steps:  15%|█▍        | 2199/15001 [1:24:00<6:51:34,  1.93s/it, loss=0.35, lr=1e-5]  Steps:  15%|█▍        | 2200/15001 [1:24:01<6:42:22,  1.89s/it, loss=0.35, lr=1e-5]Steps:  15%|█▍        | 2200/15001 [1:24:01<6:42:22,  1.89s/it, loss=0.178, lr=1e-5]Steps:  15%|█▍        | 2201/15001 [1:24:03<6:15:01,  1.76s/it, loss=0.178, lr=1e-5]Steps:  15%|█▍        | 2201/15001 [1:24:03<6:15:01,  1.76s/it, loss=0.266, lr=1e-5]Steps:  15%|█▍        | 2202/15001 [1:24:05<6:38:13,  1.87s/it, loss=0.266, lr=1e-5]Steps:  15%|█▍        | 2202/15001 [1:24:05<6:38:13,  1.87s/it, loss=0.0595, lr=1e-5]Steps:  15%|█▍        | 2203/15001 [1:24:07<6:43:33,  1.89s/it, loss=0.0595, lr=1e-5]Steps:  15%|█▍        | 2203/15001 [1:24:07<6:43:33,  1.89s/it, loss=0.12, lr=1e-5]  Steps:  15%|█▍        | 2204/15001 [1:24:09<6:40:51,  1.88s/it, loss=0.12, lr=1e-5]Steps:  15%|█▍        | 2204/15001 [1:24:09<6:40:51,  1.88s/it, loss=0.087, lr=1e-5]Steps:  15%|█▍        | 2205/15001 [1:24:10<6:23:10,  1.80s/it, loss=0.087, lr=1e-5]Steps:  15%|█▍        | 2205/15001 [1:24:11<6:23:10,  1.80s/it, loss=0.336, lr=1e-5]Steps:  15%|█▍        | 2206/15001 [1:24:12<6:16:12,  1.76s/it, loss=0.336, lr=1e-5]Steps:  15%|█▍        | 2206/15001 [1:24:12<6:16:12,  1.76s/it, loss=0.0731, lr=1e-5]Steps:  15%|█���        | 2207/15001 [1:24:14<6:28:33,  1.82s/it, loss=0.0731, lr=1e-5]Steps:  15%|█▍        | 2207/15001 [1:24:14<6:28:33,  1.82s/it, loss=0.0732, lr=1e-5]Steps:  15%|█▍        | 2208/15001 [1:24:16<6:34:17,  1.85s/it, loss=0.0732, lr=1e-5]Steps:  15%|█▍        | 2208/15001 [1:24:16<6:34:17,  1.85s/it, loss=0.187, lr=1e-5] Steps:  15%|█▍        | 2209/15001 [1:24:18<6:29:25,  1.83s/it, loss=0.187, lr=1e-5]Steps:  15%|█▍        | 2209/15001 [1:24:18<6:29:25,  1.83s/it, loss=0.107, lr=1e-5]Steps:  15%|█▍        | 2210/15001 [1:24:19<6:16:18,  1.77s/it, loss=0.107, lr=1e-5]Steps:  15%|█▍        | 2210/15001 [1:24:20<6:16:18,  1.77s/it, loss=0.107, lr=1e-5]Steps:  15%|█▍        | 2211/15001 [1:24:21<6:14:41,  1.76s/it, loss=0.107, lr=1e-5]Steps:  15%|█▍        | 2211/15001 [1:24:22<6:14:41,  1.76s/it, loss=0.142, lr=1e-5]Steps:  15%|█▍        | 2212/15001 [1:24:24<7:01:25,  1.98s/it, loss=0.142, lr=1e-5]Steps:  15%|█▍        | 2212/15001 [1:24:24<7:01:25,  1.98s/it, loss=0.129, lr=1e-5]Steps:  15%|█▍        | 2213/15001 [1:24:25<6:54:19,  1.94s/it, loss=0.129, lr=1e-5]Steps:  15%|█▍        | 2213/15001 [1:24:26<6:54:19,  1.94s/it, loss=0.153, lr=1e-5]Steps:  15%|█▍        | 2214/15001 [1:24:27<6:59:41,  1.97s/it, loss=0.153, lr=1e-5]Steps:  15%|█▍        | 2214/15001 [1:24:28<6:59:41,  1.97s/it, loss=0.175, lr=1e-5]Steps:  15%|█▍        | 2215/15001 [1:24:29<6:53:57,  1.94s/it, loss=0.175, lr=1e-5]Steps:  15%|█▍        | 2215/15001 [1:24:29<6:53:57,  1.94s/it, loss=0.193, lr=1e-5]Steps:  15%|█▍        | 2216/15001 [1:24:31<7:07:02,  2.00s/it, loss=0.193, lr=1e-5]Steps:  15%|█▍        | 2216/15001 [1:24:32<7:07:02,  2.00s/it, loss=0.18, lr=1e-5] Steps:  15%|█▍        | 2217/15001 [1:24:33<6:56:59,  1.96s/it, loss=0.18, lr=1e-5]Steps:  15%|█▍        | 2217/15001 [1:24:33<6:56:59,  1.96s/it, loss=0.0975, lr=1e-5]Steps:  15%|█▍        | 2218/15001 [1:24:35<7:02:03,  1.98s/it, loss=0.0975, lr=1e-5]Steps:  15%|█▍        | 2218/15001 [1:24:35<7:02:03,  1.98s/it, loss=0.0485, lr=1e-5]Steps:  15%|█▍        | 2219/15001 [1:24:37<6:53:53,  1.94s/it, loss=0.0485, lr=1e-5]Steps:  15%|█▍        | 2219/15001 [1:24:37<6:53:53,  1.94s/it, loss=0.187, lr=1e-5] Steps:  15%|█▍        | 2220/15001 [1:24:39<6:53:48,  1.94s/it, loss=0.187, lr=1e-5]Steps:  15%|█▍        | 2220/15001 [1:24:39<6:53:48,  1.94s/it, loss=0.186, lr=1e-5]Steps:  15%|█▍        | 2221/15001 [1:24:41<6:52:54,  1.94s/it, loss=0.186, lr=1e-5]Steps:  15%|█▍        | 2221/15001 [1:24:41<6:52:54,  1.94s/it, loss=0.0408, lr=1e-5]Steps:  15%|█▍        | 2222/15001 [1:24:43<6:30:02,  1.83s/it, loss=0.0408, lr=1e-5]Steps:  15%|█▍        | 2222/15001 [1:24:43<6:30:02,  1.83s/it, loss=0.0972, lr=1e-5]Steps:  15%|█▍        | 2223/15001 [1:24:44<6:21:51,  1.79s/it, loss=0.0972, lr=1e-5]Steps:  15%|█▍        | 2223/15001 [1:24:45<6:21:51,  1.79s/it, loss=0.397, lr=1e-5] Steps:  15%|█▍        | 2224/15001 [1:24:46<6:37:42,  1.87s/it, loss=0.397, lr=1e-5]Steps:  15%|█▍        | 2224/15001 [1:24:46<6:37:42,  1.87s/it, loss=0.0526, lr=1e-5]Steps:  15%|█▍        | 2225/15001 [1:24:48<6:19:55,  1.78s/it, loss=0.0526, lr=1e-5]Steps:  15%|█▍        | 2225/15001 [1:24:48<6:19:55,  1.78s/it, loss=0.349, lr=1e-5] Steps:  15%|█▍        | 2226/15001 [1:24:50<6:19:30,  1.78s/it, loss=0.349, lr=1e-5]Steps:  15%|█▍        | 2226/15001 [1:24:50<6:19:30,  1.78s/it, loss=0.288, lr=1e-5]Steps:  15%|█▍        | 2227/15001 [1:24:52<6:31:10,  1.84s/it, loss=0.288, lr=1e-5]Steps:  15%|█▍        | 2227/15001 [1:24:52<6:31:10,  1.84s/it, loss=0.319, lr=1e-5]Steps:  15%|█▍        | 2228/15001 [1:24:54<6:36:07,  1.86s/it, loss=0.319, lr=1e-5]Steps:  15%|█▍        | 2228/15001 [1:24:54<6:36:07,  1.86s/it, loss=0.144, lr=1e-5]Steps:  15%|█▍        | 2229/15001 [1:24:55<6:23:39,  1.80s/it, loss=0.144, lr=1e-5]Steps:  15%|█▍        | 2229/15001 [1:24:56<6:23:39,  1.80s/it, loss=0.0714, lr=1e-5]Steps:  15%|█▍        | 2230/15001 [1:24:57<6:26:12,  1.81s/it, loss=0.0714, lr=1e-5]Steps:  15%|█▍        | 2230/15001 [1:24:57<6:26:12,  1.81s/it, loss=0.243, lr=1e-5] Steps:  15%|█▍        | 2231/15001 [1:24:59<6:33:48,  1.85s/it, loss=0.243, lr=1e-5]Steps:  15%|█▍        | 2231/15001 [1:24:59<6:33:48,  1.85s/it, loss=0.148, lr=1e-5]Steps:  15%|█▍        | 2232/15001 [1:25:01<6:41:02,  1.88s/it, loss=0.148, lr=1e-5]Steps:  15%|█▍        | 2232/15001 [1:25:01<6:41:02,  1.88s/it, loss=0.201, lr=1e-5]Steps:  15%|█▍        | 2233/15001 [1:25:03<6:28:19,  1.82s/it, loss=0.201, lr=1e-5]Steps:  15%|█▍        | 2233/15001 [1:25:03<6:28:19,  1.82s/it, loss=0.314, lr=1e-5]Steps:  15%|█▍        | 2234/15001 [1:25:04<6:21:48,  1.79s/it, loss=0.314, lr=1e-5]Steps:  15%|█▍        | 2234/15001 [1:25:05<6:21:48,  1.79s/it, loss=0.133, lr=1e-5]Steps:  15%|█▍        | 2235/15001 [1:25:06<6:17:11,  1.77s/it, loss=0.133, lr=1e-5]Steps:  15%|█▍        | 2235/15001 [1:25:07<6:17:11,  1.77s/it, loss=0.158, lr=1e-5]Steps:  15%|█▍        | 2236/15001 [1:25:09<7:03:36,  1.99s/it, loss=0.158, lr=1e-5]Steps:  15%|█▍        | 2236/15001 [1:25:09<7:03:36,  1.99s/it, loss=0.215, lr=1e-5]Steps:  15%|█▍        | 2237/15001 [1:25:10<6:51:50,  1.94s/it, loss=0.215, lr=1e-5]Steps:  15%|█▍        | 2237/15001 [1:25:11<6:51:50,  1.94s/it, loss=0.345, lr=1e-5]Steps:  15%|█▍        | 2238/15001 [1:25:12<6:51:46,  1.94s/it, loss=0.345, lr=1e-5]Steps:  15%|█▍        | 2238/15001 [1:25:13<6:51:46,  1.94s/it, loss=0.166, lr=1e-5]Steps:  15%|█▍        | 2239/15001 [1:25:15<7:15:11,  2.05s/it, loss=0.166, lr=1e-5]Steps:  15%|█▍        | 2239/15001 [1:25:15<7:15:11,  2.05s/it, loss=0.146, lr=1e-5]Steps:  15%|█▍        | 2240/15001 [1:25:17<7:13:03,  2.04s/it, loss=0.146, lr=1e-5]Steps:  15%|█▍        | 2240/15001 [1:25:17<7:13:03,  2.04s/it, loss=0.178, lr=1e-5]Steps:  15%|█▍        | 2241/15001 [1:25:19<6:58:39,  1.97s/it, loss=0.178, lr=1e-5]Steps:  15%|█▍        | 2241/15001 [1:25:19<6:58:39,  1.97s/it, loss=0.256, lr=1e-5]Steps:  15%|█▍        | 2242/15001 [1:25:20<6:46:02,  1.91s/it, loss=0.256, lr=1e-5]Steps:  15%|█▍        | 2242/15001 [1:25:20<6:46:02,  1.91s/it, loss=0.171, lr=1e-5]Steps:  15%|█▍        | 2243/15001 [1:25:22<6:34:50,  1.86s/it, loss=0.171, lr=1e-5]Steps:  15%|█▍        | 2243/15001 [1:25:22<6:34:50,  1.86s/it, loss=0.0891, lr=1e-5]Steps:  15%|█▍        | 2244/15001 [1:25:24<6:39:02,  1.88s/it, loss=0.0891, lr=1e-5]Steps:  15%|█▍        | 2244/15001 [1:25:24<6:39:02,  1.88s/it, loss=0.202, lr=1e-5] Steps:  15%|█▍        | 2245/15001 [1:25:26<6:26:21,  1.82s/it, loss=0.202, lr=1e-5]Steps:  15%|█▍        | 2245/15001 [1:25:26<6:26:21,  1.82s/it, loss=0.187, lr=1e-5]Steps:  15%|█▍        | 2246/15001 [1:25:28<6:41:03,  1.89s/it, loss=0.187, lr=1e-5]Steps:  15%|█▍        | 2246/15001 [1:25:28<6:41:03,  1.89s/it, loss=0.227, lr=1e-5]Steps:  15%|█▍        | 2247/15001 [1:25:30<6:36:18,  1.86s/it, loss=0.227, lr=1e-5]Steps:  15%|█▍        | 2247/15001 [1:25:30<6:36:18,  1.86s/it, loss=0.166, lr=1e-5]Steps:  15%|█▍        | 2248/15001 [1:25:31<6:16:21,  1.77s/it, loss=0.166, lr=1e-5]Steps:  15%|█▍        | 2248/15001 [1:25:31<6:16:21,  1.77s/it, loss=0.35, lr=1e-5] Steps:  15%|█▍        | 2249/15001 [1:25:33<6:19:53,  1.79s/it, loss=0.35, lr=1e-5]Steps:  15%|█▍        | 2249/15001 [1:25:33<6:19:53,  1.79s/it, loss=0.184, lr=1e-5]Steps:  15%|█▍        | 2250/15001 [1:25:35<6:22:56,  1.80s/it, loss=0.184, lr=1e-5]Steps:  15%|█▍        | 2250/15001 [1:25:35<6:22:56,  1.80s/it, loss=0.297, lr=1e-5]Steps:  15%|█▌        | 2251/15001 [1:25:37<6:39:36,  1.88s/it, loss=0.297, lr=1e-5]Steps:  15%|█▌        | 2251/15001 [1:25:37<6:39:36,  1.88s/it, loss=0.152, lr=1e-5]Steps:  15%|█▌        | 2252/15001 [1:25:39<6:30:14,  1.84s/it, loss=0.152, lr=1e-5]Steps:  15%|█▌        | 2252/15001 [1:25:39<6:30:14,  1.84s/it, loss=0.248, lr=1e-5]Steps:  15%|█▌        | 2253/15001 [1:25:40<6:21:45,  1.80s/it, loss=0.248, lr=1e-5]Steps:  15%|█▌        | 2253/15001 [1:25:40<6:21:45,  1.80s/it, loss=0.125, lr=1e-5]Steps:  15%|█▌        | 2254/15001 [1:25:42<6:29:29,  1.83s/it, loss=0.125, lr=1e-5]Steps:  15%|█▌        | 2254/15001 [1:25:42<6:29:29,  1.83s/it, loss=0.0526, lr=1e-5]Steps:  15%|█▌        | 2255/15001 [1:25:44<6:16:51,  1.77s/it, loss=0.0526, lr=1e-5]Steps:  15%|█▌        | 2255/15001 [1:25:44<6:16:51,  1.77s/it, loss=0.299, lr=1e-5] Steps:  15%|█▌        | 2256/15001 [1:25:46<6:30:17,  1.84s/it, loss=0.299, lr=1e-5]Steps:  15%|█▌        | 2256/15001 [1:25:46<6:30:17,  1.84s/it, loss=0.157, lr=1e-5]Steps:  15%|█▌        | 2257/15001 [1:25:48<6:47:00,  1.92s/it, loss=0.157, lr=1e-5]Steps:  15%|█▌        | 2257/15001 [1:25:48<6:47:00,  1.92s/it, loss=0.178, lr=1e-5]Steps:  15%|█▌        | 2258/15001 [1:25:50<6:40:43,  1.89s/it, loss=0.178, lr=1e-5]Steps:  15%|█▌        | 2258/15001 [1:25:50<6:40:43,  1.89s/it, loss=0.226, lr=1e-5]Steps:  15%|█▌        | 2259/15001 [1:25:52<6:47:27,  1.92s/it, loss=0.226, lr=1e-5]Steps:  15%|█▌        | 2259/15001 [1:25:52<6:47:27,  1.92s/it, loss=0.283, lr=1e-5]Steps:  15%|█▌        | 2260/15001 [1:25:54<6:45:29,  1.91s/it, loss=0.283, lr=1e-5]Steps:  15%|█▌        | 2260/15001 [1:25:54<6:45:29,  1.91s/it, loss=0.0303, lr=1e-5]Steps:  15%|█▌        | 2261/15001 [1:25:56<6:50:08,  1.93s/it, loss=0.0303, lr=1e-5]Steps:  15%|█▌        | 2261/15001 [1:25:56<6:50:08,  1.93s/it, loss=0.0757, lr=1e-5]Steps:  15%|█▌        | 2262/15001 [1:25:57<6:51:05,  1.94s/it, loss=0.0757, lr=1e-5]Steps:  15%|█▌        | 2262/15001 [1:25:58<6:51:05,  1.94s/it, loss=0.2, lr=1e-5]   Steps:  15%|█▌        | 2263/15001 [1:26:00<7:06:32,  2.01s/it, loss=0.2, lr=1e-5]Steps:  15%|█▌        | 2263/15001 [1:26:00<7:06:32,  2.01s/it, loss=0.0463, lr=1e-5]Steps:  15%|█▌        | 2264/15001 [1:26:02<6:55:24,  1.96s/it, loss=0.0463, lr=1e-5]Steps:  15%|█▌        | 2264/15001 [1:26:02<6:55:24,  1.96s/it, loss=0.23, lr=1e-5]  Steps:  15%|█▌        | 2265/15001 [1:26:03<6:50:12,  1.93s/it, loss=0.23, lr=1e-5]Steps:  15%|█▌        | 2265/15001 [1:26:04<6:50:12,  1.93s/it, loss=0.234, lr=1e-5]Steps:  15%|█▌        | 2266/15001 [1:26:05<6:43:55,  1.90s/it, loss=0.234, lr=1e-5]Steps:  15%|█▌        | 2266/15001 [1:26:05<6:43:55,  1.90s/it, loss=0.0712, lr=1e-5]Steps:  15%|█▌        | 2267/15001 [1:26:07<6:38:29,  1.88s/it, loss=0.0712, lr=1e-5]Steps:  15%|█▌        | 2267/15001 [1:26:07<6:38:29,  1.88s/it, loss=0.116, lr=1e-5] Steps:  15%|█▌        | 2268/15001 [1:26:09<6:16:40,  1.77s/it, loss=0.116, lr=1e-5]Steps:  15%|█▌        | 2268/15001 [1:26:09<6:16:40,  1.77s/it, loss=0.115, lr=1e-5]Steps:  15%|█▌        | 2269/15001 [1:26:11<6:32:23,  1.85s/it, loss=0.115, lr=1e-5]Steps:  15%|█▌        | 2269/15001 [1:26:11<6:32:23,  1.85s/it, loss=0.315, lr=1e-5]Steps:  15%|█▌        | 2270/15001 [1:26:12<6:24:58,  1.81s/it, loss=0.315, lr=1e-5]Steps:  15%|█▌        | 2270/15001 [1:26:13<6:24:58,  1.81s/it, loss=0.152, lr=1e-5]Steps:  15%|█▌        | 2271/15001 [1:26:14<6:21:18,  1.80s/it, loss=0.152, lr=1e-5]Steps:  15%|█▌        | 2271/15001 [1:26:15<6:21:18,  1.80s/it, loss=0.191, lr=1e-5]Steps:  15%|█▌        | 2272/15001 [1:26:16<6:44:38,  1.91s/it, loss=0.191, lr=1e-5]Steps:  15%|█▌        | 2272/15001 [1:26:16<6:44:38,  1.91s/it, loss=0.133, lr=1e-5]Steps:  15%|█▌        | 2273/15001 [1:26:18<6:22:31,  1.80s/it, loss=0.133, lr=1e-5]Steps:  15%|█▌        | 2273/15001 [1:26:18<6:22:31,  1.80s/it, loss=0.0741, lr=1e-5]Steps:  15%|█▌        | 2274/15001 [1:26:20<6:26:05,  1.82s/it, loss=0.0741, lr=1e-5]Steps:  15%|█▌        | 2274/15001 [1:26:20<6:26:05,  1.82s/it, loss=0.225, lr=1e-5] Steps:  15%|█▌        | 2275/15001 [1:26:21<6:25:21,  1.82s/it, loss=0.225, lr=1e-5]Steps:  15%|█▌        | 2275/15001 [1:26:22<6:25:21,  1.82s/it, loss=0.112, lr=1e-5]Steps:  15%|█▌        | 2276/15001 [1:26:23<6:36:48,  1.87s/it, loss=0.112, lr=1e-5]Steps:  15%|█▌        | 2276/15001 [1:26:24<6:36:48,  1.87s/it, loss=0.11, lr=1e-5] Steps:  15%|█▌        | 2277/15001 [1:26:25<6:33:18,  1.85s/it, loss=0.11, lr=1e-5]Steps:  15%|█▌        | 2277/15001 [1:26:25<6:33:18,  1.85s/it, loss=0.115, lr=1e-5]Steps:  15%|█▌        | 2278/15001 [1:26:27<6:37:20,  1.87s/it, loss=0.115, lr=1e-5]Steps:  15%|█▌        | 2278/15001 [1:26:27<6:37:20,  1.87s/it, loss=0.0619, lr=1e-5]Steps:  15%|█▌        | 2279/15001 [1:26:29<6:35:13,  1.86s/it, loss=0.0619, lr=1e-5]Steps:  15%|█▌        | 2279/15001 [1:26:29<6:35:13,  1.86s/it, loss=0.072, lr=1e-5] Steps:  15%|█▌        | 2280/15001 [1:26:31<6:36:30,  1.87s/it, loss=0.072, lr=1e-5]Steps:  15%|█▌        | 2280/15001 [1:26:31<6:36:30,  1.87s/it, loss=0.173, lr=1e-5]Steps:  15%|█▌        | 2281/15001 [1:26:33<6:51:11,  1.94s/it, loss=0.173, lr=1e-5]Steps:  15%|█▌        | 2281/15001 [1:26:33<6:51:11,  1.94s/it, loss=0.143, lr=1e-5]Steps:  15%|█▌        | 2282/15001 [1:26:35<6:48:39,  1.93s/it, loss=0.143, lr=1e-5]Steps:  15%|█▌        | 2282/15001 [1:26:35<6:48:39,  1.93s/it, loss=0.104, lr=1e-5]Steps:  15%|█▌        | 2283/15001 [1:26:37<6:54:44,  1.96s/it, loss=0.104, lr=1e-5]Steps:  15%|█▌        | 2283/15001 [1:26:37<6:54:44,  1.96s/it, loss=0.0821, lr=1e-5]Steps:  15%|█▌        | 2284/15001 [1:26:39<7:08:19,  2.02s/it, loss=0.0821, lr=1e-5]Steps:  15%|█▌        | 2284/15001 [1:26:39<7:08:19,  2.02s/it, loss=0.227, lr=1e-5] Steps:  15%|█▌        | 2285/15001 [1:26:41<7:12:01,  2.04s/it, loss=0.227, lr=1e-5]Steps:  15%|█▌        | 2285/15001 [1:26:41<7:12:01,  2.04s/it, loss=0.0783, lr=1e-5]Steps:  15%|█▌        | 2286/15001 [1:26:43<7:03:27,  2.00s/it, loss=0.0783, lr=1e-5]Steps:  15%|█▌        | 2286/15001 [1:26:43<7:03:27,  2.00s/it, loss=0.186, lr=1e-5] Steps:  15%|█▌        | 2287/15001 [1:26:45<6:33:03,  1.85s/it, loss=0.186, lr=1e-5]Steps:  15%|█▌        | 2287/15001 [1:26:45<6:33:03,  1.85s/it, loss=0.0742, lr=1e-5]Steps:  15%|█▌        | 2288/15001 [1:26:46<6:27:25,  1.83s/it, loss=0.0742, lr=1e-5]Steps:  15%|█▌        | 2288/15001 [1:26:47<6:27:25,  1.83s/it, loss=0.118, lr=1e-5] Steps:  15%|█▌        | 2289/15001 [1:26:48<6:38:04,  1.88s/it, loss=0.118, lr=1e-5]Steps:  15%|█▌        | 2289/15001 [1:26:49<6:38:04,  1.88s/it, loss=0.228, lr=1e-5]Steps:  15%|█▌        | 2290/15001 [1:26:50<6:32:55,  1.85s/it, loss=0.228, lr=1e-5]Steps:  15%|█▌        | 2290/15001 [1:26:50<6:32:55,  1.85s/it, loss=0.159, lr=1e-5]Steps:  15%|█▌        | 2291/15001 [1:26:52<6:37:57,  1.88s/it, loss=0.159, lr=1e-5]Steps:  15%|█▌        | 2291/15001 [1:26:52<6:37:57,  1.88s/it, loss=0.102, lr=1e-5]Steps:  15%|█▌        | 2292/15001 [1:26:54<6:19:00,  1.79s/it, loss=0.102, lr=1e-5]Steps:  15%|█▌        | 2292/15001 [1:26:54<6:19:00,  1.79s/it, loss=0.2, lr=1e-5]  Steps:  15%|█▌        | 2293/15001 [1:26:56<6:26:08,  1.82s/it, loss=0.2, lr=1e-5]Steps:  15%|█▌        | 2293/15001 [1:26:56<6:26:08,  1.82s/it, loss=0.168, lr=1e-5]Steps:  15%|█▌        | 2294/15001 [1:26:57<6:26:07,  1.82s/it, loss=0.168, lr=1e-5]Steps:  15%|█▌        | 2294/15001 [1:26:58<6:26:07,  1.82s/it, loss=0.286, lr=1e-5]Steps:  15%|█▌        | 2295/15001 [1:26:59<6:30:31,  1.84s/it, loss=0.286, lr=1e-5]Steps:  15%|█▌        | 2295/15001 [1:27:00<6:30:31,  1.84s/it, loss=0.0821, lr=1e-5]Steps:  15%|█▌        | 2296/15001 [1:27:01<6:37:13,  1.88s/it, loss=0.0821, lr=1e-5]Steps:  15%|█▌        | 2296/15001 [1:27:02<6:37:13,  1.88s/it, loss=0.214, lr=1e-5] Steps:  15%|█▌        | 2297/15001 [1:27:03<6:44:13,  1.91s/it, loss=0.214, lr=1e-5]Steps:  15%|█▌        | 2297/15001 [1:27:03<6:44:13,  1.91s/it, loss=0.208, lr=1e-5]Steps:  15%|█▌        | 2298/15001 [1:27:05<6:40:45,  1.89s/it, loss=0.208, lr=1e-5]Steps:  15%|█▌        | 2298/15001 [1:27:05<6:40:45,  1.89s/it, loss=0.234, lr=1e-5]Steps:  15%|█▌        | 2299/15001 [1:27:07<6:28:27,  1.83s/it, loss=0.234, lr=1e-5]Steps:  15%|█▌        | 2299/15001 [1:27:07<6:28:27,  1.83s/it, loss=0.135, lr=1e-5]Steps:  15%|█▌        | 2300/15001 [1:27:09<6:18:50,  1.79s/it, loss=0.135, lr=1e-5]Steps:  15%|█▌        | 2300/15001 [1:27:09<6:18:50,  1.79s/it, loss=0.0821, lr=1e-5]Steps:  15%|█▌        | 2301/15001 [1:27:10<6:28:39,  1.84s/it, loss=0.0821, lr=1e-5]Steps:  15%|█▌        | 2301/15001 [1:27:11<6:28:39,  1.84s/it, loss=0.172, lr=1e-5] Steps:  15%|█▌        | 2302/15001 [1:27:12<6:38:36,  1.88s/it, loss=0.172, lr=1e-5]Steps:  15%|█▌        | 2302/15001 [1:27:13<6:38:36,  1.88s/it, loss=0.13, lr=1e-5] Steps:  15%|█▌        | 2303/15001 [1:27:14<6:46:45,  1.92s/it, loss=0.13, lr=1e-5]Steps:  15%|█▌        | 2303/15001 [1:27:15<6:46:45,  1.92s/it, loss=0.167, lr=1e-5]Steps:  15%|█▌        | 2304/15001 [1:27:17<6:56:41,  1.97s/it, loss=0.167, lr=1e-5]Steps:  15%|█▌        | 2304/15001 [1:27:17<6:56:41,  1.97s/it, loss=0.297, lr=1e-5]Steps:  15%|█▌        | 2305/15001 [1:27:18<6:51:04,  1.94s/it, loss=0.297, lr=1e-5]Steps:  15%|█▌        | 2305/15001 [1:27:19<6:51:04,  1.94s/it, loss=0.163, lr=1e-5]Steps:  15%|█▌        | 2306/15001 [1:27:21<7:10:40,  2.04s/it, loss=0.163, lr=1e-5]Steps:  15%|█▌        | 2306/15001 [1:27:21<7:10:40,  2.04s/it, loss=0.215, lr=1e-5]Steps:  15%|█▌        | 2307/15001 [1:27:23<7:07:58,  2.02s/it, loss=0.215, lr=1e-5]Steps:  15%|█▌        | 2307/15001 [1:27:23<7:07:58,  2.02s/it, loss=0.272, lr=1e-5]Steps:  15%|█▌        | 2308/15001 [1:27:25<7:10:54,  2.04s/it, loss=0.272, lr=1e-5]Steps:  15%|█▌        | 2308/15001 [1:27:25<7:10:54,  2.04s/it, loss=0.0719, lr=1e-5]Steps:  15%|█▌        | 2309/15001 [1:27:27<7:06:42,  2.02s/it, loss=0.0719, lr=1e-5]Steps:  15%|█▌        | 2309/15001 [1:27:27<7:06:42,  2.02s/it, loss=0.142, lr=1e-5] Steps:  15%|█▌        | 2310/15001 [1:27:28<6:48:39,  1.93s/it, loss=0.142, lr=1e-5]Steps:  15%|█▌        | 2310/15001 [1:27:29<6:48:39,  1.93s/it, loss=0.105, lr=1e-5]Steps:  15%|█▌        | 2311/15001 [1:27:30<6:35:54,  1.87s/it, loss=0.105, lr=1e-5]Steps:  15%|█▌        | 2311/15001 [1:27:30<6:35:54,  1.87s/it, loss=0.0685, lr=1e-5]Steps:  15%|█▌        | 2312/15001 [1:27:32<6:33:35,  1.86s/it, loss=0.0685, lr=1e-5]Steps:  15%|█▌        | 2312/15001 [1:27:32<6:33:35,  1.86s/it, loss=0.215, lr=1e-5] Steps:  15%|█▌        | 2313/15001 [1:27:34<6:34:58,  1.87s/it, loss=0.215, lr=1e-5]Steps:  15%|█▌        | 2313/15001 [1:27:34<6:34:58,  1.87s/it, loss=0.0742, lr=1e-5]Steps:  15%|█▌        | 2314/15001 [1:27:36<6:29:43,  1.84s/it, loss=0.0742, lr=1e-5]Steps:  15%|█▌        | 2314/15001 [1:27:36<6:29:43,  1.84s/it, loss=0.0884, lr=1e-5]Steps:  15%|█▌        | 2315/15001 [1:27:37<6:21:54,  1.81s/it, loss=0.0884, lr=1e-5]Steps:  15%|█▌        | 2315/15001 [1:27:38<6:21:54,  1.81s/it, loss=0.24, lr=1e-5]  Steps:  15%|█▌        | 2316/15001 [1:27:39<6:28:49,  1.84s/it, loss=0.24, lr=1e-5]Steps:  15%|█▌        | 2316/15001 [1:27:39<6:28:49,  1.84s/it, loss=0.188, lr=1e-5]Steps:  15%|█▌        | 2317/15001 [1:27:41<6:12:11,  1.76s/it, loss=0.188, lr=1e-5]Steps:  15%|█▌        | 2317/15001 [1:27:41<6:12:11,  1.76s/it, loss=0.118, lr=1e-5]Steps:  15%|█▌        | 2318/15001 [1:27:43<6:40:23,  1.89s/it, loss=0.118, lr=1e-5]Steps:  15%|█▌        | 2318/15001 [1:27:43<6:40:23,  1.89s/it, loss=0.041, lr=1e-5]Steps:  15%|█▌        | 2319/15001 [1:27:45<6:35:58,  1.87s/it, loss=0.041, lr=1e-5]Steps:  15%|█▌        | 2319/15001 [1:27:45<6:35:58,  1.87s/it, loss=0.151, lr=1e-5]Steps:  15%|█▌        | 2320/15001 [1:27:47<6:32:54,  1.86s/it, loss=0.151, lr=1e-5]Steps:  15%|█▌        | 2320/15001 [1:27:47<6:32:54,  1.86s/it, loss=0.0301, lr=1e-5]Steps:  15%|█▌        | 2321/15001 [1:27:49<6:34:49,  1.87s/it, loss=0.0301, lr=1e-5]Steps:  15%|█▌        | 2321/15001 [1:27:49<6:34:49,  1.87s/it, loss=0.215, lr=1e-5] Steps:  15%|█▌        | 2322/15001 [1:27:51<6:37:44,  1.88s/it, loss=0.215, lr=1e-5]Steps:  15%|█▌        | 2322/15001 [1:27:51<6:37:44,  1.88s/it, loss=0.131, lr=1e-5]Steps:  15%|█▌        | 2323/15001 [1:27:52<6:28:58,  1.84s/it, loss=0.131, lr=1e-5]Steps:  15%|█▌        | 2323/15001 [1:27:52<6:28:58,  1.84s/it, loss=0.209, lr=1e-5]Steps:  15%|█▌        | 2324/15001 [1:27:54<6:17:37,  1.79s/it, loss=0.209, lr=1e-5]Steps:  15%|█▌        | 2324/15001 [1:27:54<6:17:37,  1.79s/it, loss=0.0902, lr=1e-5]Steps:  15%|█▌        | 2325/15001 [1:27:56<6:29:32,  1.84s/it, loss=0.0902, lr=1e-5]Steps:  15%|█▌        | 2325/15001 [1:27:56<6:29:32,  1.84s/it, loss=0.127, lr=1e-5] Steps:  16%|█▌        | 2326/15001 [1:27:58<6:26:35,  1.83s/it, loss=0.127, lr=1e-5]Steps:  16%|█▌        | 2326/15001 [1:27:58<6:26:35,  1.83s/it, loss=0.223, lr=1e-5]Steps:  16%|█▌        | 2327/15001 [1:28:00<6:34:12,  1.87s/it, loss=0.223, lr=1e-5]Steps:  16%|█▌        | 2327/15001 [1:28:00<6:34:12,  1.87s/it, loss=0.0263, lr=1e-5]Steps:  16%|█▌        | 2328/15001 [1:28:02<7:03:13,  2.00s/it, loss=0.0263, lr=1e-5]Steps:  16%|█▌        | 2328/15001 [1:28:02<7:03:13,  2.00s/it, loss=0.332, lr=1e-5] Steps:  16%|█▌        | 2329/15001 [1:28:04<7:00:44,  1.99s/it, loss=0.332, lr=1e-5]Steps:  16%|█▌        | 2329/15001 [1:28:04<7:00:44,  1.99s/it, loss=0.137, lr=1e-5]Steps:  16%|█▌        | 2330/15001 [1:28:06<6:53:04,  1.96s/it, loss=0.137, lr=1e-5]Steps:  16%|█▌        | 2330/15001 [1:28:06<6:53:04,  1.96s/it, loss=0.105, lr=1e-5]Steps:  16%|█▌        | 2331/15001 [1:28:08<6:51:58,  1.95s/it, loss=0.105, lr=1e-5]Steps:  16%|█▌        | 2331/15001 [1:28:08<6:51:58,  1.95s/it, loss=0.138, lr=1e-5]Steps:  16%|█▌        | 2332/15001 [1:28:10<7:02:32,  2.00s/it, loss=0.138, lr=1e-5]Steps:  16%|█▌        | 2332/15001 [1:28:10<7:02:32,  2.00s/it, loss=0.128, lr=1e-5]Steps:  16%|█▌        | 2333/15001 [1:28:12<6:38:27,  1.89s/it, loss=0.128, lr=1e-5]Steps:  16%|█▌        | 2333/15001 [1:28:12<6:38:27,  1.89s/it, loss=0.131, lr=1e-5]Steps:  16%|█▌        | 2334/15001 [1:28:14<6:45:59,  1.92s/it, loss=0.131, lr=1e-5]Steps:  16%|█▌        | 2334/15001 [1:28:14<6:45:59,  1.92s/it, loss=0.14, lr=1e-5] Steps:  16%|█▌        | 2335/15001 [1:28:15<6:32:55,  1.86s/it, loss=0.14, lr=1e-5]Steps:  16%|█▌        | 2335/15001 [1:28:16<6:32:55,  1.86s/it, loss=0.11, lr=1e-5]Steps:  16%|█▌        | 2336/15001 [1:28:17<6:49:01,  1.94s/it, loss=0.11, lr=1e-5]Steps:  16%|█▌        | 2336/15001 [1:28:18<6:49:01,  1.94s/it, loss=0.176, lr=1e-5]Steps:  16%|█▌        | 2337/15001 [1:28:19<6:43:25,  1.91s/it, loss=0.176, lr=1e-5]Steps:  16%|█▌        | 2337/15001 [1:28:19<6:43:25,  1.91s/it, loss=0.0513, lr=1e-5]Steps:  16%|█▌        | 2338/15001 [1:28:21<6:29:19,  1.84s/it, loss=0.0513, lr=1e-5]Steps:  16%|█▌        | 2338/15001 [1:28:21<6:29:19,  1.84s/it, loss=0.0693, lr=1e-5]Steps:  16%|█▌        | 2339/15001 [1:28:23<6:27:30,  1.84s/it, loss=0.0693, lr=1e-5]Steps:  16%|█▌        | 2339/15001 [1:28:23<6:27:30,  1.84s/it, loss=0.424, lr=1e-5] Steps:  16%|█▌        | 2340/15001 [1:28:25<6:38:19,  1.89s/it, loss=0.424, lr=1e-5]Steps:  16%|█▌        | 2340/15001 [1:28:25<6:38:19,  1.89s/it, loss=0.168, lr=1e-5]Steps:  16%|█▌        | 2341/15001 [1:28:27<6:43:57,  1.91s/it, loss=0.168, lr=1e-5]Steps:  16%|█▌        | 2341/15001 [1:28:27<6:43:57,  1.91s/it, loss=0.198, lr=1e-5]Steps:  16%|█▌        | 2342/15001 [1:28:28<6:31:46,  1.86s/it, loss=0.198, lr=1e-5]Steps:  16%|█▌        | 2342/15001 [1:28:29<6:31:46,  1.86s/it, loss=0.233, lr=1e-5]Steps:  16%|█▌        | 2343/15001 [1:28:30<6:13:45,  1.77s/it, loss=0.233, lr=1e-5]Steps:  16%|█▌        | 2343/15001 [1:28:30<6:13:45,  1.77s/it, loss=0.381, lr=1e-5]Steps:  16%|█▌        | 2344/15001 [1:28:32<6:21:24,  1.81s/it, loss=0.381, lr=1e-5]Steps:  16%|█▌        | 2344/15001 [1:28:32<6:21:24,  1.81s/it, loss=0.179, lr=1e-5]Steps:  16%|█▌        | 2345/15001 [1:28:34<6:36:17,  1.88s/it, loss=0.179, lr=1e-5]Steps:  16%|█▌        | 2345/15001 [1:28:34<6:36:17,  1.88s/it, loss=0.116, lr=1e-5]Steps:  16%|█▌        | 2346/15001 [1:28:36<6:17:49,  1.79s/it, loss=0.116, lr=1e-5]Steps:  16%|█▌        | 2346/15001 [1:28:36<6:17:49,  1.79s/it, loss=0.138, lr=1e-5]Steps:  16%|█▌        | 2347/15001 [1:28:37<6:25:30,  1.83s/it, loss=0.138, lr=1e-5]Steps:  16%|█▌        | 2347/15001 [1:28:38<6:25:30,  1.83s/it, loss=0.0637, lr=1e-5]Steps:  16%|█▌        | 2348/15001 [1:28:39<6:24:27,  1.82s/it, loss=0.0637, lr=1e-5]Steps:  16%|█▌        | 2348/15001 [1:28:40<6:24:27,  1.82s/it, loss=0.0182, lr=1e-5]Steps:  16%|█▌        | 2349/15001 [1:28:41<6:45:48,  1.92s/it, loss=0.0182, lr=1e-5]Steps:  16%|█▌        | 2349/15001 [1:28:42<6:45:48,  1.92s/it, loss=0.0357, lr=1e-5]Steps:  16%|█▌        | 2350/15001 [1:28:44<7:04:36,  2.01s/it, loss=0.0357, lr=1e-5]Steps:  16%|█▌        | 2350/15001 [1:28:44<7:04:36,  2.01s/it, loss=0.176, lr=1e-5] Steps:  16%|█▌        | 2351/15001 [1:28:46<7:01:36,  2.00s/it, loss=0.176, lr=1e-5]Steps:  16%|█▌        | 2351/15001 [1:28:46<7:01:36,  2.00s/it, loss=0.297, lr=1e-5]Steps:  16%|█▌        | 2352/15001 [1:28:48<6:59:39,  1.99s/it, loss=0.297, lr=1e-5]Steps:  16%|█▌        | 2352/15001 [1:28:48<6:59:39,  1.99s/it, loss=0.207, lr=1e-5]Steps:  16%|█▌        | 2353/15001 [1:28:49<6:54:00,  1.96s/it, loss=0.207, lr=1e-5]Steps:  16%|█▌        | 2353/15001 [1:28:50<6:54:00,  1.96s/it, loss=0.146, lr=1e-5]Steps:  16%|█▌        | 2354/15001 [1:28:51<6:48:50,  1.94s/it, loss=0.146, lr=1e-5]Steps:  16%|█▌        | 2354/15001 [1:28:52<6:48:50,  1.94s/it, loss=0.127, lr=1e-5]Steps:  16%|█▌        | 2355/15001 [1:28:53<6:55:39,  1.97s/it, loss=0.127, lr=1e-5]Steps:  16%|█▌        | 2355/15001 [1:28:53<6:55:39,  1.97s/it, loss=0.163, lr=1e-5]Steps:  16%|█▌        | 2356/15001 [1:28:55<6:43:44,  1.92s/it, loss=0.163, lr=1e-5]Steps:  16%|█▌        | 2356/15001 [1:28:55<6:43:44,  1.92s/it, loss=0.162, lr=1e-5]Steps:  16%|█▌        | 2357/15001 [1:28:57<6:38:16,  1.89s/it, loss=0.162, lr=1e-5]Steps:  16%|█▌        | 2357/15001 [1:28:57<6:38:16,  1.89s/it, loss=0.0958, lr=1e-5]Steps:  16%|█▌        | 2358/15001 [1:28:59<6:28:10,  1.84s/it, loss=0.0958, lr=1e-5]Steps:  16%|█▌        | 2358/15001 [1:28:59<6:28:10,  1.84s/it, loss=0.123, lr=1e-5] Steps:  16%|█▌        | 2359/15001 [1:29:00<6:15:39,  1.78s/it, loss=0.123, lr=1e-5]Steps:  16%|█▌        | 2359/15001 [1:29:01<6:15:39,  1.78s/it, loss=0.119, lr=1e-5]Steps:  16%|█▌        | 2360/15001 [1:29:02<6:30:14,  1.85s/it, loss=0.119, lr=1e-5]Steps:  16%|█▌        | 2360/15001 [1:29:03<6:30:14,  1.85s/it, loss=0.381, lr=1e-5]Steps:  16%|█▌        | 2361/15001 [1:29:04<6:27:38,  1.84s/it, loss=0.381, lr=1e-5]Steps:  16%|█▌        | 2361/15001 [1:29:04<6:27:38,  1.84s/it, loss=0.204, lr=1e-5]Steps:  16%|█▌        | 2362/15001 [1:29:06<6:15:50,  1.78s/it, loss=0.204, lr=1e-5]Steps:  16%|█▌        | 2362/15001 [1:29:06<6:15:50,  1.78s/it, loss=0.202, lr=1e-5]Steps:  16%|█▌        | 2363/15001 [1:29:08<6:20:02,  1.80s/it, loss=0.202, lr=1e-5]Steps:  16%|█▌        | 2363/15001 [1:29:08<6:20:02,  1.80s/it, loss=0.154, lr=1e-5]Steps:  16%|█▌        | 2364/15001 [1:29:10<6:28:02,  1.84s/it, loss=0.154, lr=1e-5]Steps:  16%|█▌        | 2364/15001 [1:29:10<6:28:02,  1.84s/it, loss=0.179, lr=1e-5]Steps:  16%|█▌        | 2365/15001 [1:29:12<6:33:00,  1.87s/it, loss=0.179, lr=1e-5]Steps:  16%|█▌        | 2365/15001 [1:29:12<6:33:00,  1.87s/it, loss=0.13, lr=1e-5] Steps:  16%|█▌        | 2366/15001 [1:29:13<6:23:08,  1.82s/it, loss=0.13, lr=1e-5]Steps:  16%|█▌        | 2366/15001 [1:29:14<6:23:08,  1.82s/it, loss=0.0746, lr=1e-5]Steps:  16%|█▌        | 2367/15001 [1:29:15<6:38:32,  1.89s/it, loss=0.0746, lr=1e-5]Steps:  16%|█▌        | 2367/15001 [1:29:15<6:38:32,  1.89s/it, loss=0.259, lr=1e-5] Steps:  16%|█▌        | 2368/15001 [1:29:17<6:21:30,  1.81s/it, loss=0.259, lr=1e-5]Steps:  16%|█▌        | 2368/15001 [1:29:17<6:21:30,  1.81s/it, loss=0.256, lr=1e-5]Steps:  16%|█▌        | 2369/15001 [1:29:19<6:27:02,  1.84s/it, loss=0.256, lr=1e-5]Steps:  16%|█▌        | 2369/15001 [1:29:19<6:27:02,  1.84s/it, loss=0.15, lr=1e-5] Steps:  16%|█▌        | 2370/15001 [1:29:21<6:16:08,  1.79s/it, loss=0.15, lr=1e-5]Steps:  16%|█▌        | 2370/15001 [1:29:21<6:16:08,  1.79s/it, loss=0.0848, lr=1e-5]Steps:  16%|█▌        | 2371/15001 [1:29:23<6:33:44,  1.87s/it, loss=0.0848, lr=1e-5]Steps:  16%|█▌        | 2371/15001 [1:29:23<6:33:44,  1.87s/it, loss=0.113, lr=1e-5] Steps:  16%|█▌        | 2372/15001 [1:29:25<6:59:17,  1.99s/it, loss=0.113, lr=1e-5]Steps:  16%|█▌        | 2372/15001 [1:29:25<6:59:17,  1.99s/it, loss=0.126, lr=1e-5]Steps:  16%|█▌        | 2373/15001 [1:29:27<6:51:29,  1.96s/it, loss=0.126, lr=1e-5]Steps:  16%|█▌        | 2373/15001 [1:29:27<6:51:29,  1.96s/it, loss=0.00823, lr=1e-5]Steps:  16%|█▌        | 2374/15001 [1:29:29<6:49:31,  1.95s/it, loss=0.00823, lr=1e-5]Steps:  16%|█▌        | 2374/15001 [1:29:29<6:49:31,  1.95s/it, loss=0.138, lr=1e-5]  Steps:  16%|█▌        | 2375/15001 [1:29:31<6:51:06,  1.95s/it, loss=0.138, lr=1e-5]Steps:  16%|█▌        | 2375/15001 [1:29:31<6:51:06,  1.95s/it, loss=0.215, lr=1e-5]Steps:  16%|█▌        | 2376/15001 [1:29:33<7:08:07,  2.03s/it, loss=0.215, lr=1e-5]Steps:  16%|█▌        | 2376/15001 [1:29:33<7:08:07,  2.03s/it, loss=0.204, lr=1e-5]Steps:  16%|█▌        | 2377/15001 [1:29:35<6:58:40,  1.99s/it, loss=0.204, lr=1e-5]Steps:  16%|█▌        | 2377/15001 [1:29:35<6:58:40,  1.99s/it, loss=0.145, lr=1e-5]Steps:  16%|█▌        | 2378/15001 [1:29:36<6:30:35,  1.86s/it, loss=0.145, lr=1e-5]Steps:  16%|█▌        | 2378/15001 [1:29:37<6:30:35,  1.86s/it, loss=0.198, lr=1e-5]Steps:  16%|█▌        | 2379/15001 [1:29:39<6:53:19,  1.96s/it, loss=0.198, lr=1e-5]Steps:  16%|█▌        | 2379/15001 [1:29:39<6:53:19,  1.96s/it, loss=0.243, lr=1e-5]Steps:  16%|█▌        | 2380/15001 [1:29:40<6:30:58,  1.86s/it, loss=0.243, lr=1e-5]Steps:  16%|█▌        | 2380/15001 [1:29:40<6:30:58,  1.86s/it, loss=0.176, lr=1e-5]Steps:  16%|█▌        | 2381/15001 [1:29:42<6:24:07,  1.83s/it, loss=0.176, lr=1e-5]Steps:  16%|█▌        | 2381/15001 [1:29:42<6:24:07,  1.83s/it, loss=0.251, lr=1e-5]Steps:  16%|█▌        | 2382/15001 [1:29:44<6:32:48,  1.87s/it, loss=0.251, lr=1e-5]Steps:  16%|█▌        | 2382/15001 [1:29:44<6:32:48,  1.87s/it, loss=0.0527, lr=1e-5]Steps:  16%|█▌        | 2383/15001 [1:29:45<6:14:16,  1.78s/it, loss=0.0527, lr=1e-5]Steps:  16%|█▌        | 2383/15001 [1:29:46<6:14:16,  1.78s/it, loss=0.199, lr=1e-5] Steps:  16%|█▌        | 2384/15001 [1:29:47<6:15:41,  1.79s/it, loss=0.199, lr=1e-5]Steps:  16%|█▌        | 2384/15001 [1:29:48<6:15:41,  1.79s/it, loss=0.0635, lr=1e-5]Steps:  16%|█▌        | 2385/15001 [1:29:49<6:29:15,  1.85s/it, loss=0.0635, lr=1e-5]Steps:  16%|█▌        | 2385/15001 [1:29:49<6:29:15,  1.85s/it, loss=0.0521, lr=1e-5]Steps:  16%|█▌        | 2386/15001 [1:29:51<6:27:32,  1.84s/it, loss=0.0521, lr=1e-5]Steps:  16%|█▌        | 2386/15001 [1:29:51<6:27:32,  1.84s/it, loss=0.296, lr=1e-5] Steps:  16%|█▌        | 2387/15001 [1:29:53<6:29:07,  1.85s/it, loss=0.296, lr=1e-5]Steps:  16%|█▌        | 2387/15001 [1:29:53<6:29:07,  1.85s/it, loss=0.0795, lr=1e-5]Steps:  16%|█▌        | 2388/15001 [1:29:55<6:22:35,  1.82s/it, loss=0.0795, lr=1e-5]Steps:  16%|█▌        | 2388/15001 [1:29:55<6:22:35,  1.82s/it, loss=0.413, lr=1e-5] Steps:  16%|█▌        | 2389/15001 [1:29:57<6:33:02,  1.87s/it, loss=0.413, lr=1e-5]Steps:  16%|█▌        | 2389/15001 [1:29:57<6:33:02,  1.87s/it, loss=0.307, lr=1e-5]Steps:  16%|█▌        | 2390/15001 [1:29:58<6:13:32,  1.78s/it, loss=0.307, lr=1e-5]Steps:  16%|█▌        | 2390/15001 [1:29:59<6:13:32,  1.78s/it, loss=0.208, lr=1e-5]Steps:  16%|█▌        | 2391/15001 [1:30:00<6:28:00,  1.85s/it, loss=0.208, lr=1e-5]Steps:  16%|█▌        | 2391/15001 [1:30:00<6:28:00,  1.85s/it, loss=0.199, lr=1e-5]Steps:  16%|█▌        | 2392/15001 [1:30:02<6:22:30,  1.82s/it, loss=0.199, lr=1e-5]Steps:  16%|█▌        | 2392/15001 [1:30:02<6:22:30,  1.82s/it, loss=0.154, lr=1e-5]Steps:  16%|█▌        | 2393/15001 [1:30:04<6:25:03,  1.83s/it, loss=0.154, lr=1e-5]Steps:  16%|█▌        | 2393/15001 [1:30:04<6:25:03,  1.83s/it, loss=0.141, lr=1e-5]Steps:  16%|█▌        | 2394/15001 [1:30:06<6:25:49,  1.84s/it, loss=0.141, lr=1e-5]Steps:  16%|█▌        | 2394/15001 [1:30:06<6:25:49,  1.84s/it, loss=0.252, lr=1e-5]Steps:  16%|█▌        | 2395/15001 [1:30:08<6:46:24,  1.93s/it, loss=0.252, lr=1e-5]Steps:  16%|█▌        | 2395/15001 [1:30:08<6:46:24,  1.93s/it, loss=0.143, lr=1e-5]Steps:  16%|█▌        | 2396/15001 [1:30:10<6:40:56,  1.91s/it, loss=0.143, lr=1e-5]Steps:  16%|█▌        | 2396/15001 [1:30:10<6:40:56,  1.91s/it, loss=0.0698, lr=1e-5]Steps:  16%|█▌        | 2397/15001 [1:30:12<6:59:00,  1.99s/it, loss=0.0698, lr=1e-5]Steps:  16%|█▌        | 2397/15001 [1:30:12<6:59:00,  1.99s/it, loss=0.208, lr=1e-5] Steps:  16%|█▌        | 2398/15001 [1:30:14<6:42:01,  1.91s/it, loss=0.208, lr=1e-5]Steps:  16%|█▌        | 2398/15001 [1:30:14<6:42:01,  1.91s/it, loss=0.0988, lr=1e-5]Steps:  16%|█▌        | 2399/15001 [1:30:16<6:52:17,  1.96s/it, loss=0.0988, lr=1e-5]Steps:  16%|█▌        | 2399/15001 [1:30:16<6:52:17,  1.96s/it, loss=0.232, lr=1e-5] Steps:  16%|█▌        | 2400/15001 [1:30:18<6:48:32,  1.95s/it, loss=0.232, lr=1e-5]Steps:  16%|█▌        | 2400/15001 [1:30:18<6:48:32,  1.95s/it, loss=0.0306, lr=1e-5]Steps:  16%|█▌        | 2401/15001 [1:30:20<6:46:37,  1.94s/it, loss=0.0306, lr=1e-5]Steps:  16%|█▌        | 2401/15001 [1:30:20<6:46:37,  1.94s/it, loss=0.241, lr=1e-5] Steps:  16%|█▌        | 2402/15001 [1:30:21<6:32:47,  1.87s/it, loss=0.241, lr=1e-5]Steps:  16%|█▌        | 2402/15001 [1:30:22<6:32:47,  1.87s/it, loss=0.264, lr=1e-5]Steps:  16%|█▌        | 2403/15001 [1:30:23<6:29:53,  1.86s/it, loss=0.264, lr=1e-5]Steps:  16%|█▌        | 2403/15001 [1:30:23<6:29:53,  1.86s/it, loss=0.264, lr=1e-5]Steps:  16%|█▌        | 2404/15001 [1:30:25<6:29:45,  1.86s/it, loss=0.264, lr=1e-5]Steps:  16%|█▌        | 2404/15001 [1:30:25<6:29:45,  1.86s/it, loss=0.239, lr=1e-5]Steps:  16%|█▌        | 2405/15001 [1:30:27<6:45:57,  1.93s/it, loss=0.239, lr=1e-5]Steps:  16%|█▌        | 2405/15001 [1:30:27<6:45:57,  1.93s/it, loss=0.0842, lr=1e-5]Steps:  16%|█▌        | 2406/15001 [1:30:29<6:31:43,  1.87s/it, loss=0.0842, lr=1e-5]Steps:  16%|█▌        | 2406/15001 [1:30:29<6:31:43,  1.87s/it, loss=0.096, lr=1e-5] Steps:  16%|█▌        | 2407/15001 [1:30:31<6:26:02,  1.84s/it, loss=0.096, lr=1e-5]Steps:  16%|█▌        | 2407/15001 [1:30:31<6:26:02,  1.84s/it, loss=0.235, lr=1e-5]Steps:  16%|█▌        | 2408/15001 [1:30:33<6:36:01,  1.89s/it, loss=0.235, lr=1e-5]Steps:  16%|█▌        | 2408/15001 [1:30:33<6:36:01,  1.89s/it, loss=0.0541, lr=1e-5]Steps:  16%|█▌        | 2409/15001 [1:30:34<6:26:40,  1.84s/it, loss=0.0541, lr=1e-5]Steps:  16%|█▌        | 2409/15001 [1:30:35<6:26:40,  1.84s/it, loss=0.153, lr=1e-5] Steps:  16%|█▌        | 2410/15001 [1:30:36<6:39:03,  1.90s/it, loss=0.153, lr=1e-5]Steps:  16%|█▌        | 2410/15001 [1:30:36<6:39:03,  1.90s/it, loss=0.0758, lr=1e-5]Steps:  16%|█▌        | 2411/15001 [1:30:38<6:13:25,  1.78s/it, loss=0.0758, lr=1e-5]Steps:  16%|█▌        | 2411/15001 [1:30:38<6:13:25,  1.78s/it, loss=0.303, lr=1e-5] Steps:  16%|█▌        | 2412/15001 [1:30:40<6:26:56,  1.84s/it, loss=0.303, lr=1e-5]Steps:  16%|█▌        | 2412/15001 [1:30:40<6:26:56,  1.84s/it, loss=0.0856, lr=1e-5]Steps:  16%|█▌        | 2413/15001 [1:30:42<6:35:20,  1.88s/it, loss=0.0856, lr=1e-5]Steps:  16%|█▌        | 2413/15001 [1:30:42<6:35:20,  1.88s/it, loss=0.331, lr=1e-5] Steps:  16%|█▌        | 2414/15001 [1:30:43<6:13:38,  1.78s/it, loss=0.331, lr=1e-5]Steps:  16%|█▌        | 2414/15001 [1:30:44<6:13:38,  1.78s/it, loss=0.108, lr=1e-5]Steps:  16%|█▌        | 2415/15001 [1:30:45<6:16:19,  1.79s/it, loss=0.108, lr=1e-5]Steps:  16%|█▌        | 2415/15001 [1:30:45<6:16:19,  1.79s/it, loss=0.35, lr=1e-5] Steps:  16%|█▌        | 2416/15001 [1:30:47<6:26:32,  1.84s/it, loss=0.35, lr=1e-5]Steps:  16%|█▌        | 2416/15001 [1:30:47<6:26:32,  1.84s/it, loss=0.131, lr=1e-5]Steps:  16%|█▌        | 2417/15001 [1:30:49<6:43:40,  1.92s/it, loss=0.131, lr=1e-5]Steps:  16%|█▌        | 2417/15001 [1:30:49<6:43:40,  1.92s/it, loss=0.0312, lr=1e-5]Steps:  16%|█▌        | 2418/15001 [1:30:51<6:55:32,  1.98s/it, loss=0.0312, lr=1e-5]Steps:  16%|█▌        | 2418/15001 [1:30:51<6:55:32,  1.98s/it, loss=0.133, lr=1e-5] Steps:  16%|█▌        | 2419/15001 [1:30:53<6:36:24,  1.89s/it, loss=0.133, lr=1e-5]Steps:  16%|█▌        | 2419/15001 [1:30:53<6:36:24,  1.89s/it, loss=0.186, lr=1e-5]Steps:  16%|█▌        | 2420/15001 [1:30:55<6:40:24,  1.91s/it, loss=0.186, lr=1e-5]Steps:  16%|█▌        | 2420/15001 [1:30:55<6:40:24,  1.91s/it, loss=0.136, lr=1e-5]Steps:  16%|█▌        | 2421/15001 [1:30:57<7:05:03,  2.03s/it, loss=0.136, lr=1e-5]Steps:  16%|█▌        | 2421/15001 [1:30:58<7:05:03,  2.03s/it, loss=0.165, lr=1e-5]Steps:  16%|█▌        | 2422/15001 [1:31:00<7:21:52,  2.11s/it, loss=0.165, lr=1e-5]Steps:  16%|█▌        | 2422/15001 [1:31:00<7:21:52,  2.11s/it, loss=0.149, lr=1e-5]Steps:  16%|█▌        | 2423/15001 [1:31:01<6:55:17,  1.98s/it, loss=0.149, lr=1e-5]Steps:  16%|█▌        | 2423/15001 [1:31:01<6:55:17,  1.98s/it, loss=0.121, lr=1e-5]Steps:  16%|█▌        | 2424/15001 [1:31:03<6:37:36,  1.90s/it, loss=0.121, lr=1e-5]Steps:  16%|█▌        | 2424/15001 [1:31:03<6:37:36,  1.90s/it, loss=0.125, lr=1e-5]Steps:  16%|█▌        | 2425/15001 [1:31:05<6:38:57,  1.90s/it, loss=0.125, lr=1e-5]Steps:  16%|█▌        | 2425/15001 [1:31:05<6:38:57,  1.90s/it, loss=0.162, lr=1e-5]Steps:  16%|█▌        | 2426/15001 [1:31:06<6:16:04,  1.79s/it, loss=0.162, lr=1e-5]Steps:  16%|█▌        | 2426/15001 [1:31:07<6:16:04,  1.79s/it, loss=0.0386, lr=1e-5]Steps:  16%|█▌        | 2427/15001 [1:31:08<6:20:20,  1.81s/it, loss=0.0386, lr=1e-5]Steps:  16%|█▌        | 2427/15001 [1:31:09<6:20:20,  1.81s/it, loss=0.218, lr=1e-5] Steps:  16%|█▌        | 2428/15001 [1:31:10<6:30:10,  1.86s/it, loss=0.218, lr=1e-5]Steps:  16%|█▌        | 2428/15001 [1:31:10<6:30:10,  1.86s/it, loss=0.122, lr=1e-5]Steps:  16%|█▌        | 2429/15001 [1:31:12<6:21:11,  1.82s/it, loss=0.122, lr=1e-5]Steps:  16%|█▌        | 2429/15001 [1:31:12<6:21:11,  1.82s/it, loss=0.385, lr=1e-5]Steps:  16%|█▌        | 2430/15001 [1:31:14<6:38:01,  1.90s/it, loss=0.385, lr=1e-5]Steps:  16%|█▌        | 2430/15001 [1:31:14<6:38:01,  1.90s/it, loss=0.22, lr=1e-5] Steps:  16%|█▌        | 2431/15001 [1:31:16<6:36:00,  1.89s/it, loss=0.22, lr=1e-5]Steps:  16%|█▌        | 2431/15001 [1:31:16<6:36:00,  1.89s/it, loss=0.0576, lr=1e-5]Steps:  16%|█▌        | 2432/15001 [1:31:18<6:29:48,  1.86s/it, loss=0.0576, lr=1e-5]Steps:  16%|█▌        | 2432/15001 [1:31:18<6:29:48,  1.86s/it, loss=0.0727, lr=1e-5]Steps:  16%|█▌        | 2433/15001 [1:31:19<6:22:29,  1.83s/it, loss=0.0727, lr=1e-5]Steps:  16%|█▌        | 2433/15001 [1:31:20<6:22:29,  1.83s/it, loss=0.255, lr=1e-5] Steps:  16%|█▌        | 2434/15001 [1:31:21<6:18:27,  1.81s/it, loss=0.255, lr=1e-5]Steps:  16%|█▌        | 2434/15001 [1:31:21<6:18:27,  1.81s/it, loss=0.157, lr=1e-5]Steps:  16%|█▌        | 2435/15001 [1:31:23<6:18:05,  1.81s/it, loss=0.157, lr=1e-5]Steps:  16%|█▌        | 2435/15001 [1:31:23<6:18:05,  1.81s/it, loss=0.0509, lr=1e-5]Steps:  16%|█▌        | 2436/15001 [1:31:25<6:21:55,  1.82s/it, loss=0.0509, lr=1e-5]Steps:  16%|█▌        | 2436/15001 [1:31:25<6:21:55,  1.82s/it, loss=0.208, lr=1e-5] Steps:  16%|█▌        | 2437/15001 [1:31:27<6:34:01,  1.88s/it, loss=0.208, lr=1e-5]Steps:  16%|█▌        | 2437/15001 [1:31:27<6:34:01,  1.88s/it, loss=0.107, lr=1e-5]Steps:  16%|█▋        | 2438/15001 [1:31:29<6:36:47,  1.90s/it, loss=0.107, lr=1e-5]Steps:  16%|█▋        | 2438/15001 [1:31:29<6:36:47,  1.90s/it, loss=0.129, lr=1e-5]Steps:  16%|█▋        | 2439/15001 [1:31:31<6:38:22,  1.90s/it, loss=0.129, lr=1e-5]Steps:  16%|█▋        | 2439/15001 [1:31:31<6:38:22,  1.90s/it, loss=0.127, lr=1e-5]Steps:  16%|█▋        | 2440/15001 [1:31:33<6:37:26,  1.90s/it, loss=0.127, lr=1e-5]Steps:  16%|█▋        | 2440/15001 [1:31:33<6:37:26,  1.90s/it, loss=0.191, lr=1e-5]Steps:  16%|█▋        | 2441/15001 [1:31:35<6:55:13,  1.98s/it, loss=0.191, lr=1e-5]Steps:  16%|█▋        | 2441/15001 [1:31:35<6:55:13,  1.98s/it, loss=0.0727, lr=1e-5]Steps:  16%|█▋        | 2442/15001 [1:31:37<6:51:56,  1.97s/it, loss=0.0727, lr=1e-5]Steps:  16%|█▋        | 2442/15001 [1:31:37<6:51:56,  1.97s/it, loss=0.187, lr=1e-5] Steps:  16%|█▋        | 2443/15001 [1:31:39<7:00:19,  2.01s/it, loss=0.187, lr=1e-5]Steps:  16%|█▋        | 2443/15001 [1:31:39<7:00:19,  2.01s/it, loss=0.173, lr=1e-5]Steps:  16%|█▋        | 2444/15001 [1:31:41<7:02:44,  2.02s/it, loss=0.173, lr=1e-5]Steps:  16%|█▋        | 2444/15001 [1:31:41<7:02:44,  2.02s/it, loss=0.252, lr=1e-5]Steps:  16%|█▋        | 2445/15001 [1:31:43<6:42:58,  1.93s/it, loss=0.252, lr=1e-5]Steps:  16%|█▋        | 2445/15001 [1:31:43<6:42:58,  1.93s/it, loss=0.0474, lr=1e-5]Steps:  16%|█▋        | 2446/15001 [1:31:45<6:47:04,  1.95s/it, loss=0.0474, lr=1e-5]Steps:  16%|█▋        | 2446/15001 [1:31:45<6:47:04,  1.95s/it, loss=0.101, lr=1e-5] Steps:  16%|█▋        | 2447/15001 [1:31:46<6:31:16,  1.87s/it, loss=0.101, lr=1e-5]Steps:  16%|█▋        | 2447/15001 [1:31:46<6:31:16,  1.87s/it, loss=0.505, lr=1e-5]Steps:  16%|█▋        | 2448/15001 [1:31:48<6:23:18,  1.83s/it, loss=0.505, lr=1e-5]Steps:  16%|█▋        | 2448/15001 [1:31:48<6:23:18,  1.83s/it, loss=0.172, lr=1e-5]Steps:  16%|█▋        | 2449/15001 [1:31:50<6:34:45,  1.89s/it, loss=0.172, lr=1e-5]Steps:  16%|█▋        | 2449/15001 [1:31:50<6:34:45,  1.89s/it, loss=0.0391, lr=1e-5]Steps:  16%|█▋        | 2450/15001 [1:31:52<6:23:34,  1.83s/it, loss=0.0391, lr=1e-5]Steps:  16%|█▋        | 2450/15001 [1:31:52<6:23:34,  1.83s/it, loss=0.21, lr=1e-5]  Steps:  16%|█▋        | 2451/15001 [1:31:54<6:23:15,  1.83s/it, loss=0.21, lr=1e-5]Steps:  16%|█▋        | 2451/15001 [1:31:54<6:23:15,  1.83s/it, loss=0.23, lr=1e-5]Steps:  16%|█▋        | 2452/15001 [1:31:55<6:13:23,  1.79s/it, loss=0.23, lr=1e-5]Steps:  16%|█▋        | 2452/15001 [1:31:56<6:13:23,  1.79s/it, loss=0.0371, lr=1e-5]Steps:  16%|█▋        | 2453/15001 [1:31:57<6:10:47,  1.77s/it, loss=0.0371, lr=1e-5]Steps:  16%|█▋        | 2453/15001 [1:31:57<6:10:47,  1.77s/it, loss=0.0855, lr=1e-5]Steps:  16%|█▋        | 2454/15001 [1:31:59<6:38:19,  1.90s/it, loss=0.0855, lr=1e-5]Steps:  16%|█▋        | 2454/15001 [1:31:59<6:38:19,  1.90s/it, loss=0.147, lr=1e-5] Steps:  16%|█▋        | 2455/15001 [1:32:01<6:07:56,  1.76s/it, loss=0.147, lr=1e-5]Steps:  16%|█▋        | 2455/15001 [1:32:01<6:07:56,  1.76s/it, loss=0.135, lr=1e-5]Steps:  16%|█▋        | 2456/15001 [1:32:03<6:31:08,  1.87s/it, loss=0.135, lr=1e-5]Steps:  16%|█▋        | 2456/15001 [1:32:03<6:31:08,  1.87s/it, loss=0.112, lr=1e-5]Steps:  16%|█▋        | 2457/15001 [1:32:05<6:26:29,  1.85s/it, loss=0.112, lr=1e-5]Steps:  16%|█▋        | 2457/15001 [1:32:05<6:26:29,  1.85s/it, loss=0.35, lr=1e-5] Steps:  16%|█▋        | 2458/15001 [1:32:06<6:25:04,  1.84s/it, loss=0.35, lr=1e-5]Steps:  16%|█▋        | 2458/15001 [1:32:06<6:25:04,  1.84s/it, loss=0.0495, lr=1e-5]Steps:  16%|█▋        | 2459/15001 [1:32:08<6:18:47,  1.81s/it, loss=0.0495, lr=1e-5]Steps:  16%|█▋        | 2459/15001 [1:32:08<6:18:47,  1.81s/it, loss=0.127, lr=1e-5] Steps:  16%|█▋        | 2460/15001 [1:32:10<6:20:58,  1.82s/it, loss=0.127, lr=1e-5]Steps:  16%|█▋        | 2460/15001 [1:32:10<6:20:58,  1.82s/it, loss=0.151, lr=1e-5]Steps:  16%|█▋        | 2461/15001 [1:32:12<6:07:36,  1.76s/it, loss=0.151, lr=1e-5]Steps:  16%|█▋        | 2461/15001 [1:32:12<6:07:36,  1.76s/it, loss=0.118, lr=1e-5]Steps:  16%|█▋        | 2462/15001 [1:32:14<6:42:38,  1.93s/it, loss=0.118, lr=1e-5]Steps:  16%|█▋        | 2462/15001 [1:32:14<6:42:38,  1.93s/it, loss=0.108, lr=1e-5]Steps:  16%|█▋        | 2463/15001 [1:32:16<6:35:19,  1.89s/it, loss=0.108, lr=1e-5]Steps:  16%|█▋        | 2463/15001 [1:32:16<6:35:19,  1.89s/it, loss=0.153, lr=1e-5]Steps:  16%|█▋        | 2464/15001 [1:32:18<6:47:49,  1.95s/it, loss=0.153, lr=1e-5]Steps:  16%|█▋        | 2464/15001 [1:32:18<6:47:49,  1.95s/it, loss=0.164, lr=1e-5]Steps:  16%|█▋        | 2465/15001 [1:32:20<7:01:31,  2.02s/it, loss=0.164, lr=1e-5]Steps:  16%|█▋        | 2465/15001 [1:32:20<7:01:31,  2.02s/it, loss=0.143, lr=1e-5]Steps:  16%|█▋        | 2466/15001 [1:32:22<6:58:23,  2.00s/it, loss=0.143, lr=1e-5]Steps:  16%|█▋        | 2466/15001 [1:32:22<6:58:23,  2.00s/it, loss=0.235, lr=1e-5]Steps:  16%|█▋        | 2467/15001 [1:32:24<6:53:21,  1.98s/it, loss=0.235, lr=1e-5]Steps:  16%|█▋        | 2467/15001 [1:32:24<6:53:21,  1.98s/it, loss=0.0617, lr=1e-5]Steps:  16%|█▋        | 2468/15001 [1:32:25<6:28:48,  1.86s/it, loss=0.0617, lr=1e-5]Steps:  16%|█▋        | 2468/15001 [1:32:26<6:28:48,  1.86s/it, loss=0.0551, lr=1e-5]Steps:  16%|█▋        | 2469/15001 [1:32:27<6:30:12,  1.87s/it, loss=0.0551, lr=1e-5]Steps:  16%|█▋        | 2469/15001 [1:32:28<6:30:12,  1.87s/it, loss=0.155, lr=1e-5] Steps:  16%|█▋        | 2470/15001 [1:32:29<6:30:11,  1.87s/it, loss=0.155, lr=1e-5]Steps:  16%|█▋        | 2470/15001 [1:32:29<6:30:11,  1.87s/it, loss=0.121, lr=1e-5]Steps:  16%|█▋        | 2471/15001 [1:32:31<6:37:31,  1.90s/it, loss=0.121, lr=1e-5]Steps:  16%|█▋        | 2471/15001 [1:32:31<6:37:31,  1.90s/it, loss=0.214, lr=1e-5]Steps:  16%|█▋        | 2472/15001 [1:32:33<6:27:00,  1.85s/it, loss=0.214, lr=1e-5]Steps:  16%|█▋        | 2472/15001 [1:32:33<6:27:00,  1.85s/it, loss=0.225, lr=1e-5]Steps:  16%|█▋        | 2473/15001 [1:32:35<6:18:10,  1.81s/it, loss=0.225, lr=1e-5]Steps:  16%|█▋        | 2473/15001 [1:32:35<6:18:10,  1.81s/it, loss=0.218, lr=1e-5]Steps:  16%|█▋        | 2474/15001 [1:32:37<6:27:30,  1.86s/it, loss=0.218, lr=1e-5]Steps:  16%|█▋        | 2474/15001 [1:32:37<6:27:30,  1.86s/it, loss=0.37, lr=1e-5] Steps:  16%|█▋        | 2475/15001 [1:32:38<6:13:20,  1.79s/it, loss=0.37, lr=1e-5]Steps:  16%|█▋        | 2475/15001 [1:32:38<6:13:20,  1.79s/it, loss=0.0827, lr=1e-5]Steps:  17%|█▋        | 2476/15001 [1:32:40<6:12:00,  1.78s/it, loss=0.0827, lr=1e-5]Steps:  17%|█▋        | 2476/15001 [1:32:40<6:12:00,  1.78s/it, loss=0.0705, lr=1e-5]Steps:  17%|█▋        | 2477/15001 [1:32:42<6:19:37,  1.82s/it, loss=0.0705, lr=1e-5]Steps:  17%|█▋        | 2477/15001 [1:32:42<6:19:37,  1.82s/it, loss=0.36, lr=1e-5]  Steps:  17%|█▋        | 2478/15001 [1:32:44<6:16:43,  1.80s/it, loss=0.36, lr=1e-5]Steps:  17%|█▋        | 2478/15001 [1:32:44<6:16:43,  1.80s/it, loss=0.0677, lr=1e-5]Steps:  17%|█▋        | 2479/15001 [1:32:45<6:18:48,  1.82s/it, loss=0.0677, lr=1e-5]Steps:  17%|█▋        | 2479/15001 [1:32:46<6:18:48,  1.82s/it, loss=0.159, lr=1e-5] Steps:  17%|█▋        | 2480/15001 [1:32:47<6:17:26,  1.81s/it, loss=0.159, lr=1e-5]Steps:  17%|█▋        | 2480/15001 [1:32:48<6:17:26,  1.81s/it, loss=0.321, lr=1e-5]Steps:  17%|█▋        | 2481/15001 [1:32:49<6:18:33,  1.81s/it, loss=0.321, lr=1e-5]Steps:  17%|█▋        | 2481/15001 [1:32:49<6:18:33,  1.81s/it, loss=0.231, lr=1e-5]Steps:  17%|█▋        | 2482/15001 [1:32:51<6:23:17,  1.84s/it, loss=0.231, lr=1e-5]Steps:  17%|█▋        | 2482/15001 [1:32:51<6:23:17,  1.84s/it, loss=0.218, lr=1e-5]Steps:  17%|█▋        | 2483/15001 [1:32:53<6:12:31,  1.79s/it, loss=0.218, lr=1e-5]Steps:  17%|█▋        | 2483/15001 [1:32:53<6:12:31,  1.79s/it, loss=0.13, lr=1e-5] Steps:  17%|█▋        | 2484/15001 [1:32:55<6:26:38,  1.85s/it, loss=0.13, lr=1e-5]Steps:  17%|█▋        | 2484/15001 [1:32:55<6:26:38,  1.85s/it, loss=0.12, lr=1e-5]Steps:  17%|█▋        | 2485/15001 [1:32:57<6:41:47,  1.93s/it, loss=0.12, lr=1e-5]Steps:  17%|█▋        | 2485/15001 [1:32:57<6:41:47,  1.93s/it, loss=0.33, lr=1e-5]Steps:  17%|█▋        | 2486/15001 [1:32:58<6:27:08,  1.86s/it, loss=0.33, lr=1e-5]Steps:  17%|█▋        | 2486/15001 [1:32:59<6:27:08,  1.86s/it, loss=0.26, lr=1e-5]Steps:  17%|█▋        | 2487/15001 [1:33:01<6:42:02,  1.93s/it, loss=0.26, lr=1e-5]Steps:  17%|█▋        | 2487/15001 [1:33:01<6:42:02,  1.93s/it, loss=0.142, lr=1e-5]Steps:  17%|█▋        | 2488/15001 [1:33:03<7:06:38,  2.05s/it, loss=0.142, lr=1e-5]Steps:  17%|█▋        | 2488/15001 [1:33:03<7:06:38,  2.05s/it, loss=0.104, lr=1e-5]Steps:  17%|█▋        | 2489/15001 [1:33:05<7:15:54,  2.09s/it, loss=0.104, lr=1e-5]Steps:  17%|█▋        | 2489/15001 [1:33:05<7:15:54,  2.09s/it, loss=0.37, lr=1e-5] Steps:  17%|█▋        | 2490/15001 [1:33:07<6:55:26,  1.99s/it, loss=0.37, lr=1e-5]Steps:  17%|█▋        | 2490/15001 [1:33:07<6:55:26,  1.99s/it, loss=0.151, lr=1e-5]Steps:  17%|█▋        | 2491/15001 [1:33:08<6:32:12,  1.88s/it, loss=0.151, lr=1e-5]Steps:  17%|█▋        | 2491/15001 [1:33:09<6:32:12,  1.88s/it, loss=0.168, lr=1e-5]Steps:  17%|█▋        | 2492/15001 [1:33:10<6:25:45,  1.85s/it, loss=0.168, lr=1e-5]Steps:  17%|█▋        | 2492/15001 [1:33:11<6:25:45,  1.85s/it, loss=0.274, lr=1e-5]Steps:  17%|█▋        | 2493/15001 [1:33:12<6:42:50,  1.93s/it, loss=0.274, lr=1e-5]Steps:  17%|█▋        | 2493/15001 [1:33:12<6:42:50,  1.93s/it, loss=0.0949, lr=1e-5]Steps:  17%|█▋        | 2494/15001 [1:33:14<6:24:29,  1.84s/it, loss=0.0949, lr=1e-5]Steps:  17%|█▋        | 2494/15001 [1:33:14<6:24:29,  1.84s/it, loss=0.0822, lr=1e-5]Steps:  17%|█▋        | 2495/15001 [1:33:16<6:29:31,  1.87s/it, loss=0.0822, lr=1e-5]Steps:  17%|█▋        | 2495/15001 [1:33:16<6:29:31,  1.87s/it, loss=0.15, lr=1e-5]  Steps:  17%|█▋        | 2496/15001 [1:33:18<6:17:39,  1.81s/it, loss=0.15, lr=1e-5]Steps:  17%|█▋        | 2496/15001 [1:33:18<6:17:39,  1.81s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2497/15001 [1:33:20<6:29:49,  1.87s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2497/15001 [1:33:20<6:29:49,  1.87s/it, loss=0.142, lr=1e-5]Steps:  17%|█▋        | 2498/15001 [1:33:21<6:13:09,  1.79s/it, loss=0.142, lr=1e-5]Steps:  17%|█▋        | 2498/15001 [1:33:22<6:13:09,  1.79s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2499/15001 [1:33:23<6:19:00,  1.82s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2499/15001 [1:33:23<6:19:00,  1.82s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2500/15001 [1:33:25<6:22:14,  1.83s/it, loss=0.124, lr=1e-5]02/04/2024 14:35:44 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1646.22it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  17%|█▋        | 2500/15001 [1:37:05<6:22:14,  1.83s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2501/15001 [1:37:06<235:11:40, 67.74s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2501/15001 [1:37:07<235:11:40, 67.74s/it, loss=0.102, lr=1e-5]Steps:  17%|█▋        | 2502/15001 [1:37:08<166:34:49, 47.98s/it, loss=0.102, lr=1e-5]Steps:  17%|█▋        | 2502/15001 [1:37:09<166:34:49, 47.98s/it, loss=0.0869, lr=1e-5]Steps:  17%|█▋        | 2503/15001 [1:37:10<118:20:52, 34.09s/it, loss=0.0869, lr=1e-5]Steps:  17%|█▋        | 2503/15001 [1:37:10<118:20:52, 34.09s/it, loss=0.0495, lr=1e-5]Steps:  17%|█▋        | 2504/15001 [1:37:12<84:42:15, 24.40s/it, loss=0.0495, lr=1e-5] Steps:  17%|█▋        | 2504/15001 [1:37:12<84:42:15, 24.40s/it, loss=0.164, lr=1e-5] Steps:  17%|█▋        | 2505/15001 [1:37:14<61:16:04, 17.65s/it, loss=0.164, lr=1e-5]Steps:  17%|█▋        | 2505/15001 [1:37:14<61:16:04, 17.65s/it, loss=0.242, lr=1e-5]Steps:  17%|█▋        | 2506/15001 [1:37:16<44:53:23, 12.93s/it, loss=0.242, lr=1e-5]Steps:  17%|█▋        | 2506/15001 [1:37:16<44:53:23, 12.93s/it, loss=0.0855, lr=1e-5]Steps:  17%|█▋        | 2507/15001 [1:37:18<33:19:51,  9.60s/it, loss=0.0855, lr=1e-5]Steps:  17%|█▋        | 2507/15001 [1:37:18<33:19:51,  9.60s/it, loss=0.216, lr=1e-5] Steps:  17%|█▋        | 2508/15001 [1:37:19<24:53:36,  7.17s/it, loss=0.216, lr=1e-5]Steps:  17%|█▋        | 2508/15001 [1:37:19<24:53:36,  7.17s/it, loss=0.288, lr=1e-5]Steps:  17%|█▋        | 2509/15001 [1:37:21<19:38:06,  5.66s/it, loss=0.288, lr=1e-5]Steps:  17%|█▋        | 2509/15001 [1:37:21<19:38:06,  5.66s/it, loss=0.0878, lr=1e-5]Steps:  17%|█▋        | 2510/15001 [1:37:24<16:22:58,  4.72s/it, loss=0.0878, lr=1e-5]Steps:  17%|█▋        | 2510/15001 [1:37:24<16:22:58,  4.72s/it, loss=0.228, lr=1e-5] Steps:  17%|█▋        | 2511/15001 [1:37:26<13:25:52,  3.87s/it, loss=0.228, lr=1e-5]Steps:  17%|█▋        | 2511/15001 [1:37:26<13:25:52,  3.87s/it, loss=0.157, lr=1e-5]Steps:  17%|█▋        | 2512/15001 [1:37:27<10:57:30,  3.16s/it, loss=0.157, lr=1e-5]Steps:  17%|█▋        | 2512/15001 [1:37:27<10:57:30,  3.16s/it, loss=0.067, lr=1e-5]Steps:  17%|█▋        | 2513/15001 [1:37:29<9:53:25,  2.85s/it, loss=0.067, lr=1e-5] Steps:  17%|█▋        | 2513/15001 [1:37:29<9:53:25,  2.85s/it, loss=0.253, lr=1e-5]Steps:  17%|█▋        | 2514/15001 [1:37:31<8:47:22,  2.53s/it, loss=0.253, lr=1e-5]Steps:  17%|█▋        | 2514/15001 [1:37:31<8:47:22,  2.53s/it, loss=0.0864, lr=1e-5]Steps:  17%|█▋        | 2515/15001 [1:37:33<8:25:22,  2.43s/it, loss=0.0864, lr=1e-5]Steps:  17%|█▋        | 2515/15001 [1:37:33<8:25:22,  2.43s/it, loss=0.222, lr=1e-5] Steps:  17%|█▋        | 2516/15001 [1:37:35<7:55:29,  2.29s/it, loss=0.222, lr=1e-5]Steps:  17%|█▋        | 2516/15001 [1:37:35<7:55:29,  2.29s/it, loss=0.166, lr=1e-5]Steps:  17%|█▋        | 2517/15001 [1:37:37<7:28:40,  2.16s/it, loss=0.166, lr=1e-5]Steps:  17%|█▋        | 2517/15001 [1:37:37<7:28:40,  2.16s/it, loss=0.0711, lr=1e-5]Steps:  17%|█▋        | 2518/15001 [1:37:39<7:25:21,  2.14s/it, loss=0.0711, lr=1e-5]Steps:  17%|█▋        | 2518/15001 [1:37:39<7:25:21,  2.14s/it, loss=0.127, lr=1e-5] Steps:  17%|█▋        | 2519/15001 [1:37:41<7:05:44,  2.05s/it, loss=0.127, lr=1e-5]Steps:  17%|█▋        | 2519/15001 [1:37:41<7:05:44,  2.05s/it, loss=0.216, lr=1e-5]Steps:  17%|█▋        | 2520/15001 [1:37:43<6:52:31,  1.98s/it, loss=0.216, lr=1e-5]Steps:  17%|█▋        | 2520/15001 [1:37:43<6:52:31,  1.98s/it, loss=0.226, lr=1e-5]Steps:  17%|█▋        | 2521/15001 [1:37:45<6:52:21,  1.98s/it, loss=0.226, lr=1e-5]Steps:  17%|█▋        | 2521/15001 [1:37:45<6:52:21,  1.98s/it, loss=0.115, lr=1e-5]Steps:  17%|█▋        | 2522/15001 [1:37:47<6:40:20,  1.92s/it, loss=0.115, lr=1e-5]Steps:  17%|█▋        | 2522/15001 [1:37:47<6:40:20,  1.92s/it, loss=0.186, lr=1e-5]Steps:  17%|█▋        | 2523/15001 [1:37:48<6:17:37,  1.82s/it, loss=0.186, lr=1e-5]Steps:  17%|█▋        | 2523/15001 [1:37:48<6:17:37,  1.82s/it, loss=0.0588, lr=1e-5]Steps:  17%|█▋        | 2524/15001 [1:37:50<6:24:32,  1.85s/it, loss=0.0588, lr=1e-5]Steps:  17%|█▋        | 2524/15001 [1:37:50<6:24:32,  1.85s/it, loss=0.167, lr=1e-5] Steps:  17%|█▋        | 2525/15001 [1:37:52<6:30:13,  1.88s/it, loss=0.167, lr=1e-5]Steps:  17%|█▋        | 2525/15001 [1:37:52<6:30:13,  1.88s/it, loss=0.0518, lr=1e-5]Steps:  17%|█▋        | 2526/15001 [1:37:54<6:17:37,  1.82s/it, loss=0.0518, lr=1e-5]Steps:  17%|█▋        | 2526/15001 [1:37:54<6:17:37,  1.82s/it, loss=0.27, lr=1e-5]  Steps:  17%|█▋        | 2527/15001 [1:37:55<6:18:35,  1.82s/it, loss=0.27, lr=1e-5]Steps:  17%|█▋        | 2527/15001 [1:37:56<6:18:35,  1.82s/it, loss=0.0797, lr=1e-5]Steps:  17%|█▋        | 2528/15001 [1:37:57<6:06:49,  1.76s/it, loss=0.0797, lr=1e-5]Steps:  17%|█▋        | 2528/15001 [1:37:58<6:06:49,  1.76s/it, loss=0.311, lr=1e-5] Steps:  17%|█▋        | 2529/15001 [1:37:59<6:40:13,  1.93s/it, loss=0.311, lr=1e-5]Steps:  17%|█▋        | 2529/15001 [1:37:59<6:40:13,  1.93s/it, loss=0.182, lr=1e-5]Steps:  17%|█▋        | 2530/15001 [1:38:01<6:31:42,  1.88s/it, loss=0.182, lr=1e-5]Steps:  17%|█▋        | 2530/15001 [1:38:01<6:31:42,  1.88s/it, loss=0.217, lr=1e-5]Steps:  17%|█▋        | 2531/15001 [1:38:03<6:17:30,  1.82s/it, loss=0.217, lr=1e-5]Steps:  17%|█▋        | 2531/15001 [1:38:03<6:17:30,  1.82s/it, loss=0.0251, lr=1e-5]Steps:  17%|█▋        | 2532/15001 [1:38:05<6:23:20,  1.84s/it, loss=0.0251, lr=1e-5]Steps:  17%|█▋        | 2532/15001 [1:38:05<6:23:20,  1.84s/it, loss=0.13, lr=1e-5]  Steps:  17%|█▋        | 2533/15001 [1:38:06<6:07:40,  1.77s/it, loss=0.13, lr=1e-5]Steps:  17%|█▋        | 2533/15001 [1:38:07<6:07:40,  1.77s/it, loss=0.086, lr=1e-5]Steps:  17%|█▋        | 2534/15001 [1:38:08<6:07:02,  1.77s/it, loss=0.086, lr=1e-5]Steps:  17%|█▋        | 2534/15001 [1:38:08<6:07:02,  1.77s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2535/15001 [1:38:10<6:07:00,  1.77s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2535/15001 [1:38:10<6:07:00,  1.77s/it, loss=0.312, lr=1e-5]Steps:  17%|█▋        | 2536/15001 [1:38:12<6:12:33,  1.79s/it, loss=0.312, lr=1e-5]Steps:  17%|█▋        | 2536/15001 [1:38:12<6:12:33,  1.79s/it, loss=0.112, lr=1e-5]Steps:  17%|█▋        | 2537/15001 [1:38:14<6:20:39,  1.83s/it, loss=0.112, lr=1e-5]Steps:  17%|█▋        | 2537/15001 [1:38:14<6:20:39,  1.83s/it, loss=0.305, lr=1e-5]Steps:  17%|█▋        | 2538/15001 [1:38:16<6:26:20,  1.86s/it, loss=0.305, lr=1e-5]Steps:  17%|█▋        | 2538/15001 [1:38:16<6:26:20,  1.86s/it, loss=0.251, lr=1e-5]Steps:  17%|█▋        | 2539/15001 [1:38:18<6:43:13,  1.94s/it, loss=0.251, lr=1e-5]Steps:  17%|█▋        | 2539/15001 [1:38:18<6:43:13,  1.94s/it, loss=0.0978, lr=1e-5]Steps:  17%|█▋        | 2540/15001 [1:38:20<6:48:17,  1.97s/it, loss=0.0978, lr=1e-5]Steps:  17%|█▋        | 2540/15001 [1:38:20<6:48:17,  1.97s/it, loss=0.217, lr=1e-5] Steps:  17%|█▋        | 2541/15001 [1:38:22<7:03:56,  2.04s/it, loss=0.217, lr=1e-5]Steps:  17%|█▋        | 2541/15001 [1:38:22<7:03:56,  2.04s/it, loss=0.133, lr=1e-5]Steps:  17%|█▋        | 2542/15001 [1:38:24<6:40:45,  1.93s/it, loss=0.133, lr=1e-5]Steps:  17%|█▋        | 2542/15001 [1:38:24<6:40:45,  1.93s/it, loss=0.0803, lr=1e-5]Steps:  17%|█▋        | 2543/15001 [1:38:26<6:53:08,  1.99s/it, loss=0.0803, lr=1e-5]Steps:  17%|█▋        | 2543/15001 [1:38:26<6:53:08,  1.99s/it, loss=0.0241, lr=1e-5]Steps:  17%|█▋        | 2544/15001 [1:38:28<6:43:35,  1.94s/it, loss=0.0241, lr=1e-5]Steps:  17%|█▋        | 2544/15001 [1:38:28<6:43:35,  1.94s/it, loss=0.184, lr=1e-5] Steps:  17%|█▋        | 2545/15001 [1:38:29<6:41:44,  1.94s/it, loss=0.184, lr=1e-5]Steps:  17%|█▋        | 2545/15001 [1:38:30<6:41:44,  1.94s/it, loss=0.279, lr=1e-5]Steps:  17%|█▋        | 2546/15001 [1:38:31<6:39:27,  1.92s/it, loss=0.279, lr=1e-5]Steps:  17%|█▋        | 2546/15001 [1:38:32<6:39:27,  1.92s/it, loss=0.138, lr=1e-5]Steps:  17%|█▋        | 2547/15001 [1:38:33<6:28:13,  1.87s/it, loss=0.138, lr=1e-5]Steps:  17%|█▋        | 2547/15001 [1:38:33<6:28:13,  1.87s/it, loss=0.0845, lr=1e-5]Steps:  17%|█▋        | 2548/15001 [1:38:35<6:34:26,  1.90s/it, loss=0.0845, lr=1e-5]Steps:  17%|█▋        | 2548/15001 [1:38:35<6:34:26,  1.90s/it, loss=0.152, lr=1e-5] Steps:  17%|█▋        | 2549/15001 [1:38:37<6:26:33,  1.86s/it, loss=0.152, lr=1e-5]Steps:  17%|█▋        | 2549/15001 [1:38:37<6:26:33,  1.86s/it, loss=0.0765, lr=1e-5]Steps:  17%|█▋        | 2550/15001 [1:38:39<6:31:47,  1.89s/it, loss=0.0765, lr=1e-5]Steps:  17%|█▋        | 2550/15001 [1:38:39<6:31:47,  1.89s/it, loss=0.265, lr=1e-5] Steps:  17%|█▋        | 2551/15001 [1:38:41<6:26:41,  1.86s/it, loss=0.265, lr=1e-5]Steps:  17%|█▋        | 2551/15001 [1:38:41<6:26:41,  1.86s/it, loss=0.256, lr=1e-5]Steps:  17%|█▋        | 2552/15001 [1:38:43<6:28:33,  1.87s/it, loss=0.256, lr=1e-5]Steps:  17%|█▋        | 2552/15001 [1:38:43<6:28:33,  1.87s/it, loss=0.301, lr=1e-5]Steps:  17%|█▋        | 2553/15001 [1:38:44<6:16:56,  1.82s/it, loss=0.301, lr=1e-5]Steps:  17%|█▋        | 2553/15001 [1:38:44<6:16:56,  1.82s/it, loss=0.154, lr=1e-5]Steps:  17%|█▋        | 2554/15001 [1:38:46<6:29:33,  1.88s/it, loss=0.154, lr=1e-5]Steps:  17%|█▋        | 2554/15001 [1:38:46<6:29:33,  1.88s/it, loss=0.179, lr=1e-5]Steps:  17%|█▋        | 2555/15001 [1:38:48<6:22:50,  1.85s/it, loss=0.179, lr=1e-5]Steps:  17%|█▋        | 2555/15001 [1:38:48<6:22:50,  1.85s/it, loss=0.196, lr=1e-5]Steps:  17%|█▋        | 2556/15001 [1:38:50<6:15:39,  1.81s/it, loss=0.196, lr=1e-5]Steps:  17%|█▋        | 2556/15001 [1:38:50<6:15:39,  1.81s/it, loss=0.0564, lr=1e-5]Steps:  17%|█▋        | 2557/15001 [1:38:52<6:29:56,  1.88s/it, loss=0.0564, lr=1e-5]Steps:  17%|█▋        | 2557/15001 [1:38:52<6:29:56,  1.88s/it, loss=0.089, lr=1e-5] Steps:  17%|█▋        | 2558/15001 [1:38:53<6:20:09,  1.83s/it, loss=0.089, lr=1e-5]Steps:  17%|█▋        | 2558/15001 [1:38:54<6:20:09,  1.83s/it, loss=0.225, lr=1e-5]Steps:  17%|█▋        | 2559/15001 [1:38:55<6:19:29,  1.83s/it, loss=0.225, lr=1e-5]Steps:  17%|█▋        | 2559/15001 [1:38:55<6:19:29,  1.83s/it, loss=0.227, lr=1e-5]Steps:  17%|█▋        | 2560/15001 [1:38:57<6:26:42,  1.86s/it, loss=0.227, lr=1e-5]Steps:  17%|█▋        | 2560/15001 [1:38:57<6:26:42,  1.86s/it, loss=0.0198, lr=1e-5]Steps:  17%|█▋        | 2561/15001 [1:38:59<6:26:26,  1.86s/it, loss=0.0198, lr=1e-5]Steps:  17%|█▋        | 2561/15001 [1:38:59<6:26:26,  1.86s/it, loss=0.0672, lr=1e-5]Steps:  17%|█▋        | 2562/15001 [1:39:01<6:27:51,  1.87s/it, loss=0.0672, lr=1e-5]Steps:  17%|█▋        | 2562/15001 [1:39:01<6:27:51,  1.87s/it, loss=0.144, lr=1e-5] Steps:  17%|█▋        | 2563/15001 [1:39:03<6:33:19,  1.90s/it, loss=0.144, lr=1e-5]Steps:  17%|█▋        | 2563/15001 [1:39:03<6:33:19,  1.90s/it, loss=0.222, lr=1e-5]Steps:  17%|█▋        | 2564/15001 [1:39:05<6:31:26,  1.89s/it, loss=0.222, lr=1e-5]Steps:  17%|█▋        | 2564/15001 [1:39:05<6:31:26,  1.89s/it, loss=0.0553, lr=1e-5]Steps:  17%|█▋        | 2565/15001 [1:39:07<6:58:36,  2.02s/it, loss=0.0553, lr=1e-5]Steps:  17%|█▋        | 2565/15001 [1:39:07<6:58:36,  2.02s/it, loss=0.136, lr=1e-5] Steps:  17%|█▋        | 2566/15001 [1:39:09<6:53:17,  1.99s/it, loss=0.136, lr=1e-5]Steps:  17%|█▋        | 2566/15001 [1:39:09<6:53:17,  1.99s/it, loss=0.06, lr=1e-5] Steps:  17%|█▋        | 2567/15001 [1:39:11<6:56:20,  2.01s/it, loss=0.06, lr=1e-5]Steps:  17%|█▋        | 2567/15001 [1:39:11<6:56:20,  2.01s/it, loss=0.206, lr=1e-5]Steps:  17%|█▋        | 2568/15001 [1:39:13<6:44:00,  1.95s/it, loss=0.206, lr=1e-5]Steps:  17%|█▋        | 2568/15001 [1:39:13<6:44:00,  1.95s/it, loss=0.099, lr=1e-5]Steps:  17%|█▋        | 2569/15001 [1:39:15<6:32:19,  1.89s/it, loss=0.099, lr=1e-5]Steps:  17%|█▋        | 2569/15001 [1:39:15<6:32:19,  1.89s/it, loss=0.0511, lr=1e-5]Steps:  17%|█▋        | 2570/15001 [1:39:16<6:12:29,  1.80s/it, loss=0.0511, lr=1e-5]Steps:  17%|█▋        | 2570/15001 [1:39:17<6:12:29,  1.80s/it, loss=0.25, lr=1e-5]  Steps:  17%|█▋        | 2571/15001 [1:39:18<6:32:41,  1.90s/it, loss=0.25, lr=1e-5]Steps:  17%|█▋        | 2571/15001 [1:39:19<6:32:41,  1.90s/it, loss=0.197, lr=1e-5]Steps:  17%|█▋        | 2572/15001 [1:39:20<6:27:10,  1.87s/it, loss=0.197, lr=1e-5]Steps:  17%|█▋        | 2572/15001 [1:39:20<6:27:10,  1.87s/it, loss=0.369, lr=1e-5]Steps:  17%|█▋        | 2573/15001 [1:39:22<6:14:53,  1.81s/it, loss=0.369, lr=1e-5]Steps:  17%|█▋        | 2573/15001 [1:39:22<6:14:53,  1.81s/it, loss=0.125, lr=1e-5]Steps:  17%|█▋        | 2574/15001 [1:39:24<6:14:21,  1.81s/it, loss=0.125, lr=1e-5]Steps:  17%|█▋        | 2574/15001 [1:39:24<6:14:21,  1.81s/it, loss=0.147, lr=1e-5]Steps:  17%|█▋        | 2575/15001 [1:39:26<6:35:19,  1.91s/it, loss=0.147, lr=1e-5]Steps:  17%|█▋        | 2575/15001 [1:39:26<6:35:19,  1.91s/it, loss=0.118, lr=1e-5]Steps:  17%|█▋        | 2576/15001 [1:39:28<6:24:48,  1.86s/it, loss=0.118, lr=1e-5]Steps:  17%|█▋        | 2576/15001 [1:39:28<6:24:48,  1.86s/it, loss=0.118, lr=1e-5]Steps:  17%|█▋        | 2577/15001 [1:39:29<6:20:11,  1.84s/it, loss=0.118, lr=1e-5]Steps:  17%|█▋        | 2577/15001 [1:39:29<6:20:11,  1.84s/it, loss=0.27, lr=1e-5] Steps:  17%|█▋        | 2578/15001 [1:39:31<6:20:23,  1.84s/it, loss=0.27, lr=1e-5]Steps:  17%|█▋        | 2578/15001 [1:39:31<6:20:23,  1.84s/it, loss=0.0777, lr=1e-5]Steps:  17%|█▋        | 2579/15001 [1:39:33<6:15:03,  1.81s/it, loss=0.0777, lr=1e-5]Steps:  17%|█▋        | 2579/15001 [1:39:33<6:15:03,  1.81s/it, loss=0.0999, lr=1e-5]Steps:  17%|█▋        | 2580/15001 [1:39:35<6:08:28,  1.78s/it, loss=0.0999, lr=1e-5]Steps:  17%|█▋        | 2580/15001 [1:39:35<6:08:28,  1.78s/it, loss=0.154, lr=1e-5] Steps:  17%|█▋        | 2581/15001 [1:39:36<6:10:49,  1.79s/it, loss=0.154, lr=1e-5]Steps:  17%|█▋        | 2581/15001 [1:39:37<6:10:49,  1.79s/it, loss=0.305, lr=1e-5]Steps:  17%|█▋        | 2582/15001 [1:39:38<6:11:03,  1.79s/it, loss=0.305, lr=1e-5]Steps:  17%|█▋        | 2582/15001 [1:39:39<6:11:03,  1.79s/it, loss=0.00821, lr=1e-5]Steps:  17%|█▋        | 2583/15001 [1:39:40<6:21:20,  1.84s/it, loss=0.00821, lr=1e-5]Steps:  17%|█▋        | 2583/15001 [1:39:41<6:21:20,  1.84s/it, loss=0.16, lr=1e-5]   Steps:  17%|█▋        | 2584/15001 [1:39:42<6:34:06,  1.90s/it, loss=0.16, lr=1e-5]Steps:  17%|█▋        | 2584/15001 [1:39:43<6:34:06,  1.90s/it, loss=0.347, lr=1e-5]Steps:  17%|█▋        | 2585/15001 [1:39:44<6:41:19,  1.94s/it, loss=0.347, lr=1e-5]Steps:  17%|█▋        | 2585/15001 [1:39:45<6:41:19,  1.94s/it, loss=0.275, lr=1e-5]Steps:  17%|█▋        | 2586/15001 [1:39:46<6:44:54,  1.96s/it, loss=0.275, lr=1e-5]Steps:  17%|█▋        | 2586/15001 [1:39:47<6:44:54,  1.96s/it, loss=0.307, lr=1e-5]Steps:  17%|█▋        | 2587/15001 [1:39:48<6:51:22,  1.99s/it, loss=0.307, lr=1e-5]Steps:  17%|█▋        | 2587/15001 [1:39:49<6:51:22,  1.99s/it, loss=0.103, lr=1e-5]Steps:  17%|█▋        | 2588/15001 [1:39:51<7:13:39,  2.10s/it, loss=0.103, lr=1e-5]Steps:  17%|█▋        | 2588/15001 [1:39:51<7:13:39,  2.10s/it, loss=0.267, lr=1e-5]Steps:  17%|█▋        | 2589/15001 [1:39:52<6:50:08,  1.98s/it, loss=0.267, lr=1e-5]Steps:  17%|█▋        | 2589/15001 [1:39:53<6:50:08,  1.98s/it, loss=0.203, lr=1e-5]Steps:  17%|█▋        | 2590/15001 [1:39:54<6:30:09,  1.89s/it, loss=0.203, lr=1e-5]Steps:  17%|█▋        | 2590/15001 [1:39:54<6:30:09,  1.89s/it, loss=0.163, lr=1e-5]Steps:  17%|█▋        | 2591/15001 [1:39:56<6:29:04,  1.88s/it, loss=0.163, lr=1e-5]Steps:  17%|█▋        | 2591/15001 [1:39:56<6:29:04,  1.88s/it, loss=0.187, lr=1e-5]Steps:  17%|█▋        | 2592/15001 [1:39:58<6:20:30,  1.84s/it, loss=0.187, lr=1e-5]Steps:  17%|█▋        | 2592/15001 [1:39:58<6:20:30,  1.84s/it, loss=0.0731, lr=1e-5]Steps:  17%|█▋        | 2593/15001 [1:39:59<6:15:27,  1.82s/it, loss=0.0731, lr=1e-5]Steps:  17%|█▋        | 2593/15001 [1:40:00<6:15:27,  1.82s/it, loss=0.145, lr=1e-5] Steps:  17%|█▋        | 2594/15001 [1:40:01<6:03:03,  1.76s/it, loss=0.145, lr=1e-5]Steps:  17%|█▋        | 2594/15001 [1:40:02<6:03:03,  1.76s/it, loss=0.22, lr=1e-5] Steps:  17%|█▋        | 2595/15001 [1:40:03<6:27:29,  1.87s/it, loss=0.22, lr=1e-5]Steps:  17%|█▋        | 2595/15001 [1:40:03<6:27:29,  1.87s/it, loss=0.152, lr=1e-5]Steps:  17%|█▋        | 2596/15001 [1:40:05<6:27:32,  1.87s/it, loss=0.152, lr=1e-5]Steps:  17%|█▋        | 2596/15001 [1:40:05<6:27:32,  1.87s/it, loss=0.179, lr=1e-5]Steps:  17%|█▋        | 2597/15001 [1:40:07<6:22:05,  1.85s/it, loss=0.179, lr=1e-5]Steps:  17%|█▋        | 2597/15001 [1:40:07<6:22:05,  1.85s/it, loss=0.228, lr=1e-5]Steps:  17%|█▋        | 2598/15001 [1:40:09<6:22:14,  1.85s/it, loss=0.228, lr=1e-5]Steps:  17%|█▋        | 2598/15001 [1:40:09<6:22:14,  1.85s/it, loss=0.175, lr=1e-5]Steps:  17%|█▋        | 2599/15001 [1:40:10<6:08:04,  1.78s/it, loss=0.175, lr=1e-5]Steps:  17%|█▋        | 2599/15001 [1:40:11<6:08:04,  1.78s/it, loss=0.218, lr=1e-5]Steps:  17%|█▋        | 2600/15001 [1:40:12<6:20:18,  1.84s/it, loss=0.218, lr=1e-5]Steps:  17%|█▋        | 2600/15001 [1:40:12<6:20:18,  1.84s/it, loss=0.0893, lr=1e-5]Steps:  17%|█▋        | 2601/15001 [1:40:14<6:13:42,  1.81s/it, loss=0.0893, lr=1e-5]Steps:  17%|█▋        | 2601/15001 [1:40:14<6:13:42,  1.81s/it, loss=0.136, lr=1e-5] Steps:  17%|█▋        | 2602/15001 [1:40:16<6:18:54,  1.83s/it, loss=0.136, lr=1e-5]Steps:  17%|█▋        | 2602/15001 [1:40:16<6:18:54,  1.83s/it, loss=0.164, lr=1e-5]Steps:  17%|█▋        | 2603/15001 [1:40:18<6:21:57,  1.85s/it, loss=0.164, lr=1e-5]Steps:  17%|█▋        | 2603/15001 [1:40:18<6:21:57,  1.85s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2604/15001 [1:40:20<6:20:14,  1.84s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2604/15001 [1:40:20<6:20:14,  1.84s/it, loss=0.0594, lr=1e-5]Steps:  17%|█▋        | 2605/15001 [1:40:21<5:56:16,  1.72s/it, loss=0.0594, lr=1e-5]Steps:  17%|█▋        | 2605/15001 [1:40:21<5:56:16,  1.72s/it, loss=0.0339, lr=1e-5]Steps:  17%|█▋        | 2606/15001 [1:40:23<6:20:14,  1.84s/it, loss=0.0339, lr=1e-5]Steps:  17%|█▋        | 2606/15001 [1:40:23<6:20:14,  1.84s/it, loss=0.248, lr=1e-5] Steps:  17%|█▋        | 2607/15001 [1:40:25<6:19:26,  1.84s/it, loss=0.248, lr=1e-5]Steps:  17%|█▋        | 2607/15001 [1:40:26<6:19:26,  1.84s/it, loss=0.18, lr=1e-5] Steps:  17%|█▋        | 2608/15001 [1:40:27<6:43:08,  1.95s/it, loss=0.18, lr=1e-5]Steps:  17%|█▋        | 2608/15001 [1:40:27<6:43:08,  1.95s/it, loss=0.0418, lr=1e-5]Steps:  17%|█▋        | 2609/15001 [1:40:29<6:34:38,  1.91s/it, loss=0.0418, lr=1e-5]Steps:  17%|█▋        | 2609/15001 [1:40:29<6:34:38,  1.91s/it, loss=0.424, lr=1e-5] Steps:  17%|█▋        | 2610/15001 [1:40:31<6:56:05,  2.01s/it, loss=0.424, lr=1e-5]Steps:  17%|█▋        | 2610/15001 [1:40:32<6:56:05,  2.01s/it, loss=0.149, lr=1e-5]Steps:  17%|█▋        | 2611/15001 [1:40:33<6:42:10,  1.95s/it, loss=0.149, lr=1e-5]Steps:  17%|█▋        | 2611/15001 [1:40:34<6:42:10,  1.95s/it, loss=0.0645, lr=1e-5]Steps:  17%|█▋        | 2612/15001 [1:40:35<7:02:11,  2.04s/it, loss=0.0645, lr=1e-5]Steps:  17%|█▋        | 2612/15001 [1:40:35<7:02:11,  2.04s/it, loss=0.102, lr=1e-5] Steps:  17%|█▋        | 2613/15001 [1:40:37<6:34:25,  1.91s/it, loss=0.102, lr=1e-5]Steps:  17%|█▋        | 2613/15001 [1:40:37<6:34:25,  1.91s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2614/15001 [1:40:39<6:32:31,  1.90s/it, loss=0.124, lr=1e-5]Steps:  17%|█▋        | 2614/15001 [1:40:39<6:32:31,  1.90s/it, loss=0.0933, lr=1e-5]Steps:  17%|█▋        | 2615/15001 [1:40:41<6:37:46,  1.93s/it, loss=0.0933, lr=1e-5]Steps:  17%|█▋        | 2615/15001 [1:40:41<6:37:46,  1.93s/it, loss=0.113, lr=1e-5] Steps:  17%|█▋        | 2616/15001 [1:40:43<6:35:06,  1.91s/it, loss=0.113, lr=1e-5]Steps:  17%|█▋        | 2616/15001 [1:40:43<6:35:06,  1.91s/it, loss=0.00902, lr=1e-5]Steps:  17%|█▋        | 2617/15001 [1:40:45<6:32:35,  1.90s/it, loss=0.00902, lr=1e-5]Steps:  17%|█▋        | 2617/15001 [1:40:45<6:32:35,  1.90s/it, loss=0.202, lr=1e-5]  Steps:  17%|█▋        | 2618/15001 [1:40:46<6:21:33,  1.85s/it, loss=0.202, lr=1e-5]Steps:  17%|█▋        | 2618/15001 [1:40:47<6:21:33,  1.85s/it, loss=0.0901, lr=1e-5]Steps:  17%|█▋        | 2619/15001 [1:40:48<6:30:25,  1.89s/it, loss=0.0901, lr=1e-5]Steps:  17%|█▋        | 2619/15001 [1:40:48<6:30:25,  1.89s/it, loss=0.0952, lr=1e-5]Steps:  17%|█▋        | 2620/15001 [1:40:50<6:14:06,  1.81s/it, loss=0.0952, lr=1e-5]Steps:  17%|█▋        | 2620/15001 [1:40:50<6:14:06,  1.81s/it, loss=0.106, lr=1e-5] Steps:  17%|█▋        | 2621/15001 [1:40:52<6:15:00,  1.82s/it, loss=0.106, lr=1e-5]Steps:  17%|█▋        | 2621/15001 [1:40:52<6:15:00,  1.82s/it, loss=0.144, lr=1e-5]Steps:  17%|█▋        | 2622/15001 [1:40:54<6:20:03,  1.84s/it, loss=0.144, lr=1e-5]Steps:  17%|█▋        | 2622/15001 [1:40:54<6:20:03,  1.84s/it, loss=0.193, lr=1e-5]Steps:  17%|█▋        | 2623/15001 [1:40:56<6:29:10,  1.89s/it, loss=0.193, lr=1e-5]Steps:  17%|█▋        | 2623/15001 [1:40:56<6:29:10,  1.89s/it, loss=0.269, lr=1e-5]Steps:  17%|█▋        | 2624/15001 [1:40:57<6:21:45,  1.85s/it, loss=0.269, lr=1e-5]Steps:  17%|█▋        | 2624/15001 [1:40:58<6:21:45,  1.85s/it, loss=0.231, lr=1e-5]Steps:  17%|█▋        | 2625/15001 [1:40:59<6:06:55,  1.78s/it, loss=0.231, lr=1e-5]Steps:  17%|█▋        | 2625/15001 [1:40:59<6:06:55,  1.78s/it, loss=0.265, lr=1e-5]Steps:  18%|█▊        | 2626/15001 [1:41:01<6:28:54,  1.89s/it, loss=0.265, lr=1e-5]Steps:  18%|█▊        | 2626/15001 [1:41:01<6:28:54,  1.89s/it, loss=0.251, lr=1e-5]Steps:  18%|█▊        | 2627/15001 [1:41:03<6:21:44,  1.85s/it, loss=0.251, lr=1e-5]Steps:  18%|█▊        | 2627/15001 [1:41:03<6:21:44,  1.85s/it, loss=0.318, lr=1e-5]Steps:  18%|█▊        | 2628/15001 [1:41:05<6:26:17,  1.87s/it, loss=0.318, lr=1e-5]Steps:  18%|█▊        | 2628/15001 [1:41:05<6:26:17,  1.87s/it, loss=0.0859, lr=1e-5]Steps:  18%|█▊        | 2629/15001 [1:41:07<6:30:38,  1.89s/it, loss=0.0859, lr=1e-5]Steps:  18%|█▊        | 2629/15001 [1:41:07<6:30:38,  1.89s/it, loss=0.0795, lr=1e-5]Steps:  18%|█▊        | 2630/15001 [1:41:09<6:47:38,  1.98s/it, loss=0.0795, lr=1e-5]Steps:  18%|█▊        | 2630/15001 [1:41:09<6:47:38,  1.98s/it, loss=0.307, lr=1e-5] Steps:  18%|█▊        | 2631/15001 [1:41:11<6:39:32,  1.94s/it, loss=0.307, lr=1e-5]Steps:  18%|█▊        | 2631/15001 [1:41:11<6:39:32,  1.94s/it, loss=0.155, lr=1e-5]Steps:  18%|█▊        | 2632/15001 [1:41:13<6:38:23,  1.93s/it, loss=0.155, lr=1e-5]Steps:  18%|█▊        | 2632/15001 [1:41:13<6:38:23,  1.93s/it, loss=0.0956, lr=1e-5]Steps:  18%|█▊        | 2633/15001 [1:41:15<6:33:03,  1.91s/it, loss=0.0956, lr=1e-5]Steps:  18%|█▊        | 2633/15001 [1:41:15<6:33:03,  1.91s/it, loss=0.15, lr=1e-5]  Steps:  18%|█▊        | 2634/15001 [1:41:17<6:42:55,  1.95s/it, loss=0.15, lr=1e-5]Steps:  18%|█▊        | 2634/15001 [1:41:17<6:42:55,  1.95s/it, loss=0.348, lr=1e-5]Steps:  18%|█▊        | 2635/15001 [1:41:19<6:54:54,  2.01s/it, loss=0.348, lr=1e-5]Steps:  18%|█▊        | 2635/15001 [1:41:19<6:54:54,  2.01s/it, loss=0.0559, lr=1e-5]Steps:  18%|█▊        | 2636/15001 [1:41:21<6:39:48,  1.94s/it, loss=0.0559, lr=1e-5]Steps:  18%|█▊        | 2636/15001 [1:41:21<6:39:48,  1.94s/it, loss=0.284, lr=1e-5] Steps:  18%|█▊        | 2637/15001 [1:41:22<6:26:19,  1.87s/it, loss=0.284, lr=1e-5]Steps:  18%|█▊        | 2637/15001 [1:41:22<6:26:19,  1.87s/it, loss=0.155, lr=1e-5]Steps:  18%|█▊        | 2638/15001 [1:41:24<6:17:02,  1.83s/it, loss=0.155, lr=1e-5]Steps:  18%|█▊        | 2638/15001 [1:41:24<6:17:02,  1.83s/it, loss=0.131, lr=1e-5]Steps:  18%|█▊        | 2639/15001 [1:41:26<6:17:44,  1.83s/it, loss=0.131, lr=1e-5]Steps:  18%|█▊        | 2639/15001 [1:41:26<6:17:44,  1.83s/it, loss=0.222, lr=1e-5]Steps:  18%|█▊        | 2640/15001 [1:41:28<6:19:12,  1.84s/it, loss=0.222, lr=1e-5]Steps:  18%|█▊        | 2640/15001 [1:41:28<6:19:12,  1.84s/it, loss=0.323, lr=1e-5]Steps:  18%|█▊        | 2641/15001 [1:41:30<6:33:22,  1.91s/it, loss=0.323, lr=1e-5]Steps:  18%|█▊        | 2641/15001 [1:41:30<6:33:22,  1.91s/it, loss=0.119, lr=1e-5]Steps:  18%|█▊        | 2642/15001 [1:41:32<6:32:57,  1.91s/it, loss=0.119, lr=1e-5]Steps:  18%|█▊        | 2642/15001 [1:41:32<6:32:57,  1.91s/it, loss=0.0331, lr=1e-5]Steps:  18%|█▊        | 2643/15001 [1:41:33<6:07:57,  1.79s/it, loss=0.0331, lr=1e-5]Steps:  18%|█▊        | 2643/15001 [1:41:34<6:07:57,  1.79s/it, loss=0.0929, lr=1e-5]Steps:  18%|█▊        | 2644/15001 [1:41:35<6:17:20,  1.83s/it, loss=0.0929, lr=1e-5]Steps:  18%|█▊        | 2644/15001 [1:41:35<6:17:20,  1.83s/it, loss=0.111, lr=1e-5] Steps:  18%|█▊        | 2645/15001 [1:41:37<6:05:35,  1.78s/it, loss=0.111, lr=1e-5]Steps:  18%|█▊        | 2645/15001 [1:41:37<6:05:35,  1.78s/it, loss=0.138, lr=1e-5]Steps:  18%|█▊        | 2646/15001 [1:41:39<6:18:59,  1.84s/it, loss=0.138, lr=1e-5]Steps:  18%|█▊        | 2646/15001 [1:41:39<6:18:59,  1.84s/it, loss=0.29, lr=1e-5] Steps:  18%|█▊        | 2647/15001 [1:41:41<6:19:46,  1.84s/it, loss=0.29, lr=1e-5]Steps:  18%|█▊        | 2647/15001 [1:41:41<6:19:46,  1.84s/it, loss=0.102, lr=1e-5]Steps:  18%|█▊        | 2648/15001 [1:41:42<6:05:22,  1.77s/it, loss=0.102, lr=1e-5]Steps:  18%|█▊        | 2648/15001 [1:41:43<6:05:22,  1.77s/it, loss=0.22, lr=1e-5] Steps:  18%|█▊        | 2649/15001 [1:41:44<6:20:30,  1.85s/it, loss=0.22, lr=1e-5]Steps:  18%|█▊        | 2649/15001 [1:41:45<6:20:30,  1.85s/it, loss=0.239, lr=1e-5]Steps:  18%|█▊        | 2650/15001 [1:41:46<6:22:20,  1.86s/it, loss=0.239, lr=1e-5]Steps:  18%|█▊        | 2650/15001 [1:41:46<6:22:20,  1.86s/it, loss=0.235, lr=1e-5]Steps:  18%|█▊        | 2651/15001 [1:41:48<6:24:16,  1.87s/it, loss=0.235, lr=1e-5]Steps:  18%|█▊        | 2651/15001 [1:41:48<6:24:16,  1.87s/it, loss=0.172, lr=1e-5]Steps:  18%|█▊        | 2652/15001 [1:41:50<6:40:59,  1.95s/it, loss=0.172, lr=1e-5]Steps:  18%|█▊        | 2652/15001 [1:41:50<6:40:59,  1.95s/it, loss=0.193, lr=1e-5]Steps:  18%|█▊        | 2653/15001 [1:41:52<6:41:43,  1.95s/it, loss=0.193, lr=1e-5]Steps:  18%|█▊        | 2653/15001 [1:41:52<6:41:43,  1.95s/it, loss=0.213, lr=1e-5]Steps:  18%|█▊        | 2654/15001 [1:41:54<6:36:41,  1.93s/it, loss=0.213, lr=1e-5]Steps:  18%|█▊        | 2654/15001 [1:41:54<6:36:41,  1.93s/it, loss=0.2, lr=1e-5]  Steps:  18%|█▊        | 2655/15001 [1:41:56<6:46:24,  1.98s/it, loss=0.2, lr=1e-5]Steps:  18%|█▊        | 2655/15001 [1:41:56<6:46:24,  1.98s/it, loss=0.077, lr=1e-5]Steps:  18%|█▊        | 2656/15001 [1:41:58<6:43:28,  1.96s/it, loss=0.077, lr=1e-5]Steps:  18%|█▊        | 2656/15001 [1:41:58<6:43:28,  1.96s/it, loss=0.0533, lr=1e-5]Steps:  18%|█▊        | 2657/15001 [1:42:00<6:42:32,  1.96s/it, loss=0.0533, lr=1e-5]Steps:  18%|█▊        | 2657/15001 [1:42:00<6:42:32,  1.96s/it, loss=0.0928, lr=1e-5]Steps:  18%|█▊        | 2658/15001 [1:42:02<6:31:06,  1.90s/it, loss=0.0928, lr=1e-5]Steps:  18%|█▊        | 2658/15001 [1:42:02<6:31:06,  1.90s/it, loss=0.276, lr=1e-5] Steps:  18%|█▊        | 2659/15001 [1:42:04<6:38:28,  1.94s/it, loss=0.276, lr=1e-5]Steps:  18%|█▊        | 2659/15001 [1:42:04<6:38:28,  1.94s/it, loss=0.151, lr=1e-5]Steps:  18%|█▊        | 2660/15001 [1:42:05<6:13:58,  1.82s/it, loss=0.151, lr=1e-5]Steps:  18%|█▊        | 2660/15001 [1:42:06<6:13:58,  1.82s/it, loss=0.188, lr=1e-5]Steps:  18%|█▊        | 2661/15001 [1:42:08<6:38:02,  1.94s/it, loss=0.188, lr=1e-5]Steps:  18%|█▊        | 2661/15001 [1:42:08<6:38:02,  1.94s/it, loss=0.065, lr=1e-5]Steps:  18%|█▊        | 2662/15001 [1:42:09<6:25:45,  1.88s/it, loss=0.065, lr=1e-5]Steps:  18%|█▊        | 2662/15001 [1:42:09<6:25:45,  1.88s/it, loss=0.0635, lr=1e-5]Steps:  18%|█▊        | 2663/15001 [1:42:11<6:28:17,  1.89s/it, loss=0.0635, lr=1e-5]Steps:  18%|█▊        | 2663/15001 [1:42:11<6:28:17,  1.89s/it, loss=0.0478, lr=1e-5]Steps:  18%|█▊        | 2664/15001 [1:42:13<6:22:46,  1.86s/it, loss=0.0478, lr=1e-5]Steps:  18%|█▊        | 2664/15001 [1:42:13<6:22:46,  1.86s/it, loss=0.171, lr=1e-5] Steps:  18%|█▊        | 2665/15001 [1:42:15<6:19:19,  1.84s/it, loss=0.171, lr=1e-5]Steps:  18%|█▊        | 2665/15001 [1:42:15<6:19:19,  1.84s/it, loss=0.15, lr=1e-5] Steps:  18%|█▊        | 2666/15001 [1:42:17<6:17:31,  1.84s/it, loss=0.15, lr=1e-5]Steps:  18%|█▊        | 2666/15001 [1:42:17<6:17:31,  1.84s/it, loss=0.0884, lr=1e-5]Steps:  18%|█▊        | 2667/15001 [1:42:18<6:12:15,  1.81s/it, loss=0.0884, lr=1e-5]Steps:  18%|█▊        | 2667/15001 [1:42:18<6:12:15,  1.81s/it, loss=0.0456, lr=1e-5]Steps:  18%|█▊        | 2668/15001 [1:42:20<5:55:30,  1.73s/it, loss=0.0456, lr=1e-5]Steps:  18%|█▊        | 2668/15001 [1:42:20<5:55:30,  1.73s/it, loss=0.16, lr=1e-5]  Steps:  18%|█▊        | 2669/15001 [1:42:22<6:11:24,  1.81s/it, loss=0.16, lr=1e-5]Steps:  18%|█▊        | 2669/15001 [1:42:22<6:11:24,  1.81s/it, loss=0.11, lr=1e-5]Steps:  18%|█▊        | 2670/15001 [1:42:24<6:24:16,  1.87s/it, loss=0.11, lr=1e-5]Steps:  18%|█▊        | 2670/15001 [1:42:24<6:24:16,  1.87s/it, loss=0.16, lr=1e-5]Steps:  18%|█▊        | 2671/15001 [1:42:26<6:17:53,  1.84s/it, loss=0.16, lr=1e-5]Steps:  18%|█▊        | 2671/15001 [1:42:26<6:17:53,  1.84s/it, loss=0.113, lr=1e-5]Steps:  18%|█▊        | 2672/15001 [1:42:28<6:20:33,  1.85s/it, loss=0.113, lr=1e-5]Steps:  18%|█▊        | 2672/15001 [1:42:28<6:20:33,  1.85s/it, loss=0.207, lr=1e-5]Steps:  18%|█▊        | 2673/15001 [1:42:29<6:07:01,  1.79s/it, loss=0.207, lr=1e-5]Steps:  18%|█▊        | 2673/15001 [1:42:29<6:07:01,  1.79s/it, loss=0.0348, lr=1e-5]Steps:  18%|█▊        | 2674/15001 [1:42:31<6:04:01,  1.77s/it, loss=0.0348, lr=1e-5]Steps:  18%|█▊        | 2674/15001 [1:42:31<6:04:01,  1.77s/it, loss=0.178, lr=1e-5] Steps:  18%|█▊        | 2675/15001 [1:42:33<6:19:38,  1.85s/it, loss=0.178, lr=1e-5]Steps:  18%|█▊        | 2675/15001 [1:42:33<6:19:38,  1.85s/it, loss=0.12, lr=1e-5] Steps:  18%|█▊        | 2676/15001 [1:42:35<6:27:01,  1.88s/it, loss=0.12, lr=1e-5]Steps:  18%|█▊        | 2676/15001 [1:42:35<6:27:01,  1.88s/it, loss=0.0247, lr=1e-5]Steps:  18%|█▊        | 2677/15001 [1:42:37<6:36:45,  1.93s/it, loss=0.0247, lr=1e-5]Steps:  18%|█▊        | 2677/15001 [1:42:37<6:36:45,  1.93s/it, loss=0.111, lr=1e-5] Steps:  18%|█▊        | 2678/15001 [1:42:39<6:52:23,  2.01s/it, loss=0.111, lr=1e-5]Steps:  18%|█▊        | 2678/15001 [1:42:39<6:52:23,  2.01s/it, loss=0.0875, lr=1e-5]Steps:  18%|█▊        | 2679/15001 [1:42:41<6:46:17,  1.98s/it, loss=0.0875, lr=1e-5]Steps:  18%|█▊        | 2679/15001 [1:42:41<6:46:17,  1.98s/it, loss=0.075, lr=1e-5] Steps:  18%|█▊        | 2680/15001 [1:42:43<6:53:59,  2.02s/it, loss=0.075, lr=1e-5]Steps:  18%|█▊        | 2680/15001 [1:42:43<6:53:59,  2.02s/it, loss=0.247, lr=1e-5]Steps:  18%|█▊        | 2681/15001 [1:42:45<6:38:31,  1.94s/it, loss=0.247, lr=1e-5]Steps:  18%|█▊        | 2681/15001 [1:42:45<6:38:31,  1.94s/it, loss=0.086, lr=1e-5]Steps:  18%|█▊        | 2682/15001 [1:42:47<6:34:02,  1.92s/it, loss=0.086, lr=1e-5]Steps:  18%|█▊        | 2682/15001 [1:42:47<6:34:02,  1.92s/it, loss=0.231, lr=1e-5]Steps:  18%|█▊        | 2683/15001 [1:42:49<6:31:50,  1.91s/it, loss=0.231, lr=1e-5]Steps:  18%|█▊        | 2683/15001 [1:42:49<6:31:50,  1.91s/it, loss=0.145, lr=1e-5]Steps:  18%|█▊        | 2684/15001 [1:42:50<6:12:32,  1.81s/it, loss=0.145, lr=1e-5]Steps:  18%|█▊        | 2684/15001 [1:42:50<6:12:32,  1.81s/it, loss=0.124, lr=1e-5]Steps:  18%|█▊        | 2685/15001 [1:42:52<6:06:27,  1.79s/it, loss=0.124, lr=1e-5]Steps:  18%|█▊        | 2685/15001 [1:42:52<6:06:27,  1.79s/it, loss=0.0814, lr=1e-5]Steps:  18%|█▊        | 2686/15001 [1:42:54<6:13:20,  1.82s/it, loss=0.0814, lr=1e-5]Steps:  18%|█▊        | 2686/15001 [1:42:54<6:13:20,  1.82s/it, loss=0.122, lr=1e-5] Steps:  18%|█▊        | 2687/15001 [1:42:56<6:15:38,  1.83s/it, loss=0.122, lr=1e-5]Steps:  18%|█▊        | 2687/15001 [1:42:56<6:15:38,  1.83s/it, loss=0.296, lr=1e-5]Steps:  18%|█▊        | 2688/15001 [1:42:58<6:11:25,  1.81s/it, loss=0.296, lr=1e-5]Steps:  18%|█▊        | 2688/15001 [1:42:58<6:11:25,  1.81s/it, loss=0.234, lr=1e-5]Steps:  18%|█▊        | 2689/15001 [1:42:59<6:17:34,  1.84s/it, loss=0.234, lr=1e-5]Steps:  18%|█▊        | 2689/15001 [1:43:00<6:17:34,  1.84s/it, loss=0.0768, lr=1e-5]Steps:  18%|█▊        | 2690/15001 [1:43:01<5:59:51,  1.75s/it, loss=0.0768, lr=1e-5]Steps:  18%|█▊        | 2690/15001 [1:43:01<5:59:51,  1.75s/it, loss=0.243, lr=1e-5] Steps:  18%|█▊        | 2691/15001 [1:43:03<6:07:41,  1.79s/it, loss=0.243, lr=1e-5]Steps:  18%|█▊        | 2691/15001 [1:43:03<6:07:41,  1.79s/it, loss=0.0313, lr=1e-5]Steps:  18%|█▊        | 2692/15001 [1:43:05<6:01:58,  1.76s/it, loss=0.0313, lr=1e-5]Steps:  18%|█▊        | 2692/15001 [1:43:05<6:01:58,  1.76s/it, loss=0.0507, lr=1e-5]Steps:  18%|█▊        | 2693/15001 [1:43:06<6:12:01,  1.81s/it, loss=0.0507, lr=1e-5]Steps:  18%|█▊        | 2693/15001 [1:43:07<6:12:01,  1.81s/it, loss=0.156, lr=1e-5] Steps:  18%|█▊        | 2694/15001 [1:43:08<6:19:19,  1.85s/it, loss=0.156, lr=1e-5]Steps:  18%|█▊        | 2694/15001 [1:43:09<6:19:19,  1.85s/it, loss=0.121, lr=1e-5]Steps:  18%|█▊        | 2695/15001 [1:43:10<6:28:56,  1.90s/it, loss=0.121, lr=1e-5]Steps:  18%|█▊        | 2695/15001 [1:43:11<6:28:56,  1.90s/it, loss=0.118, lr=1e-5]Steps:  18%|█▊        | 2696/15001 [1:43:12<6:13:52,  1.82s/it, loss=0.118, lr=1e-5]Steps:  18%|█▊        | 2696/15001 [1:43:13<6:13:52,  1.82s/it, loss=0.128, lr=1e-5]Steps:  18%|█▊        | 2697/15001 [1:43:14<6:35:18,  1.93s/it, loss=0.128, lr=1e-5]Steps:  18%|█▊        | 2697/15001 [1:43:14<6:35:18,  1.93s/it, loss=0.0765, lr=1e-5]Steps:  18%|█▊        | 2698/15001 [1:43:16<6:37:49,  1.94s/it, loss=0.0765, lr=1e-5]Steps:  18%|█▊        | 2698/15001 [1:43:16<6:37:49,  1.94s/it, loss=0.166, lr=1e-5] Steps:  18%|█▊        | 2699/15001 [1:43:18<6:37:44,  1.94s/it, loss=0.166, lr=1e-5]Steps:  18%|█▊        | 2699/15001 [1:43:18<6:37:44,  1.94s/it, loss=0.188, lr=1e-5]Steps:  18%|█▊        | 2700/15001 [1:43:20<6:26:26,  1.88s/it, loss=0.188, lr=1e-5]Steps:  18%|█▊        | 2700/15001 [1:43:20<6:26:26,  1.88s/it, loss=0.148, lr=1e-5]Steps:  18%|█▊        | 2701/15001 [1:43:22<6:55:15,  2.03s/it, loss=0.148, lr=1e-5]Steps:  18%|█▊        | 2701/15001 [1:43:23<6:55:15,  2.03s/it, loss=0.445, lr=1e-5]Steps:  18%|█▊        | 2702/15001 [1:43:24<6:57:33,  2.04s/it, loss=0.445, lr=1e-5]Steps:  18%|█▊        | 2702/15001 [1:43:25<6:57:33,  2.04s/it, loss=0.388, lr=1e-5]Steps:  18%|█▊        | 2703/15001 [1:43:26<6:53:29,  2.02s/it, loss=0.388, lr=1e-5]Steps:  18%|█▊        | 2703/15001 [1:43:26<6:53:29,  2.02s/it, loss=0.203, lr=1e-5]Steps:  18%|█▊        | 2704/15001 [1:43:28<6:40:47,  1.96s/it, loss=0.203, lr=1e-5]Steps:  18%|█▊        | 2704/15001 [1:43:28<6:40:47,  1.96s/it, loss=0.073, lr=1e-5]Steps:  18%|█▊        | 2705/15001 [1:43:30<6:43:25,  1.97s/it, loss=0.073, lr=1e-5]Steps:  18%|█▊        | 2705/15001 [1:43:30<6:43:25,  1.97s/it, loss=0.0458, lr=1e-5]Steps:  18%|█▊        | 2706/15001 [1:43:32<6:41:30,  1.96s/it, loss=0.0458, lr=1e-5]Steps:  18%|█▊        | 2706/15001 [1:43:32<6:41:30,  1.96s/it, loss=0.0825, lr=1e-5]Steps:  18%|█▊        | 2707/15001 [1:43:34<6:19:01,  1.85s/it, loss=0.0825, lr=1e-5]Steps:  18%|█▊        | 2707/15001 [1:43:34<6:19:01,  1.85s/it, loss=0.219, lr=1e-5] Steps:  18%|█▊        | 2708/15001 [1:43:36<6:32:40,  1.92s/it, loss=0.219, lr=1e-5]Steps:  18%|█▊        | 2708/15001 [1:43:36<6:32:40,  1.92s/it, loss=0.294, lr=1e-5]Steps:  18%|█▊        | 2709/15001 [1:43:37<6:16:45,  1.84s/it, loss=0.294, lr=1e-5]Steps:  18%|█▊        | 2709/15001 [1:43:38<6:16:45,  1.84s/it, loss=0.0824, lr=1e-5]Steps:  18%|█▊        | 2710/15001 [1:43:39<6:13:56,  1.83s/it, loss=0.0824, lr=1e-5]Steps:  18%|█▊        | 2710/15001 [1:43:39<6:13:56,  1.83s/it, loss=0.0817, lr=1e-5]Steps:  18%|█▊        | 2711/15001 [1:43:41<6:17:17,  1.84s/it, loss=0.0817, lr=1e-5]Steps:  18%|█▊        | 2711/15001 [1:43:41<6:17:17,  1.84s/it, loss=0.429, lr=1e-5] Steps:  18%|█▊        | 2712/15001 [1:43:43<6:03:19,  1.77s/it, loss=0.429, lr=1e-5]Steps:  18%|█▊        | 2712/15001 [1:43:43<6:03:19,  1.77s/it, loss=0.226, lr=1e-5]Steps:  18%|█▊        | 2713/15001 [1:43:45<6:18:40,  1.85s/it, loss=0.226, lr=1e-5]Steps:  18%|█▊        | 2713/15001 [1:43:45<6:18:40,  1.85s/it, loss=0.0415, lr=1e-5]Steps:  18%|█▊        | 2714/15001 [1:43:46<6:11:57,  1.82s/it, loss=0.0415, lr=1e-5]Steps:  18%|█▊        | 2714/15001 [1:43:47<6:11:57,  1.82s/it, loss=0.242, lr=1e-5] Steps:  18%|█▊        | 2715/15001 [1:43:48<6:03:21,  1.77s/it, loss=0.242, lr=1e-5]Steps:  18%|█▊        | 2715/15001 [1:43:48<6:03:21,  1.77s/it, loss=0.0915, lr=1e-5]Steps:  18%|█▊        | 2716/15001 [1:43:50<6:20:42,  1.86s/it, loss=0.0915, lr=1e-5]Steps:  18%|█▊        | 2716/15001 [1:43:50<6:20:42,  1.86s/it, loss=0.121, lr=1e-5] Steps:  18%|█��        | 2717/15001 [1:43:52<6:13:49,  1.83s/it, loss=0.121, lr=1e-5]Steps:  18%|█▊        | 2717/15001 [1:43:52<6:13:49,  1.83s/it, loss=0.126, lr=1e-5]Steps:  18%|█▊        | 2718/15001 [1:43:54<6:00:29,  1.76s/it, loss=0.126, lr=1e-5]Steps:  18%|█▊        | 2718/15001 [1:43:54<6:00:29,  1.76s/it, loss=0.0899, lr=1e-5]Steps:  18%|█▊        | 2719/15001 [1:43:55<6:06:13,  1.79s/it, loss=0.0899, lr=1e-5]Steps:  18%|█▊        | 2719/15001 [1:43:56<6:06:13,  1.79s/it, loss=0.132, lr=1e-5] Steps:  18%|█▊        | 2720/15001 [1:43:57<6:12:41,  1.82s/it, loss=0.132, lr=1e-5]Steps:  18%|█▊        | 2720/15001 [1:43:58<6:12:41,  1.82s/it, loss=0.251, lr=1e-5]Steps:  18%|█▊        | 2721/15001 [1:43:59<6:23:27,  1.87s/it, loss=0.251, lr=1e-5]Steps:  18%|█▊        | 2721/15001 [1:44:00<6:23:27,  1.87s/it, loss=0.273, lr=1e-5]Steps:  18%|█▊        | 2722/15001 [1:44:01<6:41:31,  1.96s/it, loss=0.273, lr=1e-5]Steps:  18%|█▊        | 2722/15001 [1:44:02<6:41:31,  1.96s/it, loss=0.0423, lr=1e-5]Steps:  18%|█▊        | 2723/15001 [1:44:04<6:59:25,  2.05s/it, loss=0.0423, lr=1e-5]Steps:  18%|█▊        | 2723/15001 [1:44:04<6:59:25,  2.05s/it, loss=0.155, lr=1e-5] Steps:  18%|█▊        | 2724/15001 [1:44:06<6:48:42,  2.00s/it, loss=0.155, lr=1e-5]Steps:  18%|█▊        | 2724/15001 [1:44:06<6:48:42,  2.00s/it, loss=0.237, lr=1e-5]Steps:  18%|█▊        | 2725/15001 [1:44:08<7:09:49,  2.10s/it, loss=0.237, lr=1e-5]Steps:  18%|█▊        | 2725/15001 [1:44:08<7:09:49,  2.10s/it, loss=0.0952, lr=1e-5]Steps:  18%|█▊        | 2726/15001 [1:44:10<6:48:39,  2.00s/it, loss=0.0952, lr=1e-5]Steps:  18%|█▊        | 2726/15001 [1:44:10<6:48:39,  2.00s/it, loss=0.107, lr=1e-5] Steps:  18%|█▊        | 2727/15001 [1:44:12<6:39:49,  1.95s/it, loss=0.107, lr=1e-5]Steps:  18%|█▊        | 2727/15001 [1:44:12<6:39:49,  1.95s/it, loss=0.113, lr=1e-5]Steps:  18%|█▊        | 2728/15001 [1:44:13<6:23:21,  1.87s/it, loss=0.113, lr=1e-5]Steps:  18%|█▊        | 2728/15001 [1:44:13<6:23:21,  1.87s/it, loss=0.0731, lr=1e-5]Steps:  18%|█▊        | 2729/15001 [1:44:15<6:25:32,  1.88s/it, loss=0.0731, lr=1e-5]Steps:  18%|█▊        | 2729/15001 [1:44:15<6:25:32,  1.88s/it, loss=0.19, lr=1e-5]  Steps:  18%|█▊        | 2730/15001 [1:44:17<6:15:11,  1.83s/it, loss=0.19, lr=1e-5]Steps:  18%|█▊        | 2730/15001 [1:44:17<6:15:11,  1.83s/it, loss=0.206, lr=1e-5]Steps:  18%|█▊        | 2731/15001 [1:44:19<6:30:14,  1.91s/it, loss=0.206, lr=1e-5]Steps:  18%|█▊        | 2731/15001 [1:44:19<6:30:14,  1.91s/it, loss=0.0806, lr=1e-5]Steps:  18%|█▊        | 2732/15001 [1:44:21<6:11:22,  1.82s/it, loss=0.0806, lr=1e-5]Steps:  18%|█▊        | 2732/15001 [1:44:21<6:11:22,  1.82s/it, loss=0.169, lr=1e-5] Steps:  18%|█▊        | 2733/15001 [1:44:23<6:25:19,  1.88s/it, loss=0.169, lr=1e-5]Steps:  18%|█▊        | 2733/15001 [1:44:23<6:25:19,  1.88s/it, loss=0.114, lr=1e-5]Steps:  18%|█▊        | 2734/15001 [1:44:24<6:20:20,  1.86s/it, loss=0.114, lr=1e-5]Steps:  18%|█▊        | 2734/15001 [1:44:25<6:20:20,  1.86s/it, loss=0.176, lr=1e-5]Steps:  18%|█▊        | 2735/15001 [1:44:26<6:11:10,  1.82s/it, loss=0.176, lr=1e-5]Steps:  18%|█▊        | 2735/15001 [1:44:26<6:11:10,  1.82s/it, loss=0.127, lr=1e-5]Steps:  18%|█▊        | 2736/15001 [1:44:28<6:04:26,  1.78s/it, loss=0.127, lr=1e-5]Steps:  18%|█▊        | 2736/15001 [1:44:28<6:04:26,  1.78s/it, loss=0.228, lr=1e-5]Steps:  18%|█▊        | 2737/15001 [1:44:30<6:20:27,  1.86s/it, loss=0.228, lr=1e-5]Steps:  18%|█▊        | 2737/15001 [1:44:30<6:20:27,  1.86s/it, loss=0.105, lr=1e-5]Steps:  18%|█▊        | 2738/15001 [1:44:32<6:20:56,  1.86s/it, loss=0.105, lr=1e-5]Steps:  18%|█▊        | 2738/15001 [1:44:32<6:20:56,  1.86s/it, loss=0.206, lr=1e-5]Steps:  18%|█▊        | 2739/15001 [1:44:34<6:19:07,  1.86s/it, loss=0.206, lr=1e-5]Steps:  18%|█▊        | 2739/15001 [1:44:34<6:19:07,  1.86s/it, loss=0.147, lr=1e-5]Steps:  18%|█▊        | 2740/15001 [1:44:35<6:18:27,  1.85s/it, loss=0.147, lr=1e-5]Steps:  18%|█▊        | 2740/15001 [1:44:36<6:18:27,  1.85s/it, loss=0.136, lr=1e-5]Steps:  18%|█▊        | 2741/15001 [1:44:37<6:24:12,  1.88s/it, loss=0.136, lr=1e-5]Steps:  18%|█▊        | 2741/15001 [1:44:38<6:24:12,  1.88s/it, loss=0.208, lr=1e-5]Steps:  18%|█▊        | 2742/15001 [1:44:39<6:20:26,  1.86s/it, loss=0.208, lr=1e-5]Steps:  18%|█▊        | 2742/15001 [1:44:39<6:20:26,  1.86s/it, loss=0.132, lr=1e-5]Steps:  18%|█▊        | 2743/15001 [1:44:41<6:20:53,  1.86s/it, loss=0.132, lr=1e-5]Steps:  18%|█▊        | 2743/15001 [1:44:41<6:20:53,  1.86s/it, loss=0.366, lr=1e-5]Steps:  18%|█▊        | 2744/15001 [1:44:43<6:29:22,  1.91s/it, loss=0.366, lr=1e-5]Steps:  18%|█▊        | 2744/15001 [1:44:43<6:29:22,  1.91s/it, loss=0.0922, lr=1e-5]Steps:  18%|█▊        | 2745/15001 [1:44:45<6:40:01,  1.96s/it, loss=0.0922, lr=1e-5]Steps:  18%|█▊        | 2745/15001 [1:44:45<6:40:01,  1.96s/it, loss=0.166, lr=1e-5] Steps:  18%|█▊        | 2746/15001 [1:44:47<6:30:22,  1.91s/it, loss=0.166, lr=1e-5]Steps:  18%|█▊        | 2746/15001 [1:44:47<6:30:22,  1.91s/it, loss=0.13, lr=1e-5] Steps:  18%|█▊        | 2747/15001 [1:44:49<6:39:41,  1.96s/it, loss=0.13, lr=1e-5]Steps:  18%|█▊        | 2747/15001 [1:44:49<6:39:41,  1.96s/it, loss=0.146, lr=1e-5]Steps:  18%|█▊        | 2748/15001 [1:44:51<6:58:18,  2.05s/it, loss=0.146, lr=1e-5]Steps:  18%|█▊        | 2748/15001 [1:44:51<6:58:18,  2.05s/it, loss=0.255, lr=1e-5]Steps:  18%|█▊        | 2749/15001 [1:44:53<6:42:28,  1.97s/it, loss=0.255, lr=1e-5]Steps:  18%|█▊        | 2749/15001 [1:44:53<6:42:28,  1.97s/it, loss=0.127, lr=1e-5]Steps:  18%|█▊        | 2750/15001 [1:44:55<6:33:09,  1.93s/it, loss=0.127, lr=1e-5]Steps:  18%|█▊        | 2750/15001 [1:44:55<6:33:09,  1.93s/it, loss=0.0654, lr=1e-5]Steps:  18%|█▊        | 2751/15001 [1:44:57<6:31:37,  1.92s/it, loss=0.0654, lr=1e-5]Steps:  18%|█▊        | 2751/15001 [1:44:57<6:31:37,  1.92s/it, loss=0.00834, lr=1e-5]Steps:  18%|█▊        | 2752/15001 [1:44:58<6:20:12,  1.86s/it, loss=0.00834, lr=1e-5]Steps:  18%|█▊        | 2752/15001 [1:44:59<6:20:12,  1.86s/it, loss=0.0652, lr=1e-5] Steps:  18%|█▊        | 2753/15001 [1:45:00<6:20:03,  1.86s/it, loss=0.0652, lr=1e-5]Steps:  18%|█▊        | 2753/15001 [1:45:01<6:20:03,  1.86s/it, loss=0.0196, lr=1e-5]Steps:  18%|█▊        | 2754/15001 [1:45:02<6:34:36,  1.93s/it, loss=0.0196, lr=1e-5]Steps:  18%|█▊        | 2754/15001 [1:45:02<6:34:36,  1.93s/it, loss=0.258, lr=1e-5] Steps:  18%|█▊        | 2755/15001 [1:45:04<6:17:50,  1.85s/it, loss=0.258, lr=1e-5]Steps:  18%|█▊        | 2755/15001 [1:45:04<6:17:50,  1.85s/it, loss=0.0182, lr=1e-5]Steps:  18%|█▊        | 2756/15001 [1:45:06<6:18:57,  1.86s/it, loss=0.0182, lr=1e-5]Steps:  18%|█▊        | 2756/15001 [1:45:06<6:18:57,  1.86s/it, loss=0.273, lr=1e-5] Steps:  18%|█▊        | 2757/15001 [1:45:08<6:12:06,  1.82s/it, loss=0.273, lr=1e-5]Steps:  18%|█▊        | 2757/15001 [1:45:08<6:12:06,  1.82s/it, loss=0.0944, lr=1e-5]Steps:  18%|█▊        | 2758/15001 [1:45:10<6:11:01,  1.82s/it, loss=0.0944, lr=1e-5]Steps:  18%|█▊        | 2758/15001 [1:45:10<6:11:01,  1.82s/it, loss=0.0599, lr=1e-5]Steps:  18%|█▊        | 2759/15001 [1:45:11<6:04:02,  1.78s/it, loss=0.0599, lr=1e-5]Steps:  18%|█▊        | 2759/15001 [1:45:11<6:04:02,  1.78s/it, loss=0.193, lr=1e-5] Steps:  18%|█▊        | 2760/15001 [1:45:13<6:16:30,  1.85s/it, loss=0.193, lr=1e-5]Steps:  18%|█▊        | 2760/15001 [1:45:13<6:16:30,  1.85s/it, loss=0.0442, lr=1e-5]Steps:  18%|█▊        | 2761/15001 [1:45:15<6:21:40,  1.87s/it, loss=0.0442, lr=1e-5]Steps:  18%|█▊        | 2761/15001 [1:45:15<6:21:40,  1.87s/it, loss=0.347, lr=1e-5] Steps:  18%|█▊        | 2762/15001 [1:45:17<6:11:01,  1.82s/it, loss=0.347, lr=1e-5]Steps:  18%|█▊        | 2762/15001 [1:45:17<6:11:01,  1.82s/it, loss=0.231, lr=1e-5]Steps:  18%|█▊        | 2763/15001 [1:45:19<6:09:59,  1.81s/it, loss=0.231, lr=1e-5]Steps:  18%|█▊        | 2763/15001 [1:45:19<6:09:59,  1.81s/it, loss=0.378, lr=1e-5]Steps:  18%|█▊        | 2764/15001 [1:45:20<6:07:12,  1.80s/it, loss=0.378, lr=1e-5]Steps:  18%|█▊        | 2764/15001 [1:45:21<6:07:12,  1.80s/it, loss=0.129, lr=1e-5]Steps:  18%|█▊        | 2765/15001 [1:45:22<6:10:49,  1.82s/it, loss=0.129, lr=1e-5]Steps:  18%|█▊        | 2765/15001 [1:45:22<6:10:49,  1.82s/it, loss=0.258, lr=1e-5]Steps:  18%|█▊        | 2766/15001 [1:45:24<6:09:31,  1.81s/it, loss=0.258, lr=1e-5]Steps:  18%|█▊        | 2766/15001 [1:45:24<6:09:31,  1.81s/it, loss=0.0324, lr=1e-5]Steps:  18%|█▊        | 2767/15001 [1:45:26<6:23:05,  1.88s/it, loss=0.0324, lr=1e-5]Steps:  18%|█▊        | 2767/15001 [1:45:27<6:23:05,  1.88s/it, loss=0.11, lr=1e-5]  Steps:  18%|█▊        | 2768/15001 [1:45:28<6:50:27,  2.01s/it, loss=0.11, lr=1e-5]Steps:  18%|█▊        | 2768/15001 [1:45:28<6:50:27,  2.01s/it, loss=0.406, lr=1e-5]Steps:  18%|█▊        | 2769/15001 [1:45:30<6:49:53,  2.01s/it, loss=0.406, lr=1e-5]Steps:  18%|█▊        | 2769/15001 [1:45:31<6:49:53,  2.01s/it, loss=0.297, lr=1e-5]Steps:  18%|█▊        | 2770/15001 [1:45:32<6:44:56,  1.99s/it, loss=0.297, lr=1e-5]Steps:  18%|█▊        | 2770/15001 [1:45:33<6:44:56,  1.99s/it, loss=0.177, lr=1e-5]Steps:  18%|█▊        | 2771/15001 [1:45:34<6:43:23,  1.98s/it, loss=0.177, lr=1e-5]Steps:  18%|█▊        | 2771/15001 [1:45:35<6:43:23,  1.98s/it, loss=0.359, lr=1e-5]Steps:  18%|█▊        | 2772/15001 [1:45:36<6:48:47,  2.01s/it, loss=0.359, lr=1e-5]Steps:  18%|█▊        | 2772/15001 [1:45:36<6:48:47,  2.01s/it, loss=0.227, lr=1e-5]Steps:  18%|█▊        | 2773/15001 [1:45:38<6:30:47,  1.92s/it, loss=0.227, lr=1e-5]Steps:  18%|█▊        | 2773/15001 [1:45:38<6:30:47,  1.92s/it, loss=0.139, lr=1e-5]Steps:  18%|█▊        | 2774/15001 [1:45:40<6:25:05,  1.89s/it, loss=0.139, lr=1e-5]Steps:  18%|█▊        | 2774/15001 [1:45:40<6:25:05,  1.89s/it, loss=0.051, lr=1e-5]Steps:  18%|█▊        | 2775/15001 [1:45:42<6:21:51,  1.87s/it, loss=0.051, lr=1e-5]Steps:  18%|█▊        | 2775/15001 [1:45:42<6:21:51,  1.87s/it, loss=0.181, lr=1e-5]Steps:  19%|█▊        | 2776/15001 [1:45:44<6:32:42,  1.93s/it, loss=0.181, lr=1e-5]Steps:  19%|█▊        | 2776/15001 [1:45:44<6:32:42,  1.93s/it, loss=0.191, lr=1e-5]Steps:  19%|█▊        | 2777/15001 [1:45:46<6:21:50,  1.87s/it, loss=0.191, lr=1e-5]Steps:  19%|█▊        | 2777/15001 [1:45:46<6:21:50,  1.87s/it, loss=0.208, lr=1e-5]Steps:  19%|█▊        | 2778/15001 [1:45:48<6:29:00,  1.91s/it, loss=0.208, lr=1e-5]Steps:  19%|█▊        | 2778/15001 [1:45:48<6:29:00,  1.91s/it, loss=0.166, lr=1e-5]Steps:  19%|█▊        | 2779/15001 [1:45:49<6:20:08,  1.87s/it, loss=0.166, lr=1e-5]Steps:  19%|█▊        | 2779/15001 [1:45:50<6:20:08,  1.87s/it, loss=0.268, lr=1e-5]Steps:  19%|█▊        | 2780/15001 [1:45:51<6:19:08,  1.86s/it, loss=0.268, lr=1e-5]Steps:  19%|█▊        | 2780/15001 [1:45:51<6:19:08,  1.86s/it, loss=0.253, lr=1e-5]Steps:  19%|█▊        | 2781/15001 [1:45:53<6:18:23,  1.86s/it, loss=0.253, lr=1e-5]Steps:  19%|█▊        | 2781/15001 [1:45:53<6:18:23,  1.86s/it, loss=0.131, lr=1e-5]Steps:  19%|█▊        | 2782/15001 [1:45:55<6:15:19,  1.84s/it, loss=0.131, lr=1e-5]Steps:  19%|█▊        | 2782/15001 [1:45:55<6:15:19,  1.84s/it, loss=0.085, lr=1e-5]Steps:  19%|█▊        | 2783/15001 [1:45:57<6:19:19,  1.86s/it, loss=0.085, lr=1e-5]Steps:  19%|█▊        | 2783/15001 [1:45:57<6:19:19,  1.86s/it, loss=0.193, lr=1e-5]Steps:  19%|█▊        | 2784/15001 [1:45:58<6:06:18,  1.80s/it, loss=0.193, lr=1e-5]Steps:  19%|█▊        | 2784/15001 [1:45:59<6:06:18,  1.80s/it, loss=0.116, lr=1e-5]Steps:  19%|█▊        | 2785/15001 [1:46:00<6:03:15,  1.78s/it, loss=0.116, lr=1e-5]Steps:  19%|█▊        | 2785/15001 [1:46:00<6:03:15,  1.78s/it, loss=0.148, lr=1e-5]Steps:  19%|█▊        | 2786/15001 [1:46:02<6:12:30,  1.83s/it, loss=0.148, lr=1e-5]Steps:  19%|█▊        | 2786/15001 [1:46:02<6:12:30,  1.83s/it, loss=0.205, lr=1e-5]Steps:  19%|█▊        | 2787/15001 [1:46:04<6:10:19,  1.82s/it, loss=0.205, lr=1e-5]Steps:  19%|█▊        | 2787/15001 [1:46:04<6:10:19,  1.82s/it, loss=0.167, lr=1e-5]Steps:  19%|█▊        | 2788/15001 [1:46:06<6:32:50,  1.93s/it, loss=0.167, lr=1e-5]Steps:  19%|█▊        | 2788/15001 [1:46:06<6:32:50,  1.93s/it, loss=0.107, lr=1e-5]Steps:  19%|█▊        | 2789/15001 [1:46:08<6:37:54,  1.95s/it, loss=0.107, lr=1e-5]Steps:  19%|█▊        | 2789/15001 [1:46:08<6:37:54,  1.95s/it, loss=0.314, lr=1e-5]Steps:  19%|█▊        | 2790/15001 [1:46:10<6:49:22,  2.01s/it, loss=0.314, lr=1e-5]Steps:  19%|█▊        | 2790/15001 [1:46:10<6:49:22,  2.01s/it, loss=0.211, lr=1e-5]Steps:  19%|█▊        | 2791/15001 [1:46:12<6:32:46,  1.93s/it, loss=0.211, lr=1e-5]Steps:  19%|█▊        | 2791/15001 [1:46:12<6:32:46,  1.93s/it, loss=0.216, lr=1e-5]Steps:  19%|█▊        | 2792/15001 [1:46:14<6:32:02,  1.93s/it, loss=0.216, lr=1e-5]Steps:  19%|█▊        | 2792/15001 [1:46:14<6:32:02,  1.93s/it, loss=0.147, lr=1e-5]Steps:  19%|█▊        | 2793/15001 [1:46:16<6:40:47,  1.97s/it, loss=0.147, lr=1e-5]Steps:  19%|█▊        | 2793/15001 [1:46:16<6:40:47,  1.97s/it, loss=0.0508, lr=1e-5]Steps:  19%|█▊        | 2794/15001 [1:46:18<6:54:14,  2.04s/it, loss=0.0508, lr=1e-5]Steps:  19%|█▊        | 2794/15001 [1:46:18<6:54:14,  2.04s/it, loss=0.112, lr=1e-5] Steps:  19%|█▊        | 2795/15001 [1:46:20<6:31:58,  1.93s/it, loss=0.112, lr=1e-5]Steps:  19%|█▊        | 2795/15001 [1:46:20<6:31:58,  1.93s/it, loss=0.335, lr=1e-5]Steps:  19%|█▊        | 2796/15001 [1:46:22<6:30:50,  1.92s/it, loss=0.335, lr=1e-5]Steps:  19%|█▊        | 2796/15001 [1:46:22<6:30:50,  1.92s/it, loss=0.172, lr=1e-5]Steps:  19%|█▊        | 2797/15001 [1:46:24<6:23:58,  1.89s/it, loss=0.172, lr=1e-5]Steps:  19%|█▊        | 2797/15001 [1:46:24<6:23:58,  1.89s/it, loss=0.18, lr=1e-5] Steps:  19%|█▊        | 2798/15001 [1:46:26<6:31:57,  1.93s/it, loss=0.18, lr=1e-5]Steps:  19%|█▊        | 2798/15001 [1:46:26<6:31:57,  1.93s/it, loss=0.039, lr=1e-5]Steps:  19%|█▊        | 2799/15001 [1:46:27<6:02:20,  1.78s/it, loss=0.039, lr=1e-5]Steps:  19%|█▊        | 2799/15001 [1:46:27<6:02:20,  1.78s/it, loss=0.161, lr=1e-5]Steps:  19%|█▊        | 2800/15001 [1:46:29<6:21:51,  1.88s/it, loss=0.161, lr=1e-5]Steps:  19%|█▊        | 2800/15001 [1:46:29<6:21:51,  1.88s/it, loss=0.139, lr=1e-5]Steps:  19%|█▊        | 2801/15001 [1:46:31<6:13:58,  1.84s/it, loss=0.139, lr=1e-5]Steps:  19%|█▊        | 2801/15001 [1:46:31<6:13:58,  1.84s/it, loss=0.0891, lr=1e-5]Steps:  19%|█▊        | 2802/15001 [1:46:33<6:03:44,  1.79s/it, loss=0.0891, lr=1e-5]Steps:  19%|█▊        | 2802/15001 [1:46:33<6:03:44,  1.79s/it, loss=0.0921, lr=1e-5]Steps:  19%|█▊        | 2803/15001 [1:46:34<5:58:42,  1.76s/it, loss=0.0921, lr=1e-5]Steps:  19%|█▊        | 2803/15001 [1:46:35<5:58:42,  1.76s/it, loss=0.148, lr=1e-5] Steps:  19%|█▊        | 2804/15001 [1:46:37<6:32:50,  1.93s/it, loss=0.148, lr=1e-5]Steps:  19%|█▊        | 2804/15001 [1:46:37<6:32:50,  1.93s/it, loss=0.253, lr=1e-5]Steps:  19%|█▊        | 2805/15001 [1:46:38<6:23:08,  1.88s/it, loss=0.253, lr=1e-5]Steps:  19%|█▊        | 2805/15001 [1:46:38<6:23:08,  1.88s/it, loss=0.164, lr=1e-5]Steps:  19%|█▊        | 2806/15001 [1:46:40<6:15:04,  1.85s/it, loss=0.164, lr=1e-5]Steps:  19%|█▊        | 2806/15001 [1:46:40<6:15:04,  1.85s/it, loss=0.142, lr=1e-5]Steps:  19%|█▊        | 2807/15001 [1:46:42<6:17:31,  1.86s/it, loss=0.142, lr=1e-5]Steps:  19%|█▊        | 2807/15001 [1:46:42<6:17:31,  1.86s/it, loss=0.199, lr=1e-5]Steps:  19%|█▊        | 2808/15001 [1:46:44<6:13:54,  1.84s/it, loss=0.199, lr=1e-5]Steps:  19%|█▊        | 2808/15001 [1:46:44<6:13:54,  1.84s/it, loss=0.0936, lr=1e-5]Steps:  19%|█▊        | 2809/15001 [1:46:45<6:06:25,  1.80s/it, loss=0.0936, lr=1e-5]Steps:  19%|█▊        | 2809/15001 [1:46:46<6:06:25,  1.80s/it, loss=0.285, lr=1e-5] Steps:  19%|█▊        | 2810/15001 [1:46:47<5:57:07,  1.76s/it, loss=0.285, lr=1e-5]Steps:  19%|█▊        | 2810/15001 [1:46:47<5:57:07,  1.76s/it, loss=0.36, lr=1e-5] Steps:  19%|█▊        | 2811/15001 [1:46:49<6:18:25,  1.86s/it, loss=0.36, lr=1e-5]Steps:  19%|█▊        | 2811/15001 [1:46:50<6:18:25,  1.86s/it, loss=0.145, lr=1e-5]Steps:  19%|█▊        | 2812/15001 [1:46:52<6:58:19,  2.06s/it, loss=0.145, lr=1e-5]Steps:  19%|█▊        | 2812/15001 [1:46:52<6:58:19,  2.06s/it, loss=0.142, lr=1e-5]Steps:  19%|█▉        | 2813/15001 [1:46:54<6:47:50,  2.01s/it, loss=0.142, lr=1e-5]Steps:  19%|█▉        | 2813/15001 [1:46:54<6:47:50,  2.01s/it, loss=0.121, lr=1e-5]Steps:  19%|█▉        | 2814/15001 [1:46:56<6:51:04,  2.02s/it, loss=0.121, lr=1e-5]Steps:  19%|█▉        | 2814/15001 [1:46:56<6:51:04,  2.02s/it, loss=0.154, lr=1e-5]Steps:  19%|█▉        | 2815/15001 [1:46:58<6:59:42,  2.07s/it, loss=0.154, lr=1e-5]Steps:  19%|█▉        | 2815/15001 [1:46:58<6:59:42,  2.07s/it, loss=0.0778, lr=1e-5]Steps:  19%|█▉        | 2816/15001 [1:47:00<6:46:50,  2.00s/it, loss=0.0778, lr=1e-5]Steps:  19%|█▉        | 2816/15001 [1:47:00<6:46:50,  2.00s/it, loss=0.013, lr=1e-5] Steps:  19%|█▉        | 2817/15001 [1:47:01<6:32:11,  1.93s/it, loss=0.013, lr=1e-5]Steps:  19%|█▉        | 2817/15001 [1:47:02<6:32:11,  1.93s/it, loss=0.0945, lr=1e-5]Steps:  19%|█▉        | 2818/15001 [1:47:03<6:27:57,  1.91s/it, loss=0.0945, lr=1e-5]Steps:  19%|█▉        | 2818/15001 [1:47:03<6:27:57,  1.91s/it, loss=0.31, lr=1e-5]  Steps:  19%|█▉        | 2819/15001 [1:47:05<6:03:40,  1.79s/it, loss=0.31, lr=1e-5]Steps:  19%|█▉        | 2819/15001 [1:47:05<6:03:40,  1.79s/it, loss=0.115, lr=1e-5]Steps:  19%|█▉        | 2820/15001 [1:47:07<6:06:07,  1.80s/it, loss=0.115, lr=1e-5]Steps:  19%|█▉        | 2820/15001 [1:47:07<6:06:07,  1.80s/it, loss=0.113, lr=1e-5]Steps:  19%|█▉        | 2821/15001 [1:47:09<6:17:26,  1.86s/it, loss=0.113, lr=1e-5]Steps:  19%|█▉        | 2821/15001 [1:47:09<6:17:26,  1.86s/it, loss=0.233, lr=1e-5]Steps:  19%|█▉        | 2822/15001 [1:47:10<6:11:23,  1.83s/it, loss=0.233, lr=1e-5]Steps:  19%|█▉        | 2822/15001 [1:47:11<6:11:23,  1.83s/it, loss=0.158, lr=1e-5]Steps:  19%|█▉        | 2823/15001 [1:47:12<6:16:45,  1.86s/it, loss=0.158, lr=1e-5]Steps:  19%|█▉        | 2823/15001 [1:47:12<6:16:45,  1.86s/it, loss=0.141, lr=1e-5]Steps:  19%|█▉        | 2824/15001 [1:47:14<6:02:57,  1.79s/it, loss=0.141, lr=1e-5]Steps:  19%|█▉        | 2824/15001 [1:47:14<6:02:57,  1.79s/it, loss=0.325, lr=1e-5]Steps:  19%|█▉        | 2825/15001 [1:47:16<6:15:31,  1.85s/it, loss=0.325, lr=1e-5]Steps:  19%|█▉        | 2825/15001 [1:47:16<6:15:31,  1.85s/it, loss=0.161, lr=1e-5]Steps:  19%|█▉        | 2826/15001 [1:47:18<6:09:59,  1.82s/it, loss=0.161, lr=1e-5]Steps:  19%|█▉        | 2826/15001 [1:47:18<6:09:59,  1.82s/it, loss=0.16, lr=1e-5] Steps:  19%|█▉        | 2827/15001 [1:47:20<6:21:45,  1.88s/it, loss=0.16, lr=1e-5]Steps:  19%|█▉        | 2827/15001 [1:47:20<6:21:45,  1.88s/it, loss=0.129, lr=1e-5]Steps:  19%|█▉        | 2828/15001 [1:47:21<6:09:13,  1.82s/it, loss=0.129, lr=1e-5]Steps:  19%|█▉        | 2828/15001 [1:47:22<6:09:13,  1.82s/it, loss=0.244, lr=1e-5]Steps:  19%|█▉        | 2829/15001 [1:47:23<6:11:11,  1.83s/it, loss=0.244, lr=1e-5]Steps:  19%|█▉        | 2829/15001 [1:47:24<6:11:11,  1.83s/it, loss=0.131, lr=1e-5]Steps:  19%|█▉        | 2830/15001 [1:47:25<6:05:03,  1.80s/it, loss=0.131, lr=1e-5]Steps:  19%|█▉        | 2830/15001 [1:47:25<6:05:03,  1.80s/it, loss=0.0439, lr=1e-5]Steps:  19%|█▉        | 2831/15001 [1:47:27<6:02:43,  1.79s/it, loss=0.0439, lr=1e-5]Steps:  19%|█▉        | 2831/15001 [1:47:27<6:02:43,  1.79s/it, loss=0.126, lr=1e-5] Steps:  19%|█▉        | 2832/15001 [1:47:29<6:26:34,  1.91s/it, loss=0.126, lr=1e-5]Steps:  19%|█▉        | 2832/15001 [1:47:29<6:26:34,  1.91s/it, loss=0.141, lr=1e-5]Steps:  19%|█▉        | 2833/15001 [1:47:31<6:27:08,  1.91s/it, loss=0.141, lr=1e-5]Steps:  19%|█▉        | 2833/15001 [1:47:31<6:27:08,  1.91s/it, loss=0.184, lr=1e-5]Steps:  19%|█▉        | 2834/15001 [1:47:33<6:36:56,  1.96s/it, loss=0.184, lr=1e-5]Steps:  19%|█▉        | 2834/15001 [1:47:33<6:36:56,  1.96s/it, loss=0.0632, lr=1e-5]Steps:  19%|█▉        | 2835/15001 [1:47:35<6:45:03,  2.00s/it, loss=0.0632, lr=1e-5]Steps:  19%|█▉        | 2835/15001 [1:47:35<6:45:03,  2.00s/it, loss=0.148, lr=1e-5] Steps:  19%|█▉        | 2836/15001 [1:47:37<6:54:49,  2.05s/it, loss=0.148, lr=1e-5]Steps:  19%|█▉        | 2836/15001 [1:47:37<6:54:49,  2.05s/it, loss=0.167, lr=1e-5]Steps:  19%|█▉        | 2837/15001 [1:47:39<6:53:58,  2.04s/it, loss=0.167, lr=1e-5]Steps:  19%|█▉        | 2837/15001 [1:47:39<6:53:58,  2.04s/it, loss=0.128, lr=1e-5]Steps:  19%|█▉        | 2838/15001 [1:47:41<6:48:30,  2.02s/it, loss=0.128, lr=1e-5]Steps:  19%|█▉        | 2838/15001 [1:47:41<6:48:30,  2.02s/it, loss=0.0646, lr=1e-5]Steps:  19%|█▉        | 2839/15001 [1:47:43<6:43:20,  1.99s/it, loss=0.0646, lr=1e-5]Steps:  19%|█▉        | 2839/15001 [1:47:43<6:43:20,  1.99s/it, loss=0.176, lr=1e-5] Steps:  19%|█▉        | 2840/15001 [1:47:45<6:25:30,  1.90s/it, loss=0.176, lr=1e-5]Steps:  19%|█▉        | 2840/15001 [1:47:45<6:25:30,  1.90s/it, loss=0.236, lr=1e-5]Steps:  19%|█▉        | 2841/15001 [1:47:46<6:07:06,  1.81s/it, loss=0.236, lr=1e-5]Steps:  19%|█▉        | 2841/15001 [1:47:47<6:07:06,  1.81s/it, loss=0.164, lr=1e-5]Steps:  19%|█▉        | 2842/15001 [1:47:48<5:52:21,  1.74s/it, loss=0.164, lr=1e-5]Steps:  19%|█▉        | 2842/15001 [1:47:50<5:52:21,  1.74s/it, loss=0.0795, lr=1e-5]Steps:  19%|█▉        | 2843/15001 [1:47:52<7:41:40,  2.28s/it, loss=0.0795, lr=1e-5]Steps:  19%|█▉        | 2843/15001 [1:47:52<7:41:40,  2.28s/it, loss=0.155, lr=1e-5] Steps:  19%|█▉        | 2844/15001 [1:47:54<7:25:05,  2.20s/it, loss=0.155, lr=1e-5]Steps:  19%|█▉        | 2844/15001 [1:47:54<7:25:05,  2.20s/it, loss=0.235, lr=1e-5]Steps:  19%|█▉        | 2845/15001 [1:47:55<6:41:52,  1.98s/it, loss=0.235, lr=1e-5]Steps:  19%|█▉        | 2845/15001 [1:47:55<6:41:52,  1.98s/it, loss=0.0785, lr=1e-5]Steps:  19%|█▉        | 2846/15001 [1:47:57<6:32:23,  1.94s/it, loss=0.0785, lr=1e-5]Steps:  19%|█▉        | 2846/15001 [1:47:57<6:32:23,  1.94s/it, loss=0.255, lr=1e-5] Steps:  19%|█▉        | 2847/15001 [1:47:59<6:36:26,  1.96s/it, loss=0.255, lr=1e-5]Steps:  19%|█▉        | 2847/15001 [1:47:59<6:36:26,  1.96s/it, loss=0.385, lr=1e-5]Steps:  19%|█▉        | 2848/15001 [1:48:01<6:27:41,  1.91s/it, loss=0.385, lr=1e-5]Steps:  19%|█▉        | 2848/15001 [1:48:01<6:27:41,  1.91s/it, loss=0.4, lr=1e-5]  Steps:  19%|█▉        | 2849/15001 [1:48:03<6:28:37,  1.92s/it, loss=0.4, lr=1e-5]Steps:  19%|█▉        | 2849/15001 [1:48:03<6:28:37,  1.92s/it, loss=0.25, lr=1e-5]Steps:  19%|█▉        | 2850/15001 [1:48:04<6:17:59,  1.87s/it, loss=0.25, lr=1e-5]Steps:  19%|█▉        | 2850/15001 [1:48:04<6:17:59,  1.87s/it, loss=0.0586, lr=1e-5]Steps:  19%|█▉        | 2851/15001 [1:48:06<5:58:44,  1.77s/it, loss=0.0586, lr=1e-5]Steps:  19%|█▉        | 2851/15001 [1:48:06<5:58:44,  1.77s/it, loss=0.0643, lr=1e-5]Steps:  19%|█▉        | 2852/15001 [1:48:08<6:04:34,  1.80s/it, loss=0.0643, lr=1e-5]Steps:  19%|█▉        | 2852/15001 [1:48:08<6:04:34,  1.80s/it, loss=0.203, lr=1e-5] Steps:  19%|█▉        | 2853/15001 [1:48:10<6:13:48,  1.85s/it, loss=0.203, lr=1e-5]Steps:  19%|█▉        | 2853/15001 [1:48:10<6:13:48,  1.85s/it, loss=0.322, lr=1e-5]Steps:  19%|█▉        | 2854/15001 [1:48:11<5:41:37,  1.69s/it, loss=0.322, lr=1e-5]Steps:  19%|█▉        | 2854/15001 [1:48:12<5:41:37,  1.69s/it, loss=0.0861, lr=1e-5]Steps:  19%|█▉        | 2855/15001 [1:48:13<6:19:57,  1.88s/it, loss=0.0861, lr=1e-5]Steps:  19%|█▉        | 2855/15001 [1:48:13<6:19:57,  1.88s/it, loss=0.283, lr=1e-5] Steps:  19%|█▉        | 2856/15001 [1:48:15<6:11:26,  1.84s/it, loss=0.283, lr=1e-5]Steps:  19%|█▉        | 2856/15001 [1:48:15<6:11:26,  1.84s/it, loss=0.394, lr=1e-5]Steps:  19%|█▉        | 2857/15001 [1:48:17<6:40:42,  1.98s/it, loss=0.394, lr=1e-5]Steps:  19%|█▉        | 2857/15001 [1:48:17<6:40:42,  1.98s/it, loss=0.332, lr=1e-5]Steps:  19%|█▉        | 2858/15001 [1:48:19<6:32:24,  1.94s/it, loss=0.332, lr=1e-5]Steps:  19%|█▉        | 2858/15001 [1:48:20<6:32:24,  1.94s/it, loss=0.265, lr=1e-5]Steps:  19%|█▉        | 2859/15001 [1:48:21<6:46:43,  2.01s/it, loss=0.265, lr=1e-5]Steps:  19%|█▉        | 2859/15001 [1:48:22<6:46:43,  2.01s/it, loss=0.118, lr=1e-5]Steps:  19%|█▉        | 2860/15001 [1:48:23<6:32:21,  1.94s/it, loss=0.118, lr=1e-5]Steps:  19%|█▉        | 2860/15001 [1:48:24<6:32:21,  1.94s/it, loss=0.0518, lr=1e-5]Steps:  19%|█▉        | 2861/15001 [1:48:25<6:43:02,  1.99s/it, loss=0.0518, lr=1e-5]Steps:  19%|█▉        | 2861/15001 [1:48:25<6:43:02,  1.99s/it, loss=0.187, lr=1e-5] Steps:  19%|█▉        | 2862/15001 [1:48:27<6:31:56,  1.94s/it, loss=0.187, lr=1e-5]Steps:  19%|█▉        | 2862/15001 [1:48:27<6:31:56,  1.94s/it, loss=0.25, lr=1e-5] Steps:  19%|█▉        | 2863/15001 [1:48:29<6:04:37,  1.80s/it, loss=0.25, lr=1e-5]Steps:  19%|█▉        | 2863/15001 [1:48:29<6:04:37,  1.80s/it, loss=0.302, lr=1e-5]Steps:  19%|█▉        | 2864/15001 [1:48:31<6:28:46,  1.92s/it, loss=0.302, lr=1e-5]Steps:  19%|█▉        | 2864/15001 [1:48:31<6:28:46,  1.92s/it, loss=0.0577, lr=1e-5]Steps:  19%|█▉        | 2865/15001 [1:48:32<6:14:13,  1.85s/it, loss=0.0577, lr=1e-5]Steps:  19%|█▉        | 2865/15001 [1:48:33<6:14:13,  1.85s/it, loss=0.0477, lr=1e-5]Steps:  19%|█▉        | 2866/15001 [1:48:34<6:21:00,  1.88s/it, loss=0.0477, lr=1e-5]Steps:  19%|█▉        | 2866/15001 [1:48:35<6:21:00,  1.88s/it, loss=0.115, lr=1e-5] Steps:  19%|█▉        | 2867/15001 [1:48:36<6:13:20,  1.85s/it, loss=0.115, lr=1e-5]Steps:  19%|█▉        | 2867/15001 [1:48:36<6:13:20,  1.85s/it, loss=0.108, lr=1e-5]Steps:  19%|█▉        | 2868/15001 [1:48:38<6:20:12,  1.88s/it, loss=0.108, lr=1e-5]Steps:  19%|█▉        | 2868/15001 [1:48:38<6:20:12,  1.88s/it, loss=0.06, lr=1e-5] Steps:  19%|█▉        | 2869/15001 [1:48:40<6:16:02,  1.86s/it, loss=0.06, lr=1e-5]Steps:  19%|█▉        | 2869/15001 [1:48:40<6:16:02,  1.86s/it, loss=0.223, lr=1e-5]Steps:  19%|█▉        | 2870/15001 [1:48:42<6:18:12,  1.87s/it, loss=0.223, lr=1e-5]Steps:  19%|█▉        | 2870/15001 [1:48:42<6:18:12,  1.87s/it, loss=0.107, lr=1e-5]Steps:  19%|█▉        | 2871/15001 [1:48:44<6:16:10,  1.86s/it, loss=0.107, lr=1e-5]Steps:  19%|█▉        | 2871/15001 [1:48:44<6:16:10,  1.86s/it, loss=0.214, lr=1e-5]Steps:  19%|█▉        | 2872/15001 [1:48:45<6:09:06,  1.83s/it, loss=0.214, lr=1e-5]Steps:  19%|█▉        | 2872/15001 [1:48:46<6:09:06,  1.83s/it, loss=0.189, lr=1e-5]Steps:  19%|█▉        | 2873/15001 [1:48:47<6:15:16,  1.86s/it, loss=0.189, lr=1e-5]Steps:  19%|█▉        | 2873/15001 [1:48:47<6:15:16,  1.86s/it, loss=0.0474, lr=1e-5]Steps:  19%|█▉        | 2874/15001 [1:48:49<6:08:06,  1.82s/it, loss=0.0474, lr=1e-5]Steps:  19%|█▉        | 2874/15001 [1:48:49<6:08:06,  1.82s/it, loss=0.086, lr=1e-5] Steps:  19%|█▉        | 2875/15001 [1:48:51<5:54:59,  1.76s/it, loss=0.086, lr=1e-5]Steps:  19%|█▉        | 2875/15001 [1:48:51<5:54:59,  1.76s/it, loss=0.125, lr=1e-5]Steps:  19%|█▉        | 2876/15001 [1:48:53<6:19:40,  1.88s/it, loss=0.125, lr=1e-5]Steps:  19%|█▉        | 2876/15001 [1:48:53<6:19:40,  1.88s/it, loss=0.367, lr=1e-5]Steps:  19%|█▉        | 2877/15001 [1:48:55<6:12:22,  1.84s/it, loss=0.367, lr=1e-5]Steps:  19%|█▉        | 2877/15001 [1:48:55<6:12:22,  1.84s/it, loss=0.263, lr=1e-5]Steps:  19%|█▉        | 2878/15001 [1:48:57<6:21:30,  1.89s/it, loss=0.263, lr=1e-5]Steps:  19%|█▉        | 2878/15001 [1:48:57<6:21:30,  1.89s/it, loss=0.146, lr=1e-5]Steps:  19%|█▉        | 2879/15001 [1:48:59<6:25:21,  1.91s/it, loss=0.146, lr=1e-5]Steps:  19%|█▉        | 2879/15001 [1:48:59<6:25:21,  1.91s/it, loss=0.108, lr=1e-5]Steps:  19%|█▉        | 2880/15001 [1:49:01<6:32:59,  1.95s/it, loss=0.108, lr=1e-5]Steps:  19%|█▉        | 2880/15001 [1:49:01<6:32:59,  1.95s/it, loss=0.129, lr=1e-5]Steps:  19%|█▉        | 2881/15001 [1:49:02<6:27:48,  1.92s/it, loss=0.129, lr=1e-5]Steps:  19%|█▉        | 2881/15001 [1:49:03<6:27:48,  1.92s/it, loss=0.189, lr=1e-5]Steps:  19%|█▉        | 2882/15001 [1:49:04<6:21:15,  1.89s/it, loss=0.189, lr=1e-5]Steps:  19%|█▉        | 2882/15001 [1:49:05<6:21:15,  1.89s/it, loss=0.099, lr=1e-5]Steps:  19%|█▉        | 2883/15001 [1:49:06<6:33:27,  1.95s/it, loss=0.099, lr=1e-5]Steps:  19%|█▉        | 2883/15001 [1:49:07<6:33:27,  1.95s/it, loss=0.18, lr=1e-5] Steps:  19%|█▉        | 2884/15001 [1:49:08<6:36:00,  1.96s/it, loss=0.18, lr=1e-5]Steps:  19%|█▉        | 2884/15001 [1:49:09<6:36:00,  1.96s/it, loss=0.189, lr=1e-5]Steps:  19%|█▉        | 2885/15001 [1:49:10<6:22:03,  1.89s/it, loss=0.189, lr=1e-5]Steps:  19%|█▉        | 2885/15001 [1:49:10<6:22:03,  1.89s/it, loss=0.233, lr=1e-5]Steps:  19%|█▉        | 2886/15001 [1:49:12<6:31:17,  1.94s/it, loss=0.233, lr=1e-5]Steps:  19%|█▉        | 2886/15001 [1:49:12<6:31:17,  1.94s/it, loss=0.163, lr=1e-5]Steps:  19%|█▉        | 2887/15001 [1:49:14<6:20:16,  1.88s/it, loss=0.163, lr=1e-5]Steps:  19%|█▉        | 2887/15001 [1:49:14<6:20:16,  1.88s/it, loss=0.235, lr=1e-5]Steps:  19%|█▉        | 2888/15001 [1:49:16<6:21:52,  1.89s/it, loss=0.235, lr=1e-5]Steps:  19%|█▉        | 2888/15001 [1:49:16<6:21:52,  1.89s/it, loss=0.0567, lr=1e-5]Steps:  19%|█▉        | 2889/15001 [1:49:17<6:05:42,  1.81s/it, loss=0.0567, lr=1e-5]Steps:  19%|█▉        | 2889/15001 [1:49:18<6:05:42,  1.81s/it, loss=0.231, lr=1e-5] Steps:  19%|█▉        | 2890/15001 [1:49:19<6:16:31,  1.87s/it, loss=0.231, lr=1e-5]Steps:  19%|█▉        | 2890/15001 [1:49:19<6:16:31,  1.87s/it, loss=0.229, lr=1e-5]Steps:  19%|█▉        | 2891/15001 [1:49:21<6:06:06,  1.81s/it, loss=0.229, lr=1e-5]Steps:  19%|█▉        | 2891/15001 [1:49:21<6:06:06,  1.81s/it, loss=0.0969, lr=1e-5]Steps:  19%|█▉        | 2892/15001 [1:49:23<6:11:20,  1.84s/it, loss=0.0969, lr=1e-5]Steps:  19%|█▉        | 2892/15001 [1:49:23<6:11:20,  1.84s/it, loss=0.147, lr=1e-5] Steps:  19%|█▉        | 2893/15001 [1:49:25<6:13:36,  1.85s/it, loss=0.147, lr=1e-5]Steps:  19%|█▉        | 2893/15001 [1:49:25<6:13:36,  1.85s/it, loss=0.103, lr=1e-5]Steps:  19%|█▉        | 2894/15001 [1:49:27<6:10:45,  1.84s/it, loss=0.103, lr=1e-5]Steps:  19%|█▉        | 2894/15001 [1:49:27<6:10:45,  1.84s/it, loss=0.313, lr=1e-5]Steps:  19%|█▉        | 2895/15001 [1:49:28<6:07:26,  1.82s/it, loss=0.313, lr=1e-5]Steps:  19%|█▉        | 2895/15001 [1:49:29<6:07:26,  1.82s/it, loss=0.126, lr=1e-5]Steps:  19%|█▉        | 2896/15001 [1:49:30<6:06:59,  1.82s/it, loss=0.126, lr=1e-5]Steps:  19%|█▉        | 2896/15001 [1:49:30<6:06:59,  1.82s/it, loss=0.116, lr=1e-5]Steps:  19%|█▉        | 2897/15001 [1:49:32<6:05:41,  1.81s/it, loss=0.116, lr=1e-5]Steps:  19%|█▉        | 2897/15001 [1:49:32<6:05:41,  1.81s/it, loss=0.18, lr=1e-5] Steps:  19%|█▉        | 2898/15001 [1:49:34<6:10:25,  1.84s/it, loss=0.18, lr=1e-5]Steps:  19%|█▉        | 2898/15001 [1:49:34<6:10:25,  1.84s/it, loss=0.247, lr=1e-5]Steps:  19%|█▉        | 2899/15001 [1:49:36<6:12:07,  1.84s/it, loss=0.247, lr=1e-5]Steps:  19%|█▉        | 2899/15001 [1:49:36<6:12:07,  1.84s/it, loss=0.0932, lr=1e-5]Steps:  19%|█▉        | 2900/15001 [1:49:38<6:00:44,  1.79s/it, loss=0.0932, lr=1e-5]Steps:  19%|█▉        | 2900/15001 [1:49:38<6:00:44,  1.79s/it, loss=0.15, lr=1e-5]  Steps:  19%|█▉        | 2901/15001 [1:49:40<6:30:26,  1.94s/it, loss=0.15, lr=1e-5]Steps:  19%|█▉        | 2901/15001 [1:49:40<6:30:26,  1.94s/it, loss=0.257, lr=1e-5]Steps:  19%|█▉        | 2902/15001 [1:49:42<6:34:06,  1.95s/it, loss=0.257, lr=1e-5]Steps:  19%|█▉        | 2902/15001 [1:49:42<6:34:06,  1.95s/it, loss=0.259, lr=1e-5]Steps:  19%|█▉        | 2903/15001 [1:49:44<6:37:47,  1.97s/it, loss=0.259, lr=1e-5]Steps:  19%|█▉        | 2903/15001 [1:49:44<6:37:47,  1.97s/it, loss=0.288, lr=1e-5]Steps:  19%|█▉        | 2904/15001 [1:49:46<6:30:39,  1.94s/it, loss=0.288, lr=1e-5]Steps:  19%|█▉        | 2904/15001 [1:49:46<6:30:39,  1.94s/it, loss=0.145, lr=1e-5]Steps:  19%|█▉        | 2905/15001 [1:49:48<6:43:55,  2.00s/it, loss=0.145, lr=1e-5]Steps:  19%|█▉        | 2905/15001 [1:49:48<6:43:55,  2.00s/it, loss=0.224, lr=1e-5]Steps:  19%|█▉        | 2906/15001 [1:49:50<6:37:47,  1.97s/it, loss=0.224, lr=1e-5]Steps:  19%|█▉        | 2906/15001 [1:49:50<6:37:47,  1.97s/it, loss=0.18, lr=1e-5] Steps:  19%|█▉        | 2907/15001 [1:49:51<6:22:28,  1.90s/it, loss=0.18, lr=1e-5]Steps:  19%|█▉        | 2907/15001 [1:49:52<6:22:28,  1.90s/it, loss=0.161, lr=1e-5]Steps:  19%|█▉        | 2908/15001 [1:49:53<6:23:00,  1.90s/it, loss=0.161, lr=1e-5]Steps:  19%|█▉        | 2908/15001 [1:49:54<6:23:00,  1.90s/it, loss=0.261, lr=1e-5]Steps:  19%|█▉        | 2909/15001 [1:49:55<6:27:07,  1.92s/it, loss=0.261, lr=1e-5]Steps:  19%|█▉        | 2909/15001 [1:49:55<6:27:07,  1.92s/it, loss=0.603, lr=1e-5]Steps:  19%|█▉        | 2910/15001 [1:49:57<6:11:28,  1.84s/it, loss=0.603, lr=1e-5]Steps:  19%|█▉        | 2910/15001 [1:49:57<6:11:28,  1.84s/it, loss=0.287, lr=1e-5]Steps:  19%|█▉        | 2911/15001 [1:49:59<6:12:35,  1.85s/it, loss=0.287, lr=1e-5]Steps:  19%|█▉        | 2911/15001 [1:49:59<6:12:35,  1.85s/it, loss=0.176, lr=1e-5]Steps:  19%|█▉        | 2912/15001 [1:50:01<6:23:45,  1.90s/it, loss=0.176, lr=1e-5]Steps:  19%|█▉        | 2912/15001 [1:50:01<6:23:45,  1.90s/it, loss=0.238, lr=1e-5]Steps:  19%|█▉        | 2913/15001 [1:50:03<6:07:55,  1.83s/it, loss=0.238, lr=1e-5]Steps:  19%|█▉        | 2913/15001 [1:50:03<6:07:55,  1.83s/it, loss=0.138, lr=1e-5]Steps:  19%|█▉        | 2914/15001 [1:50:04<6:03:01,  1.80s/it, loss=0.138, lr=1e-5]Steps:  19%|█▉        | 2914/15001 [1:50:05<6:03:01,  1.80s/it, loss=0.128, lr=1e-5]Steps:  19%|█▉        | 2915/15001 [1:50:06<6:10:41,  1.84s/it, loss=0.128, lr=1e-5]Steps:  19%|█▉        | 2915/15001 [1:50:06<6:10:41,  1.84s/it, loss=0.248, lr=1e-5]Steps:  19%|█▉        | 2916/15001 [1:50:08<5:59:03,  1.78s/it, loss=0.248, lr=1e-5]Steps:  19%|█▉        | 2916/15001 [1:50:08<5:59:03,  1.78s/it, loss=0.0346, lr=1e-5]Steps:  19%|█▉        | 2917/15001 [1:50:10<6:18:05,  1.88s/it, loss=0.0346, lr=1e-5]Steps:  19%|█▉        | 2917/15001 [1:50:10<6:18:05,  1.88s/it, loss=0.151, lr=1e-5] Steps:  19%|█▉        | 2918/15001 [1:50:12<6:06:04,  1.82s/it, loss=0.151, lr=1e-5]Steps:  19%|█▉        | 2918/15001 [1:50:12<6:06:04,  1.82s/it, loss=0.301, lr=1e-5]Steps:  19%|█▉        | 2919/15001 [1:50:14<6:21:53,  1.90s/it, loss=0.301, lr=1e-5]Steps:  19%|█▉        | 2919/15001 [1:50:14<6:21:53,  1.90s/it, loss=0.11, lr=1e-5] Steps:  19%|█▉        | 2920/15001 [1:50:16<6:24:28,  1.91s/it, loss=0.11, lr=1e-5]Steps:  19%|█▉        | 2920/15001 [1:50:16<6:24:28,  1.91s/it, loss=0.2, lr=1e-5] Steps:  19%|█▉        | 2921/15001 [1:50:17<6:15:08,  1.86s/it, loss=0.2, lr=1e-5]Steps:  19%|█▉        | 2921/15001 [1:50:18<6:15:08,  1.86s/it, loss=0.257, lr=1e-5]Steps:  19%|█▉        | 2922/15001 [1:50:19<6:21:06,  1.89s/it, loss=0.257, lr=1e-5]Steps:  19%|█▉        | 2922/15001 [1:50:19<6:21:06,  1.89s/it, loss=0.169, lr=1e-5]Steps:  19%|█▉        | 2923/15001 [1:50:21<6:16:13,  1.87s/it, loss=0.169, lr=1e-5]Steps:  19%|█▉        | 2923/15001 [1:50:21<6:16:13,  1.87s/it, loss=0.103, lr=1e-5]Steps:  19%|█▉        | 2924/15001 [1:50:23<6:02:18,  1.80s/it, loss=0.103, lr=1e-5]Steps:  19%|█▉        | 2924/15001 [1:50:23<6:02:18,  1.80s/it, loss=0.213, lr=1e-5]Steps:  19%|█▉        | 2925/15001 [1:50:25<6:14:47,  1.86s/it, loss=0.213, lr=1e-5]Steps:  19%|█▉        | 2925/15001 [1:50:25<6:14:47,  1.86s/it, loss=0.172, lr=1e-5]Steps:  20%|█▉        | 2926/15001 [1:50:27<6:35:09,  1.96s/it, loss=0.172, lr=1e-5]Steps:  20%|█▉        | 2926/15001 [1:50:27<6:35:09,  1.96s/it, loss=0.28, lr=1e-5] Steps:  20%|█▉        | 2927/15001 [1:50:29<6:38:20,  1.98s/it, loss=0.28, lr=1e-5]Steps:  20%|█▉        | 2927/15001 [1:50:29<6:38:20,  1.98s/it, loss=0.202, lr=1e-5]Steps:  20%|█▉        | 2928/15001 [1:50:31<6:19:44,  1.89s/it, loss=0.202, lr=1e-5]Steps:  20%|█▉        | 2928/15001 [1:50:31<6:19:44,  1.89s/it, loss=0.0524, lr=1e-5]Steps:  20%|█▉        | 2929/15001 [1:50:33<6:46:34,  2.02s/it, loss=0.0524, lr=1e-5]Steps:  20%|█▉        | 2929/15001 [1:50:33<6:46:34,  2.02s/it, loss=0.148, lr=1e-5] Steps:  20%|█▉        | 2930/15001 [1:50:35<6:26:00,  1.92s/it, loss=0.148, lr=1e-5]Steps:  20%|█▉        | 2930/15001 [1:50:35<6:26:00,  1.92s/it, loss=0.131, lr=1e-5]Steps:  20%|█▉        | 2931/15001 [1:50:37<6:36:37,  1.97s/it, loss=0.131, lr=1e-5]Steps:  20%|█▉        | 2931/15001 [1:50:37<6:36:37,  1.97s/it, loss=0.146, lr=1e-5]Steps:  20%|█▉        | 2932/15001 [1:50:39<6:25:26,  1.92s/it, loss=0.146, lr=1e-5]Steps:  20%|█▉        | 2932/15001 [1:50:39<6:25:26,  1.92s/it, loss=0.159, lr=1e-5]Steps:  20%|█▉        | 2933/15001 [1:50:40<6:14:01,  1.86s/it, loss=0.159, lr=1e-5]Steps:  20%|█▉        | 2933/15001 [1:50:40<6:14:01,  1.86s/it, loss=0.351, lr=1e-5]Steps:  20%|█▉        | 2934/15001 [1:50:42<6:11:41,  1.85s/it, loss=0.351, lr=1e-5]Steps:  20%|█▉        | 2934/15001 [1:50:42<6:11:41,  1.85s/it, loss=0.159, lr=1e-5]Steps:  20%|█▉        | 2935/15001 [1:50:44<6:04:19,  1.81s/it, loss=0.159, lr=1e-5]Steps:  20%|█▉        | 2935/15001 [1:50:44<6:04:19,  1.81s/it, loss=0.295, lr=1e-5]Steps:  20%|█▉        | 2936/15001 [1:50:46<5:58:50,  1.78s/it, loss=0.295, lr=1e-5]Steps:  20%|█▉        | 2936/15001 [1:50:46<5:58:50,  1.78s/it, loss=0.238, lr=1e-5]Steps:  20%|█▉        | 2937/15001 [1:50:48<6:15:51,  1.87s/it, loss=0.238, lr=1e-5]Steps:  20%|█▉        | 2937/15001 [1:50:48<6:15:51,  1.87s/it, loss=0.19, lr=1e-5] Steps:  20%|█▉        | 2938/15001 [1:50:50<6:24:12,  1.91s/it, loss=0.19, lr=1e-5]Steps:  20%|█▉        | 2938/15001 [1:50:50<6:24:12,  1.91s/it, loss=0.217, lr=1e-5]Steps:  20%|█▉        | 2939/15001 [1:50:51<6:06:56,  1.83s/it, loss=0.217, lr=1e-5]Steps:  20%|█▉        | 2939/15001 [1:50:52<6:06:56,  1.83s/it, loss=0.0885, lr=1e-5]Steps:  20%|█▉        | 2940/15001 [1:50:53<6:20:22,  1.89s/it, loss=0.0885, lr=1e-5]Steps:  20%|█▉        | 2940/15001 [1:50:53<6:20:22,  1.89s/it, loss=0.122, lr=1e-5] Steps:  20%|█▉        | 2941/15001 [1:50:55<6:14:50,  1.86s/it, loss=0.122, lr=1e-5]Steps:  20%|█▉        | 2941/15001 [1:50:55<6:14:50,  1.86s/it, loss=0.248, lr=1e-5]Steps:  20%|█▉        | 2942/15001 [1:50:57<6:07:48,  1.83s/it, loss=0.248, lr=1e-5]Steps:  20%|█▉        | 2942/15001 [1:50:57<6:07:48,  1.83s/it, loss=0.161, lr=1e-5]Steps:  20%|█▉        | 2943/15001 [1:50:59<6:15:27,  1.87s/it, loss=0.161, lr=1e-5]Steps:  20%|█▉        | 2943/15001 [1:50:59<6:15:27,  1.87s/it, loss=0.262, lr=1e-5]Steps:  20%|█▉        | 2944/15001 [1:51:01<6:04:55,  1.82s/it, loss=0.262, lr=1e-5]Steps:  20%|█▉        | 2944/15001 [1:51:01<6:04:55,  1.82s/it, loss=0.104, lr=1e-5]Steps:  20%|█▉        | 2945/15001 [1:51:03<6:23:25,  1.91s/it, loss=0.104, lr=1e-5]Steps:  20%|█▉        | 2945/15001 [1:51:03<6:23:25,  1.91s/it, loss=0.166, lr=1e-5]Steps:  20%|█▉        | 2946/15001 [1:51:04<6:10:41,  1.85s/it, loss=0.166, lr=1e-5]Steps:  20%|█▉        | 2946/15001 [1:51:05<6:10:41,  1.85s/it, loss=0.14, lr=1e-5] Steps:  20%|█▉        | 2947/15001 [1:51:07<6:30:13,  1.94s/it, loss=0.14, lr=1e-5]Steps:  20%|█▉        | 2947/15001 [1:51:07<6:30:13,  1.94s/it, loss=0.127, lr=1e-5]Steps:  20%|█▉        | 2948/15001 [1:51:08<6:19:29,  1.89s/it, loss=0.127, lr=1e-5]Steps:  20%|█▉        | 2948/15001 [1:51:09<6:19:29,  1.89s/it, loss=0.194, lr=1e-5]Steps:  20%|█▉        | 2949/15001 [1:51:10<6:26:32,  1.92s/it, loss=0.194, lr=1e-5]Steps:  20%|█▉        | 2949/15001 [1:51:11<6:26:32,  1.92s/it, loss=0.206, lr=1e-5]Steps:  20%|█▉        | 2950/15001 [1:51:12<6:31:41,  1.95s/it, loss=0.206, lr=1e-5]Steps:  20%|█▉        | 2950/15001 [1:51:13<6:31:41,  1.95s/it, loss=0.168, lr=1e-5]Steps:  20%|█▉        | 2951/15001 [1:51:14<6:35:51,  1.97s/it, loss=0.168, lr=1e-5]Steps:  20%|█▉        | 2951/15001 [1:51:15<6:35:51,  1.97s/it, loss=0.199, lr=1e-5]Steps:  20%|█▉        | 2952/15001 [1:51:17<6:50:01,  2.04s/it, loss=0.199, lr=1e-5]Steps:  20%|█▉        | 2952/15001 [1:51:17<6:50:01,  2.04s/it, loss=0.0438, lr=1e-5]Steps:  20%|█▉        | 2953/15001 [1:51:18<6:27:41,  1.93s/it, loss=0.0438, lr=1e-5]Steps:  20%|█▉        | 2953/15001 [1:51:18<6:27:41,  1.93s/it, loss=0.0142, lr=1e-5]Steps:  20%|█▉        | 2954/15001 [1:51:20<6:16:31,  1.88s/it, loss=0.0142, lr=1e-5]Steps:  20%|█▉        | 2954/15001 [1:51:20<6:16:31,  1.88s/it, loss=0.129, lr=1e-5] Steps:  20%|█▉        | 2955/15001 [1:51:22<6:27:03,  1.93s/it, loss=0.129, lr=1e-5]Steps:  20%|█▉        | 2955/15001 [1:51:22<6:27:03,  1.93s/it, loss=0.0345, lr=1e-5]Steps:  20%|█▉        | 2956/15001 [1:51:24<6:20:14,  1.89s/it, loss=0.0345, lr=1e-5]Steps:  20%|█▉        | 2956/15001 [1:51:24<6:20:14,  1.89s/it, loss=0.309, lr=1e-5] Steps:  20%|█▉        | 2957/15001 [1:51:26<6:10:25,  1.85s/it, loss=0.309, lr=1e-5]Steps:  20%|█▉        | 2957/15001 [1:51:26<6:10:25,  1.85s/it, loss=0.22, lr=1e-5] Steps:  20%|█▉        | 2958/15001 [1:51:27<6:04:28,  1.82s/it, loss=0.22, lr=1e-5]Steps:  20%|█▉        | 2958/15001 [1:51:28<6:04:28,  1.82s/it, loss=0.0962, lr=1e-5]Steps:  20%|█▉        | 2959/15001 [1:51:29<5:49:01,  1.74s/it, loss=0.0962, lr=1e-5]Steps:  20%|█▉        | 2959/15001 [1:51:29<5:49:01,  1.74s/it, loss=0.135, lr=1e-5] Steps:  20%|█▉        | 2960/15001 [1:51:31<6:18:28,  1.89s/it, loss=0.135, lr=1e-5]Steps:  20%|█▉        | 2960/15001 [1:51:31<6:18:28,  1.89s/it, loss=0.225, lr=1e-5]Steps:  20%|█▉        | 2961/15001 [1:51:33<6:01:56,  1.80s/it, loss=0.225, lr=1e-5]Steps:  20%|█▉        | 2961/15001 [1:51:33<6:01:56,  1.80s/it, loss=0.147, lr=1e-5]Steps:  20%|█▉        | 2962/15001 [1:51:35<6:16:14,  1.88s/it, loss=0.147, lr=1e-5]Steps:  20%|█▉        | 2962/15001 [1:51:35<6:16:14,  1.88s/it, loss=0.239, lr=1e-5]Steps:  20%|█▉        | 2963/15001 [1:51:36<6:07:43,  1.83s/it, loss=0.239, lr=1e-5]Steps:  20%|█▉        | 2963/15001 [1:51:37<6:07:43,  1.83s/it, loss=0.139, lr=1e-5]Steps:  20%|█▉        | 2964/15001 [1:51:38<5:56:01,  1.77s/it, loss=0.139, lr=1e-5]Steps:  20%|█▉        | 2964/15001 [1:51:38<5:56:01,  1.77s/it, loss=0.303, lr=1e-5]Steps:  20%|█▉        | 2965/15001 [1:51:40<6:09:17,  1.84s/it, loss=0.303, lr=1e-5]Steps:  20%|█▉        | 2965/15001 [1:51:40<6:09:17,  1.84s/it, loss=0.149, lr=1e-5]Steps:  20%|█▉        | 2966/15001 [1:51:42<6:05:47,  1.82s/it, loss=0.149, lr=1e-5]Steps:  20%|█▉        | 2966/15001 [1:51:42<6:05:47,  1.82s/it, loss=0.0871, lr=1e-5]Steps:  20%|█▉        | 2967/15001 [1:51:44<6:17:56,  1.88s/it, loss=0.0871, lr=1e-5]Steps:  20%|█▉        | 2967/15001 [1:51:44<6:17:56,  1.88s/it, loss=0.362, lr=1e-5] Steps:  20%|█▉        | 2968/15001 [1:51:46<6:08:20,  1.84s/it, loss=0.362, lr=1e-5]Steps:  20%|█▉        | 2968/15001 [1:51:46<6:08:20,  1.84s/it, loss=0.102, lr=1e-5]Steps:  20%|█▉        | 2969/15001 [1:51:48<6:08:42,  1.84s/it, loss=0.102, lr=1e-5]Steps:  20%|█▉        | 2969/15001 [1:51:48<6:08:42,  1.84s/it, loss=0.244, lr=1e-5]Steps:  20%|█▉        | 2970/15001 [1:51:49<6:00:20,  1.80s/it, loss=0.244, lr=1e-5]Steps:  20%|█▉        | 2970/15001 [1:51:50<6:00:20,  1.80s/it, loss=0.1, lr=1e-5]  Steps:  20%|█▉        | 2971/15001 [1:51:51<6:14:48,  1.87s/it, loss=0.1, lr=1e-5]Steps:  20%|█▉        | 2971/15001 [1:51:52<6:14:48,  1.87s/it, loss=0.256, lr=1e-5]Steps:  20%|█▉        | 2972/15001 [1:51:53<6:35:22,  1.97s/it, loss=0.256, lr=1e-5]Steps:  20%|█▉        | 2972/15001 [1:51:54<6:35:22,  1.97s/it, loss=0.145, lr=1e-5]Steps:  20%|█▉        | 2973/15001 [1:51:55<6:30:03,  1.95s/it, loss=0.145, lr=1e-5]Steps:  20%|█▉        | 2973/15001 [1:51:56<6:30:03,  1.95s/it, loss=0.284, lr=1e-5]Steps:  20%|█▉        | 2974/15001 [1:51:57<6:33:28,  1.96s/it, loss=0.284, lr=1e-5]Steps:  20%|█▉        | 2974/15001 [1:51:58<6:33:28,  1.96s/it, loss=0.132, lr=1e-5]Steps:  20%|█▉        | 2975/15001 [1:51:59<6:39:42,  1.99s/it, loss=0.132, lr=1e-5]Steps:  20%|█▉        | 2975/15001 [1:52:00<6:39:42,  1.99s/it, loss=0.179, lr=1e-5]Steps:  20%|█▉        | 2976/15001 [1:52:01<6:41:47,  2.00s/it, loss=0.179, lr=1e-5]Steps:  20%|█▉        | 2976/15001 [1:52:01<6:41:47,  2.00s/it, loss=0.122, lr=1e-5]Steps:  20%|█▉        | 2977/15001 [1:52:03<6:33:55,  1.97s/it, loss=0.122, lr=1e-5]Steps:  20%|█▉        | 2977/15001 [1:52:03<6:33:55,  1.97s/it, loss=0.0974, lr=1e-5]Steps:  20%|█▉        | 2978/15001 [1:52:05<6:22:32,  1.91s/it, loss=0.0974, lr=1e-5]Steps:  20%|█▉        | 2978/15001 [1:52:05<6:22:32,  1.91s/it, loss=0.0903, lr=1e-5]Steps:  20%|█▉        | 2979/15001 [1:52:07<6:28:55,  1.94s/it, loss=0.0903, lr=1e-5]Steps:  20%|█▉        | 2979/15001 [1:52:07<6:28:55,  1.94s/it, loss=0.155, lr=1e-5] Steps:  20%|█▉        | 2980/15001 [1:52:09<6:08:32,  1.84s/it, loss=0.155, lr=1e-5]Steps:  20%|█▉        | 2980/15001 [1:52:09<6:08:32,  1.84s/it, loss=0.179, lr=1e-5]Steps:  20%|█▉        | 2981/15001 [1:52:11<6:10:47,  1.85s/it, loss=0.179, lr=1e-5]Steps:  20%|█▉        | 2981/15001 [1:52:11<6:10:47,  1.85s/it, loss=0.326, lr=1e-5]Steps:  20%|█▉        | 2982/15001 [1:52:12<6:02:58,  1.81s/it, loss=0.326, lr=1e-5]Steps:  20%|█▉        | 2982/15001 [1:52:13<6:02:58,  1.81s/it, loss=0.223, lr=1e-5]Steps:  20%|█▉        | 2983/15001 [1:52:15<6:26:34,  1.93s/it, loss=0.223, lr=1e-5]Steps:  20%|█▉        | 2983/15001 [1:52:15<6:26:34,  1.93s/it, loss=0.0958, lr=1e-5]Steps:  20%|█▉        | 2984/15001 [1:52:16<6:20:38,  1.90s/it, loss=0.0958, lr=1e-5]Steps:  20%|█▉        | 2984/15001 [1:52:16<6:20:38,  1.90s/it, loss=0.0348, lr=1e-5]Steps:  20%|█▉        | 2985/15001 [1:52:18<6:18:12,  1.89s/it, loss=0.0348, lr=1e-5]Steps:  20%|█▉        | 2985/15001 [1:52:18<6:18:12,  1.89s/it, loss=0.0639, lr=1e-5]Steps:  20%|█▉        | 2986/15001 [1:52:20<5:52:45,  1.76s/it, loss=0.0639, lr=1e-5]Steps:  20%|█▉        | 2986/15001 [1:52:20<5:52:45,  1.76s/it, loss=0.143, lr=1e-5] Steps:  20%|█▉        | 2987/15001 [1:52:22<6:14:42,  1.87s/it, loss=0.143, lr=1e-5]Steps:  20%|█▉        | 2987/15001 [1:52:22<6:14:42,  1.87s/it, loss=0.167, lr=1e-5]Steps:  20%|█▉        | 2988/15001 [1:52:24<6:16:49,  1.88s/it, loss=0.167, lr=1e-5]Steps:  20%|█▉        | 2988/15001 [1:52:24<6:16:49,  1.88s/it, loss=0.0766, lr=1e-5]Steps:  20%|█▉        | 2989/15001 [1:52:26<6:19:32,  1.90s/it, loss=0.0766, lr=1e-5]Steps:  20%|█▉        | 2989/15001 [1:52:26<6:19:32,  1.90s/it, loss=0.166, lr=1e-5] Steps:  20%|█▉        | 2990/15001 [1:52:27<6:08:09,  1.84s/it, loss=0.166, lr=1e-5]Steps:  20%|█▉        | 2990/15001 [1:52:28<6:08:09,  1.84s/it, loss=0.167, lr=1e-5]Steps:  20%|█▉        | 2991/15001 [1:52:29<6:02:32,  1.81s/it, loss=0.167, lr=1e-5]Steps:  20%|█▉        | 2991/15001 [1:52:29<6:02:32,  1.81s/it, loss=0.247, lr=1e-5]Steps:  20%|█▉        | 2992/15001 [1:52:31<6:14:29,  1.87s/it, loss=0.247, lr=1e-5]Steps:  20%|█▉        | 2992/15001 [1:52:31<6:14:29,  1.87s/it, loss=0.269, lr=1e-5]Steps:  20%|█▉        | 2993/15001 [1:52:33<6:37:02,  1.98s/it, loss=0.269, lr=1e-5]Steps:  20%|█▉        | 2993/15001 [1:52:34<6:37:02,  1.98s/it, loss=0.32, lr=1e-5] Steps:  20%|█▉        | 2994/15001 [1:52:36<6:49:04,  2.04s/it, loss=0.32, lr=1e-5]Steps:  20%|█▉        | 2994/15001 [1:52:36<6:49:04,  2.04s/it, loss=0.17, lr=1e-5]Steps:  20%|█▉        | 2995/15001 [1:52:37<6:41:23,  2.01s/it, loss=0.17, lr=1e-5]Steps:  20%|█▉        | 2995/15001 [1:52:38<6:41:23,  2.01s/it, loss=0.209, lr=1e-5]Steps:  20%|█▉        | 2996/15001 [1:52:39<6:28:56,  1.94s/it, loss=0.209, lr=1e-5]Steps:  20%|█▉        | 2996/15001 [1:52:40<6:28:56,  1.94s/it, loss=0.118, lr=1e-5]Steps:  20%|█▉        | 2997/15001 [1:52:41<6:42:30,  2.01s/it, loss=0.118, lr=1e-5]Steps:  20%|█▉        | 2997/15001 [1:52:42<6:42:30,  2.01s/it, loss=0.205, lr=1e-5]Steps:  20%|█▉        | 2998/15001 [1:52:43<6:17:18,  1.89s/it, loss=0.205, lr=1e-5]Steps:  20%|█▉        | 2998/15001 [1:52:44<6:17:18,  1.89s/it, loss=0.2, lr=1e-5]  Steps:  20%|█▉        | 2999/15001 [1:52:45<6:27:25,  1.94s/it, loss=0.2, lr=1e-5]Steps:  20%|█▉        | 2999/15001 [1:52:45<6:27:25,  1.94s/it, loss=0.297, lr=1e-5]Steps:  20%|█▉        | 3000/15001 [1:52:47<6:24:06,  1.92s/it, loss=0.297, lr=1e-5]02/04/2024 14:55:06 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1741.22it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  20%|█▉        | 3000/15001 [1:56:25<6:24:06,  1.92s/it, loss=0.0973, lr=1e-5]Steps:  20%|██        | 3001/15001 [1:56:27<224:24:54, 67.32s/it, loss=0.0973, lr=1e-5]Steps:  20%|██        | 3001/15001 [1:56:27<224:24:54, 67.32s/it, loss=0.0766, lr=1e-5]Steps:  20%|██        | 3002/15001 [1:56:29<159:00:47, 47.71s/it, loss=0.0766, lr=1e-5]Steps:  20%|██        | 3002/15001 [1:56:29<159:00:47, 47.71s/it, loss=0.182, lr=1e-5] Steps:  20%|██        | 3003/15001 [1:56:31<113:23:58, 34.03s/it, loss=0.182, lr=1e-5]Steps:  20%|██        | 3003/15001 [1:56:31<113:23:58, 34.03s/it, loss=0.152, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  20%|██        | 3004/15001 [1:56:33<81:32:54, 24.47s/it, loss=0.152, lr=1e-5] Steps:  20%|██        | 3004/15001 [1:56:33<81:32:54, 24.47s/it, loss=0.25, lr=1e-5] Steps:  20%|██        | 3005/15001 [1:56:35<58:54:50, 17.68s/it, loss=0.25, lr=1e-5]Steps:  20%|██        | 3005/15001 [1:56:35<58:54:50, 17.68s/it, loss=0.0439, lr=1e-5]Steps:  20%|██        | 3006/15001 [1:56:37<43:30:26, 13.06s/it, loss=0.0439, lr=1e-5]Steps:  20%|██        | 3006/15001 [1:56:37<43:30:26, 13.06s/it, loss=0.124, lr=1e-5] Steps:  20%|██        | 3007/15001 [1:56:39<32:23:01,  9.72s/it, loss=0.124, lr=1e-5]Steps:  20%|██        | 3007/15001 [1:56:39<32:23:01,  9.72s/it, loss=0.208, lr=1e-5]Steps:  20%|██        | 3008/15001 [1:56:41<24:19:35,  7.30s/it, loss=0.208, lr=1e-5]Steps:  20%|██        | 3008/15001 [1:56:41<24:19:35,  7.30s/it, loss=0.089, lr=1e-5]Steps:  20%|██        | 3009/15001 [1:56:43<18:59:36,  5.70s/it, loss=0.089, lr=1e-5]Steps:  20%|██        | 3009/15001 [1:56:43<18:59:36,  5.70s/it, loss=0.11, lr=1e-5] Steps:  20%|██        | 3010/15001 [1:56:45<15:06:12,  4.53s/it, loss=0.11, lr=1e-5]Steps:  20%|██        | 3010/15001 [1:56:45<15:06:12,  4.53s/it, loss=0.189, lr=1e-5]Steps:  20%|██        | 3011/15001 [1:56:46<12:13:18,  3.67s/it, loss=0.189, lr=1e-5]Steps:  20%|██        | 3011/15001 [1:56:47<12:13:18,  3.67s/it, loss=0.083, lr=1e-5]Steps:  20%|██        | 3012/15001 [1:56:48<10:39:45,  3.20s/it, loss=0.083, lr=1e-5]Steps:  20%|██        | 3012/15001 [1:56:48<10:39:45,  3.20s/it, loss=0.127, lr=1e-5]Steps:  20%|██        | 3013/15001 [1:56:50<9:01:38,  2.71s/it, loss=0.127, lr=1e-5] Steps:  20%|██        | 3013/15001 [1:56:50<9:01:38,  2.71s/it, loss=0.377, lr=1e-5]Steps:  20%|██        | 3014/15001 [1:56:52<8:16:08,  2.48s/it, loss=0.377, lr=1e-5]Steps:  20%|██        | 3014/15001 [1:56:52<8:16:08,  2.48s/it, loss=0.207, lr=1e-5]Steps:  20%|██        | 3015/15001 [1:56:54<7:51:58,  2.36s/it, loss=0.207, lr=1e-5]Steps:  20%|██        | 3015/15001 [1:56:54<7:51:58,  2.36s/it, loss=0.0538, lr=1e-5]Steps:  20%|██        | 3016/15001 [1:56:56<7:31:16,  2.26s/it, loss=0.0538, lr=1e-5]Steps:  20%|██        | 3016/15001 [1:56:56<7:31:16,  2.26s/it, loss=0.212, lr=1e-5] Steps:  20%|██        | 3017/15001 [1:56:58<6:50:07,  2.05s/it, loss=0.212, lr=1e-5]Steps:  20%|██        | 3017/15001 [1:56:58<6:50:07,  2.05s/it, loss=0.176, lr=1e-5]Steps:  20%|██        | 3018/15001 [1:56:59<6:43:24,  2.02s/it, loss=0.176, lr=1e-5]Steps:  20%|██        | 3018/15001 [1:57:00<6:43:24,  2.02s/it, loss=0.0856, lr=1e-5]Steps:  20%|██        | 3019/15001 [1:57:01<6:32:29,  1.97s/it, loss=0.0856, lr=1e-5]Steps:  20%|██        | 3019/15001 [1:57:01<6:32:29,  1.97s/it, loss=0.107, lr=1e-5] Steps:  20%|██        | 3020/15001 [1:57:03<6:16:39,  1.89s/it, loss=0.107, lr=1e-5]Steps:  20%|██        | 3020/15001 [1:57:03<6:16:39,  1.89s/it, loss=0.319, lr=1e-5]Steps:  20%|██        | 3021/15001 [1:57:05<6:12:20,  1.86s/it, loss=0.319, lr=1e-5]Steps:  20%|██        | 3021/15001 [1:57:05<6:12:20,  1.86s/it, loss=0.274, lr=1e-5]Steps:  20%|██        | 3022/15001 [1:57:06<5:59:28,  1.80s/it, loss=0.274, lr=1e-5]Steps:  20%|██        | 3022/15001 [1:57:07<5:59:28,  1.80s/it, loss=0.218, lr=1e-5]Steps:  20%|██        | 3023/15001 [1:57:08<6:11:02,  1.86s/it, loss=0.218, lr=1e-5]Steps:  20%|██        | 3023/15001 [1:57:09<6:11:02,  1.86s/it, loss=0.228, lr=1e-5]Steps:  20%|██        | 3024/15001 [1:57:10<6:20:45,  1.91s/it, loss=0.228, lr=1e-5]Steps:  20%|██        | 3024/15001 [1:57:11<6:20:45,  1.91s/it, loss=0.0692, lr=1e-5]Steps:  20%|██        | 3025/15001 [1:57:13<6:32:57,  1.97s/it, loss=0.0692, lr=1e-5]Steps:  20%|██        | 3025/15001 [1:57:13<6:32:57,  1.97s/it, loss=0.0945, lr=1e-5]Steps:  20%|██        | 3026/15001 [1:57:15<6:42:49,  2.02s/it, loss=0.0945, lr=1e-5]Steps:  20%|██        | 3026/15001 [1:57:15<6:42:49,  2.02s/it, loss=0.13, lr=1e-5]  Steps:  20%|██        | 3027/15001 [1:57:17<6:38:46,  2.00s/it, loss=0.13, lr=1e-5]Steps:  20%|██        | 3027/15001 [1:57:17<6:38:46,  2.00s/it, loss=0.245, lr=1e-5]Steps:  20%|██        | 3028/15001 [1:57:19<6:47:36,  2.04s/it, loss=0.245, lr=1e-5]Steps:  20%|██        | 3028/15001 [1:57:19<6:47:36,  2.04s/it, loss=0.196, lr=1e-5]Steps:  20%|██        | 3029/15001 [1:57:21<6:34:04,  1.98s/it, loss=0.196, lr=1e-5]Steps:  20%|██        | 3029/15001 [1:57:21<6:34:04,  1.98s/it, loss=0.11, lr=1e-5] Steps:  20%|██        | 3030/15001 [1:57:23<6:40:01,  2.00s/it, loss=0.11, lr=1e-5]Steps:  20%|██        | 3030/15001 [1:57:23<6:40:01,  2.00s/it, loss=0.155, lr=1e-5]Steps:  20%|██        | 3031/15001 [1:57:25<6:37:52,  1.99s/it, loss=0.155, lr=1e-5]Steps:  20%|██        | 3031/15001 [1:57:25<6:37:52,  1.99s/it, loss=0.0528, lr=1e-5]Steps:  20%|██        | 3032/15001 [1:57:27<6:29:33,  1.95s/it, loss=0.0528, lr=1e-5]Steps:  20%|██        | 3032/15001 [1:57:27<6:29:33,  1.95s/it, loss=0.163, lr=1e-5] Steps:  20%|██        | 3033/15001 [1:57:28<6:20:51,  1.91s/it, loss=0.163, lr=1e-5]Steps:  20%|██        | 3033/15001 [1:57:28<6:20:51,  1.91s/it, loss=0.174, lr=1e-5]Steps:  20%|██        | 3034/15001 [1:57:30<6:13:51,  1.87s/it, loss=0.174, lr=1e-5]Steps:  20%|██        | 3034/15001 [1:57:30<6:13:51,  1.87s/it, loss=0.177, lr=1e-5]Steps:  20%|██        | 3035/15001 [1:57:32<6:02:52,  1.82s/it, loss=0.177, lr=1e-5]Steps:  20%|██        | 3035/15001 [1:57:32<6:02:52,  1.82s/it, loss=0.179, lr=1e-5]Steps:  20%|██        | 3036/15001 [1:57:34<6:09:03,  1.85s/it, loss=0.179, lr=1e-5]Steps:  20%|██        | 3036/15001 [1:57:34<6:09:03,  1.85s/it, loss=0.0557, lr=1e-5]Steps:  20%|██        | 3037/15001 [1:57:35<5:52:59,  1.77s/it, loss=0.0557, lr=1e-5]Steps:  20%|██        | 3037/15001 [1:57:36<5:52:59,  1.77s/it, loss=0.181, lr=1e-5] Steps:  20%|██        | 3038/15001 [1:57:37<6:05:42,  1.83s/it, loss=0.181, lr=1e-5]Steps:  20%|██        | 3038/15001 [1:57:38<6:05:42,  1.83s/it, loss=0.103, lr=1e-5]Steps:  20%|██        | 3039/15001 [1:57:39<5:54:24,  1.78s/it, loss=0.103, lr=1e-5]Steps:  20%|██        | 3039/15001 [1:57:39<5:54:24,  1.78s/it, loss=0.0983, lr=1e-5]Steps:  20%|██        | 3040/15001 [1:57:41<6:08:14,  1.85s/it, loss=0.0983, lr=1e-5]Steps:  20%|██        | 3040/15001 [1:57:41<6:08:14,  1.85s/it, loss=0.232, lr=1e-5] Steps:  20%|██        | 3041/15001 [1:57:43<6:02:22,  1.82s/it, loss=0.232, lr=1e-5]Steps:  20%|██        | 3041/15001 [1:57:43<6:02:22,  1.82s/it, loss=0.269, lr=1e-5]Steps:  20%|██        | 3042/15001 [1:57:45<5:59:56,  1.81s/it, loss=0.269, lr=1e-5]Steps:  20%|██        | 3042/15001 [1:57:45<5:59:56,  1.81s/it, loss=0.31, lr=1e-5] Steps:  20%|██        | 3043/15001 [1:57:46<6:10:21,  1.86s/it, loss=0.31, lr=1e-5]Steps:  20%|██        | 3043/15001 [1:57:47<6:10:21,  1.86s/it, loss=0.259, lr=1e-5]Steps:  20%|██        | 3044/15001 [1:57:48<5:58:09,  1.80s/it, loss=0.259, lr=1e-5]Steps:  20%|██        | 3044/15001 [1:57:48<5:58:09,  1.80s/it, loss=0.0303, lr=1e-5]Steps:  20%|██        | 3045/15001 [1:57:50<6:04:34,  1.83s/it, loss=0.0303, lr=1e-5]Steps:  20%|██        | 3045/15001 [1:57:50<6:04:34,  1.83s/it, loss=0.136, lr=1e-5] Steps:  20%|██        | 3046/15001 [1:57:52<6:06:09,  1.84s/it, loss=0.136, lr=1e-5]Steps:  20%|██        | 3046/15001 [1:57:52<6:06:09,  1.84s/it, loss=0.112, lr=1e-5]Steps:  20%|██        | 3047/15001 [1:57:54<6:12:52,  1.87s/it, loss=0.112, lr=1e-5]Steps:  20%|██        | 3047/15001 [1:57:54<6:12:52,  1.87s/it, loss=0.103, lr=1e-5]Steps:  20%|██        | 3048/15001 [1:57:56<6:15:50,  1.89s/it, loss=0.103, lr=1e-5]Steps:  20%|██        | 3048/15001 [1:57:56<6:15:50,  1.89s/it, loss=0.192, lr=1e-5]Steps:  20%|██        | 3049/15001 [1:57:58<6:25:57,  1.94s/it, loss=0.192, lr=1e-5]Steps:  20%|██        | 3049/15001 [1:57:58<6:25:57,  1.94s/it, loss=0.301, lr=1e-5]Steps:  20%|██        | 3050/15001 [1:58:00<6:38:20,  2.00s/it, loss=0.301, lr=1e-5]Steps:  20%|██        | 3050/15001 [1:58:00<6:38:20,  2.00s/it, loss=0.236, lr=1e-5]Steps:  20%|██        | 3051/15001 [1:58:02<6:37:36,  2.00s/it, loss=0.236, lr=1e-5]Steps:  20%|██        | 3051/15001 [1:58:02<6:37:36,  2.00s/it, loss=0.141, lr=1e-5]Steps:  20%|██        | 3052/15001 [1:58:04<6:26:41,  1.94s/it, loss=0.141, lr=1e-5]Steps:  20%|██        | 3052/15001 [1:58:04<6:26:41,  1.94s/it, loss=0.123, lr=1e-5]Steps:  20%|██        | 3053/15001 [1:58:06<6:23:14,  1.92s/it, loss=0.123, lr=1e-5]Steps:  20%|██        | 3053/15001 [1:58:06<6:23:14,  1.92s/it, loss=0.102, lr=1e-5]Steps:  20%|██        | 3054/15001 [1:58:07<6:13:30,  1.88s/it, loss=0.102, lr=1e-5]Steps:  20%|██        | 3054/15001 [1:58:08<6:13:30,  1.88s/it, loss=0.189, lr=1e-5]Steps:  20%|██        | 3055/15001 [1:58:09<6:20:07,  1.91s/it, loss=0.189, lr=1e-5]Steps:  20%|██        | 3055/15001 [1:58:10<6:20:07,  1.91s/it, loss=0.169, lr=1e-5]Steps:  20%|██        | 3056/15001 [1:58:11<6:17:30,  1.90s/it, loss=0.169, lr=1e-5]Steps:  20%|██        | 3056/15001 [1:58:12<6:17:30,  1.90s/it, loss=0.32, lr=1e-5] Steps:  20%|██        | 3057/15001 [1:58:13<6:10:27,  1.86s/it, loss=0.32, lr=1e-5]Steps:  20%|██        | 3057/15001 [1:58:13<6:10:27,  1.86s/it, loss=0.107, lr=1e-5]Steps:  20%|██        | 3058/15001 [1:58:15<6:07:49,  1.85s/it, loss=0.107, lr=1e-5]Steps:  20%|██        | 3058/15001 [1:58:15<6:07:49,  1.85s/it, loss=0.215, lr=1e-5]Steps:  20%|██        | 3059/15001 [1:58:17<6:11:05,  1.86s/it, loss=0.215, lr=1e-5]Steps:  20%|██        | 3059/15001 [1:58:17<6:11:05,  1.86s/it, loss=0.235, lr=1e-5]Steps:  20%|██        | 3060/15001 [1:58:19<6:04:01,  1.83s/it, loss=0.235, lr=1e-5]Steps:  20%|██        | 3060/15001 [1:58:19<6:04:01,  1.83s/it, loss=0.017, lr=1e-5]Steps:  20%|██        | 3061/15001 [1:58:21<6:18:10,  1.90s/it, loss=0.017, lr=1e-5]Steps:  20%|██        | 3061/15001 [1:58:21<6:18:10,  1.90s/it, loss=0.211, lr=1e-5]Steps:  20%|██        | 3062/15001 [1:58:23<6:20:24,  1.91s/it, loss=0.211, lr=1e-5]Steps:  20%|██        | 3062/15001 [1:58:23<6:20:24,  1.91s/it, loss=0.218, lr=1e-5]Steps:  20%|██        | 3063/15001 [1:58:24<6:13:57,  1.88s/it, loss=0.218, lr=1e-5]Steps:  20%|██        | 3063/15001 [1:58:24<6:13:57,  1.88s/it, loss=0.17, lr=1e-5] Steps:  20%|██        | 3064/15001 [1:58:26<6:13:25,  1.88s/it, loss=0.17, lr=1e-5]Steps:  20%|██        | 3064/15001 [1:58:26<6:13:25,  1.88s/it, loss=0.101, lr=1e-5]Steps:  20%|██        | 3065/15001 [1:58:28<5:57:57,  1.80s/it, loss=0.101, lr=1e-5]Steps:  20%|██        | 3065/15001 [1:58:28<5:57:57,  1.80s/it, loss=0.16, lr=1e-5] Steps:  20%|██        | 3066/15001 [1:58:30<6:07:15,  1.85s/it, loss=0.16, lr=1e-5]Steps:  20%|██        | 3066/15001 [1:58:30<6:07:15,  1.85s/it, loss=0.14, lr=1e-5]Steps:  20%|██        | 3067/15001 [1:58:31<5:58:17,  1.80s/it, loss=0.14, lr=1e-5]Steps:  20%|██        | 3067/15001 [1:58:32<5:58:17,  1.80s/it, loss=0.198, lr=1e-5]Steps:  20%|██        | 3068/15001 [1:58:33<5:48:27,  1.75s/it, loss=0.198, lr=1e-5]Steps:  20%|██        | 3068/15001 [1:58:34<5:48:27,  1.75s/it, loss=0.227, lr=1e-5]Steps:  20%|██        | 3069/15001 [1:58:35<6:15:59,  1.89s/it, loss=0.227, lr=1e-5]Steps:  20%|██        | 3069/15001 [1:58:35<6:15:59,  1.89s/it, loss=0.113, lr=1e-5]Steps:  20%|██        | 3070/15001 [1:58:37<6:08:13,  1.85s/it, loss=0.113, lr=1e-5]Steps:  20%|██        | 3070/15001 [1:58:37<6:08:13,  1.85s/it, loss=0.141, lr=1e-5]Steps:  20%|██        | 3071/15001 [1:58:39<6:07:37,  1.85s/it, loss=0.141, lr=1e-5]Steps:  20%|██        | 3071/15001 [1:58:39<6:07:37,  1.85s/it, loss=0.123, lr=1e-5]Steps:  20%|██        | 3072/15001 [1:58:41<6:39:30,  2.01s/it, loss=0.123, lr=1e-5]Steps:  20%|██        | 3072/15001 [1:58:41<6:39:30,  2.01s/it, loss=0.0922, lr=1e-5]Steps:  20%|██        | 3073/15001 [1:58:43<6:33:22,  1.98s/it, loss=0.0922, lr=1e-5]Steps:  20%|██        | 3073/15001 [1:58:43<6:33:22,  1.98s/it, loss=0.0996, lr=1e-5]Steps:  20%|██        | 3074/15001 [1:58:45<6:18:02,  1.90s/it, loss=0.0996, lr=1e-5]Steps:  20%|██        | 3074/15001 [1:58:45<6:18:02,  1.90s/it, loss=0.232, lr=1e-5] Steps:  20%|██        | 3075/15001 [1:58:47<6:38:25,  2.00s/it, loss=0.232, lr=1e-5]Steps:  20%|██        | 3075/15001 [1:58:47<6:38:25,  2.00s/it, loss=0.229, lr=1e-5]Steps:  21%|██        | 3076/15001 [1:58:49<6:34:54,  1.99s/it, loss=0.229, lr=1e-5]Steps:  21%|██        | 3076/15001 [1:58:49<6:34:54,  1.99s/it, loss=0.208, lr=1e-5]Steps:  21%|██        | 3077/15001 [1:58:51<6:13:46,  1.88s/it, loss=0.208, lr=1e-5]Steps:  21%|██        | 3077/15001 [1:58:51<6:13:46,  1.88s/it, loss=0.169, lr=1e-5]Steps:  21%|██        | 3078/15001 [1:58:52<5:58:20,  1.80s/it, loss=0.169, lr=1e-5]Steps:  21%|██        | 3078/15001 [1:58:53<5:58:20,  1.80s/it, loss=0.143, lr=1e-5]Steps:  21%|██        | 3079/15001 [1:58:54<6:10:13,  1.86s/it, loss=0.143, lr=1e-5]Steps:  21%|██        | 3079/15001 [1:58:55<6:10:13,  1.86s/it, loss=0.196, lr=1e-5]Steps:  21%|██        | 3080/15001 [1:58:56<6:02:27,  1.82s/it, loss=0.196, lr=1e-5]Steps:  21%|██        | 3080/15001 [1:58:56<6:02:27,  1.82s/it, loss=0.258, lr=1e-5]Steps:  21%|██        | 3081/15001 [1:58:58<6:03:59,  1.83s/it, loss=0.258, lr=1e-5]Steps:  21%|██        | 3081/15001 [1:58:58<6:03:59,  1.83s/it, loss=0.42, lr=1e-5] Steps:  21%|██        | 3082/15001 [1:59:00<6:09:18,  1.86s/it, loss=0.42, lr=1e-5]Steps:  21%|██        | 3082/15001 [1:59:00<6:09:18,  1.86s/it, loss=0.0587, lr=1e-5]Steps:  21%|██        | 3083/15001 [1:59:02<5:59:47,  1.81s/it, loss=0.0587, lr=1e-5]Steps:  21%|██        | 3083/15001 [1:59:02<5:59:47,  1.81s/it, loss=0.186, lr=1e-5] Steps:  21%|██        | 3084/15001 [1:59:04<6:07:09,  1.85s/it, loss=0.186, lr=1e-5]Steps:  21%|██        | 3084/15001 [1:59:04<6:07:09,  1.85s/it, loss=0.109, lr=1e-5]Steps:  21%|██        | 3085/15001 [1:59:05<6:06:40,  1.85s/it, loss=0.109, lr=1e-5]Steps:  21%|██        | 3085/15001 [1:59:05<6:06:40,  1.85s/it, loss=0.168, lr=1e-5]Steps:  21%|██        | 3086/15001 [1:59:07<5:37:09,  1.70s/it, loss=0.168, lr=1e-5]Steps:  21%|██        | 3086/15001 [1:59:07<5:37:09,  1.70s/it, loss=0.112, lr=1e-5]Steps:  21%|██        | 3087/15001 [1:59:09<5:48:33,  1.76s/it, loss=0.112, lr=1e-5]Steps:  21%|██        | 3087/15001 [1:59:09<5:48:33,  1.76s/it, loss=0.233, lr=1e-5]Steps:  21%|██        | 3088/15001 [1:59:11<6:14:10,  1.88s/it, loss=0.233, lr=1e-5]Steps:  21%|██        | 3088/15001 [1:59:11<6:14:10,  1.88s/it, loss=0.117, lr=1e-5]Steps:  21%|██        | 3089/15001 [1:59:13<6:05:51,  1.84s/it, loss=0.117, lr=1e-5]Steps:  21%|██        | 3089/15001 [1:59:13<6:05:51,  1.84s/it, loss=0.172, lr=1e-5]Steps:  21%|██        | 3090/15001 [1:59:14<6:06:51,  1.85s/it, loss=0.172, lr=1e-5]Steps:  21%|██        | 3090/15001 [1:59:15<6:06:51,  1.85s/it, loss=0.123, lr=1e-5]Steps:  21%|██        | 3091/15001 [1:59:16<6:01:35,  1.82s/it, loss=0.123, lr=1e-5]Steps:  21%|██        | 3091/15001 [1:59:16<6:01:35,  1.82s/it, loss=0.0884, lr=1e-5]Steps:  21%|██        | 3092/15001 [1:59:18<6:12:05,  1.87s/it, loss=0.0884, lr=1e-5]Steps:  21%|██        | 3092/15001 [1:59:18<6:12:05,  1.87s/it, loss=0.183, lr=1e-5] Steps:  21%|██        | 3093/15001 [1:59:20<6:15:44,  1.89s/it, loss=0.183, lr=1e-5]Steps:  21%|██        | 3093/15001 [1:59:20<6:15:44,  1.89s/it, loss=0.25, lr=1e-5] Steps:  21%|██        | 3094/15001 [1:59:22<6:21:16,  1.92s/it, loss=0.25, lr=1e-5]Steps:  21%|██        | 3094/15001 [1:59:22<6:21:16,  1.92s/it, loss=0.102, lr=1e-5]Steps:  21%|██        | 3095/15001 [1:59:24<6:34:55,  1.99s/it, loss=0.102, lr=1e-5]Steps:  21%|██        | 3095/15001 [1:59:24<6:34:55,  1.99s/it, loss=0.156, lr=1e-5]Steps:  21%|██        | 3096/15001 [1:59:26<6:33:31,  1.98s/it, loss=0.156, lr=1e-5]Steps:  21%|██        | 3096/15001 [1:59:26<6:33:31,  1.98s/it, loss=0.0894, lr=1e-5]Steps:  21%|██        | 3097/15001 [1:59:28<6:37:00,  2.00s/it, loss=0.0894, lr=1e-5]Steps:  21%|██        | 3097/15001 [1:59:28<6:37:00,  2.00s/it, loss=0.243, lr=1e-5] Steps:  21%|██        | 3098/15001 [1:59:30<6:38:03,  2.01s/it, loss=0.243, lr=1e-5]Steps:  21%|██        | 3098/15001 [1:59:30<6:38:03,  2.01s/it, loss=0.0769, lr=1e-5]Steps:  21%|██        | 3099/15001 [1:59:32<6:40:27,  2.02s/it, loss=0.0769, lr=1e-5]Steps:  21%|██        | 3099/15001 [1:59:32<6:40:27,  2.02s/it, loss=0.197, lr=1e-5] Steps:  21%|██        | 3100/15001 [1:59:34<6:27:40,  1.95s/it, loss=0.197, lr=1e-5]Steps:  21%|██        | 3100/15001 [1:59:34<6:27:40,  1.95s/it, loss=0.249, lr=1e-5]Steps:  21%|██        | 3101/15001 [1:59:36<6:27:00,  1.95s/it, loss=0.249, lr=1e-5]Steps:  21%|██        | 3101/15001 [1:59:36<6:27:00,  1.95s/it, loss=0.14, lr=1e-5] Steps:  21%|██        | 3102/15001 [1:59:38<6:20:52,  1.92s/it, loss=0.14, lr=1e-5]Steps:  21%|██        | 3102/15001 [1:59:38<6:20:52,  1.92s/it, loss=0.166, lr=1e-5]Steps:  21%|██        | 3103/15001 [1:59:40<6:14:30,  1.89s/it, loss=0.166, lr=1e-5]Steps:  21%|██        | 3103/15001 [1:59:40<6:14:30,  1.89s/it, loss=0.182, lr=1e-5]Steps:  21%|██        | 3104/15001 [1:59:41<5:54:46,  1.79s/it, loss=0.182, lr=1e-5]Steps:  21%|██        | 3104/15001 [1:59:42<5:54:46,  1.79s/it, loss=0.0934, lr=1e-5]Steps:  21%|██        | 3105/15001 [1:59:43<6:14:19,  1.89s/it, loss=0.0934, lr=1e-5]Steps:  21%|██        | 3105/15001 [1:59:43<6:14:19,  1.89s/it, loss=0.117, lr=1e-5] Steps:  21%|██        | 3106/15001 [1:59:45<6:11:10,  1.87s/it, loss=0.117, lr=1e-5]Steps:  21%|██        | 3106/15001 [1:59:45<6:11:10,  1.87s/it, loss=0.231, lr=1e-5]Steps:  21%|██        | 3107/15001 [1:59:47<6:04:15,  1.84s/it, loss=0.231, lr=1e-5]Steps:  21%|██        | 3107/15001 [1:59:47<6:04:15,  1.84s/it, loss=0.159, lr=1e-5]Steps:  21%|██        | 3108/15001 [1:59:49<5:52:39,  1.78s/it, loss=0.159, lr=1e-5]Steps:  21%|██        | 3108/15001 [1:59:49<5:52:39,  1.78s/it, loss=0.145, lr=1e-5]Steps:  21%|██        | 3109/15001 [1:59:50<5:56:33,  1.80s/it, loss=0.145, lr=1e-5]Steps:  21%|██        | 3109/15001 [1:59:51<5:56:33,  1.80s/it, loss=0.127, lr=1e-5]Steps:  21%|██        | 3110/15001 [1:59:52<6:00:46,  1.82s/it, loss=0.127, lr=1e-5]Steps:  21%|██        | 3110/15001 [1:59:53<6:00:46,  1.82s/it, loss=0.344, lr=1e-5]Steps:  21%|██        | 3111/15001 [1:59:54<6:10:16,  1.87s/it, loss=0.344, lr=1e-5]Steps:  21%|██        | 3111/15001 [1:59:55<6:10:16,  1.87s/it, loss=0.0619, lr=1e-5]Steps:  21%|██        | 3112/15001 [1:59:56<6:15:57,  1.90s/it, loss=0.0619, lr=1e-5]Steps:  21%|██        | 3112/15001 [1:59:56<6:15:57,  1.90s/it, loss=0.077, lr=1e-5] Steps:  21%|██        | 3113/15001 [1:59:58<6:08:04,  1.86s/it, loss=0.077, lr=1e-5]Steps:  21%|██        | 3113/15001 [1:59:58<6:08:04,  1.86s/it, loss=0.237, lr=1e-5]Steps:  21%|██        | 3114/15001 [2:00:00<5:59:06,  1.81s/it, loss=0.237, lr=1e-5]Steps:  21%|██        | 3114/15001 [2:00:00<5:59:06,  1.81s/it, loss=0.132, lr=1e-5]Steps:  21%|██        | 3115/15001 [2:00:02<6:00:10,  1.82s/it, loss=0.132, lr=1e-5]Steps:  21%|██        | 3115/15001 [2:00:02<6:00:10,  1.82s/it, loss=0.244, lr=1e-5]Steps:  21%|██        | 3116/15001 [2:00:03<6:02:42,  1.83s/it, loss=0.244, lr=1e-5]Steps:  21%|██        | 3116/15001 [2:00:04<6:02:42,  1.83s/it, loss=0.278, lr=1e-5]Steps:  21%|██        | 3117/15001 [2:00:05<5:58:51,  1.81s/it, loss=0.278, lr=1e-5]Steps:  21%|██        | 3117/15001 [2:00:06<5:58:51,  1.81s/it, loss=0.0564, lr=1e-5]Steps:  21%|██        | 3118/15001 [2:00:07<6:12:46,  1.88s/it, loss=0.0564, lr=1e-5]Steps:  21%|██        | 3118/15001 [2:00:08<6:12:46,  1.88s/it, loss=0.295, lr=1e-5] Steps:  21%|██        | 3119/15001 [2:00:09<6:30:22,  1.97s/it, loss=0.295, lr=1e-5]Steps:  21%|██        | 3119/15001 [2:00:10<6:30:22,  1.97s/it, loss=0.227, lr=1e-5]Steps:  21%|██        | 3120/15001 [2:00:11<6:31:34,  1.98s/it, loss=0.227, lr=1e-5]Steps:  21%|██        | 3120/15001 [2:00:12<6:31:34,  1.98s/it, loss=0.173, lr=1e-5]Steps:  21%|██        | 3121/15001 [2:00:13<6:19:01,  1.91s/it, loss=0.173, lr=1e-5]Steps:  21%|██        | 3121/15001 [2:00:14<6:19:01,  1.91s/it, loss=0.27, lr=1e-5] Steps:  21%|██        | 3122/15001 [2:00:15<6:28:21,  1.96s/it, loss=0.27, lr=1e-5]Steps:  21%|██        | 3122/15001 [2:00:16<6:28:21,  1.96s/it, loss=0.212, lr=1e-5]Steps:  21%|██        | 3123/15001 [2:00:17<6:23:19,  1.94s/it, loss=0.212, lr=1e-5]Steps:  21%|██        | 3123/15001 [2:00:17<6:23:19,  1.94s/it, loss=0.163, lr=1e-5]Steps:  21%|██        | 3124/15001 [2:00:19<6:12:20,  1.88s/it, loss=0.163, lr=1e-5]Steps:  21%|██        | 3124/15001 [2:00:19<6:12:20,  1.88s/it, loss=0.142, lr=1e-5]Steps:  21%|██        | 3125/15001 [2:00:21<6:20:50,  1.92s/it, loss=0.142, lr=1e-5]Steps:  21%|██        | 3125/15001 [2:00:21<6:20:50,  1.92s/it, loss=0.115, lr=1e-5]Steps:  21%|██        | 3126/15001 [2:00:23<6:01:41,  1.83s/it, loss=0.115, lr=1e-5]Steps:  21%|██        | 3126/15001 [2:00:23<6:01:41,  1.83s/it, loss=0.0546, lr=1e-5]Steps:  21%|██        | 3127/15001 [2:00:25<6:13:48,  1.89s/it, loss=0.0546, lr=1e-5]Steps:  21%|██        | 3127/15001 [2:00:25<6:13:48,  1.89s/it, loss=0.0695, lr=1e-5]Steps:  21%|██        | 3128/15001 [2:00:26<5:44:20,  1.74s/it, loss=0.0695, lr=1e-5]Steps:  21%|██        | 3128/15001 [2:00:26<5:44:20,  1.74s/it, loss=0.266, lr=1e-5] Steps:  21%|██        | 3129/15001 [2:00:28<6:06:10,  1.85s/it, loss=0.266, lr=1e-5]Steps:  21%|██        | 3129/15001 [2:00:28<6:06:10,  1.85s/it, loss=0.105, lr=1e-5]Steps:  21%|██        | 3130/15001 [2:00:30<5:53:19,  1.79s/it, loss=0.105, lr=1e-5]Steps:  21%|██        | 3130/15001 [2:00:30<5:53:19,  1.79s/it, loss=0.316, lr=1e-5]Steps:  21%|██        | 3131/15001 [2:00:31<5:52:22,  1.78s/it, loss=0.316, lr=1e-5]Steps:  21%|██        | 3131/15001 [2:00:32<5:52:22,  1.78s/it, loss=0.155, lr=1e-5]Steps:  21%|██        | 3132/15001 [2:00:34<6:11:26,  1.88s/it, loss=0.155, lr=1e-5]Steps:  21%|██        | 3132/15001 [2:00:34<6:11:26,  1.88s/it, loss=0.141, lr=1e-5]Steps:  21%|██        | 3133/15001 [2:00:35<5:56:35,  1.80s/it, loss=0.141, lr=1e-5]Steps:  21%|██        | 3133/15001 [2:00:35<5:56:35,  1.80s/it, loss=0.107, lr=1e-5]Steps:  21%|██        | 3134/15001 [2:00:37<6:06:39,  1.85s/it, loss=0.107, lr=1e-5]Steps:  21%|██        | 3134/15001 [2:00:37<6:06:39,  1.85s/it, loss=0.0928, lr=1e-5]Steps:  21%|██        | 3135/15001 [2:00:39<5:43:45,  1.74s/it, loss=0.0928, lr=1e-5]Steps:  21%|██        | 3135/15001 [2:00:39<5:43:45,  1.74s/it, loss=0.323, lr=1e-5] Steps:  21%|██        | 3136/15001 [2:00:41<6:01:13,  1.83s/it, loss=0.323, lr=1e-5]Steps:  21%|██        | 3136/15001 [2:00:41<6:01:13,  1.83s/it, loss=0.476, lr=1e-5]Steps:  21%|██        | 3137/15001 [2:00:42<5:49:58,  1.77s/it, loss=0.476, lr=1e-5]Steps:  21%|██        | 3137/15001 [2:00:43<5:49:58,  1.77s/it, loss=0.0881, lr=1e-5]Steps:  21%|██        | 3138/15001 [2:00:44<6:00:47,  1.82s/it, loss=0.0881, lr=1e-5]Steps:  21%|██        | 3138/15001 [2:00:44<6:00:47,  1.82s/it, loss=0.214, lr=1e-5] Steps:  21%|██        | 3139/15001 [2:00:46<6:00:43,  1.82s/it, loss=0.214, lr=1e-5]Steps:  21%|██        | 3139/15001 [2:00:46<6:00:43,  1.82s/it, loss=0.232, lr=1e-5]Steps:  21%|██        | 3140/15001 [2:00:48<6:20:37,  1.93s/it, loss=0.232, lr=1e-5]Steps:  21%|██        | 3140/15001 [2:00:48<6:20:37,  1.93s/it, loss=0.0632, lr=1e-5]Steps:  21%|██        | 3141/15001 [2:00:50<6:16:03,  1.90s/it, loss=0.0632, lr=1e-5]Steps:  21%|██        | 3141/15001 [2:00:51<6:16:03,  1.90s/it, loss=0.235, lr=1e-5] Steps:  21%|██        | 3142/15001 [2:00:52<6:40:50,  2.03s/it, loss=0.235, lr=1e-5]Steps:  21%|██        | 3142/15001 [2:00:53<6:40:50,  2.03s/it, loss=0.145, lr=1e-5]Steps:  21%|██        | 3143/15001 [2:00:54<6:33:31,  1.99s/it, loss=0.145, lr=1e-5]Steps:  21%|██        | 3143/15001 [2:00:54<6:33:31,  1.99s/it, loss=0.305, lr=1e-5]Steps:  21%|██        | 3144/15001 [2:00:56<6:25:06,  1.95s/it, loss=0.305, lr=1e-5]Steps:  21%|██        | 3144/15001 [2:00:56<6:25:06,  1.95s/it, loss=0.0883, lr=1e-5]Steps:  21%|██        | 3145/15001 [2:00:58<6:22:14,  1.93s/it, loss=0.0883, lr=1e-5]Steps:  21%|██        | 3145/15001 [2:00:58<6:22:14,  1.93s/it, loss=0.111, lr=1e-5] Steps:  21%|██        | 3146/15001 [2:01:00<6:10:25,  1.87s/it, loss=0.111, lr=1e-5]Steps:  21%|██        | 3146/15001 [2:01:00<6:10:25,  1.87s/it, loss=0.0996, lr=1e-5]Steps:  21%|██        | 3147/15001 [2:01:01<5:54:50,  1.80s/it, loss=0.0996, lr=1e-5]Steps:  21%|██        | 3147/15001 [2:01:02<5:54:50,  1.80s/it, loss=0.215, lr=1e-5] Steps:  21%|██        | 3148/15001 [2:01:04<6:23:21,  1.94s/it, loss=0.215, lr=1e-5]Steps:  21%|██        | 3148/15001 [2:01:04<6:23:21,  1.94s/it, loss=0.0443, lr=1e-5]Steps:  21%|██        | 3149/15001 [2:01:05<6:13:31,  1.89s/it, loss=0.0443, lr=1e-5]Steps:  21%|██        | 3149/15001 [2:01:06<6:13:31,  1.89s/it, loss=0.255, lr=1e-5] Steps:  21%|██        | 3150/15001 [2:01:07<6:15:50,  1.90s/it, loss=0.255, lr=1e-5]Steps:  21%|██        | 3150/15001 [2:01:08<6:15:50,  1.90s/it, loss=0.0954, lr=1e-5]Steps:  21%|██        | 3151/15001 [2:01:09<6:14:36,  1.90s/it, loss=0.0954, lr=1e-5]Steps:  21%|██        | 3151/15001 [2:01:09<6:14:36,  1.90s/it, loss=0.127, lr=1e-5] Steps:  21%|██        | 3152/15001 [2:01:11<6:08:48,  1.87s/it, loss=0.127, lr=1e-5]Steps:  21%|██        | 3152/15001 [2:01:11<6:08:48,  1.87s/it, loss=0.0755, lr=1e-5]Steps:  21%|██        | 3153/15001 [2:01:13<6:05:10,  1.85s/it, loss=0.0755, lr=1e-5]Steps:  21%|██        | 3153/15001 [2:01:13<6:05:10,  1.85s/it, loss=0.151, lr=1e-5] Steps:  21%|██        | 3154/15001 [2:01:15<6:05:26,  1.85s/it, loss=0.151, lr=1e-5]Steps:  21%|██        | 3154/15001 [2:01:15<6:05:26,  1.85s/it, loss=0.113, lr=1e-5]Steps:  21%|██        | 3155/15001 [2:01:17<6:00:17,  1.82s/it, loss=0.113, lr=1e-5]Steps:  21%|██        | 3155/15001 [2:01:17<6:00:17,  1.82s/it, loss=0.082, lr=1e-5]Steps:  21%|██        | 3156/15001 [2:01:18<6:02:27,  1.84s/it, loss=0.082, lr=1e-5]Steps:  21%|██        | 3156/15001 [2:01:18<6:02:27,  1.84s/it, loss=0.237, lr=1e-5]Steps:  21%|██        | 3157/15001 [2:01:20<6:03:52,  1.84s/it, loss=0.237, lr=1e-5]Steps:  21%|██        | 3157/15001 [2:01:20<6:03:52,  1.84s/it, loss=0.157, lr=1e-5]Steps:  21%|██        | 3158/15001 [2:01:22<6:06:05,  1.85s/it, loss=0.157, lr=1e-5]Steps:  21%|██        | 3158/15001 [2:01:22<6:06:05,  1.85s/it, loss=0.112, lr=1e-5]Steps:  21%|██        | 3159/15001 [2:01:24<6:03:02,  1.84s/it, loss=0.112, lr=1e-5]Steps:  21%|██        | 3159/15001 [2:01:24<6:03:02,  1.84s/it, loss=0.202, lr=1e-5]Steps:  21%|██        | 3160/15001 [2:01:26<5:58:17,  1.82s/it, loss=0.202, lr=1e-5]Steps:  21%|██        | 3160/15001 [2:01:26<5:58:17,  1.82s/it, loss=0.048, lr=1e-5]Steps:  21%|██        | 3161/15001 [2:01:27<5:45:21,  1.75s/it, loss=0.048, lr=1e-5]Steps:  21%|██        | 3161/15001 [2:01:28<5:45:21,  1.75s/it, loss=0.136, lr=1e-5]Steps:  21%|██        | 3162/15001 [2:01:29<5:57:54,  1.81s/it, loss=0.136, lr=1e-5]Steps:  21%|██        | 3162/15001 [2:01:29<5:57:54,  1.81s/it, loss=0.144, lr=1e-5]Steps:  21%|██        | 3163/15001 [2:01:31<6:05:21,  1.85s/it, loss=0.144, lr=1e-5]Steps:  21%|██        | 3163/15001 [2:01:31<6:05:21,  1.85s/it, loss=0.198, lr=1e-5]Steps:  21%|██        | 3164/15001 [2:01:33<6:14:01,  1.90s/it, loss=0.198, lr=1e-5]Steps:  21%|██        | 3164/15001 [2:01:34<6:14:01,  1.90s/it, loss=0.289, lr=1e-5]Steps:  21%|██        | 3165/15001 [2:01:35<6:26:13,  1.96s/it, loss=0.289, lr=1e-5]Steps:  21%|██        | 3165/15001 [2:01:36<6:26:13,  1.96s/it, loss=0.253, lr=1e-5]Steps:  21%|██        | 3166/15001 [2:01:38<6:41:51,  2.04s/it, loss=0.253, lr=1e-5]Steps:  21%|██        | 3166/15001 [2:01:38<6:41:51,  2.04s/it, loss=0.131, lr=1e-5]Steps:  21%|██        | 3167/15001 [2:01:40<6:40:23,  2.03s/it, loss=0.131, lr=1e-5]Steps:  21%|██        | 3167/15001 [2:01:40<6:40:23,  2.03s/it, loss=0.166, lr=1e-5]Steps:  21%|██        | 3168/15001 [2:01:41<6:23:27,  1.94s/it, loss=0.166, lr=1e-5]Steps:  21%|██        | 3168/15001 [2:01:41<6:23:27,  1.94s/it, loss=0.0365, lr=1e-5]Steps:  21%|██        | 3169/15001 [2:01:43<6:02:11,  1.84s/it, loss=0.0365, lr=1e-5]Steps:  21%|██        | 3169/15001 [2:01:43<6:02:11,  1.84s/it, loss=0.365, lr=1e-5] Steps:  21%|██        | 3170/15001 [2:01:45<6:17:18,  1.91s/it, loss=0.365, lr=1e-5]Steps:  21%|██        | 3170/15001 [2:01:45<6:17:18,  1.91s/it, loss=0.0615, lr=1e-5]Steps:  21%|██        | 3171/15001 [2:01:47<6:16:37,  1.91s/it, loss=0.0615, lr=1e-5]Steps:  21%|██        | 3171/15001 [2:01:47<6:16:37,  1.91s/it, loss=0.33, lr=1e-5]  Steps:  21%|██        | 3172/15001 [2:01:49<6:13:26,  1.89s/it, loss=0.33, lr=1e-5]Steps:  21%|██        | 3172/15001 [2:01:49<6:13:26,  1.89s/it, loss=0.138, lr=1e-5]Steps:  21%|██        | 3173/15001 [2:01:50<6:03:21,  1.84s/it, loss=0.138, lr=1e-5]Steps:  21%|██        | 3173/15001 [2:01:51<6:03:21,  1.84s/it, loss=0.165, lr=1e-5]Steps:  21%|██        | 3174/15001 [2:01:52<5:57:31,  1.81s/it, loss=0.165, lr=1e-5]Steps:  21%|██        | 3174/15001 [2:01:52<5:57:31,  1.81s/it, loss=0.192, lr=1e-5]Steps:  21%|██        | 3175/15001 [2:01:54<6:20:52,  1.93s/it, loss=0.192, lr=1e-5]Steps:  21%|██        | 3175/15001 [2:01:54<6:20:52,  1.93s/it, loss=0.275, lr=1e-5]Steps:  21%|██        | 3176/15001 [2:01:56<6:04:58,  1.85s/it, loss=0.275, lr=1e-5]Steps:  21%|██        | 3176/15001 [2:01:56<6:04:58,  1.85s/it, loss=0.109, lr=1e-5]Steps:  21%|██        | 3177/15001 [2:01:58<5:50:46,  1.78s/it, loss=0.109, lr=1e-5]Steps:  21%|██        | 3177/15001 [2:01:58<5:50:46,  1.78s/it, loss=0.0875, lr=1e-5]Steps:  21%|██        | 3178/15001 [2:02:00<6:26:11,  1.96s/it, loss=0.0875, lr=1e-5]Steps:  21%|██        | 3178/15001 [2:02:00<6:26:11,  1.96s/it, loss=0.205, lr=1e-5] Steps:  21%|██        | 3179/15001 [2:02:02<6:03:05,  1.84s/it, loss=0.205, lr=1e-5]Steps:  21%|██        | 3179/15001 [2:02:02<6:03:05,  1.84s/it, loss=0.0905, lr=1e-5]Steps:  21%|██        | 3180/15001 [2:02:03<5:48:45,  1.77s/it, loss=0.0905, lr=1e-5]Steps:  21%|██        | 3180/15001 [2:02:04<5:48:45,  1.77s/it, loss=0.167, lr=1e-5] Steps:  21%|██        | 3181/15001 [2:02:05<5:58:06,  1.82s/it, loss=0.167, lr=1e-5]Steps:  21%|██        | 3181/15001 [2:02:05<5:58:06,  1.82s/it, loss=0.129, lr=1e-5]Steps:  21%|██        | 3182/15001 [2:02:07<6:04:41,  1.85s/it, loss=0.129, lr=1e-5]Steps:  21%|██        | 3182/15001 [2:02:07<6:04:41,  1.85s/it, loss=0.162, lr=1e-5]Steps:  21%|██        | 3183/15001 [2:02:09<6:03:19,  1.84s/it, loss=0.162, lr=1e-5]Steps:  21%|██        | 3183/15001 [2:02:09<6:03:19,  1.84s/it, loss=0.287, lr=1e-5]Steps:  21%|██        | 3184/15001 [2:02:11<5:57:21,  1.81s/it, loss=0.287, lr=1e-5]Steps:  21%|██        | 3184/15001 [2:02:11<5:57:21,  1.81s/it, loss=0.159, lr=1e-5]Steps:  21%|██        | 3185/15001 [2:02:13<6:04:07,  1.85s/it, loss=0.159, lr=1e-5]Steps:  21%|██        | 3185/15001 [2:02:13<6:04:07,  1.85s/it, loss=0.133, lr=1e-5]Steps:  21%|██        | 3186/15001 [2:02:15<6:10:41,  1.88s/it, loss=0.133, lr=1e-5]Steps:  21%|██        | 3186/15001 [2:02:15<6:10:41,  1.88s/it, loss=0.3, lr=1e-5]  Steps:  21%|██        | 3187/15001 [2:02:17<6:29:02,  1.98s/it, loss=0.3, lr=1e-5]Steps:  21%|██        | 3187/15001 [2:02:17<6:29:02,  1.98s/it, loss=0.166, lr=1e-5]Steps:  21%|██▏       | 3188/15001 [2:02:19<6:37:04,  2.02s/it, loss=0.166, lr=1e-5]Steps:  21%|██▏       | 3188/15001 [2:02:19<6:37:04,  2.02s/it, loss=0.152, lr=1e-5]Steps:  21%|██▏       | 3189/15001 [2:02:21<6:27:40,  1.97s/it, loss=0.152, lr=1e-5]Steps:  21%|██▏       | 3189/15001 [2:02:21<6:27:40,  1.97s/it, loss=0.0811, lr=1e-5]Steps:  21%|██▏       | 3190/15001 [2:02:23<6:35:16,  2.01s/it, loss=0.0811, lr=1e-5]Steps:  21%|██▏       | 3190/15001 [2:02:23<6:35:16,  2.01s/it, loss=0.164, lr=1e-5] Steps:  21%|██▏       | 3191/15001 [2:02:25<6:23:42,  1.95s/it, loss=0.164, lr=1e-5]Steps:  21%|██▏       | 3191/15001 [2:02:25<6:23:42,  1.95s/it, loss=0.19, lr=1e-5] Steps:  21%|██▏       | 3192/15001 [2:02:27<6:38:59,  2.03s/it, loss=0.19, lr=1e-5]Steps:  21%|██▏       | 3192/15001 [2:02:27<6:38:59,  2.03s/it, loss=0.25, lr=1e-5]Steps:  21%|██▏       | 3193/15001 [2:02:29<6:27:28,  1.97s/it, loss=0.25, lr=1e-5]Steps:  21%|██▏       | 3193/15001 [2:02:29<6:27:28,  1.97s/it, loss=0.0965, lr=1e-5]Steps:  21%|██▏       | 3194/15001 [2:02:30<6:16:40,  1.91s/it, loss=0.0965, lr=1e-5]Steps:  21%|██▏       | 3194/15001 [2:02:31<6:16:40,  1.91s/it, loss=0.108, lr=1e-5] Steps:  21%|██▏       | 3195/15001 [2:02:32<6:04:58,  1.85s/it, loss=0.108, lr=1e-5]Steps:  21%|██▏       | 3195/15001 [2:02:33<6:04:58,  1.85s/it, loss=0.164, lr=1e-5]Steps:  21%|██▏       | 3196/15001 [2:02:34<6:19:54,  1.93s/it, loss=0.164, lr=1e-5]Steps:  21%|██▏       | 3196/15001 [2:02:34<6:19:54,  1.93s/it, loss=0.11, lr=1e-5] Steps:  21%|██▏       | 3197/15001 [2:02:36<6:14:23,  1.90s/it, loss=0.11, lr=1e-5]Steps:  21%|██▏       | 3197/15001 [2:02:36<6:14:23,  1.90s/it, loss=0.0409, lr=1e-5]Steps:  21%|██▏       | 3198/15001 [2:02:38<6:07:32,  1.87s/it, loss=0.0409, lr=1e-5]Steps:  21%|██▏       | 3198/15001 [2:02:38<6:07:32,  1.87s/it, loss=0.219, lr=1e-5] Steps:  21%|██▏       | 3199/15001 [2:02:40<6:02:21,  1.84s/it, loss=0.219, lr=1e-5]Steps:  21%|██▏       | 3199/15001 [2:02:40<6:02:21,  1.84s/it, loss=0.142, lr=1e-5]Steps:  21%|██▏       | 3200/15001 [2:02:42<6:06:28,  1.86s/it, loss=0.142, lr=1e-5]Steps:  21%|██▏       | 3200/15001 [2:02:42<6:06:28,  1.86s/it, loss=0.168, lr=1e-5]Steps:  21%|██▏       | 3201/15001 [2:02:43<5:56:14,  1.81s/it, loss=0.168, lr=1e-5]Steps:  21%|██▏       | 3201/15001 [2:02:43<5:56:14,  1.81s/it, loss=0.113, lr=1e-5]Steps:  21%|██▏       | 3202/15001 [2:02:45<5:57:51,  1.82s/it, loss=0.113, lr=1e-5]Steps:  21%|██▏       | 3202/15001 [2:02:45<5:57:51,  1.82s/it, loss=0.0774, lr=1e-5]Steps:  21%|██▏       | 3203/15001 [2:02:47<5:45:21,  1.76s/it, loss=0.0774, lr=1e-5]Steps:  21%|██▏       | 3203/15001 [2:02:47<5:45:21,  1.76s/it, loss=0.131, lr=1e-5] Steps:  21%|██▏       | 3204/15001 [2:02:49<6:08:40,  1.88s/it, loss=0.131, lr=1e-5]Steps:  21%|██▏       | 3204/15001 [2:02:49<6:08:40,  1.88s/it, loss=0.0712, lr=1e-5]Steps:  21%|██▏       | 3205/15001 [2:02:51<6:05:27,  1.86s/it, loss=0.0712, lr=1e-5]Steps:  21%|██▏       | 3205/15001 [2:02:51<6:05:27,  1.86s/it, loss=0.0159, lr=1e-5]Steps:  21%|██▏       | 3206/15001 [2:02:52<5:55:33,  1.81s/it, loss=0.0159, lr=1e-5]Steps:  21%|██▏       | 3206/15001 [2:02:53<5:55:33,  1.81s/it, loss=0.183, lr=1e-5] Steps:  21%|██▏       | 3207/15001 [2:02:54<6:01:15,  1.84s/it, loss=0.183, lr=1e-5]Steps:  21%|██▏       | 3207/15001 [2:02:54<6:01:15,  1.84s/it, loss=0.146, lr=1e-5]Steps:  21%|██▏       | 3208/15001 [2:02:56<6:14:20,  1.90s/it, loss=0.146, lr=1e-5]Steps:  21%|██▏       | 3208/15001 [2:02:56<6:14:20,  1.90s/it, loss=0.194, lr=1e-5]Steps:  21%|██▏       | 3209/15001 [2:02:58<6:20:07,  1.93s/it, loss=0.194, lr=1e-5]Steps:  21%|██▏       | 3209/15001 [2:02:58<6:20:07,  1.93s/it, loss=0.145, lr=1e-5]Steps:  21%|██▏       | 3210/15001 [2:03:00<6:12:12,  1.89s/it, loss=0.145, lr=1e-5]Steps:  21%|██▏       | 3210/15001 [2:03:00<6:12:12,  1.89s/it, loss=0.25, lr=1e-5] Steps:  21%|██▏       | 3211/15001 [2:03:02<6:19:28,  1.93s/it, loss=0.25, lr=1e-5]Steps:  21%|██▏       | 3211/15001 [2:03:02<6:19:28,  1.93s/it, loss=0.455, lr=1e-5]Steps:  21%|██▏       | 3212/15001 [2:03:04<6:25:29,  1.96s/it, loss=0.455, lr=1e-5]Steps:  21%|██▏       | 3212/15001 [2:03:04<6:25:29,  1.96s/it, loss=0.166, lr=1e-5]Steps:  21%|██▏       | 3213/15001 [2:03:06<6:25:05,  1.96s/it, loss=0.166, lr=1e-5]Steps:  21%|██▏       | 3213/15001 [2:03:06<6:25:05,  1.96s/it, loss=0.285, lr=1e-5]Steps:  21%|██▏       | 3214/15001 [2:03:08<6:18:40,  1.93s/it, loss=0.285, lr=1e-5]Steps:  21%|██▏       | 3214/15001 [2:03:08<6:18:40,  1.93s/it, loss=0.182, lr=1e-5]Steps:  21%|██▏       | 3215/15001 [2:03:10<6:11:42,  1.89s/it, loss=0.182, lr=1e-5]Steps:  21%|██▏       | 3215/15001 [2:03:10<6:11:42,  1.89s/it, loss=0.246, lr=1e-5]Steps:  21%|██▏       | 3216/15001 [2:03:12<6:01:13,  1.84s/it, loss=0.246, lr=1e-5]Steps:  21%|██▏       | 3216/15001 [2:03:12<6:01:13,  1.84s/it, loss=0.175, lr=1e-5]Steps:  21%|██▏       | 3217/15001 [2:03:14<6:12:35,  1.90s/it, loss=0.175, lr=1e-5]Steps:  21%|██▏       | 3217/15001 [2:03:14<6:12:35,  1.90s/it, loss=0.331, lr=1e-5]Steps:  21%|██▏       | 3218/15001 [2:03:15<5:41:48,  1.74s/it, loss=0.331, lr=1e-5]Steps:  21%|██▏       | 3218/15001 [2:03:15<5:41:48,  1.74s/it, loss=0.187, lr=1e-5]Steps:  21%|██▏       | 3219/15001 [2:03:17<5:58:25,  1.83s/it, loss=0.187, lr=1e-5]Steps:  21%|██▏       | 3219/15001 [2:03:17<5:58:25,  1.83s/it, loss=0.234, lr=1e-5]Steps:  21%|██▏       | 3220/15001 [2:03:19<6:13:11,  1.90s/it, loss=0.234, lr=1e-5]Steps:  21%|██▏       | 3220/15001 [2:03:19<6:13:11,  1.90s/it, loss=0.18, lr=1e-5] Steps:  21%|██▏       | 3221/15001 [2:03:21<6:04:01,  1.85s/it, loss=0.18, lr=1e-5]Steps:  21%|██▏       | 3221/15001 [2:03:21<6:04:01,  1.85s/it, loss=0.147, lr=1e-5]Steps:  21%|██▏       | 3222/15001 [2:03:23<6:04:40,  1.86s/it, loss=0.147, lr=1e-5]Steps:  21%|██▏       | 3222/15001 [2:03:23<6:04:40,  1.86s/it, loss=0.231, lr=1e-5]Steps:  21%|██▏       | 3223/15001 [2:03:24<5:47:48,  1.77s/it, loss=0.231, lr=1e-5]Steps:  21%|██▏       | 3223/15001 [2:03:25<5:47:48,  1.77s/it, loss=0.0788, lr=1e-5]Steps:  21%|██▏       | 3224/15001 [2:03:26<5:58:22,  1.83s/it, loss=0.0788, lr=1e-5]Steps:  21%|██▏       | 3224/15001 [2:03:27<5:58:22,  1.83s/it, loss=0.18, lr=1e-5]  Steps:  21%|██▏       | 3225/15001 [2:03:28<6:04:13,  1.86s/it, loss=0.18, lr=1e-5]Steps:  21%|██▏       | 3225/15001 [2:03:28<6:04:13,  1.86s/it, loss=0.182, lr=1e-5]Steps:  22%|██▏       | 3226/15001 [2:03:30<5:51:02,  1.79s/it, loss=0.182, lr=1e-5]Steps:  22%|██▏       | 3226/15001 [2:03:30<5:51:02,  1.79s/it, loss=0.0378, lr=1e-5]Steps:  22%|██▏       | 3227/15001 [2:03:32<5:54:31,  1.81s/it, loss=0.0378, lr=1e-5]Steps:  22%|██▏       | 3227/15001 [2:03:32<5:54:31,  1.81s/it, loss=0.0296, lr=1e-5]Steps:  22%|██▏       | 3228/15001 [2:03:33<5:45:28,  1.76s/it, loss=0.0296, lr=1e-5]Steps:  22%|██▏       | 3228/15001 [2:03:34<5:45:28,  1.76s/it, loss=0.086, lr=1e-5] Steps:  22%|██▏       | 3229/15001 [2:03:35<5:59:43,  1.83s/it, loss=0.086, lr=1e-5]Steps:  22%|██▏       | 3229/15001 [2:03:35<5:59:43,  1.83s/it, loss=0.0736, lr=1e-5]Steps:  22%|██▏       | 3230/15001 [2:03:37<5:56:07,  1.82s/it, loss=0.0736, lr=1e-5]Steps:  22%|██▏       | 3230/15001 [2:03:37<5:56:07,  1.82s/it, loss=0.198, lr=1e-5] Steps:  22%|██▏       | 3231/15001 [2:03:39<6:03:41,  1.85s/it, loss=0.198, lr=1e-5]Steps:  22%|██▏       | 3231/15001 [2:03:39<6:03:41,  1.85s/it, loss=0.291, lr=1e-5]Steps:  22%|██▏       | 3232/15001 [2:03:41<6:06:14,  1.87s/it, loss=0.291, lr=1e-5]Steps:  22%|██▏       | 3232/15001 [2:03:41<6:06:14,  1.87s/it, loss=0.179, lr=1e-5]Steps:  22%|██▏       | 3233/15001 [2:03:43<6:05:52,  1.87s/it, loss=0.179, lr=1e-5]Steps:  22%|██▏       | 3233/15001 [2:03:43<6:05:52,  1.87s/it, loss=0.27, lr=1e-5] Steps:  22%|██▏       | 3234/15001 [2:03:45<6:26:13,  1.97s/it, loss=0.27, lr=1e-5]Steps:  22%|██▏       | 3234/15001 [2:03:45<6:26:13,  1.97s/it, loss=0.116, lr=1e-5]Steps:  22%|██▏       | 3235/15001 [2:03:47<6:22:51,  1.95s/it, loss=0.116, lr=1e-5]Steps:  22%|██▏       | 3235/15001 [2:03:47<6:22:51,  1.95s/it, loss=0.0807, lr=1e-5]Steps:  22%|██▏       | 3236/15001 [2:03:49<6:40:28,  2.04s/it, loss=0.0807, lr=1e-5]Steps:  22%|██▏       | 3236/15001 [2:03:49<6:40:28,  2.04s/it, loss=0.213, lr=1e-5] Steps:  22%|██▏       | 3237/15001 [2:03:51<6:33:56,  2.01s/it, loss=0.213, lr=1e-5]Steps:  22%|██▏       | 3237/15001 [2:03:51<6:33:56,  2.01s/it, loss=0.12, lr=1e-5] Steps:  22%|██▏       | 3238/15001 [2:03:53<6:23:30,  1.96s/it, loss=0.12, lr=1e-5]Steps:  22%|██▏       | 3238/15001 [2:03:53<6:23:30,  1.96s/it, loss=0.155, lr=1e-5]Steps:  22%|██▏       | 3239/15001 [2:03:55<6:06:35,  1.87s/it, loss=0.155, lr=1e-5]Steps:  22%|██▏       | 3239/15001 [2:03:55<6:06:35,  1.87s/it, loss=0.176, lr=1e-5]Steps:  22%|██▏       | 3240/15001 [2:03:56<5:56:27,  1.82s/it, loss=0.176, lr=1e-5]Steps:  22%|██▏       | 3240/15001 [2:03:57<5:56:27,  1.82s/it, loss=0.141, lr=1e-5]Steps:  22%|██▏       | 3241/15001 [2:03:58<6:10:04,  1.89s/it, loss=0.141, lr=1e-5]Steps:  22%|██▏       | 3241/15001 [2:03:58<6:10:04,  1.89s/it, loss=0.0652, lr=1e-5]Steps:  22%|██▏       | 3242/15001 [2:04:00<5:53:22,  1.80s/it, loss=0.0652, lr=1e-5]Steps:  22%|██▏       | 3242/15001 [2:04:00<5:53:22,  1.80s/it, loss=0.221, lr=1e-5] Steps:  22%|██▏       | 3243/15001 [2:04:02<5:54:51,  1.81s/it, loss=0.221, lr=1e-5]Steps:  22%|██▏       | 3243/15001 [2:04:02<5:54:51,  1.81s/it, loss=0.0954, lr=1e-5]Steps:  22%|██▏       | 3244/15001 [2:04:04<6:01:58,  1.85s/it, loss=0.0954, lr=1e-5]Steps:  22%|██▏       | 3244/15001 [2:04:04<6:01:58,  1.85s/it, loss=0.211, lr=1e-5] Steps:  22%|██▏       | 3245/15001 [2:04:06<6:03:13,  1.85s/it, loss=0.211, lr=1e-5]Steps:  22%|██▏       | 3245/15001 [2:04:06<6:03:13,  1.85s/it, loss=0.0625, lr=1e-5]Steps:  22%|██▏       | 3246/15001 [2:04:07<5:42:41,  1.75s/it, loss=0.0625, lr=1e-5]Steps:  22%|██▏       | 3246/15001 [2:04:07<5:42:41,  1.75s/it, loss=0.386, lr=1e-5] Steps:  22%|██▏       | 3247/15001 [2:04:09<5:55:04,  1.81s/it, loss=0.386, lr=1e-5]Steps:  22%|██▏       | 3247/15001 [2:04:09<5:55:04,  1.81s/it, loss=0.19, lr=1e-5] Steps:  22%|██▏       | 3248/15001 [2:04:11<5:54:41,  1.81s/it, loss=0.19, lr=1e-5]Steps:  22%|██▏       | 3248/15001 [2:04:11<5:54:41,  1.81s/it, loss=0.0949, lr=1e-5]Steps:  22%|██▏       | 3249/15001 [2:04:13<5:54:55,  1.81s/it, loss=0.0949, lr=1e-5]Steps:  22%|██▏       | 3249/15001 [2:04:13<5:54:55,  1.81s/it, loss=0.213, lr=1e-5] Steps:  22%|██▏       | 3250/15001 [2:04:15<6:07:53,  1.88s/it, loss=0.213, lr=1e-5]Steps:  22%|██▏       | 3250/15001 [2:04:15<6:07:53,  1.88s/it, loss=0.207, lr=1e-5]Steps:  22%|██▏       | 3251/15001 [2:04:16<6:00:44,  1.84s/it, loss=0.207, lr=1e-5]Steps:  22%|██▏       | 3251/15001 [2:04:16<6:00:44,  1.84s/it, loss=0.28, lr=1e-5] Steps:  22%|██▏       | 3252/15001 [2:04:18<5:45:32,  1.76s/it, loss=0.28, lr=1e-5]Steps:  22%|██▏       | 3252/15001 [2:04:18<5:45:32,  1.76s/it, loss=0.306, lr=1e-5]Steps:  22%|██▏       | 3253/15001 [2:04:20<5:45:43,  1.77s/it, loss=0.306, lr=1e-5]Steps:  22%|██▏       | 3253/15001 [2:04:20<5:45:43,  1.77s/it, loss=0.211, lr=1e-5]Steps:  22%|██▏       | 3254/15001 [2:04:22<6:04:13,  1.86s/it, loss=0.211, lr=1e-5]Steps:  22%|██▏       | 3254/15001 [2:04:22<6:04:13,  1.86s/it, loss=0.141, lr=1e-5]Steps:  22%|██▏       | 3255/15001 [2:04:24<6:04:42,  1.86s/it, loss=0.141, lr=1e-5]Steps:  22%|██▏       | 3255/15001 [2:04:24<6:04:42,  1.86s/it, loss=0.205, lr=1e-5]Steps:  22%|██▏       | 3256/15001 [2:04:26<6:37:37,  2.03s/it, loss=0.205, lr=1e-5]Steps:  22%|██▏       | 3256/15001 [2:04:26<6:37:37,  2.03s/it, loss=0.193, lr=1e-5]Steps:  22%|██▏       | 3257/15001 [2:04:28<6:42:47,  2.06s/it, loss=0.193, lr=1e-5]Steps:  22%|██▏       | 3257/15001 [2:04:28<6:42:47,  2.06s/it, loss=0.0587, lr=1e-5]Steps:  22%|██▏       | 3258/15001 [2:04:30<6:33:03,  2.01s/it, loss=0.0587, lr=1e-5]Steps:  22%|██▏       | 3258/15001 [2:04:30<6:33:03,  2.01s/it, loss=0.28, lr=1e-5]  Steps:  22%|██▏       | 3259/15001 [2:04:32<6:39:18,  2.04s/it, loss=0.28, lr=1e-5]Steps:  22%|██▏       | 3259/15001 [2:04:32<6:39:18,  2.04s/it, loss=0.189, lr=1e-5]Steps:  22%|██▏       | 3260/15001 [2:04:34<6:22:11,  1.95s/it, loss=0.189, lr=1e-5]Steps:  22%|██▏       | 3260/15001 [2:04:34<6:22:11,  1.95s/it, loss=0.132, lr=1e-5]Steps:  22%|██▏       | 3261/15001 [2:04:36<6:22:58,  1.96s/it, loss=0.132, lr=1e-5]Steps:  22%|██▏       | 3261/15001 [2:04:36<6:22:58,  1.96s/it, loss=0.0575, lr=1e-5]Steps:  22%|██▏       | 3262/15001 [2:04:38<6:13:20,  1.91s/it, loss=0.0575, lr=1e-5]Steps:  22%|██▏       | 3262/15001 [2:04:38<6:13:20,  1.91s/it, loss=0.163, lr=1e-5] Steps:  22%|██▏       | 3263/15001 [2:04:39<5:47:22,  1.78s/it, loss=0.163, lr=1e-5]Steps:  22%|██▏       | 3263/15001 [2:04:40<5:47:22,  1.78s/it, loss=0.165, lr=1e-5]Steps:  22%|██▏       | 3264/15001 [2:04:41<6:04:37,  1.86s/it, loss=0.165, lr=1e-5]Steps:  22%|██▏       | 3264/15001 [2:04:42<6:04:37,  1.86s/it, loss=0.234, lr=1e-5]Steps:  22%|██▏       | 3265/15001 [2:04:43<6:06:20,  1.87s/it, loss=0.234, lr=1e-5]Steps:  22%|██▏       | 3265/15001 [2:04:43<6:06:20,  1.87s/it, loss=0.0687, lr=1e-5]Steps:  22%|██▏       | 3266/15001 [2:04:45<6:10:52,  1.90s/it, loss=0.0687, lr=1e-5]Steps:  22%|██▏       | 3266/15001 [2:04:45<6:10:52,  1.90s/it, loss=0.0705, lr=1e-5]Steps:  22%|██▏       | 3267/15001 [2:04:47<5:57:07,  1.83s/it, loss=0.0705, lr=1e-5]Steps:  22%|██▏       | 3267/15001 [2:04:47<5:57:07,  1.83s/it, loss=0.264, lr=1e-5] Steps:  22%|██▏       | 3268/15001 [2:04:49<5:51:30,  1.80s/it, loss=0.264, lr=1e-5]Steps:  22%|██▏       | 3268/15001 [2:04:49<5:51:30,  1.80s/it, loss=0.0223, lr=1e-5]Steps:  22%|██▏       | 3269/15001 [2:04:50<5:45:42,  1.77s/it, loss=0.0223, lr=1e-5]Steps:  22%|██▏       | 3269/15001 [2:04:51<5:45:42,  1.77s/it, loss=0.159, lr=1e-5] Steps:  22%|██▏       | 3270/15001 [2:04:52<5:58:52,  1.84s/it, loss=0.159, lr=1e-5]Steps:  22%|██▏       | 3270/15001 [2:04:52<5:58:52,  1.84s/it, loss=0.0213, lr=1e-5]Steps:  22%|██▏       | 3271/15001 [2:04:54<5:46:27,  1.77s/it, loss=0.0213, lr=1e-5]Steps:  22%|██▏       | 3271/15001 [2:04:54<5:46:27,  1.77s/it, loss=0.389, lr=1e-5] Steps:  22%|██▏       | 3272/15001 [2:04:56<5:55:04,  1.82s/it, loss=0.389, lr=1e-5]Steps:  22%|██▏       | 3272/15001 [2:04:56<5:55:04,  1.82s/it, loss=0.253, lr=1e-5]Steps:  22%|██▏       | 3273/15001 [2:04:58<5:55:36,  1.82s/it, loss=0.253, lr=1e-5]Steps:  22%|██▏       | 3273/15001 [2:04:58<5:55:36,  1.82s/it, loss=0.03, lr=1e-5] Steps:  22%|██▏       | 3274/15001 [2:04:59<5:49:23,  1.79s/it, loss=0.03, lr=1e-5]Steps:  22%|██▏       | 3274/15001 [2:05:00<5:49:23,  1.79s/it, loss=0.0605, lr=1e-5]Steps:  22%|██▏       | 3275/15001 [2:05:01<6:07:51,  1.88s/it, loss=0.0605, lr=1e-5]Steps:  22%|██▏       | 3275/15001 [2:05:01<6:07:51,  1.88s/it, loss=0.2, lr=1e-5]   Steps:  22%|██▏       | 3276/15001 [2:05:03<5:58:46,  1.84s/it, loss=0.2, lr=1e-5]Steps:  22%|██▏       | 3276/15001 [2:05:03<5:58:46,  1.84s/it, loss=0.102, lr=1e-5]Steps:  22%|██▏       | 3277/15001 [2:05:05<6:18:59,  1.94s/it, loss=0.102, lr=1e-5]Steps:  22%|██▏       | 3277/15001 [2:05:05<6:18:59,  1.94s/it, loss=0.0482, lr=1e-5]Steps:  22%|██▏       | 3278/15001 [2:05:07<6:11:08,  1.90s/it, loss=0.0482, lr=1e-5]Steps:  22%|██▏       | 3278/15001 [2:05:07<6:11:08,  1.90s/it, loss=0.0795, lr=1e-5]Steps:  22%|██▏       | 3279/15001 [2:05:09<6:21:38,  1.95s/it, loss=0.0795, lr=1e-5]Steps:  22%|██▏       | 3279/15001 [2:05:09<6:21:38,  1.95s/it, loss=0.368, lr=1e-5] Steps:  22%|██▏       | 3280/15001 [2:05:11<6:28:47,  1.99s/it, loss=0.368, lr=1e-5]Steps:  22%|██▏       | 3280/15001 [2:05:11<6:28:47,  1.99s/it, loss=0.194, lr=1e-5]Steps:  22%|██▏       | 3281/15001 [2:05:13<6:27:38,  1.98s/it, loss=0.194, lr=1e-5]Steps:  22%|██▏       | 3281/15001 [2:05:13<6:27:38,  1.98s/it, loss=0.161, lr=1e-5]Steps:  22%|██▏       | 3282/15001 [2:05:15<6:21:18,  1.95s/it, loss=0.161, lr=1e-5]Steps:  22%|██▏       | 3282/15001 [2:05:15<6:21:18,  1.95s/it, loss=0.126, lr=1e-5]Steps:  22%|██▏       | 3283/15001 [2:05:17<6:14:13,  1.92s/it, loss=0.126, lr=1e-5]Steps:  22%|██▏       | 3283/15001 [2:05:17<6:14:13,  1.92s/it, loss=0.122, lr=1e-5]Steps:  22%|██▏       | 3284/15001 [2:05:19<6:10:17,  1.90s/it, loss=0.122, lr=1e-5]Steps:  22%|██▏       | 3284/15001 [2:05:19<6:10:17,  1.90s/it, loss=0.0885, lr=1e-5]Steps:  22%|██▏       | 3285/15001 [2:05:21<6:01:45,  1.85s/it, loss=0.0885, lr=1e-5]Steps:  22%|██▏       | 3285/15001 [2:05:21<6:01:45,  1.85s/it, loss=0.0557, lr=1e-5]Steps:  22%|██▏       | 3286/15001 [2:05:22<5:55:52,  1.82s/it, loss=0.0557, lr=1e-5]Steps:  22%|██▏       | 3286/15001 [2:05:23<5:55:52,  1.82s/it, loss=0.327, lr=1e-5] Steps:  22%|██▏       | 3287/15001 [2:05:24<5:47:31,  1.78s/it, loss=0.327, lr=1e-5]Steps:  22%|██▏       | 3287/15001 [2:05:24<5:47:31,  1.78s/it, loss=0.162, lr=1e-5]Steps:  22%|██▏       | 3288/15001 [2:05:26<5:45:45,  1.77s/it, loss=0.162, lr=1e-5]Steps:  22%|██▏       | 3288/15001 [2:05:26<5:45:45,  1.77s/it, loss=0.121, lr=1e-5]Steps:  22%|██▏       | 3289/15001 [2:05:28<6:02:39,  1.86s/it, loss=0.121, lr=1e-5]Steps:  22%|██▏       | 3289/15001 [2:05:28<6:02:39,  1.86s/it, loss=0.159, lr=1e-5]Steps:  22%|██▏       | 3290/15001 [2:05:30<6:03:10,  1.86s/it, loss=0.159, lr=1e-5]Steps:  22%|██▏       | 3290/15001 [2:05:30<6:03:10,  1.86s/it, loss=0.28, lr=1e-5] Steps:  22%|██▏       | 3291/15001 [2:05:32<6:06:54,  1.88s/it, loss=0.28, lr=1e-5]Steps:  22%|██▏       | 3291/15001 [2:05:32<6:06:54,  1.88s/it, loss=0.107, lr=1e-5]Steps:  22%|██▏       | 3292/15001 [2:05:33<5:43:05,  1.76s/it, loss=0.107, lr=1e-5]Steps:  22%|██▏       | 3292/15001 [2:05:34<5:43:05,  1.76s/it, loss=0.125, lr=1e-5]Steps:  22%|██▏       | 3293/15001 [2:05:35<5:54:11,  1.82s/it, loss=0.125, lr=1e-5]Steps:  22%|██▏       | 3293/15001 [2:05:35<5:54:11,  1.82s/it, loss=0.0645, lr=1e-5]Steps:  22%|██▏       | 3294/15001 [2:05:37<6:06:11,  1.88s/it, loss=0.0645, lr=1e-5]Steps:  22%|██▏       | 3294/15001 [2:05:37<6:06:11,  1.88s/it, loss=0.128, lr=1e-5] Steps:  22%|██▏       | 3295/15001 [2:05:39<5:59:56,  1.84s/it, loss=0.128, lr=1e-5]Steps:  22%|██▏       | 3295/15001 [2:05:39<5:59:56,  1.84s/it, loss=0.193, lr=1e-5]Steps:  22%|██▏       | 3296/15001 [2:05:41<6:00:58,  1.85s/it, loss=0.193, lr=1e-5]Steps:  22%|██▏       | 3296/15001 [2:05:41<6:00:58,  1.85s/it, loss=0.301, lr=1e-5]Steps:  22%|██▏       | 3297/15001 [2:05:43<6:07:54,  1.89s/it, loss=0.301, lr=1e-5]Steps:  22%|██▏       | 3297/15001 [2:05:43<6:07:54,  1.89s/it, loss=0.116, lr=1e-5]Steps:  22%|██▏       | 3298/15001 [2:05:45<6:09:18,  1.89s/it, loss=0.116, lr=1e-5]Steps:  22%|██▏       | 3298/15001 [2:05:45<6:09:18,  1.89s/it, loss=0.26, lr=1e-5] Steps:  22%|██▏       | 3299/15001 [2:05:46<6:05:27,  1.87s/it, loss=0.26, lr=1e-5]Steps:  22%|██▏       | 3299/15001 [2:05:47<6:05:27,  1.87s/it, loss=0.108, lr=1e-5]Steps:  22%|██▏       | 3300/15001 [2:05:48<6:06:02,  1.88s/it, loss=0.108, lr=1e-5]Steps:  22%|██▏       | 3300/15001 [2:05:49<6:06:02,  1.88s/it, loss=0.367, lr=1e-5]Steps:  22%|██▏       | 3301/15001 [2:05:50<6:13:03,  1.91s/it, loss=0.367, lr=1e-5]Steps:  22%|██▏       | 3301/15001 [2:05:50<6:13:03,  1.91s/it, loss=0.215, lr=1e-5]Steps:  22%|██▏       | 3302/15001 [2:05:52<6:26:02,  1.98s/it, loss=0.215, lr=1e-5]Steps:  22%|██▏       | 3302/15001 [2:05:53<6:26:02,  1.98s/it, loss=0.134, lr=1e-5]Steps:  22%|██▏       | 3303/15001 [2:05:54<6:17:57,  1.94s/it, loss=0.134, lr=1e-5]Steps:  22%|██▏       | 3303/15001 [2:05:55<6:17:57,  1.94s/it, loss=0.194, lr=1e-5]Steps:  22%|██▏       | 3304/15001 [2:05:57<6:38:08,  2.04s/it, loss=0.194, lr=1e-5]Steps:  22%|██▏       | 3304/15001 [2:05:57<6:38:08,  2.04s/it, loss=0.153, lr=1e-5]Steps:  22%|██▏       | 3305/15001 [2:05:59<6:39:54,  2.05s/it, loss=0.153, lr=1e-5]Steps:  22%|██▏       | 3305/15001 [2:05:59<6:39:54,  2.05s/it, loss=0.233, lr=1e-5]Steps:  22%|██▏       | 3306/15001 [2:06:00<6:15:42,  1.93s/it, loss=0.233, lr=1e-5]Steps:  22%|██▏       | 3306/15001 [2:06:01<6:15:42,  1.93s/it, loss=0.173, lr=1e-5]Steps:  22%|██▏       | 3307/15001 [2:06:02<6:13:14,  1.92s/it, loss=0.173, lr=1e-5]Steps:  22%|██▏       | 3307/15001 [2:06:02<6:13:14,  1.92s/it, loss=0.123, lr=1e-5]Steps:  22%|██▏       | 3308/15001 [2:06:04<5:59:57,  1.85s/it, loss=0.123, lr=1e-5]Steps:  22%|██▏       | 3308/15001 [2:06:04<5:59:57,  1.85s/it, loss=0.131, lr=1e-5]Steps:  22%|██▏       | 3309/15001 [2:06:06<6:02:29,  1.86s/it, loss=0.131, lr=1e-5]Steps:  22%|██▏       | 3309/15001 [2:06:06<6:02:29,  1.86s/it, loss=0.0455, lr=1e-5]Steps:  22%|██▏       | 3310/15001 [2:06:08<6:05:26,  1.88s/it, loss=0.0455, lr=1e-5]Steps:  22%|██▏       | 3310/15001 [2:06:08<6:05:26,  1.88s/it, loss=0.00688, lr=1e-5]Steps:  22%|██▏       | 3311/15001 [2:06:09<5:56:17,  1.83s/it, loss=0.00688, lr=1e-5]Steps:  22%|██▏       | 3311/15001 [2:06:10<5:56:17,  1.83s/it, loss=0.252, lr=1e-5]  Steps:  22%|██▏       | 3312/15001 [2:06:11<6:07:49,  1.89s/it, loss=0.252, lr=1e-5]Steps:  22%|██▏       | 3312/15001 [2:06:11<6:07:49,  1.89s/it, loss=0.224, lr=1e-5]Steps:  22%|██▏       | 3313/15001 [2:06:13<5:54:03,  1.82s/it, loss=0.224, lr=1e-5]Steps:  22%|██▏       | 3313/15001 [2:06:13<5:54:03,  1.82s/it, loss=0.228, lr=1e-5]Steps:  22%|██▏       | 3314/15001 [2:06:15<6:07:33,  1.89s/it, loss=0.228, lr=1e-5]Steps:  22%|██▏       | 3314/15001 [2:06:15<6:07:33,  1.89s/it, loss=0.156, lr=1e-5]Steps:  22%|██▏       | 3315/15001 [2:06:17<5:48:59,  1.79s/it, loss=0.156, lr=1e-5]Steps:  22%|██▏       | 3315/15001 [2:06:17<5:48:59,  1.79s/it, loss=0.243, lr=1e-5]Steps:  22%|██▏       | 3316/15001 [2:06:19<6:01:32,  1.86s/it, loss=0.243, lr=1e-5]Steps:  22%|██▏       | 3316/15001 [2:06:19<6:01:32,  1.86s/it, loss=0.128, lr=1e-5]Steps:  22%|██▏       | 3317/15001 [2:06:20<5:57:11,  1.83s/it, loss=0.128, lr=1e-5]Steps:  22%|██▏       | 3317/15001 [2:06:20<5:57:11,  1.83s/it, loss=0.115, lr=1e-5]Steps:  22%|██▏       | 3318/15001 [2:06:22<5:39:14,  1.74s/it, loss=0.115, lr=1e-5]Steps:  22%|██▏       | 3318/15001 [2:06:22<5:39:14,  1.74s/it, loss=0.177, lr=1e-5]Steps:  22%|██▏       | 3319/15001 [2:06:24<5:44:36,  1.77s/it, loss=0.177, lr=1e-5]Steps:  22%|██▏       | 3319/15001 [2:06:24<5:44:36,  1.77s/it, loss=0.07, lr=1e-5] Steps:  22%|██▏       | 3320/15001 [2:06:25<5:39:19,  1.74s/it, loss=0.07, lr=1e-5]Steps:  22%|██▏       | 3320/15001 [2:06:26<5:39:19,  1.74s/it, loss=0.122, lr=1e-5]Steps:  22%|██▏       | 3321/15001 [2:06:28<5:58:25,  1.84s/it, loss=0.122, lr=1e-5]Steps:  22%|██▏       | 3321/15001 [2:06:28<5:58:25,  1.84s/it, loss=0.0933, lr=1e-5]Steps:  22%|██▏       | 3322/15001 [2:06:29<6:00:29,  1.85s/it, loss=0.0933, lr=1e-5]Steps:  22%|██▏       | 3322/15001 [2:06:29<6:00:29,  1.85s/it, loss=0.184, lr=1e-5] Steps:  22%|██▏       | 3323/15001 [2:06:31<6:06:30,  1.88s/it, loss=0.184, lr=1e-5]Steps:  22%|██▏       | 3323/15001 [2:06:31<6:06:30,  1.88s/it, loss=0.18, lr=1e-5] Steps:  22%|██▏       | 3324/15001 [2:06:33<5:50:21,  1.80s/it, loss=0.18, lr=1e-5]Steps:  22%|██▏       | 3324/15001 [2:06:33<5:50:21,  1.80s/it, loss=0.0948, lr=1e-5]Steps:  22%|██▏       | 3325/15001 [2:06:35<6:15:08,  1.93s/it, loss=0.0948, lr=1e-5]Steps:  22%|██▏       | 3325/15001 [2:06:35<6:15:08,  1.93s/it, loss=0.285, lr=1e-5] Steps:  22%|██▏       | 3326/15001 [2:06:37<6:19:11,  1.95s/it, loss=0.285, lr=1e-5]Steps:  22%|██▏       | 3326/15001 [2:06:37<6:19:11,  1.95s/it, loss=0.0445, lr=1e-5]Steps:  22%|██▏       | 3327/15001 [2:06:39<6:24:42,  1.98s/it, loss=0.0445, lr=1e-5]Steps:  22%|██▏       | 3327/15001 [2:06:39<6:24:42,  1.98s/it, loss=0.0889, lr=1e-5]Steps:  22%|██▏       | 3328/15001 [2:06:41<6:24:18,  1.98s/it, loss=0.0889, lr=1e-5]Steps:  22%|██▏       | 3328/15001 [2:06:41<6:24:18,  1.98s/it, loss=0.069, lr=1e-5] Steps:  22%|██▏       | 3329/15001 [2:06:43<6:09:48,  1.90s/it, loss=0.069, lr=1e-5]Steps:  22%|██▏       | 3329/15001 [2:06:43<6:09:48,  1.90s/it, loss=0.19, lr=1e-5] Steps:  22%|██▏       | 3330/15001 [2:06:45<5:54:37,  1.82s/it, loss=0.19, lr=1e-5]Steps:  22%|██▏       | 3330/15001 [2:06:45<5:54:37,  1.82s/it, loss=0.13, lr=1e-5]Steps:  22%|██▏       | 3331/15001 [2:06:47<5:59:48,  1.85s/it, loss=0.13, lr=1e-5]Steps:  22%|██▏       | 3331/15001 [2:06:47<5:59:48,  1.85s/it, loss=0.11, lr=1e-5]Steps:  22%|██▏       | 3332/15001 [2:06:48<5:59:01,  1.85s/it, loss=0.11, lr=1e-5]Steps:  22%|██▏       | 3332/15001 [2:06:48<5:59:01,  1.85s/it, loss=0.157, lr=1e-5]Steps:  22%|██▏       | 3333/15001 [2:06:50<5:51:27,  1.81s/it, loss=0.157, lr=1e-5]Steps:  22%|██▏       | 3333/15001 [2:06:50<5:51:27,  1.81s/it, loss=0.2, lr=1e-5]  Steps:  22%|██▏       | 3334/15001 [2:06:52<5:49:00,  1.79s/it, loss=0.2, lr=1e-5]Steps:  22%|██▏       | 3334/15001 [2:06:52<5:49:00,  1.79s/it, loss=0.174, lr=1e-5]Steps:  22%|██▏       | 3335/15001 [2:06:54<6:03:13,  1.87s/it, loss=0.174, lr=1e-5]Steps:  22%|██▏       | 3335/15001 [2:06:54<6:03:13,  1.87s/it, loss=0.238, lr=1e-5]Steps:  22%|██▏       | 3336/15001 [2:06:56<5:55:21,  1.83s/it, loss=0.238, lr=1e-5]Steps:  22%|██▏       | 3336/15001 [2:06:56<5:55:21,  1.83s/it, loss=0.189, lr=1e-5]Steps:  22%|██▏       | 3337/15001 [2:06:57<5:42:49,  1.76s/it, loss=0.189, lr=1e-5]Steps:  22%|██▏       | 3337/15001 [2:06:58<5:42:49,  1.76s/it, loss=0.172, lr=1e-5]Steps:  22%|██▏       | 3338/15001 [2:06:59<5:57:32,  1.84s/it, loss=0.172, lr=1e-5]Steps:  22%|██▏       | 3338/15001 [2:06:59<5:57:32,  1.84s/it, loss=0.14, lr=1e-5] Steps:  22%|██▏       | 3339/15001 [2:07:01<5:51:50,  1.81s/it, loss=0.14, lr=1e-5]Steps:  22%|██▏       | 3339/15001 [2:07:01<5:51:50,  1.81s/it, loss=0.187, lr=1e-5]Steps:  22%|██▏       | 3340/15001 [2:07:03<6:07:28,  1.89s/it, loss=0.187, lr=1e-5]Steps:  22%|██▏       | 3340/15001 [2:07:03<6:07:28,  1.89s/it, loss=0.0432, lr=1e-5]Steps:  22%|██▏       | 3341/15001 [2:07:05<6:02:00,  1.86s/it, loss=0.0432, lr=1e-5]Steps:  22%|██▏       | 3341/15001 [2:07:05<6:02:00,  1.86s/it, loss=0.0419, lr=1e-5]Steps:  22%|██▏       | 3342/15001 [2:07:07<6:01:37,  1.86s/it, loss=0.0419, lr=1e-5]Steps:  22%|██▏       | 3342/15001 [2:07:07<6:01:37,  1.86s/it, loss=0.126, lr=1e-5] Steps:  22%|██▏       | 3343/15001 [2:07:08<5:49:38,  1.80s/it, loss=0.126, lr=1e-5]Steps:  22%|██▏       | 3343/15001 [2:07:09<5:49:38,  1.80s/it, loss=0.0335, lr=1e-5]Steps:  22%|██▏       | 3344/15001 [2:07:10<5:48:11,  1.79s/it, loss=0.0335, lr=1e-5]Steps:  22%|██▏       | 3344/15001 [2:07:10<5:48:11,  1.79s/it, loss=0.104, lr=1e-5] Steps:  22%|██▏       | 3345/15001 [2:07:12<5:55:45,  1.83s/it, loss=0.104, lr=1e-5]Steps:  22%|██▏       | 3345/15001 [2:07:13<5:55:45,  1.83s/it, loss=0.306, lr=1e-5]Steps:  22%|██▏       | 3346/15001 [2:07:14<6:22:44,  1.97s/it, loss=0.306, lr=1e-5]Steps:  22%|██▏       | 3346/15001 [2:07:14<6:22:44,  1.97s/it, loss=0.107, lr=1e-5]Steps:  22%|██▏       | 3347/15001 [2:07:16<6:10:29,  1.91s/it, loss=0.107, lr=1e-5]Steps:  22%|██▏       | 3347/15001 [2:07:16<6:10:29,  1.91s/it, loss=0.38, lr=1e-5] Steps:  22%|██▏       | 3348/15001 [2:07:18<6:28:16,  2.00s/it, loss=0.38, lr=1e-5]Steps:  22%|██▏       | 3348/15001 [2:07:18<6:28:16,  2.00s/it, loss=0.0525, lr=1e-5]Steps:  22%|██▏       | 3349/15001 [2:07:20<6:25:30,  1.99s/it, loss=0.0525, lr=1e-5]Steps:  22%|██▏       | 3349/15001 [2:07:20<6:25:30,  1.99s/it, loss=0.116, lr=1e-5] Steps:  22%|██▏       | 3350/15001 [2:07:22<6:20:24,  1.96s/it, loss=0.116, lr=1e-5]Steps:  22%|██▏       | 3350/15001 [2:07:22<6:20:24,  1.96s/it, loss=0.0271, lr=1e-5]Steps:  22%|██▏       | 3351/15001 [2:07:24<6:22:33,  1.97s/it, loss=0.0271, lr=1e-5]Steps:  22%|██▏       | 3351/15001 [2:07:24<6:22:33,  1.97s/it, loss=0.0525, lr=1e-5]Steps:  22%|██▏       | 3352/15001 [2:07:26<6:00:45,  1.86s/it, loss=0.0525, lr=1e-5]Steps:  22%|██▏       | 3352/15001 [2:07:26<6:00:45,  1.86s/it, loss=0.234, lr=1e-5] Steps:  22%|██▏       | 3353/15001 [2:07:28<6:03:04,  1.87s/it, loss=0.234, lr=1e-5]Steps:  22%|██▏       | 3353/15001 [2:07:28<6:03:04,  1.87s/it, loss=0.263, lr=1e-5]Steps:  22%|██▏       | 3354/15001 [2:07:30<6:04:00,  1.88s/it, loss=0.263, lr=1e-5]Steps:  22%|██▏       | 3354/15001 [2:07:30<6:04:00,  1.88s/it, loss=0.147, lr=1e-5]Steps:  22%|██▏       | 3355/15001 [2:07:31<5:59:08,  1.85s/it, loss=0.147, lr=1e-5]Steps:  22%|██▏       | 3355/15001 [2:07:31<5:59:08,  1.85s/it, loss=0.158, lr=1e-5]Steps:  22%|██▏       | 3356/15001 [2:07:33<5:51:20,  1.81s/it, loss=0.158, lr=1e-5]Steps:  22%|██▏       | 3356/15001 [2:07:33<5:51:20,  1.81s/it, loss=0.265, lr=1e-5]Steps:  22%|██▏       | 3357/15001 [2:07:35<5:57:37,  1.84s/it, loss=0.265, lr=1e-5]Steps:  22%|██▏       | 3357/15001 [2:07:35<5:57:37,  1.84s/it, loss=0.0587, lr=1e-5]Steps:  22%|██▏       | 3358/15001 [2:07:37<5:41:22,  1.76s/it, loss=0.0587, lr=1e-5]Steps:  22%|██▏       | 3358/15001 [2:07:37<5:41:22,  1.76s/it, loss=0.123, lr=1e-5] Steps:  22%|██▏       | 3359/15001 [2:07:38<5:52:04,  1.81s/it, loss=0.123, lr=1e-5]Steps:  22%|██▏       | 3359/15001 [2:07:39<5:52:04,  1.81s/it, loss=0.118, lr=1e-5]Steps:  22%|██▏       | 3360/15001 [2:07:40<5:47:55,  1.79s/it, loss=0.118, lr=1e-5]Steps:  22%|██▏       | 3360/15001 [2:07:41<5:47:55,  1.79s/it, loss=0.181, lr=1e-5]Steps:  22%|██▏       | 3361/15001 [2:07:42<6:04:09,  1.88s/it, loss=0.181, lr=1e-5]Steps:  22%|██▏       | 3361/15001 [2:07:42<6:04:09,  1.88s/it, loss=0.23, lr=1e-5] Steps:  22%|██▏       | 3362/15001 [2:07:44<6:03:19,  1.87s/it, loss=0.23, lr=1e-5]Steps:  22%|██▏       | 3362/15001 [2:07:44<6:03:19,  1.87s/it, loss=0.066, lr=1e-5]Steps:  22%|██▏       | 3363/15001 [2:07:46<5:56:43,  1.84s/it, loss=0.066, lr=1e-5]Steps:  22%|██▏       | 3363/15001 [2:07:46<5:56:43,  1.84s/it, loss=0.125, lr=1e-5]Steps:  22%|██▏       | 3364/15001 [2:07:47<5:40:56,  1.76s/it, loss=0.125, lr=1e-5]Steps:  22%|██▏       | 3364/15001 [2:07:48<5:40:56,  1.76s/it, loss=0.0657, lr=1e-5]Steps:  22%|██▏       | 3365/15001 [2:07:49<5:49:04,  1.80s/it, loss=0.0657, lr=1e-5]Steps:  22%|██▏       | 3365/15001 [2:07:50<5:49:04,  1.80s/it, loss=0.0796, lr=1e-5]Steps:  22%|██▏       | 3366/15001 [2:07:51<5:58:22,  1.85s/it, loss=0.0796, lr=1e-5]Steps:  22%|██▏       | 3366/15001 [2:07:52<5:58:22,  1.85s/it, loss=0.0999, lr=1e-5]Steps:  22%|██▏       | 3367/15001 [2:07:53<5:52:33,  1.82s/it, loss=0.0999, lr=1e-5]Steps:  22%|██▏       | 3367/15001 [2:07:53<5:52:33,  1.82s/it, loss=0.0506, lr=1e-5]Steps:  22%|██▏       | 3368/15001 [2:07:55<6:05:01,  1.88s/it, loss=0.0506, lr=1e-5]Steps:  22%|██▏       | 3368/15001 [2:07:55<6:05:01,  1.88s/it, loss=0.0987, lr=1e-5]Steps:  22%|██▏       | 3369/15001 [2:07:57<6:00:48,  1.86s/it, loss=0.0987, lr=1e-5]Steps:  22%|██▏       | 3369/15001 [2:07:57<6:00:48,  1.86s/it, loss=0.205, lr=1e-5] Steps:  22%|██▏       | 3370/15001 [2:07:59<6:24:38,  1.98s/it, loss=0.205, lr=1e-5]Steps:  22%|██▏       | 3370/15001 [2:07:59<6:24:38,  1.98s/it, loss=0.185, lr=1e-5]Steps:  22%|██▏       | 3371/15001 [2:08:01<6:19:42,  1.96s/it, loss=0.185, lr=1e-5]Steps:  22%|██▏       | 3371/15001 [2:08:01<6:19:42,  1.96s/it, loss=0.18, lr=1e-5] Steps:  22%|██▏       | 3372/15001 [2:08:03<6:18:52,  1.95s/it, loss=0.18, lr=1e-5]Steps:  22%|██▏       | 3372/15001 [2:08:03<6:18:52,  1.95s/it, loss=0.215, lr=1e-5]Steps:  22%|██▏       | 3373/15001 [2:08:05<6:22:27,  1.97s/it, loss=0.215, lr=1e-5]Steps:  22%|██▏       | 3373/15001 [2:08:05<6:22:27,  1.97s/it, loss=0.235, lr=1e-5]Steps:  22%|██▏       | 3374/15001 [2:08:07<6:34:52,  2.04s/it, loss=0.235, lr=1e-5]Steps:  22%|██▏       | 3374/15001 [2:08:08<6:34:52,  2.04s/it, loss=0.329, lr=1e-5]Steps:  22%|██▏       | 3375/15001 [2:08:09<6:31:15,  2.02s/it, loss=0.329, lr=1e-5]Steps:  22%|██▏       | 3375/15001 [2:08:09<6:31:15,  2.02s/it, loss=0.0439, lr=1e-5]Steps:  23%|██▎       | 3376/15001 [2:08:11<6:02:00,  1.87s/it, loss=0.0439, lr=1e-5]Steps:  23%|██▎       | 3376/15001 [2:08:11<6:02:00,  1.87s/it, loss=0.179, lr=1e-5] Steps:  23%|██▎       | 3377/15001 [2:08:13<6:18:31,  1.95s/it, loss=0.179, lr=1e-5]Steps:  23%|██▎       | 3377/15001 [2:08:13<6:18:31,  1.95s/it, loss=0.0824, lr=1e-5]Steps:  23%|██▎       | 3378/15001 [2:08:15<6:18:36,  1.95s/it, loss=0.0824, lr=1e-5]Steps:  23%|██▎       | 3378/15001 [2:08:15<6:18:36,  1.95s/it, loss=0.227, lr=1e-5] Steps:  23%|██▎       | 3379/15001 [2:08:17<6:03:58,  1.88s/it, loss=0.227, lr=1e-5]Steps:  23%|██▎       | 3379/15001 [2:08:17<6:03:58,  1.88s/it, loss=0.0427, lr=1e-5]Steps:  23%|██▎       | 3380/15001 [2:08:18<5:47:41,  1.80s/it, loss=0.0427, lr=1e-5]Steps:  23%|██▎       | 3380/15001 [2:08:19<5:47:41,  1.80s/it, loss=0.327, lr=1e-5] Steps:  23%|██▎       | 3381/15001 [2:08:20<6:03:35,  1.88s/it, loss=0.327, lr=1e-5]Steps:  23%|██▎       | 3381/15001 [2:08:20<6:03:35,  1.88s/it, loss=0.0942, lr=1e-5]Steps:  23%|██▎       | 3382/15001 [2:08:22<5:49:36,  1.81s/it, loss=0.0942, lr=1e-5]Steps:  23%|██▎       | 3382/15001 [2:08:22<5:49:36,  1.81s/it, loss=0.0996, lr=1e-5]Steps:  23%|██▎       | 3383/15001 [2:08:24<5:54:06,  1.83s/it, loss=0.0996, lr=1e-5]Steps:  23%|██▎       | 3383/15001 [2:08:24<5:54:06,  1.83s/it, loss=0.129, lr=1e-5] Steps:  23%|██▎       | 3384/15001 [2:08:26<6:03:53,  1.88s/it, loss=0.129, lr=1e-5]Steps:  23%|██▎       | 3384/15001 [2:08:26<6:03:53,  1.88s/it, loss=0.258, lr=1e-5]Steps:  23%|██▎       | 3385/15001 [2:08:28<5:57:53,  1.85s/it, loss=0.258, lr=1e-5]Steps:  23%|██▎       | 3385/15001 [2:08:28<5:57:53,  1.85s/it, loss=0.141, lr=1e-5]Steps:  23%|██▎       | 3386/15001 [2:08:29<5:45:19,  1.78s/it, loss=0.141, lr=1e-5]Steps:  23%|██▎       | 3386/15001 [2:08:29<5:45:19,  1.78s/it, loss=0.257, lr=1e-5]Steps:  23%|██▎       | 3387/15001 [2:08:31<5:51:11,  1.81s/it, loss=0.257, lr=1e-5]Steps:  23%|██▎       | 3387/15001 [2:08:31<5:51:11,  1.81s/it, loss=0.142, lr=1e-5]Steps:  23%|██▎       | 3388/15001 [2:08:33<6:01:44,  1.87s/it, loss=0.142, lr=1e-5]Steps:  23%|██▎       | 3388/15001 [2:08:33<6:01:44,  1.87s/it, loss=0.144, lr=1e-5]Steps:  23%|██▎       | 3389/15001 [2:08:35<5:48:02,  1.80s/it, loss=0.144, lr=1e-5]Steps:  23%|██▎       | 3389/15001 [2:08:35<5:48:02,  1.80s/it, loss=0.13, lr=1e-5] Steps:  23%|██▎       | 3390/15001 [2:08:37<5:51:05,  1.81s/it, loss=0.13, lr=1e-5]Steps:  23%|██▎       | 3390/15001 [2:08:37<5:51:05,  1.81s/it, loss=0.366, lr=1e-5]Steps:  23%|██▎       | 3391/15001 [2:08:38<5:52:48,  1.82s/it, loss=0.366, lr=1e-5]Steps:  23%|██▎       | 3391/15001 [2:08:39<5:52:48,  1.82s/it, loss=0.125, lr=1e-5]Steps:  23%|██▎       | 3392/15001 [2:08:40<6:06:33,  1.89s/it, loss=0.125, lr=1e-5]Steps:  23%|██▎       | 3392/15001 [2:08:41<6:06:33,  1.89s/it, loss=0.186, lr=1e-5]Steps:  23%|██▎       | 3393/15001 [2:08:42<6:01:37,  1.87s/it, loss=0.186, lr=1e-5]Steps:  23%|██▎       | 3393/15001 [2:08:42<6:01:37,  1.87s/it, loss=0.0993, lr=1e-5]Steps:  23%|██▎       | 3394/15001 [2:08:44<6:08:09,  1.90s/it, loss=0.0993, lr=1e-5]Steps:  23%|██▎       | 3394/15001 [2:08:44<6:08:09,  1.90s/it, loss=0.0236, lr=1e-5]Steps:  23%|██▎       | 3395/15001 [2:08:46<6:16:29,  1.95s/it, loss=0.0236, lr=1e-5]Steps:  23%|██▎       | 3395/15001 [2:08:46<6:16:29,  1.95s/it, loss=0.17, lr=1e-5]  Steps:  23%|██▎       | 3396/15001 [2:08:48<6:21:54,  1.97s/it, loss=0.17, lr=1e-5]Steps:  23%|██▎       | 3396/15001 [2:08:48<6:21:54,  1.97s/it, loss=0.177, lr=1e-5]Steps:  23%|██▎       | 3397/15001 [2:08:50<6:21:28,  1.97s/it, loss=0.177, lr=1e-5]Steps:  23%|██▎       | 3397/15001 [2:08:50<6:21:28,  1.97s/it, loss=0.168, lr=1e-5]Steps:  23%|██▎       | 3398/15001 [2:08:52<6:23:41,  1.98s/it, loss=0.168, lr=1e-5]Steps:  23%|██▎       | 3398/15001 [2:08:52<6:23:41,  1.98s/it, loss=0.0691, lr=1e-5]Steps:  23%|██▎       | 3399/15001 [2:08:54<6:09:24,  1.91s/it, loss=0.0691, lr=1e-5]Steps:  23%|██▎       | 3399/15001 [2:08:54<6:09:24,  1.91s/it, loss=0.139, lr=1e-5] Steps:  23%|██▎       | 3400/15001 [2:08:56<5:50:30,  1.81s/it, loss=0.139, lr=1e-5]Steps:  23%|██▎       | 3400/15001 [2:08:56<5:50:30,  1.81s/it, loss=0.173, lr=1e-5]Steps:  23%|██▎       | 3401/15001 [2:08:58<5:58:35,  1.85s/it, loss=0.173, lr=1e-5]Steps:  23%|██▎       | 3401/15001 [2:08:58<5:58:35,  1.85s/it, loss=0.156, lr=1e-5]Steps:  23%|██▎       | 3402/15001 [2:09:00<6:10:52,  1.92s/it, loss=0.156, lr=1e-5]Steps:  23%|██▎       | 3402/15001 [2:09:00<6:10:52,  1.92s/it, loss=0.0188, lr=1e-5]Steps:  23%|██▎       | 3403/15001 [2:09:02<6:16:30,  1.95s/it, loss=0.0188, lr=1e-5]Steps:  23%|██▎       | 3403/15001 [2:09:02<6:16:30,  1.95s/it, loss=0.114, lr=1e-5] Steps:  23%|██▎       | 3404/15001 [2:09:03<6:06:56,  1.90s/it, loss=0.114, lr=1e-5]Steps:  23%|██▎       | 3404/15001 [2:09:03<6:06:56,  1.90s/it, loss=0.153, lr=1e-5]Steps:  23%|██▎       | 3405/15001 [2:09:05<5:40:52,  1.76s/it, loss=0.153, lr=1e-5]Steps:  23%|██▎       | 3405/15001 [2:09:05<5:40:52,  1.76s/it, loss=0.152, lr=1e-5]Steps:  23%|██▎       | 3406/15001 [2:09:07<5:55:27,  1.84s/it, loss=0.152, lr=1e-5]Steps:  23%|██▎       | 3406/15001 [2:09:07<5:55:27,  1.84s/it, loss=0.0812, lr=1e-5]Steps:  23%|██▎       | 3407/15001 [2:09:09<5:47:30,  1.80s/it, loss=0.0812, lr=1e-5]Steps:  23%|██▎       | 3407/15001 [2:09:09<5:47:30,  1.80s/it, loss=0.131, lr=1e-5] Steps:  23%|██▎       | 3408/15001 [2:09:11<5:55:15,  1.84s/it, loss=0.131, lr=1e-5]Steps:  23%|██▎       | 3408/15001 [2:09:11<5:55:15,  1.84s/it, loss=0.16, lr=1e-5] Steps:  23%|██▎       | 3409/15001 [2:09:12<5:55:09,  1.84s/it, loss=0.16, lr=1e-5]Steps:  23%|██▎       | 3409/15001 [2:09:13<5:55:09,  1.84s/it, loss=0.12, lr=1e-5]Steps:  23%|██▎       | 3410/15001 [2:09:14<5:45:32,  1.79s/it, loss=0.12, lr=1e-5]Steps:  23%|██▎       | 3410/15001 [2:09:14<5:45:32,  1.79s/it, loss=0.242, lr=1e-5]Steps:  23%|██▎       | 3411/15001 [2:09:16<5:51:30,  1.82s/it, loss=0.242, lr=1e-5]Steps:  23%|██▎       | 3411/15001 [2:09:16<5:51:30,  1.82s/it, loss=0.0719, lr=1e-5]Steps:  23%|██▎       | 3412/15001 [2:09:18<5:49:08,  1.81s/it, loss=0.0719, lr=1e-5]Steps:  23%|██▎       | 3412/15001 [2:09:18<5:49:08,  1.81s/it, loss=0.281, lr=1e-5] Steps:  23%|██▎       | 3413/15001 [2:09:20<5:57:03,  1.85s/it, loss=0.281, lr=1e-5]Steps:  23%|██▎       | 3413/15001 [2:09:20<5:57:03,  1.85s/it, loss=0.16, lr=1e-5] Steps:  23%|██▎       | 3414/15001 [2:09:21<5:45:24,  1.79s/it, loss=0.16, lr=1e-5]Steps:  23%|██▎       | 3414/15001 [2:09:22<5:45:24,  1.79s/it, loss=0.281, lr=1e-5]Steps:  23%|██▎       | 3415/15001 [2:09:23<5:58:36,  1.86s/it, loss=0.281, lr=1e-5]Steps:  23%|██▎       | 3415/15001 [2:09:24<5:58:36,  1.86s/it, loss=0.227, lr=1e-5]Steps:  23%|██▎       | 3416/15001 [2:09:26<6:16:44,  1.95s/it, loss=0.227, lr=1e-5]Steps:  23%|██▎       | 3416/15001 [2:09:26<6:16:44,  1.95s/it, loss=0.209, lr=1e-5]Steps:  23%|██▎       | 3417/15001 [2:09:27<6:08:00,  1.91s/it, loss=0.209, lr=1e-5]Steps:  23%|██▎       | 3417/15001 [2:09:28<6:08:00,  1.91s/it, loss=0.266, lr=1e-5]Steps:  23%|██▎       | 3418/15001 [2:09:30<6:26:34,  2.00s/it, loss=0.266, lr=1e-5]Steps:  23%|██▎       | 3418/15001 [2:09:30<6:26:34,  2.00s/it, loss=0.191, lr=1e-5]Steps:  23%|██▎       | 3419/15001 [2:09:32<6:32:20,  2.03s/it, loss=0.191, lr=1e-5]Steps:  23%|██▎       | 3419/15001 [2:09:32<6:32:20,  2.03s/it, loss=0.114, lr=1e-5]Steps:  23%|██▎       | 3420/15001 [2:09:33<6:09:56,  1.92s/it, loss=0.114, lr=1e-5]Steps:  23%|██▎       | 3420/15001 [2:09:34<6:09:56,  1.92s/it, loss=0.222, lr=1e-5]Steps:  23%|██▎       | 3421/15001 [2:09:35<6:20:46,  1.97s/it, loss=0.222, lr=1e-5]Steps:  23%|██▎       | 3421/15001 [2:09:35<6:20:46,  1.97s/it, loss=0.0577, lr=1e-5]Steps:  23%|██▎       | 3422/15001 [2:09:37<5:57:29,  1.85s/it, loss=0.0577, lr=1e-5]Steps:  23%|██▎       | 3422/15001 [2:09:37<5:57:29,  1.85s/it, loss=0.115, lr=1e-5] Steps:  23%|██▎       | 3423/15001 [2:09:39<6:07:17,  1.90s/it, loss=0.115, lr=1e-5]Steps:  23%|██▎       | 3423/15001 [2:09:39<6:07:17,  1.90s/it, loss=0.029, lr=1e-5]Steps:  23%|██▎       | 3424/15001 [2:09:41<6:01:49,  1.88s/it, loss=0.029, lr=1e-5]Steps:  23%|██▎       | 3424/15001 [2:09:41<6:01:49,  1.88s/it, loss=0.233, lr=1e-5]Steps:  23%|██▎       | 3425/15001 [2:09:43<6:01:46,  1.88s/it, loss=0.233, lr=1e-5]Steps:  23%|██▎       | 3425/15001 [2:09:43<6:01:46,  1.88s/it, loss=0.00864, lr=1e-5]Steps:  23%|██▎       | 3426/15001 [2:09:45<6:02:37,  1.88s/it, loss=0.00864, lr=1e-5]Steps:  23%|██▎       | 3426/15001 [2:09:45<6:02:37,  1.88s/it, loss=0.25, lr=1e-5]   Steps:  23%|██▎       | 3427/15001 [2:09:46<5:57:35,  1.85s/it, loss=0.25, lr=1e-5]Steps:  23%|██▎       | 3427/15001 [2:09:46<5:57:35,  1.85s/it, loss=0.186, lr=1e-5]Steps:  23%|██▎       | 3428/15001 [2:09:48<5:52:20,  1.83s/it, loss=0.186, lr=1e-5]Steps:  23%|██▎       | 3428/15001 [2:09:48<5:52:20,  1.83s/it, loss=0.146, lr=1e-5]Steps:  23%|██▎       | 3429/15001 [2:09:50<5:53:05,  1.83s/it, loss=0.146, lr=1e-5]Steps:  23%|██▎       | 3429/15001 [2:09:50<5:53:05,  1.83s/it, loss=0.0348, lr=1e-5]Steps:  23%|██▎       | 3430/15001 [2:09:52<5:48:03,  1.80s/it, loss=0.0348, lr=1e-5]Steps:  23%|██▎       | 3430/15001 [2:09:52<5:48:03,  1.80s/it, loss=0.24, lr=1e-5]  Steps:  23%|██▎       | 3431/15001 [2:09:54<5:59:08,  1.86s/it, loss=0.24, lr=1e-5]Steps:  23%|██▎       | 3431/15001 [2:09:54<5:59:08,  1.86s/it, loss=0.0536, lr=1e-5]Steps:  23%|██▎       | 3432/15001 [2:09:55<5:53:05,  1.83s/it, loss=0.0536, lr=1e-5]Steps:  23%|██▎       | 3432/15001 [2:09:56<5:53:05,  1.83s/it, loss=0.314, lr=1e-5] Steps:  23%|██▎       | 3433/15001 [2:09:57<5:51:11,  1.82s/it, loss=0.314, lr=1e-5]Steps:  23%|██▎       | 3433/15001 [2:09:57<5:51:11,  1.82s/it, loss=0.111, lr=1e-5]Steps:  23%|██▎       | 3434/15001 [2:09:59<5:58:36,  1.86s/it, loss=0.111, lr=1e-5]Steps:  23%|██▎       | 3434/15001 [2:09:59<5:58:36,  1.86s/it, loss=0.203, lr=1e-5]Steps:  23%|██▎       | 3435/15001 [2:10:01<6:01:08,  1.87s/it, loss=0.203, lr=1e-5]Steps:  23%|██▎       | 3435/15001 [2:10:01<6:01:08,  1.87s/it, loss=0.291, lr=1e-5]Steps:  23%|██▎       | 3436/15001 [2:10:03<5:57:45,  1.86s/it, loss=0.291, lr=1e-5]Steps:  23%|██▎       | 3436/15001 [2:10:03<5:57:45,  1.86s/it, loss=0.468, lr=1e-5]Steps:  23%|██▎       | 3437/15001 [2:10:05<5:46:14,  1.80s/it, loss=0.468, lr=1e-5]Steps:  23%|██▎       | 3437/15001 [2:10:05<5:46:14,  1.80s/it, loss=0.135, lr=1e-5]Steps:  23%|██▎       | 3438/15001 [2:10:07<6:13:53,  1.94s/it, loss=0.135, lr=1e-5]Steps:  23%|██▎       | 3438/15001 [2:10:07<6:13:53,  1.94s/it, loss=0.25, lr=1e-5] Steps:  23%|██▎       | 3439/15001 [2:10:09<6:02:56,  1.88s/it, loss=0.25, lr=1e-5]Steps:  23%|██▎       | 3439/15001 [2:10:09<6:02:56,  1.88s/it, loss=0.148, lr=1e-5]Steps:  23%|██▎       | 3440/15001 [2:10:11<6:22:23,  1.98s/it, loss=0.148, lr=1e-5]Steps:  23%|██▎       | 3440/15001 [2:10:11<6:22:23,  1.98s/it, loss=0.228, lr=1e-5]Steps:  23%|██▎       | 3441/15001 [2:10:13<6:20:51,  1.98s/it, loss=0.228, lr=1e-5]Steps:  23%|██▎       | 3441/15001 [2:10:13<6:20:51,  1.98s/it, loss=0.0882, lr=1e-5]Steps:  23%|██▎       | 3442/15001 [2:10:15<6:23:22,  1.99s/it, loss=0.0882, lr=1e-5]Steps:  23%|██▎       | 3442/15001 [2:10:15<6:23:22,  1.99s/it, loss=0.182, lr=1e-5] Steps:  23%|██▎       | 3443/15001 [2:10:17<6:29:12,  2.02s/it, loss=0.182, lr=1e-5]Steps:  23%|██▎       | 3443/15001 [2:10:17<6:29:12,  2.02s/it, loss=0.24, lr=1e-5] Steps:  23%|██▎       | 3444/15001 [2:10:18<6:04:38,  1.89s/it, loss=0.24, lr=1e-5]Steps:  23%|██▎       | 3444/15001 [2:10:19<6:04:38,  1.89s/it, loss=0.0592, lr=1e-5]Steps:  23%|██▎       | 3445/15001 [2:10:20<5:55:36,  1.85s/it, loss=0.0592, lr=1e-5]Steps:  23%|██▎       | 3445/15001 [2:10:20<5:55:36,  1.85s/it, loss=0.211, lr=1e-5] Steps:  23%|██▎       | 3446/15001 [2:10:22<5:58:09,  1.86s/it, loss=0.211, lr=1e-5]Steps:  23%|██▎       | 3446/15001 [2:10:22<5:58:09,  1.86s/it, loss=0.229, lr=1e-5]Steps:  23%|██▎       | 3447/15001 [2:10:24<5:53:30,  1.84s/it, loss=0.229, lr=1e-5]Steps:  23%|██▎       | 3447/15001 [2:10:24<5:53:30,  1.84s/it, loss=0.294, lr=1e-5]Steps:  23%|██▎       | 3448/15001 [2:10:26<5:48:26,  1.81s/it, loss=0.294, lr=1e-5]Steps:  23%|██▎       | 3448/15001 [2:10:26<5:48:26,  1.81s/it, loss=0.0985, lr=1e-5]Steps:  23%|██▎       | 3449/15001 [2:10:28<5:59:42,  1.87s/it, loss=0.0985, lr=1e-5]Steps:  23%|██▎       | 3449/15001 [2:10:28<5:59:42,  1.87s/it, loss=0.0709, lr=1e-5]Steps:  23%|██▎       | 3450/15001 [2:10:29<5:38:02,  1.76s/it, loss=0.0709, lr=1e-5]Steps:  23%|██▎       | 3450/15001 [2:10:29<5:38:02,  1.76s/it, loss=0.242, lr=1e-5] Steps:  23%|██▎       | 3451/15001 [2:10:31<5:45:01,  1.79s/it, loss=0.242, lr=1e-5]Steps:  23%|██▎       | 3451/15001 [2:10:31<5:45:01,  1.79s/it, loss=0.0716, lr=1e-5]Steps:  23%|██▎       | 3452/15001 [2:10:33<5:42:47,  1.78s/it, loss=0.0716, lr=1e-5]Steps:  23%|██▎       | 3452/15001 [2:10:33<5:42:47,  1.78s/it, loss=0.12, lr=1e-5]  Steps:  23%|██▎       | 3453/15001 [2:10:35<6:02:02,  1.88s/it, loss=0.12, lr=1e-5]Steps:  23%|██▎       | 3453/15001 [2:10:35<6:02:02,  1.88s/it, loss=0.0406, lr=1e-5]Steps:  23%|██▎       | 3454/15001 [2:10:37<6:07:21,  1.91s/it, loss=0.0406, lr=1e-5]Steps:  23%|██▎       | 3454/15001 [2:10:37<6:07:21,  1.91s/it, loss=0.135, lr=1e-5] Steps:  23%|██▎       | 3455/15001 [2:10:39<5:59:57,  1.87s/it, loss=0.135, lr=1e-5]Steps:  23%|██▎       | 3455/15001 [2:10:39<5:59:57,  1.87s/it, loss=0.107, lr=1e-5]Steps:  23%|██▎       | 3456/15001 [2:10:40<5:46:31,  1.80s/it, loss=0.107, lr=1e-5]Steps:  23%|██▎       | 3456/15001 [2:10:40<5:46:31,  1.80s/it, loss=0.0901, lr=1e-5]Steps:  23%|██▎       | 3457/15001 [2:10:42<5:49:57,  1.82s/it, loss=0.0901, lr=1e-5]Steps:  23%|██▎       | 3457/15001 [2:10:42<5:49:57,  1.82s/it, loss=0.223, lr=1e-5] Steps:  23%|██▎       | 3458/15001 [2:10:44<5:50:25,  1.82s/it, loss=0.223, lr=1e-5]Steps:  23%|██▎       | 3458/15001 [2:10:44<5:50:25,  1.82s/it, loss=0.102, lr=1e-5]Steps:  23%|██▎       | 3459/15001 [2:10:46<5:58:26,  1.86s/it, loss=0.102, lr=1e-5]Steps:  23%|██▎       | 3459/15001 [2:10:46<5:58:26,  1.86s/it, loss=0.177, lr=1e-5]Steps:  23%|██▎       | 3460/15001 [2:10:48<5:58:15,  1.86s/it, loss=0.177, lr=1e-5]Steps:  23%|██▎       | 3460/15001 [2:10:48<5:58:15,  1.86s/it, loss=0.33, lr=1e-5] Steps:  23%|██▎       | 3461/15001 [2:10:50<5:53:40,  1.84s/it, loss=0.33, lr=1e-5]Steps:  23%|██▎       | 3461/15001 [2:10:50<5:53:40,  1.84s/it, loss=0.185, lr=1e-5]Steps:  23%|██▎       | 3462/15001 [2:10:51<5:57:23,  1.86s/it, loss=0.185, lr=1e-5]Steps:  23%|██▎       | 3462/15001 [2:10:52<5:57:23,  1.86s/it, loss=0.21, lr=1e-5] Steps:  23%|██▎       | 3463/15001 [2:10:54<6:20:41,  1.98s/it, loss=0.21, lr=1e-5]Steps:  23%|██▎       | 3463/15001 [2:10:54<6:20:41,  1.98s/it, loss=0.276, lr=1e-5]Steps:  23%|██▎       | 3464/15001 [2:10:56<6:25:18,  2.00s/it, loss=0.276, lr=1e-5]Steps:  23%|██▎       | 3464/15001 [2:10:56<6:25:18,  2.00s/it, loss=0.146, lr=1e-5]Steps:  23%|██▎       | 3465/15001 [2:10:58<6:17:42,  1.96s/it, loss=0.146, lr=1e-5]Steps:  23%|██▎       | 3465/15001 [2:10:58<6:17:42,  1.96s/it, loss=0.11, lr=1e-5] Steps:  23%|██▎       | 3466/15001 [2:11:00<6:24:20,  2.00s/it, loss=0.11, lr=1e-5]Steps:  23%|██▎       | 3466/15001 [2:11:00<6:24:20,  2.00s/it, loss=0.501, lr=1e-5]Steps:  23%|██▎       | 3467/15001 [2:11:02<6:15:54,  1.96s/it, loss=0.501, lr=1e-5]Steps:  23%|██▎       | 3467/15001 [2:11:02<6:15:54,  1.96s/it, loss=0.158, lr=1e-5]Steps:  23%|██▎       | 3468/15001 [2:11:04<6:13:04,  1.94s/it, loss=0.158, lr=1e-5]Steps:  23%|██▎       | 3468/15001 [2:11:04<6:13:04,  1.94s/it, loss=0.0269, lr=1e-5]Steps:  23%|██▎       | 3469/15001 [2:11:05<5:48:58,  1.82s/it, loss=0.0269, lr=1e-5]Steps:  23%|██▎       | 3469/15001 [2:11:05<5:48:58,  1.82s/it, loss=0.191, lr=1e-5] Steps:  23%|██▎       | 3470/15001 [2:11:07<6:10:02,  1.93s/it, loss=0.191, lr=1e-5]Steps:  23%|██▎       | 3470/15001 [2:11:07<6:10:02,  1.93s/it, loss=0.0579, lr=1e-5]Steps:  23%|██▎       | 3471/15001 [2:11:09<5:47:52,  1.81s/it, loss=0.0579, lr=1e-5]Steps:  23%|██▎       | 3471/15001 [2:11:09<5:47:52,  1.81s/it, loss=0.237, lr=1e-5] Steps:  23%|██▎       | 3472/15001 [2:11:11<5:56:11,  1.85s/it, loss=0.237, lr=1e-5]Steps:  23%|██▎       | 3472/15001 [2:11:11<5:56:11,  1.85s/it, loss=0.175, lr=1e-5]Steps:  23%|██▎       | 3473/15001 [2:11:12<5:36:26,  1.75s/it, loss=0.175, lr=1e-5]Steps:  23%|██▎       | 3473/15001 [2:11:13<5:36:26,  1.75s/it, loss=0.148, lr=1e-5]Steps:  23%|██▎       | 3474/15001 [2:11:14<5:58:37,  1.87s/it, loss=0.148, lr=1e-5]Steps:  23%|██▎       | 3474/15001 [2:11:15<5:58:37,  1.87s/it, loss=0.365, lr=1e-5]Steps:  23%|██▎       | 3475/15001 [2:11:16<5:55:40,  1.85s/it, loss=0.365, lr=1e-5]Steps:  23%|██▎       | 3475/15001 [2:11:16<5:55:40,  1.85s/it, loss=0.0726, lr=1e-5]Steps:  23%|██▎       | 3476/15001 [2:11:18<6:02:57,  1.89s/it, loss=0.0726, lr=1e-5]Steps:  23%|██▎       | 3476/15001 [2:11:18<6:02:57,  1.89s/it, loss=0.168, lr=1e-5] Steps:  23%|██▎       | 3477/15001 [2:11:20<6:02:13,  1.89s/it, loss=0.168, lr=1e-5]Steps:  23%|██▎       | 3477/15001 [2:11:20<6:02:13,  1.89s/it, loss=0.0801, lr=1e-5]Steps:  23%|██▎       | 3478/15001 [2:11:22<6:05:43,  1.90s/it, loss=0.0801, lr=1e-5]Steps:  23%|██▎       | 3478/15001 [2:11:22<6:05:43,  1.90s/it, loss=0.156, lr=1e-5] Steps:  23%|██▎       | 3479/15001 [2:11:24<5:56:22,  1.86s/it, loss=0.156, lr=1e-5]Steps:  23%|██▎       | 3479/15001 [2:11:24<5:56:22,  1.86s/it, loss=0.116, lr=1e-5]Steps:  23%|██▎       | 3480/15001 [2:11:26<6:05:15,  1.90s/it, loss=0.116, lr=1e-5]Steps:  23%|██▎       | 3480/15001 [2:11:26<6:05:15,  1.90s/it, loss=0.273, lr=1e-5]Steps:  23%|██▎       | 3481/15001 [2:11:27<5:50:18,  1.82s/it, loss=0.273, lr=1e-5]Steps:  23%|██▎       | 3481/15001 [2:11:28<5:50:18,  1.82s/it, loss=0.176, lr=1e-5]Steps:  23%|██▎       | 3482/15001 [2:11:29<6:01:40,  1.88s/it, loss=0.176, lr=1e-5]Steps:  23%|██▎       | 3482/15001 [2:11:30<6:01:40,  1.88s/it, loss=0.123, lr=1e-5]Steps:  23%|██▎       | 3483/15001 [2:11:32<6:28:45,  2.03s/it, loss=0.123, lr=1e-5]Steps:  23%|██▎       | 3483/15001 [2:11:32<6:28:45,  2.03s/it, loss=0.0725, lr=1e-5]Steps:  23%|██▎       | 3484/15001 [2:11:34<6:19:48,  1.98s/it, loss=0.0725, lr=1e-5]Steps:  23%|██▎       | 3484/15001 [2:11:34<6:19:48,  1.98s/it, loss=0.212, lr=1e-5] Steps:  23%|██▎       | 3485/15001 [2:11:36<6:17:45,  1.97s/it, loss=0.212, lr=1e-5]Steps:  23%|██▎       | 3485/15001 [2:11:36<6:17:45,  1.97s/it, loss=0.254, lr=1e-5]Steps:  23%|██▎       | 3486/15001 [2:11:38<6:17:00,  1.96s/it, loss=0.254, lr=1e-5]Steps:  23%|██▎       | 3486/15001 [2:11:38<6:17:00,  1.96s/it, loss=0.226, lr=1e-5]Steps:  23%|██▎       | 3487/15001 [2:11:40<6:23:32,  2.00s/it, loss=0.226, lr=1e-5]Steps:  23%|██▎       | 3487/15001 [2:11:40<6:23:32,  2.00s/it, loss=0.27, lr=1e-5] Steps:  23%|██▎       | 3488/15001 [2:11:42<6:27:48,  2.02s/it, loss=0.27, lr=1e-5]Steps:  23%|██▎       | 3488/15001 [2:11:42<6:27:48,  2.02s/it, loss=0.214, lr=1e-5]Steps:  23%|██▎       | 3489/15001 [2:11:44<6:19:51,  1.98s/it, loss=0.214, lr=1e-5]Steps:  23%|██▎       | 3489/15001 [2:11:44<6:19:51,  1.98s/it, loss=0.0826, lr=1e-5]Steps:  23%|██▎       | 3490/15001 [2:11:46<6:19:22,  1.98s/it, loss=0.0826, lr=1e-5]Steps:  23%|██▎       | 3490/15001 [2:11:46<6:19:22,  1.98s/it, loss=0.131, lr=1e-5] Steps:  23%|██▎       | 3491/15001 [2:11:47<6:06:23,  1.91s/it, loss=0.131, lr=1e-5]Steps:  23%|██▎       | 3491/15001 [2:11:47<6:06:23,  1.91s/it, loss=0.147, lr=1e-5]Steps:  23%|██▎       | 3492/15001 [2:11:49<6:02:42,  1.89s/it, loss=0.147, lr=1e-5]Steps:  23%|██▎       | 3492/15001 [2:11:49<6:02:42,  1.89s/it, loss=0.15, lr=1e-5] Steps:  23%|██▎       | 3493/15001 [2:11:51<5:53:41,  1.84s/it, loss=0.15, lr=1e-5]Steps:  23%|██▎       | 3493/15001 [2:11:51<5:53:41,  1.84s/it, loss=0.0883, lr=1e-5]Steps:  23%|██▎       | 3494/15001 [2:11:53<5:57:26,  1.86s/it, loss=0.0883, lr=1e-5]Steps:  23%|██▎       | 3494/15001 [2:11:53<5:57:26,  1.86s/it, loss=0.0598, lr=1e-5]Steps:  23%|██▎       | 3495/15001 [2:11:55<5:51:00,  1.83s/it, loss=0.0598, lr=1e-5]Steps:  23%|██▎       | 3495/15001 [2:11:55<5:51:00,  1.83s/it, loss=0.0412, lr=1e-5]Steps:  23%|██▎       | 3496/15001 [2:11:56<5:45:00,  1.80s/it, loss=0.0412, lr=1e-5]Steps:  23%|██▎       | 3496/15001 [2:11:56<5:45:00,  1.80s/it, loss=0.108, lr=1e-5] Steps:  23%|██▎       | 3497/15001 [2:11:58<5:45:49,  1.80s/it, loss=0.108, lr=1e-5]Steps:  23%|██▎       | 3497/15001 [2:11:58<5:45:49,  1.80s/it, loss=0.148, lr=1e-5]Steps:  23%|██▎       | 3498/15001 [2:12:00<5:54:13,  1.85s/it, loss=0.148, lr=1e-5]Steps:  23%|██▎       | 3498/15001 [2:12:00<5:54:13,  1.85s/it, loss=0.378, lr=1e-5]Steps:  23%|██▎       | 3499/15001 [2:12:02<5:47:50,  1.81s/it, loss=0.378, lr=1e-5]Steps:  23%|██▎       | 3499/15001 [2:12:02<5:47:50,  1.81s/it, loss=0.0718, lr=1e-5]Steps:  23%|██▎       | 3500/15001 [2:12:04<5:56:31,  1.86s/it, loss=0.0718, lr=1e-5]02/04/2024 15:14:23 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1730.32it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  23%|██▎       | 3500/15001 [2:15:44<5:56:31,  1.86s/it, loss=0.0393, lr=1e-5]Steps:  23%|██▎       | 3501/15001 [2:15:45<216:30:05, 67.77s/it, loss=0.0393, lr=1e-5]Steps:  23%|██▎       | 3501/15001 [2:15:45<216:30:05, 67.77s/it, loss=0.229, lr=1e-5] Steps:  23%|██▎       | 3502/15001 [2:15:47<153:09:30, 47.95s/it, loss=0.229, lr=1e-5]Steps:  23%|██▎       | 3502/15001 [2:15:47<153:09:30, 47.95s/it, loss=0.0937, lr=1e-5]Steps:  23%|██▎       | 3503/15001 [2:15:49<109:07:28, 34.17s/it, loss=0.0937, lr=1e-5]Steps:  23%|██▎       | 3503/15001 [2:15:49<109:07:28, 34.17s/it, loss=0.0751, lr=1e-5]Steps:  23%|██▎       | 3504/15001 [2:15:51<78:03:13, 24.44s/it, loss=0.0751, lr=1e-5] Steps:  23%|██▎       | 3504/15001 [2:15:51<78:03:13, 24.44s/it, loss=0.279, lr=1e-5] Steps:  23%|██▎       | 3505/15001 [2:15:53<56:24:28, 17.66s/it, loss=0.279, lr=1e-5]Steps:  23%|██▎       | 3505/15001 [2:15:53<56:24:28, 17.66s/it, loss=0.117, lr=1e-5]Steps:  23%|██▎       | 3506/15001 [2:15:55<41:19:45, 12.94s/it, loss=0.117, lr=1e-5]Steps:  23%|██▎       | 3506/15001 [2:15:55<41:19:45, 12.94s/it, loss=0.0515, lr=1e-5]Steps:  23%|██▎       | 3507/15001 [2:15:57<30:50:03,  9.66s/it, loss=0.0515, lr=1e-5]Steps:  23%|██▎       | 3507/15001 [2:15:57<30:50:03,  9.66s/it, loss=0.0683, lr=1e-5]Steps:  23%|██▎       | 3508/15001 [2:15:58<23:18:29,  7.30s/it, loss=0.0683, lr=1e-5]Steps:  23%|██▎       | 3508/15001 [2:15:58<23:18:29,  7.30s/it, loss=0.201, lr=1e-5] Steps:  23%|██▎       | 3509/15001 [2:16:00<17:50:49,  5.59s/it, loss=0.201, lr=1e-5]Steps:  23%|██▎       | 3509/15001 [2:16:00<17:50:49,  5.59s/it, loss=0.131, lr=1e-5]Steps:  23%|██▎       | 3510/15001 [2:16:02<14:21:03,  4.50s/it, loss=0.131, lr=1e-5]Steps:  23%|██▎       | 3510/15001 [2:16:02<14:21:03,  4.50s/it, loss=0.193, lr=1e-5]Steps:  23%|██▎       | 3511/15001 [2:16:04<11:41:10,  3.66s/it, loss=0.193, lr=1e-5]Steps:  23%|██▎       | 3511/15001 [2:16:04<11:41:10,  3.66s/it, loss=0.132, lr=1e-5]Steps:  23%|██▎       | 3512/15001 [2:16:05<9:58:35,  3.13s/it, loss=0.132, lr=1e-5] Steps:  23%|██▎       | 3512/15001 [2:16:06<9:58:35,  3.13s/it, loss=0.252, lr=1e-5]Steps:  23%|██▎       | 3513/15001 [2:16:07<8:54:05,  2.79s/it, loss=0.252, lr=1e-5]Steps:  23%|██▎       | 3513/15001 [2:16:08<8:54:05,  2.79s/it, loss=0.276, lr=1e-5]Steps:  23%|██▎       | 3514/15001 [2:16:10<8:15:22,  2.59s/it, loss=0.276, lr=1e-5]Steps:  23%|██▎       | 3514/15001 [2:16:10<8:15:22,  2.59s/it, loss=0.127, lr=1e-5]Steps:  23%|██▎       | 3515/15001 [2:16:12<7:53:11,  2.47s/it, loss=0.127, lr=1e-5]Steps:  23%|██▎       | 3515/15001 [2:16:12<7:53:11,  2.47s/it, loss=0.0156, lr=1e-5]Steps:  23%|██▎       | 3516/15001 [2:16:14<7:29:12,  2.35s/it, loss=0.0156, lr=1e-5]Steps:  23%|██▎       | 3516/15001 [2:16:14<7:29:12,  2.35s/it, loss=0.188, lr=1e-5] Steps:  23%|██▎       | 3517/15001 [2:16:16<7:12:23,  2.26s/it, loss=0.188, lr=1e-5]Steps:  23%|██▎       | 3517/15001 [2:16:16<7:12:23,  2.26s/it, loss=0.0944, lr=1e-5]Steps:  23%|██▎       | 3518/15001 [2:16:18<6:54:21,  2.17s/it, loss=0.0944, lr=1e-5]Steps:  23%|██▎       | 3518/15001 [2:16:18<6:54:21,  2.17s/it, loss=0.267, lr=1e-5] Steps:  23%|██▎       | 3519/15001 [2:16:20<6:34:56,  2.06s/it, loss=0.267, lr=1e-5]Steps:  23%|██▎       | 3519/15001 [2:16:20<6:34:56,  2.06s/it, loss=0.108, lr=1e-5]Steps:  23%|██▎       | 3520/15001 [2:16:21<6:21:12,  1.99s/it, loss=0.108, lr=1e-5]Steps:  23%|██▎       | 3520/15001 [2:16:22<6:21:12,  1.99s/it, loss=0.138, lr=1e-5]Steps:  23%|██▎       | 3521/15001 [2:16:23<6:21:32,  1.99s/it, loss=0.138, lr=1e-5]Steps:  23%|██▎       | 3521/15001 [2:16:24<6:21:32,  1.99s/it, loss=0.069, lr=1e-5]Steps:  23%|██▎       | 3522/15001 [2:16:25<6:04:51,  1.91s/it, loss=0.069, lr=1e-5]Steps:  23%|██▎       | 3522/15001 [2:16:25<6:04:51,  1.91s/it, loss=0.037, lr=1e-5]Steps:  23%|██▎       | 3523/15001 [2:16:27<5:48:44,  1.82s/it, loss=0.037, lr=1e-5]Steps:  23%|██▎       | 3523/15001 [2:16:27<5:48:44,  1.82s/it, loss=0.156, lr=1e-5]Steps:  23%|██▎       | 3524/15001 [2:16:29<5:46:06,  1.81s/it, loss=0.156, lr=1e-5]Steps:  23%|██▎       | 3524/15001 [2:16:29<5:46:06,  1.81s/it, loss=0.171, lr=1e-5]Steps:  23%|██▎       | 3525/15001 [2:16:30<5:47:09,  1.82s/it, loss=0.171, lr=1e-5]Steps:  23%|██▎       | 3525/15001 [2:16:31<5:47:09,  1.82s/it, loss=0.231, lr=1e-5]Steps:  24%|██▎       | 3526/15001 [2:16:32<5:58:31,  1.87s/it, loss=0.231, lr=1e-5]Steps:  24%|██▎       | 3526/15001 [2:16:33<5:58:31,  1.87s/it, loss=0.162, lr=1e-5]Steps:  24%|██▎       | 3527/15001 [2:16:34<5:48:47,  1.82s/it, loss=0.162, lr=1e-5]Steps:  24%|██▎       | 3527/15001 [2:16:34<5:48:47,  1.82s/it, loss=0.186, lr=1e-5]Steps:  24%|██▎       | 3528/15001 [2:16:36<6:08:47,  1.93s/it, loss=0.186, lr=1e-5]Steps:  24%|██▎       | 3528/15001 [2:16:36<6:08:47,  1.93s/it, loss=0.122, lr=1e-5]Steps:  24%|██▎       | 3529/15001 [2:16:38<6:03:50,  1.90s/it, loss=0.122, lr=1e-5]Steps:  24%|██▎       | 3529/15001 [2:16:38<6:03:50,  1.90s/it, loss=0.164, lr=1e-5]Steps:  24%|██▎       | 3530/15001 [2:16:40<5:54:01,  1.85s/it, loss=0.164, lr=1e-5]Steps:  24%|██▎       | 3530/15001 [2:16:40<5:54:01,  1.85s/it, loss=0.231, lr=1e-5]Steps:  24%|██▎       | 3531/15001 [2:16:42<5:48:53,  1.83s/it, loss=0.231, lr=1e-5]Steps:  24%|██▎       | 3531/15001 [2:16:42<5:48:53,  1.83s/it, loss=0.271, lr=1e-5]Steps:  24%|██▎       | 3532/15001 [2:16:44<5:58:33,  1.88s/it, loss=0.271, lr=1e-5]Steps:  24%|██▎       | 3532/15001 [2:16:44<5:58:33,  1.88s/it, loss=0.25, lr=1e-5] Steps:  24%|██▎       | 3533/15001 [2:16:46<5:58:33,  1.88s/it, loss=0.25, lr=1e-5]Steps:  24%|██▎       | 3533/15001 [2:16:46<5:58:33,  1.88s/it, loss=0.185, lr=1e-5]Steps:  24%|██▎       | 3534/15001 [2:16:47<5:56:08,  1.86s/it, loss=0.185, lr=1e-5]Steps:  24%|██▎       | 3534/15001 [2:16:48<5:56:08,  1.86s/it, loss=0.0876, lr=1e-5]Steps:  24%|██▎       | 3535/15001 [2:16:49<6:00:17,  1.89s/it, loss=0.0876, lr=1e-5]Steps:  24%|██▎       | 3535/15001 [2:16:49<6:00:17,  1.89s/it, loss=0.33, lr=1e-5]  Steps:  24%|██▎       | 3536/15001 [2:16:51<6:11:35,  1.94s/it, loss=0.33, lr=1e-5]Steps:  24%|██▎       | 3536/15001 [2:16:51<6:11:35,  1.94s/it, loss=0.186, lr=1e-5]Steps:  24%|██▎       | 3537/15001 [2:16:53<6:00:10,  1.89s/it, loss=0.186, lr=1e-5]Steps:  24%|██▎       | 3537/15001 [2:16:54<6:00:10,  1.89s/it, loss=0.103, lr=1e-5]Steps:  24%|██▎       | 3538/15001 [2:16:55<6:22:12,  2.00s/it, loss=0.103, lr=1e-5]Steps:  24%|██▎       | 3538/15001 [2:16:55<6:22:12,  2.00s/it, loss=0.0369, lr=1e-5]Steps:  24%|██▎       | 3539/15001 [2:16:57<6:19:26,  1.99s/it, loss=0.0369, lr=1e-5]Steps:  24%|██▎       | 3539/15001 [2:16:57<6:19:26,  1.99s/it, loss=0.312, lr=1e-5] Steps:  24%|██▎       | 3540/15001 [2:16:59<6:13:29,  1.96s/it, loss=0.312, lr=1e-5]Steps:  24%|██▎       | 3540/15001 [2:16:59<6:13:29,  1.96s/it, loss=0.263, lr=1e-5]Steps:  24%|██▎       | 3541/15001 [2:17:01<6:20:32,  1.99s/it, loss=0.263, lr=1e-5]Steps:  24%|██▎       | 3541/15001 [2:17:01<6:20:32,  1.99s/it, loss=0.25, lr=1e-5] Steps:  24%|██▎       | 3542/15001 [2:17:03<6:05:27,  1.91s/it, loss=0.25, lr=1e-5]Steps:  24%|██▎       | 3542/15001 [2:17:03<6:05:27,  1.91s/it, loss=0.192, lr=1e-5]Steps:  24%|██▎       | 3543/15001 [2:17:05<6:13:37,  1.96s/it, loss=0.192, lr=1e-5]Steps:  24%|██▎       | 3543/15001 [2:17:05<6:13:37,  1.96s/it, loss=0.212, lr=1e-5]Steps:  24%|██▎       | 3544/15001 [2:17:07<6:02:09,  1.90s/it, loss=0.212, lr=1e-5]Steps:  24%|██▎       | 3544/15001 [2:17:07<6:02:09,  1.90s/it, loss=0.179, lr=1e-5]Steps:  24%|██▎       | 3545/15001 [2:17:09<6:07:03,  1.92s/it, loss=0.179, lr=1e-5]Steps:  24%|██▎       | 3545/15001 [2:17:09<6:07:03,  1.92s/it, loss=0.312, lr=1e-5]Steps:  24%|██▎       | 3546/15001 [2:17:10<5:39:44,  1.78s/it, loss=0.312, lr=1e-5]Steps:  24%|██▎       | 3546/15001 [2:17:11<5:39:44,  1.78s/it, loss=0.367, lr=1e-5]Steps:  24%|██▎       | 3547/15001 [2:17:12<6:00:11,  1.89s/it, loss=0.367, lr=1e-5]Steps:  24%|██▎       | 3547/15001 [2:17:13<6:00:11,  1.89s/it, loss=0.0627, lr=1e-5]Steps:  24%|██▎       | 3548/15001 [2:17:14<5:52:50,  1.85s/it, loss=0.0627, lr=1e-5]Steps:  24%|██▎       | 3548/15001 [2:17:15<5:52:50,  1.85s/it, loss=0.341, lr=1e-5] Steps:  24%|██▎       | 3549/15001 [2:17:16<6:04:32,  1.91s/it, loss=0.341, lr=1e-5]Steps:  24%|██▎       | 3549/15001 [2:17:16<6:04:32,  1.91s/it, loss=0.0782, lr=1e-5]Steps:  24%|██▎       | 3550/15001 [2:17:18<5:51:42,  1.84s/it, loss=0.0782, lr=1e-5]Steps:  24%|██▎       | 3550/15001 [2:17:18<5:51:42,  1.84s/it, loss=0.288, lr=1e-5] Steps:  24%|██▎       | 3551/15001 [2:17:20<5:46:20,  1.81s/it, loss=0.288, lr=1e-5]Steps:  24%|██▎       | 3551/15001 [2:17:20<5:46:20,  1.81s/it, loss=0.252, lr=1e-5]Steps:  24%|██▎       | 3552/15001 [2:17:22<5:51:12,  1.84s/it, loss=0.252, lr=1e-5]Steps:  24%|██▎       | 3552/15001 [2:17:22<5:51:12,  1.84s/it, loss=0.0967, lr=1e-5]Steps:  24%|██▎       | 3553/15001 [2:17:23<5:54:35,  1.86s/it, loss=0.0967, lr=1e-5]Steps:  24%|██▎       | 3553/15001 [2:17:24<5:54:35,  1.86s/it, loss=0.15, lr=1e-5]  Steps:  24%|██▎       | 3554/15001 [2:17:26<6:06:05,  1.92s/it, loss=0.15, lr=1e-5]Steps:  24%|██▎       | 3554/15001 [2:17:26<6:06:05,  1.92s/it, loss=0.126, lr=1e-5]Steps:  24%|██▎       | 3555/15001 [2:17:27<5:52:17,  1.85s/it, loss=0.126, lr=1e-5]Steps:  24%|██▎       | 3555/15001 [2:17:27<5:52:17,  1.85s/it, loss=0.187, lr=1e-5]Steps:  24%|██▎       | 3556/15001 [2:17:29<5:50:29,  1.84s/it, loss=0.187, lr=1e-5]Steps:  24%|██▎       | 3556/15001 [2:17:29<5:50:29,  1.84s/it, loss=0.344, lr=1e-5]Steps:  24%|█��▎       | 3557/15001 [2:17:31<5:47:27,  1.82s/it, loss=0.344, lr=1e-5]Steps:  24%|██▎       | 3557/15001 [2:17:31<5:47:27,  1.82s/it, loss=0.0402, lr=1e-5]Steps:  24%|██▎       | 3558/15001 [2:17:33<5:46:09,  1.82s/it, loss=0.0402, lr=1e-5]Steps:  24%|██▎       | 3558/15001 [2:17:33<5:46:09,  1.82s/it, loss=0.21, lr=1e-5]  Steps:  24%|██▎       | 3559/15001 [2:17:35<6:11:33,  1.95s/it, loss=0.21, lr=1e-5]Steps:  24%|██▎       | 3559/15001 [2:17:35<6:11:33,  1.95s/it, loss=0.364, lr=1e-5]Steps:  24%|██▎       | 3560/15001 [2:17:36<5:52:45,  1.85s/it, loss=0.364, lr=1e-5]Steps:  24%|██▎       | 3560/15001 [2:17:37<5:52:45,  1.85s/it, loss=0.08, lr=1e-5] Steps:  24%|██▎       | 3561/15001 [2:17:39<6:07:16,  1.93s/it, loss=0.08, lr=1e-5]Steps:  24%|██▎       | 3561/15001 [2:17:39<6:07:16,  1.93s/it, loss=0.111, lr=1e-5]Steps:  24%|██▎       | 3562/15001 [2:17:41<6:29:37,  2.04s/it, loss=0.111, lr=1e-5]Steps:  24%|██▎       | 3562/15001 [2:17:41<6:29:37,  2.04s/it, loss=0.317, lr=1e-5]Steps:  24%|██▍       | 3563/15001 [2:17:43<6:25:50,  2.02s/it, loss=0.317, lr=1e-5]Steps:  24%|██▍       | 3563/15001 [2:17:43<6:25:50,  2.02s/it, loss=0.244, lr=1e-5]Steps:  24%|██▍       | 3564/15001 [2:17:45<6:06:41,  1.92s/it, loss=0.244, lr=1e-5]Steps:  24%|██▍       | 3564/15001 [2:17:45<6:06:41,  1.92s/it, loss=0.123, lr=1e-5]Steps:  24%|██▍       | 3565/15001 [2:17:46<5:56:37,  1.87s/it, loss=0.123, lr=1e-5]Steps:  24%|██▍       | 3565/15001 [2:17:47<5:56:37,  1.87s/it, loss=0.266, lr=1e-5]Steps:  24%|██▍       | 3566/15001 [2:17:48<6:07:32,  1.93s/it, loss=0.266, lr=1e-5]Steps:  24%|██▍       | 3566/15001 [2:17:49<6:07:32,  1.93s/it, loss=0.339, lr=1e-5]Steps:  24%|██▍       | 3567/15001 [2:17:50<6:13:38,  1.96s/it, loss=0.339, lr=1e-5]Steps:  24%|██▍       | 3567/15001 [2:17:50<6:13:38,  1.96s/it, loss=0.169, lr=1e-5]Steps:  24%|██▍       | 3568/15001 [2:17:52<6:01:47,  1.90s/it, loss=0.169, lr=1e-5]Steps:  24%|██▍       | 3568/15001 [2:17:52<6:01:47,  1.90s/it, loss=0.275, lr=1e-5]Steps:  24%|██▍       | 3569/15001 [2:17:54<5:54:27,  1.86s/it, loss=0.275, lr=1e-5]Steps:  24%|██▍       | 3569/15001 [2:17:54<5:54:27,  1.86s/it, loss=0.315, lr=1e-5]Steps:  24%|██▍       | 3570/15001 [2:17:56<5:54:08,  1.86s/it, loss=0.315, lr=1e-5]Steps:  24%|██▍       | 3570/15001 [2:17:56<5:54:08,  1.86s/it, loss=0.408, lr=1e-5]Steps:  24%|██▍       | 3571/15001 [2:17:58<5:59:00,  1.88s/it, loss=0.408, lr=1e-5]Steps:  24%|██▍       | 3571/15001 [2:17:58<5:59:00,  1.88s/it, loss=0.0446, lr=1e-5]Steps:  24%|██▍       | 3572/15001 [2:18:00<6:00:00,  1.89s/it, loss=0.0446, lr=1e-5]Steps:  24%|██▍       | 3572/15001 [2:18:00<6:00:00,  1.89s/it, loss=0.0771, lr=1e-5]Steps:  24%|██▍       | 3573/15001 [2:18:01<5:48:47,  1.83s/it, loss=0.0771, lr=1e-5]Steps:  24%|██▍       | 3573/15001 [2:18:02<5:48:47,  1.83s/it, loss=0.111, lr=1e-5] Steps:  24%|██▍       | 3574/15001 [2:18:03<5:54:11,  1.86s/it, loss=0.111, lr=1e-5]Steps:  24%|██▍       | 3574/15001 [2:18:03<5:54:11,  1.86s/it, loss=0.196, lr=1e-5]Steps:  24%|██▍       | 3575/15001 [2:18:05<5:48:01,  1.83s/it, loss=0.196, lr=1e-5]Steps:  24%|██▍       | 3575/15001 [2:18:05<5:48:01,  1.83s/it, loss=0.224, lr=1e-5]Steps:  24%|██▍       | 3576/15001 [2:18:07<5:34:09,  1.75s/it, loss=0.224, lr=1e-5]Steps:  24%|██▍       | 3576/15001 [2:18:07<5:34:09,  1.75s/it, loss=0.272, lr=1e-5]Steps:  24%|██▍       | 3577/15001 [2:18:08<5:41:02,  1.79s/it, loss=0.272, lr=1e-5]Steps:  24%|██▍       | 3577/15001 [2:18:09<5:41:02,  1.79s/it, loss=0.146, lr=1e-5]Steps:  24%|██▍       | 3578/15001 [2:18:11<5:58:31,  1.88s/it, loss=0.146, lr=1e-5]Steps:  24%|██▍       | 3578/15001 [2:18:11<5:58:31,  1.88s/it, loss=0.107, lr=1e-5]Steps:  24%|██▍       | 3579/15001 [2:18:12<5:52:46,  1.85s/it, loss=0.107, lr=1e-5]Steps:  24%|██▍       | 3579/15001 [2:18:12<5:52:46,  1.85s/it, loss=0.15, lr=1e-5] Steps:  24%|██▍       | 3580/15001 [2:18:14<5:47:10,  1.82s/it, loss=0.15, lr=1e-5]Steps:  24%|██▍       | 3580/15001 [2:18:14<5:47:10,  1.82s/it, loss=0.158, lr=1e-5]Steps:  24%|██▍       | 3581/15001 [2:18:16<5:37:55,  1.78s/it, loss=0.158, lr=1e-5]Steps:  24%|██▍       | 3581/15001 [2:18:16<5:37:55,  1.78s/it, loss=0.163, lr=1e-5]Steps:  24%|██▍       | 3582/15001 [2:18:18<6:04:43,  1.92s/it, loss=0.163, lr=1e-5]Steps:  24%|██▍       | 3582/15001 [2:18:18<6:04:43,  1.92s/it, loss=0.124, lr=1e-5]Steps:  24%|██▍       | 3583/15001 [2:18:20<6:07:55,  1.93s/it, loss=0.124, lr=1e-5]Steps:  24%|██▍       | 3583/15001 [2:18:20<6:07:55,  1.93s/it, loss=0.132, lr=1e-5]Steps:  24%|██▍       | 3584/15001 [2:18:22<6:14:04,  1.97s/it, loss=0.132, lr=1e-5]Steps:  24%|██▍       | 3584/15001 [2:18:22<6:14:04,  1.97s/it, loss=0.133, lr=1e-5]Steps:  24%|██▍       | 3585/15001 [2:18:24<6:23:57,  2.02s/it, loss=0.133, lr=1e-5]Steps:  24%|██▍       | 3585/15001 [2:18:24<6:23:57,  2.02s/it, loss=0.149, lr=1e-5]Steps:  24%|██▍       | 3586/15001 [2:18:26<6:22:29,  2.01s/it, loss=0.149, lr=1e-5]Steps:  24%|██▍       | 3586/15001 [2:18:26<6:22:29,  2.01s/it, loss=0.259, lr=1e-5]Steps:  24%|██▍       | 3587/15001 [2:18:28<6:10:50,  1.95s/it, loss=0.259, lr=1e-5]Steps:  24%|██▍       | 3587/15001 [2:18:28<6:10:50,  1.95s/it, loss=0.19, lr=1e-5] Steps:  24%|██▍       | 3588/15001 [2:18:30<5:55:42,  1.87s/it, loss=0.19, lr=1e-5]Steps:  24%|██▍       | 3588/15001 [2:18:30<5:55:42,  1.87s/it, loss=0.218, lr=1e-5]Steps:  24%|██▍       | 3589/15001 [2:18:32<5:58:50,  1.89s/it, loss=0.218, lr=1e-5]Steps:  24%|██▍       | 3589/15001 [2:18:32<5:58:50,  1.89s/it, loss=0.0492, lr=1e-5]Steps:  24%|██▍       | 3590/15001 [2:18:33<5:51:58,  1.85s/it, loss=0.0492, lr=1e-5]Steps:  24%|██▍       | 3590/15001 [2:18:34<5:51:58,  1.85s/it, loss=0.0554, lr=1e-5]Steps:  24%|██▍       | 3591/15001 [2:18:35<5:58:36,  1.89s/it, loss=0.0554, lr=1e-5]Steps:  24%|██▍       | 3591/15001 [2:18:35<5:58:36,  1.89s/it, loss=0.226, lr=1e-5] Steps:  24%|██▍       | 3592/15001 [2:18:37<5:59:45,  1.89s/it, loss=0.226, lr=1e-5]Steps:  24%|██▍       | 3592/15001 [2:18:37<5:59:45,  1.89s/it, loss=0.319, lr=1e-5]Steps:  24%|██▍       | 3593/15001 [2:18:39<5:55:07,  1.87s/it, loss=0.319, lr=1e-5]Steps:  24%|██▍       | 3593/15001 [2:18:39<5:55:07,  1.87s/it, loss=0.239, lr=1e-5]Steps:  24%|██▍       | 3594/15001 [2:18:41<5:52:09,  1.85s/it, loss=0.239, lr=1e-5]Steps:  24%|██▍       | 3594/15001 [2:18:41<5:52:09,  1.85s/it, loss=0.226, lr=1e-5]Steps:  24%|██▍       | 3595/15001 [2:18:43<5:51:41,  1.85s/it, loss=0.226, lr=1e-5]Steps:  24%|██▍       | 3595/15001 [2:18:43<5:51:41,  1.85s/it, loss=0.187, lr=1e-5]Steps:  24%|██▍       | 3596/15001 [2:18:45<5:53:20,  1.86s/it, loss=0.187, lr=1e-5]Steps:  24%|██▍       | 3596/15001 [2:18:45<5:53:20,  1.86s/it, loss=0.18, lr=1e-5] Steps:  24%|██▍       | 3597/15001 [2:18:46<5:47:15,  1.83s/it, loss=0.18, lr=1e-5]Steps:  24%|██▍       | 3597/15001 [2:18:46<5:47:15,  1.83s/it, loss=0.224, lr=1e-5]Steps:  24%|██▍       | 3598/15001 [2:18:48<5:25:41,  1.71s/it, loss=0.224, lr=1e-5]Steps:  24%|██▍       | 3598/15001 [2:18:48<5:25:41,  1.71s/it, loss=0.124, lr=1e-5]Steps:  24%|██▍       | 3599/15001 [2:18:50<5:50:45,  1.85s/it, loss=0.124, lr=1e-5]Steps:  24%|██▍       | 3599/15001 [2:18:50<5:50:45,  1.85s/it, loss=0.339, lr=1e-5]Steps:  24%|██▍       | 3600/15001 [2:18:52<5:40:49,  1.79s/it, loss=0.339, lr=1e-5]Steps:  24%|██▍       | 3600/15001 [2:18:52<5:40:49,  1.79s/it, loss=0.159, lr=1e-5]Steps:  24%|██▍       | 3601/15001 [2:18:53<5:34:30,  1.76s/it, loss=0.159, lr=1e-5]Steps:  24%|██▍       | 3601/15001 [2:18:54<5:34:30,  1.76s/it, loss=0.126, lr=1e-5]Steps:  24%|██▍       | 3602/15001 [2:18:55<5:46:53,  1.83s/it, loss=0.126, lr=1e-5]Steps:  24%|██▍       | 3602/15001 [2:18:55<5:46:53,  1.83s/it, loss=0.106, lr=1e-5]Steps:  24%|██▍       | 3603/15001 [2:18:57<5:30:01,  1.74s/it, loss=0.106, lr=1e-5]Steps:  24%|██▍       | 3603/15001 [2:18:57<5:30:01,  1.74s/it, loss=0.245, lr=1e-5]Steps:  24%|██▍       | 3604/15001 [2:18:59<6:00:20,  1.90s/it, loss=0.245, lr=1e-5]Steps:  24%|██▍       | 3604/15001 [2:18:59<6:00:20,  1.90s/it, loss=0.209, lr=1e-5]Steps:  24%|██▍       | 3605/15001 [2:19:01<6:13:59,  1.97s/it, loss=0.209, lr=1e-5]Steps:  24%|██▍       | 3605/15001 [2:19:01<6:13:59,  1.97s/it, loss=0.218, lr=1e-5]Steps:  24%|██▍       | 3606/15001 [2:19:03<6:19:03,  2.00s/it, loss=0.218, lr=1e-5]Steps:  24%|██▍       | 3606/15001 [2:19:04<6:19:03,  2.00s/it, loss=0.184, lr=1e-5]Steps:  24%|██▍       | 3607/15001 [2:19:05<6:26:52,  2.04s/it, loss=0.184, lr=1e-5]Steps:  24%|██▍       | 3607/15001 [2:19:05<6:26:52,  2.04s/it, loss=0.252, lr=1e-5]Steps:  24%|██▍       | 3608/15001 [2:19:07<6:19:55,  2.00s/it, loss=0.252, lr=1e-5]Steps:  24%|██▍       | 3608/15001 [2:19:07<6:19:55,  2.00s/it, loss=0.21, lr=1e-5] Steps:  24%|██▍       | 3609/15001 [2:19:09<6:15:49,  1.98s/it, loss=0.21, lr=1e-5]Steps:  24%|██▍       | 3609/15001 [2:19:09<6:15:49,  1.98s/it, loss=0.307, lr=1e-5]Steps:  24%|██▍       | 3610/15001 [2:19:11<6:24:21,  2.02s/it, loss=0.307, lr=1e-5]Steps:  24%|██▍       | 3610/15001 [2:19:11<6:24:21,  2.02s/it, loss=0.162, lr=1e-5]Steps:  24%|██▍       | 3611/15001 [2:19:13<6:01:39,  1.91s/it, loss=0.162, lr=1e-5]Steps:  24%|██▍       | 3611/15001 [2:19:13<6:01:39,  1.91s/it, loss=0.224, lr=1e-5]Steps:  24%|██▍       | 3612/15001 [2:19:15<5:53:56,  1.86s/it, loss=0.224, lr=1e-5]Steps:  24%|██▍       | 3612/15001 [2:19:15<5:53:56,  1.86s/it, loss=0.285, lr=1e-5]Steps:  24%|██▍       | 3613/15001 [2:19:17<6:02:53,  1.91s/it, loss=0.285, lr=1e-5]Steps:  24%|██▍       | 3613/15001 [2:19:17<6:02:53,  1.91s/it, loss=0.0913, lr=1e-5]Steps:  24%|██▍       | 3614/15001 [2:19:19<5:51:37,  1.85s/it, loss=0.0913, lr=1e-5]Steps:  24%|██▍       | 3614/15001 [2:19:19<5:51:37,  1.85s/it, loss=0.229, lr=1e-5] Steps:  24%|██▍       | 3615/15001 [2:19:20<5:51:13,  1.85s/it, loss=0.229, lr=1e-5]Steps:  24%|██▍       | 3615/15001 [2:19:21<5:51:13,  1.85s/it, loss=0.199, lr=1e-5]Steps:  24%|██▍       | 3616/15001 [2:19:22<6:02:25,  1.91s/it, loss=0.199, lr=1e-5]Steps:  24%|██▍       | 3616/15001 [2:19:22<6:02:25,  1.91s/it, loss=0.132, lr=1e-5]Steps:  24%|██▍       | 3617/15001 [2:19:24<5:55:45,  1.88s/it, loss=0.132, lr=1e-5]Steps:  24%|██▍       | 3617/15001 [2:19:24<5:55:45,  1.88s/it, loss=0.149, lr=1e-5]Steps:  24%|██▍       | 3618/15001 [2:19:26<5:47:54,  1.83s/it, loss=0.149, lr=1e-5]Steps:  24%|██▍       | 3618/15001 [2:19:26<5:47:54,  1.83s/it, loss=0.0452, lr=1e-5]Steps:  24%|██▍       | 3619/15001 [2:19:27<5:30:07,  1.74s/it, loss=0.0452, lr=1e-5]Steps:  24%|██▍       | 3619/15001 [2:19:28<5:30:07,  1.74s/it, loss=0.227, lr=1e-5] Steps:  24%|██▍       | 3620/15001 [2:19:29<5:39:25,  1.79s/it, loss=0.227, lr=1e-5]Steps:  24%|██▍       | 3620/15001 [2:19:30<5:39:25,  1.79s/it, loss=0.0735, lr=1e-5]Steps:  24%|██▍       | 3621/15001 [2:19:31<5:51:47,  1.85s/it, loss=0.0735, lr=1e-5]Steps:  24%|██▍       | 3621/15001 [2:19:31<5:51:47,  1.85s/it, loss=0.178, lr=1e-5] Steps:  24%|██▍       | 3622/15001 [2:19:33<5:40:51,  1.80s/it, loss=0.178, lr=1e-5]Steps:  24%|██▍       | 3622/15001 [2:19:33<5:40:51,  1.80s/it, loss=0.379, lr=1e-5]Steps:  24%|██▍       | 3623/15001 [2:19:35<5:38:33,  1.79s/it, loss=0.379, lr=1e-5]Steps:  24%|██▍       | 3623/15001 [2:19:35<5:38:33,  1.79s/it, loss=0.106, lr=1e-5]Steps:  24%|██▍       | 3624/15001 [2:19:37<5:39:13,  1.79s/it, loss=0.106, lr=1e-5]Steps:  24%|██▍       | 3624/15001 [2:19:37<5:39:13,  1.79s/it, loss=0.155, lr=1e-5]Steps:  24%|██▍       | 3625/15001 [2:19:39<5:50:15,  1.85s/it, loss=0.155, lr=1e-5]Steps:  24%|██▍       | 3625/15001 [2:19:39<5:50:15,  1.85s/it, loss=0.188, lr=1e-5]Steps:  24%|██▍       | 3626/15001 [2:19:40<5:44:32,  1.82s/it, loss=0.188, lr=1e-5]Steps:  24%|██▍       | 3626/15001 [2:19:40<5:44:32,  1.82s/it, loss=0.107, lr=1e-5]Steps:  24%|██▍       | 3627/15001 [2:19:42<5:38:42,  1.79s/it, loss=0.107, lr=1e-5]Steps:  24%|██▍       | 3627/15001 [2:19:42<5:38:42,  1.79s/it, loss=0.247, lr=1e-5]Steps:  24%|██▍       | 3628/15001 [2:19:44<6:02:15,  1.91s/it, loss=0.247, lr=1e-5]Steps:  24%|██▍       | 3628/15001 [2:19:44<6:02:15,  1.91s/it, loss=0.385, lr=1e-5]Steps:  24%|██▍       | 3629/15001 [2:19:46<6:04:29,  1.92s/it, loss=0.385, lr=1e-5]Steps:  24%|██▍       | 3629/15001 [2:19:46<6:04:29,  1.92s/it, loss=0.17, lr=1e-5] Steps:  24%|██▍       | 3630/15001 [2:19:48<6:04:17,  1.92s/it, loss=0.17, lr=1e-5]Steps:  24%|██▍       | 3630/15001 [2:19:48<6:04:17,  1.92s/it, loss=0.244, lr=1e-5]Steps:  24%|██▍       | 3631/15001 [2:19:50<6:01:27,  1.91s/it, loss=0.244, lr=1e-5]Steps:  24%|██▍       | 3631/15001 [2:19:50<6:01:27,  1.91s/it, loss=0.216, lr=1e-5]Steps:  24%|██▍       | 3632/15001 [2:19:52<6:12:36,  1.97s/it, loss=0.216, lr=1e-5]Steps:  24%|██▍       | 3632/15001 [2:19:52<6:12:36,  1.97s/it, loss=0.354, lr=1e-5]Steps:  24%|██▍       | 3633/15001 [2:19:54<6:17:56,  1.99s/it, loss=0.354, lr=1e-5]Steps:  24%|██▍       | 3633/15001 [2:19:54<6:17:56,  1.99s/it, loss=0.111, lr=1e-5]Steps:  24%|██▍       | 3634/15001 [2:19:56<6:12:01,  1.96s/it, loss=0.111, lr=1e-5]Steps:  24%|██▍       | 3634/15001 [2:19:56<6:12:01,  1.96s/it, loss=0.256, lr=1e-5]Steps:  24%|██▍       | 3635/15001 [2:19:58<5:49:42,  1.85s/it, loss=0.256, lr=1e-5]Steps:  24%|██▍       | 3635/15001 [2:19:58<5:49:42,  1.85s/it, loss=0.175, lr=1e-5]Steps:  24%|██▍       | 3636/15001 [2:20:00<5:55:20,  1.88s/it, loss=0.175, lr=1e-5]Steps:  24%|██▍       | 3636/15001 [2:20:00<5:55:20,  1.88s/it, loss=0.183, lr=1e-5]Steps:  24%|██▍       | 3637/15001 [2:20:01<5:51:30,  1.86s/it, loss=0.183, lr=1e-5]Steps:  24%|██▍       | 3637/15001 [2:20:02<5:51:30,  1.86s/it, loss=0.206, lr=1e-5]Steps:  24%|██▍       | 3638/15001 [2:20:03<5:56:49,  1.88s/it, loss=0.206, lr=1e-5]Steps:  24%|██▍       | 3638/15001 [2:20:03<5:56:49,  1.88s/it, loss=0.27, lr=1e-5] Steps:  24%|██▍       | 3639/15001 [2:20:05<5:56:42,  1.88s/it, loss=0.27, lr=1e-5]Steps:  24%|██▍       | 3639/15001 [2:20:05<5:56:42,  1.88s/it, loss=0.358, lr=1e-5]Steps:  24%|██▍       | 3640/15001 [2:20:07<5:58:25,  1.89s/it, loss=0.358, lr=1e-5]Steps:  24%|██▍       | 3640/15001 [2:20:07<5:58:25,  1.89s/it, loss=0.0839, lr=1e-5]Steps:  24%|██▍       | 3641/15001 [2:20:09<5:35:41,  1.77s/it, loss=0.0839, lr=1e-5]Steps:  24%|██▍       | 3641/15001 [2:20:09<5:35:41,  1.77s/it, loss=0.153, lr=1e-5] Steps:  24%|██▍       | 3642/15001 [2:20:11<5:48:48,  1.84s/it, loss=0.153, lr=1e-5]Steps:  24%|██▍       | 3642/15001 [2:20:11<5:48:48,  1.84s/it, loss=0.12, lr=1e-5] Steps:  24%|██▍       | 3643/15001 [2:20:12<5:37:31,  1.78s/it, loss=0.12, lr=1e-5]Steps:  24%|██▍       | 3643/15001 [2:20:13<5:37:31,  1.78s/it, loss=0.192, lr=1e-5]Steps:  24%|██▍       | 3644/15001 [2:20:14<5:57:50,  1.89s/it, loss=0.192, lr=1e-5]Steps:  24%|██▍       | 3644/15001 [2:20:14<5:57:50,  1.89s/it, loss=0.319, lr=1e-5]Steps:  24%|██▍       | 3645/15001 [2:20:16<5:48:35,  1.84s/it, loss=0.319, lr=1e-5]Steps:  24%|██▍       | 3645/15001 [2:20:16<5:48:35,  1.84s/it, loss=0.125, lr=1e-5]Steps:  24%|██▍       | 3646/15001 [2:20:18<5:47:49,  1.84s/it, loss=0.125, lr=1e-5]Steps:  24%|██▍       | 3646/15001 [2:20:18<5:47:49,  1.84s/it, loss=0.168, lr=1e-5]Steps:  24%|██▍       | 3647/15001 [2:20:20<5:40:22,  1.80s/it, loss=0.168, lr=1e-5]Steps:  24%|██▍       | 3647/15001 [2:20:20<5:40:22,  1.80s/it, loss=0.0545, lr=1e-5]Steps:  24%|██▍       | 3648/15001 [2:20:21<5:37:54,  1.79s/it, loss=0.0545, lr=1e-5]Steps:  24%|██▍       | 3648/15001 [2:20:22<5:37:54,  1.79s/it, loss=0.121, lr=1e-5] Steps:  24%|██▍       | 3649/15001 [2:20:23<5:46:51,  1.83s/it, loss=0.121, lr=1e-5]Steps:  24%|██▍       | 3649/15001 [2:20:24<5:46:51,  1.83s/it, loss=0.11, lr=1e-5] Steps:  24%|██▍       | 3650/15001 [2:20:25<5:48:25,  1.84s/it, loss=0.11, lr=1e-5]Steps:  24%|██▍       | 3650/15001 [2:20:25<5:48:25,  1.84s/it, loss=0.0555, lr=1e-5]Steps:  24%|██▍       | 3651/15001 [2:20:27<6:05:51,  1.93s/it, loss=0.0555, lr=1e-5]Steps:  24%|██▍       | 3651/15001 [2:20:27<6:05:51,  1.93s/it, loss=0.269, lr=1e-5] Steps:  24%|██▍       | 3652/15001 [2:20:29<5:50:47,  1.85s/it, loss=0.269, lr=1e-5]Steps:  24%|██▍       | 3652/15001 [2:20:29<5:50:47,  1.85s/it, loss=0.252, lr=1e-5]Steps:  24%|██▍       | 3653/15001 [2:20:31<6:13:11,  1.97s/it, loss=0.252, lr=1e-5]Steps:  24%|██▍       | 3653/15001 [2:20:31<6:13:11,  1.97s/it, loss=0.291, lr=1e-5]Steps:  24%|██▍       | 3654/15001 [2:20:33<6:06:38,  1.94s/it, loss=0.291, lr=1e-5]Steps:  24%|██▍       | 3654/15001 [2:20:33<6:06:38,  1.94s/it, loss=0.17, lr=1e-5] Steps:  24%|██▍       | 3655/15001 [2:20:35<6:13:23,  1.97s/it, loss=0.17, lr=1e-5]Steps:  24%|██▍       | 3655/15001 [2:20:35<6:13:23,  1.97s/it, loss=0.0294, lr=1e-5]Steps:  24%|██▍       | 3656/15001 [2:20:37<6:06:38,  1.94s/it, loss=0.0294, lr=1e-5]Steps:  24%|██▍       | 3656/15001 [2:20:37<6:06:38,  1.94s/it, loss=0.13, lr=1e-5]  Steps:  24%|██▍       | 3657/15001 [2:20:39<5:51:53,  1.86s/it, loss=0.13, lr=1e-5]Steps:  24%|██▍       | 3657/15001 [2:20:39<5:51:53,  1.86s/it, loss=0.0769, lr=1e-5]Steps:  24%|██▍       | 3658/15001 [2:20:41<5:53:34,  1.87s/it, loss=0.0769, lr=1e-5]Steps:  24%|██▍       | 3658/15001 [2:20:41<5:53:34,  1.87s/it, loss=0.197, lr=1e-5] Steps:  24%|██▍       | 3659/15001 [2:20:42<5:47:58,  1.84s/it, loss=0.197, lr=1e-5]Steps:  24%|██▍       | 3659/15001 [2:20:43<5:47:58,  1.84s/it, loss=0.201, lr=1e-5]Steps:  24%|██▍       | 3660/15001 [2:20:45<6:03:54,  1.93s/it, loss=0.201, lr=1e-5]Steps:  24%|██▍       | 3660/15001 [2:20:45<6:03:54,  1.93s/it, loss=0.204, lr=1e-5]Steps:  24%|██▍       | 3661/15001 [2:20:46<5:52:28,  1.86s/it, loss=0.204, lr=1e-5]Steps:  24%|██▍       | 3661/15001 [2:20:46<5:52:28,  1.86s/it, loss=0.107, lr=1e-5]Steps:  24%|██▍       | 3662/15001 [2:20:48<5:50:49,  1.86s/it, loss=0.107, lr=1e-5]Steps:  24%|██▍       | 3662/15001 [2:20:48<5:50:49,  1.86s/it, loss=0.268, lr=1e-5]Steps:  24%|██▍       | 3663/15001 [2:20:50<5:47:49,  1.84s/it, loss=0.268, lr=1e-5]Steps:  24%|██▍       | 3663/15001 [2:20:50<5:47:49,  1.84s/it, loss=0.217, lr=1e-5]Steps:  24%|██▍       | 3664/15001 [2:20:52<5:45:58,  1.83s/it, loss=0.217, lr=1e-5]Steps:  24%|██▍       | 3664/15001 [2:20:52<5:45:58,  1.83s/it, loss=0.0188, lr=1e-5]Steps:  24%|██▍       | 3665/15001 [2:20:53<5:31:30,  1.75s/it, loss=0.0188, lr=1e-5]Steps:  24%|██▍       | 3665/15001 [2:20:54<5:31:30,  1.75s/it, loss=0.158, lr=1e-5] Steps:  24%|██▍       | 3666/15001 [2:20:55<5:41:58,  1.81s/it, loss=0.158, lr=1e-5]Steps:  24%|██▍       | 3666/15001 [2:20:55<5:41:58,  1.81s/it, loss=0.388, lr=1e-5]Steps:  24%|██▍       | 3667/15001 [2:20:57<5:43:15,  1.82s/it, loss=0.388, lr=1e-5]Steps:  24%|██▍       | 3667/15001 [2:20:57<5:43:15,  1.82s/it, loss=0.171, lr=1e-5]Steps:  24%|██▍       | 3668/15001 [2:20:59<5:34:14,  1.77s/it, loss=0.171, lr=1e-5]Steps:  24%|██▍       | 3668/15001 [2:20:59<5:34:14,  1.77s/it, loss=0.115, lr=1e-5]Steps:  24%|██▍       | 3669/15001 [2:21:01<5:45:25,  1.83s/it, loss=0.115, lr=1e-5]Steps:  24%|██▍       | 3669/15001 [2:21:01<5:45:25,  1.83s/it, loss=0.126, lr=1e-5]Steps:  24%|██▍       | 3670/15001 [2:21:03<5:46:40,  1.84s/it, loss=0.126, lr=1e-5]Steps:  24%|██▍       | 3670/15001 [2:21:03<5:46:40,  1.84s/it, loss=0.317, lr=1e-5]Steps:  24%|██▍       | 3671/15001 [2:21:04<5:39:05,  1.80s/it, loss=0.317, lr=1e-5]Steps:  24%|██▍       | 3671/15001 [2:21:04<5:39:05,  1.80s/it, loss=0.0807, lr=1e-5]Steps:  24%|██▍       | 3672/15001 [2:21:06<5:51:44,  1.86s/it, loss=0.0807, lr=1e-5]Steps:  24%|██▍       | 3672/15001 [2:21:06<5:51:44,  1.86s/it, loss=0.144, lr=1e-5] Steps:  24%|██▍       | 3673/15001 [2:21:08<5:43:27,  1.82s/it, loss=0.144, lr=1e-5]Steps:  24%|██▍       | 3673/15001 [2:21:08<5:43:27,  1.82s/it, loss=0.198, lr=1e-5]Steps:  24%|██▍       | 3674/15001 [2:21:10<6:00:37,  1.91s/it, loss=0.198, lr=1e-5]Steps:  24%|██▍       | 3674/15001 [2:21:10<6:00:37,  1.91s/it, loss=0.0454, lr=1e-5]Steps:  24%|██▍       | 3675/15001 [2:21:12<5:59:06,  1.90s/it, loss=0.0454, lr=1e-5]Steps:  24%|██▍       | 3675/15001 [2:21:12<5:59:06,  1.90s/it, loss=0.124, lr=1e-5] Steps:  25%|██▍       | 3676/15001 [2:21:14<6:08:45,  1.95s/it, loss=0.124, lr=1e-5]Steps:  25%|██▍       | 3676/15001 [2:21:14<6:08:45,  1.95s/it, loss=0.0917, lr=1e-5]Steps:  25%|██▍       | 3677/15001 [2:21:16<6:15:14,  1.99s/it, loss=0.0917, lr=1e-5]Steps:  25%|██▍       | 3677/15001 [2:21:16<6:15:14,  1.99s/it, loss=0.224, lr=1e-5] Steps:  25%|██▍       | 3678/15001 [2:21:18<6:11:11,  1.97s/it, loss=0.224, lr=1e-5]Steps:  25%|██▍       | 3678/15001 [2:21:18<6:11:11,  1.97s/it, loss=0.174, lr=1e-5]Steps:  25%|██▍       | 3679/15001 [2:21:20<6:29:19,  2.06s/it, loss=0.174, lr=1e-5]Steps:  25%|██▍       | 3679/15001 [2:21:20<6:29:19,  2.06s/it, loss=0.244, lr=1e-5]Steps:  25%|██▍       | 3680/15001 [2:21:22<6:16:59,  2.00s/it, loss=0.244, lr=1e-5]Steps:  25%|██▍       | 3680/15001 [2:21:22<6:16:59,  2.00s/it, loss=0.203, lr=1e-5]Steps:  25%|██▍       | 3681/15001 [2:21:24<5:57:41,  1.90s/it, loss=0.203, lr=1e-5]Steps:  25%|██▍       | 3681/15001 [2:21:24<5:57:41,  1.90s/it, loss=0.225, lr=1e-5]Steps:  25%|██▍       | 3682/15001 [2:21:26<5:51:14,  1.86s/it, loss=0.225, lr=1e-5]Steps:  25%|██▍       | 3682/15001 [2:21:26<5:51:14,  1.86s/it, loss=0.282, lr=1e-5]Steps:  25%|██▍       | 3683/15001 [2:21:27<5:51:35,  1.86s/it, loss=0.282, lr=1e-5]Steps:  25%|██▍       | 3683/15001 [2:21:28<5:51:35,  1.86s/it, loss=0.169, lr=1e-5]Steps:  25%|██▍       | 3684/15001 [2:21:29<5:45:19,  1.83s/it, loss=0.169, lr=1e-5]Steps:  25%|██▍       | 3684/15001 [2:21:30<5:45:19,  1.83s/it, loss=0.227, lr=1e-5]Steps:  25%|██▍       | 3685/15001 [2:21:31<5:52:45,  1.87s/it, loss=0.227, lr=1e-5]Steps:  25%|██▍       | 3685/15001 [2:21:31<5:52:45,  1.87s/it, loss=0.185, lr=1e-5]Steps:  25%|██▍       | 3686/15001 [2:21:33<5:49:53,  1.86s/it, loss=0.185, lr=1e-5]Steps:  25%|██▍       | 3686/15001 [2:21:33<5:49:53,  1.86s/it, loss=0.0444, lr=1e-5]Steps:  25%|██▍       | 3687/15001 [2:21:35<5:46:29,  1.84s/it, loss=0.0444, lr=1e-5]Steps:  25%|██▍       | 3687/15001 [2:21:35<5:46:29,  1.84s/it, loss=0.15, lr=1e-5]  Steps:  25%|██▍       | 3688/15001 [2:21:37<5:48:29,  1.85s/it, loss=0.15, lr=1e-5]Steps:  25%|██▍       | 3688/15001 [2:21:37<5:48:29,  1.85s/it, loss=0.118, lr=1e-5]Steps:  25%|██▍       | 3689/15001 [2:21:39<5:53:59,  1.88s/it, loss=0.118, lr=1e-5]Steps:  25%|██▍       | 3689/15001 [2:21:39<5:53:59,  1.88s/it, loss=0.103, lr=1e-5]Steps:  25%|██▍       | 3690/15001 [2:21:40<5:52:19,  1.87s/it, loss=0.103, lr=1e-5]Steps:  25%|██▍       | 3690/15001 [2:21:41<5:52:19,  1.87s/it, loss=0.182, lr=1e-5]Steps:  25%|██▍       | 3691/15001 [2:21:42<5:38:51,  1.80s/it, loss=0.182, lr=1e-5]Steps:  25%|██▍       | 3691/15001 [2:21:42<5:38:51,  1.80s/it, loss=0.385, lr=1e-5]Steps:  25%|██▍       | 3692/15001 [2:21:44<5:39:41,  1.80s/it, loss=0.385, lr=1e-5]Steps:  25%|██▍       | 3692/15001 [2:21:44<5:39:41,  1.80s/it, loss=0.458, lr=1e-5]Steps:  25%|██▍       | 3693/15001 [2:21:46<5:43:53,  1.82s/it, loss=0.458, lr=1e-5]Steps:  25%|██▍       | 3693/15001 [2:21:46<5:43:53,  1.82s/it, loss=0.164, lr=1e-5]Steps:  25%|██▍       | 3694/15001 [2:21:48<5:42:18,  1.82s/it, loss=0.164, lr=1e-5]Steps:  25%|██▍       | 3694/15001 [2:21:48<5:42:18,  1.82s/it, loss=0.194, lr=1e-5]Steps:  25%|██▍       | 3695/15001 [2:21:49<5:42:41,  1.82s/it, loss=0.194, lr=1e-5]Steps:  25%|██▍       | 3695/15001 [2:21:50<5:42:41,  1.82s/it, loss=0.0943, lr=1e-5]Steps:  25%|██▍       | 3696/15001 [2:21:51<5:56:55,  1.89s/it, loss=0.0943, lr=1e-5]Steps:  25%|██▍       | 3696/15001 [2:21:52<5:56:55,  1.89s/it, loss=0.156, lr=1e-5] Steps:  25%|██▍       | 3697/15001 [2:21:54<6:08:24,  1.96s/it, loss=0.156, lr=1e-5]Steps:  25%|██▍       | 3697/15001 [2:21:54<6:08:24,  1.96s/it, loss=0.122, lr=1e-5]Steps:  25%|██▍       | 3698/15001 [2:21:56<6:07:48,  1.95s/it, loss=0.122, lr=1e-5]Steps:  25%|██▍       | 3698/15001 [2:21:56<6:07:48,  1.95s/it, loss=0.302, lr=1e-5]Steps:  25%|██▍       | 3699/15001 [2:21:58<6:18:21,  2.01s/it, loss=0.302, lr=1e-5]Steps:  25%|██▍       | 3699/15001 [2:21:58<6:18:21,  2.01s/it, loss=0.136, lr=1e-5]Steps:  25%|██▍       | 3700/15001 [2:22:00<6:19:26,  2.01s/it, loss=0.136, lr=1e-5]Steps:  25%|██▍       | 3700/15001 [2:22:00<6:19:26,  2.01s/it, loss=0.116, lr=1e-5]Steps:  25%|██▍       | 3701/15001 [2:22:02<6:20:57,  2.02s/it, loss=0.116, lr=1e-5]Steps:  25%|██▍       | 3701/15001 [2:22:02<6:20:57,  2.02s/it, loss=0.232, lr=1e-5]Steps:  25%|██▍       | 3702/15001 [2:22:04<6:16:22,  2.00s/it, loss=0.232, lr=1e-5]Steps:  25%|██▍       | 3702/15001 [2:22:04<6:16:22,  2.00s/it, loss=0.273, lr=1e-5]Steps:  25%|██▍       | 3703/15001 [2:22:05<5:45:37,  1.84s/it, loss=0.273, lr=1e-5]Steps:  25%|██▍       | 3703/15001 [2:22:06<5:45:37,  1.84s/it, loss=0.042, lr=1e-5]Steps:  25%|██▍       | 3704/15001 [2:22:07<5:43:24,  1.82s/it, loss=0.042, lr=1e-5]Steps:  25%|██▍       | 3704/15001 [2:22:07<5:43:24,  1.82s/it, loss=0.176, lr=1e-5]Steps:  25%|██▍       | 3705/15001 [2:22:09<6:00:47,  1.92s/it, loss=0.176, lr=1e-5]Steps:  25%|██▍       | 3705/15001 [2:22:09<6:00:47,  1.92s/it, loss=0.144, lr=1e-5]Steps:  25%|██▍       | 3706/15001 [2:22:11<5:55:41,  1.89s/it, loss=0.144, lr=1e-5]Steps:  25%|██▍       | 3706/15001 [2:22:11<5:55:41,  1.89s/it, loss=0.215, lr=1e-5]Steps:  25%|██▍       | 3707/15001 [2:22:12<5:39:04,  1.80s/it, loss=0.215, lr=1e-5]Steps:  25%|██▍       | 3707/15001 [2:22:13<5:39:04,  1.80s/it, loss=0.0727, lr=1e-5]Steps:  25%|██▍       | 3708/15001 [2:22:14<5:40:19,  1.81s/it, loss=0.0727, lr=1e-5]Steps:  25%|██▍       | 3708/15001 [2:22:15<5:40:19,  1.81s/it, loss=0.115, lr=1e-5] Steps:  25%|██▍       | 3709/15001 [2:22:16<5:52:20,  1.87s/it, loss=0.115, lr=1e-5]Steps:  25%|██▍       | 3709/15001 [2:22:16<5:52:20,  1.87s/it, loss=0.286, lr=1e-5]Steps:  25%|██▍       | 3710/15001 [2:22:18<5:44:21,  1.83s/it, loss=0.286, lr=1e-5]Steps:  25%|██▍       | 3710/15001 [2:22:18<5:44:21,  1.83s/it, loss=0.0678, lr=1e-5]Steps:  25%|██▍       | 3711/15001 [2:22:20<5:37:24,  1.79s/it, loss=0.0678, lr=1e-5]Steps:  25%|██▍       | 3711/15001 [2:22:20<5:37:24,  1.79s/it, loss=0.127, lr=1e-5] Steps:  25%|██▍       | 3712/15001 [2:22:22<5:58:19,  1.90s/it, loss=0.127, lr=1e-5]Steps:  25%|██▍       | 3712/15001 [2:22:22<5:58:19,  1.90s/it, loss=0.304, lr=1e-5]Steps:  25%|██▍       | 3713/15001 [2:22:24<5:51:24,  1.87s/it, loss=0.304, lr=1e-5]Steps:  25%|██▍       | 3713/15001 [2:22:24<5:51:24,  1.87s/it, loss=0.0583, lr=1e-5]Steps:  25%|██▍       | 3714/15001 [2:22:25<5:45:41,  1.84s/it, loss=0.0583, lr=1e-5]Steps:  25%|██▍       | 3714/15001 [2:22:26<5:45:41,  1.84s/it, loss=0.231, lr=1e-5] Steps:  25%|██▍       | 3715/15001 [2:22:27<5:52:59,  1.88s/it, loss=0.231, lr=1e-5]Steps:  25%|██▍       | 3715/15001 [2:22:27<5:52:59,  1.88s/it, loss=0.0281, lr=1e-5]Steps:  25%|██▍       | 3716/15001 [2:22:29<5:39:38,  1.81s/it, loss=0.0281, lr=1e-5]Steps:  25%|██▍       | 3716/15001 [2:22:29<5:39:38,  1.81s/it, loss=0.261, lr=1e-5] Steps:  25%|██▍       | 3717/15001 [2:22:31<5:49:18,  1.86s/it, loss=0.261, lr=1e-5]Steps:  25%|██▍       | 3717/15001 [2:22:31<5:49:18,  1.86s/it, loss=0.102, lr=1e-5]Steps:  25%|██▍       | 3718/15001 [2:22:33<5:40:06,  1.81s/it, loss=0.102, lr=1e-5]Steps:  25%|██▍       | 3718/15001 [2:22:33<5:40:06,  1.81s/it, loss=0.192, lr=1e-5]Steps:  25%|██▍       | 3719/15001 [2:22:35<5:46:59,  1.85s/it, loss=0.192, lr=1e-5]Steps:  25%|██▍       | 3719/15001 [2:22:35<5:46:59,  1.85s/it, loss=0.189, lr=1e-5]Steps:  25%|██▍       | 3720/15001 [2:22:37<6:16:55,  2.00s/it, loss=0.189, lr=1e-5]Steps:  25%|██▍       | 3720/15001 [2:22:37<6:16:55,  2.00s/it, loss=0.05, lr=1e-5] Steps:  25%|██▍       | 3721/15001 [2:22:39<6:25:50,  2.05s/it, loss=0.05, lr=1e-5]Steps:  25%|██▍       | 3721/15001 [2:22:39<6:25:50,  2.05s/it, loss=0.101, lr=1e-5]Steps:  25%|██▍       | 3722/15001 [2:22:41<6:23:27,  2.04s/it, loss=0.101, lr=1e-5]Steps:  25%|██▍       | 3722/15001 [2:22:41<6:23:27,  2.04s/it, loss=0.21, lr=1e-5] Steps:  25%|██▍       | 3723/15001 [2:22:43<6:23:50,  2.04s/it, loss=0.21, lr=1e-5]Steps:  25%|██▍       | 3723/15001 [2:22:43<6:23:50,  2.04s/it, loss=0.0872, lr=1e-5]Steps:  25%|██▍       | 3724/15001 [2:22:45<6:20:55,  2.03s/it, loss=0.0872, lr=1e-5]Steps:  25%|██▍       | 3724/15001 [2:22:45<6:20:55,  2.03s/it, loss=0.117, lr=1e-5] Steps:  25%|██▍       | 3725/15001 [2:22:47<6:06:12,  1.95s/it, loss=0.117, lr=1e-5]Steps:  25%|██▍       | 3725/15001 [2:22:47<6:06:12,  1.95s/it, loss=0.179, lr=1e-5]Steps:  25%|██▍       | 3726/15001 [2:22:49<5:50:27,  1.86s/it, loss=0.179, lr=1e-5]Steps:  25%|██▍       | 3726/15001 [2:22:49<5:50:27,  1.86s/it, loss=0.0659, lr=1e-5]Steps:  25%|██▍       | 3727/15001 [2:22:51<5:54:58,  1.89s/it, loss=0.0659, lr=1e-5]Steps:  25%|██▍       | 3727/15001 [2:22:51<5:54:58,  1.89s/it, loss=0.302, lr=1e-5] Steps:  25%|██▍       | 3728/15001 [2:22:53<5:53:25,  1.88s/it, loss=0.302, lr=1e-5]Steps:  25%|██▍       | 3728/15001 [2:22:53<5:53:25,  1.88s/it, loss=0.0572, lr=1e-5]Steps:  25%|██▍       | 3729/15001 [2:22:54<5:46:40,  1.85s/it, loss=0.0572, lr=1e-5]Steps:  25%|██▍       | 3729/15001 [2:22:54<5:46:40,  1.85s/it, loss=0.0468, lr=1e-5]Steps:  25%|██▍       | 3730/15001 [2:22:56<5:43:32,  1.83s/it, loss=0.0468, lr=1e-5]Steps:  25%|██▍       | 3730/15001 [2:22:56<5:43:32,  1.83s/it, loss=0.219, lr=1e-5] Steps:  25%|██▍       | 3731/15001 [2:22:58<5:52:05,  1.87s/it, loss=0.219, lr=1e-5]Steps:  25%|██▍       | 3731/15001 [2:22:58<5:52:05,  1.87s/it, loss=0.194, lr=1e-5]Steps:  25%|██▍       | 3732/15001 [2:23:00<5:45:21,  1.84s/it, loss=0.194, lr=1e-5]Steps:  25%|██▍       | 3732/15001 [2:23:00<5:45:21,  1.84s/it, loss=0.308, lr=1e-5]Steps:  25%|██▍       | 3733/15001 [2:23:01<5:36:09,  1.79s/it, loss=0.308, lr=1e-5]Steps:  25%|██▍       | 3733/15001 [2:23:02<5:36:09,  1.79s/it, loss=0.0636, lr=1e-5]Steps:  25%|██▍       | 3734/15001 [2:23:03<5:47:32,  1.85s/it, loss=0.0636, lr=1e-5]Steps:  25%|██▍       | 3734/15001 [2:23:04<5:47:32,  1.85s/it, loss=0.131, lr=1e-5] Steps:  25%|██▍       | 3735/15001 [2:23:05<5:35:43,  1.79s/it, loss=0.131, lr=1e-5]Steps:  25%|██▍       | 3735/15001 [2:23:06<5:35:43,  1.79s/it, loss=0.139, lr=1e-5]Steps:  25%|██▍       | 3736/15001 [2:23:07<6:05:27,  1.95s/it, loss=0.139, lr=1e-5]Steps:  25%|██▍       | 3736/15001 [2:23:08<6:05:27,  1.95s/it, loss=0.128, lr=1e-5]Steps:  25%|██▍       | 3737/15001 [2:23:09<5:49:35,  1.86s/it, loss=0.128, lr=1e-5]Steps:  25%|██▍       | 3737/15001 [2:23:09<5:49:35,  1.86s/it, loss=0.434, lr=1e-5]Steps:  25%|██▍       | 3738/15001 [2:23:11<5:30:27,  1.76s/it, loss=0.434, lr=1e-5]Steps:  25%|██▍       | 3738/15001 [2:23:11<5:30:27,  1.76s/it, loss=0.357, lr=1e-5]Steps:  25%|██▍       | 3739/15001 [2:23:13<5:44:43,  1.84s/it, loss=0.357, lr=1e-5]Steps:  25%|██▍       | 3739/15001 [2:23:13<5:44:43,  1.84s/it, loss=0.0893, lr=1e-5]Steps:  25%|██▍       | 3740/15001 [2:23:15<5:56:26,  1.90s/it, loss=0.0893, lr=1e-5]Steps:  25%|██▍       | 3740/15001 [2:23:15<5:56:26,  1.90s/it, loss=0.232, lr=1e-5] Steps:  25%|██▍       | 3741/15001 [2:23:16<5:46:55,  1.85s/it, loss=0.232, lr=1e-5]Steps:  25%|██▍       | 3741/15001 [2:23:17<5:46:55,  1.85s/it, loss=0.194, lr=1e-5]Steps:  25%|██▍       | 3742/15001 [2:23:19<6:04:06,  1.94s/it, loss=0.194, lr=1e-5]Steps:  25%|██▍       | 3742/15001 [2:23:19<6:04:06,  1.94s/it, loss=0.161, lr=1e-5]Steps:  25%|██▍       | 3743/15001 [2:23:21<6:04:49,  1.94s/it, loss=0.161, lr=1e-5]Steps:  25%|██▍       | 3743/15001 [2:23:21<6:04:49,  1.94s/it, loss=0.174, lr=1e-5]Steps:  25%|██▍       | 3744/15001 [2:23:23<6:08:06,  1.96s/it, loss=0.174, lr=1e-5]Steps:  25%|██▍       | 3744/15001 [2:23:23<6:08:06,  1.96s/it, loss=0.0558, lr=1e-5]Steps:  25%|██▍       | 3745/15001 [2:23:24<6:03:37,  1.94s/it, loss=0.0558, lr=1e-5]Steps:  25%|██▍       | 3745/15001 [2:23:25<6:03:37,  1.94s/it, loss=0.147, lr=1e-5] Steps:  25%|██▍       | 3746/15001 [2:23:27<6:24:42,  2.05s/it, loss=0.147, lr=1e-5]Steps:  25%|██▍       | 3746/15001 [2:23:27<6:24:42,  2.05s/it, loss=0.0717, lr=1e-5]Steps:  25%|██▍       | 3747/15001 [2:23:29<6:21:35,  2.03s/it, loss=0.0717, lr=1e-5]Steps:  25%|██▍       | 3747/15001 [2:23:29<6:21:35,  2.03s/it, loss=0.315, lr=1e-5] Steps:  25%|██▍       | 3748/15001 [2:23:31<6:09:57,  1.97s/it, loss=0.315, lr=1e-5]Steps:  25%|██▍       | 3748/15001 [2:23:31<6:09:57,  1.97s/it, loss=0.0949, lr=1e-5]Steps:  25%|██▍       | 3749/15001 [2:23:32<6:01:10,  1.93s/it, loss=0.0949, lr=1e-5]Steps:  25%|██▍       | 3749/15001 [2:23:32<6:01:10,  1.93s/it, loss=0.188, lr=1e-5] Steps:  25%|██▍       | 3750/15001 [2:23:34<5:52:39,  1.88s/it, loss=0.188, lr=1e-5]Steps:  25%|██▍       | 3750/15001 [2:23:34<5:52:39,  1.88s/it, loss=0.263, lr=1e-5]Steps:  25%|██▌       | 3751/15001 [2:23:36<5:35:32,  1.79s/it, loss=0.263, lr=1e-5]Steps:  25%|██▌       | 3751/15001 [2:23:36<5:35:32,  1.79s/it, loss=0.218, lr=1e-5]Steps:  25%|██▌       | 3752/15001 [2:23:38<5:47:40,  1.85s/it, loss=0.218, lr=1e-5]Steps:  25%|██▌       | 3752/15001 [2:23:38<5:47:40,  1.85s/it, loss=0.276, lr=1e-5]Steps:  25%|██▌       | 3753/15001 [2:23:40<5:44:50,  1.84s/it, loss=0.276, lr=1e-5]Steps:  25%|█���▌       | 3753/15001 [2:23:40<5:44:50,  1.84s/it, loss=0.184, lr=1e-5]Steps:  25%|██▌       | 3754/15001 [2:23:41<5:45:27,  1.84s/it, loss=0.184, lr=1e-5]Steps:  25%|██▌       | 3754/15001 [2:23:42<5:45:27,  1.84s/it, loss=0.0874, lr=1e-5]Steps:  25%|██▌       | 3755/15001 [2:23:43<5:49:02,  1.86s/it, loss=0.0874, lr=1e-5]Steps:  25%|██▌       | 3755/15001 [2:23:43<5:49:02,  1.86s/it, loss=0.182, lr=1e-5] Steps:  25%|██▌       | 3756/15001 [2:23:45<5:50:18,  1.87s/it, loss=0.182, lr=1e-5]Steps:  25%|██▌       | 3756/15001 [2:23:45<5:50:18,  1.87s/it, loss=0.236, lr=1e-5]Steps:  25%|██▌       | 3757/15001 [2:23:47<5:52:12,  1.88s/it, loss=0.236, lr=1e-5]Steps:  25%|██▌       | 3757/15001 [2:23:47<5:52:12,  1.88s/it, loss=0.0398, lr=1e-5]Steps:  25%|██▌       | 3758/15001 [2:23:49<5:40:09,  1.82s/it, loss=0.0398, lr=1e-5]Steps:  25%|██▌       | 3758/15001 [2:23:49<5:40:09,  1.82s/it, loss=0.0712, lr=1e-5]Steps:  25%|██▌       | 3759/15001 [2:23:51<5:39:05,  1.81s/it, loss=0.0712, lr=1e-5]Steps:  25%|██▌       | 3759/15001 [2:23:51<5:39:05,  1.81s/it, loss=0.209, lr=1e-5] Steps:  25%|██▌       | 3760/15001 [2:23:52<5:33:14,  1.78s/it, loss=0.209, lr=1e-5]Steps:  25%|██▌       | 3760/15001 [2:23:53<5:33:14,  1.78s/it, loss=0.0643, lr=1e-5]Steps:  25%|██▌       | 3761/15001 [2:23:54<5:40:46,  1.82s/it, loss=0.0643, lr=1e-5]Steps:  25%|██▌       | 3761/15001 [2:23:54<5:40:46,  1.82s/it, loss=0.163, lr=1e-5] Steps:  25%|██▌       | 3762/15001 [2:23:56<5:33:53,  1.78s/it, loss=0.163, lr=1e-5]Steps:  25%|██▌       | 3762/15001 [2:23:56<5:33:53,  1.78s/it, loss=0.125, lr=1e-5]Steps:  25%|██▌       | 3763/15001 [2:23:58<5:39:43,  1.81s/it, loss=0.125, lr=1e-5]Steps:  25%|██▌       | 3763/15001 [2:23:58<5:39:43,  1.81s/it, loss=0.157, lr=1e-5]Steps:  25%|██▌       | 3764/15001 [2:24:00<5:51:09,  1.88s/it, loss=0.157, lr=1e-5]Steps:  25%|██▌       | 3764/15001 [2:24:00<5:51:09,  1.88s/it, loss=0.275, lr=1e-5]Steps:  25%|██▌       | 3765/15001 [2:24:02<5:47:18,  1.85s/it, loss=0.275, lr=1e-5]Steps:  25%|██▌       | 3765/15001 [2:24:02<5:47:18,  1.85s/it, loss=0.098, lr=1e-5]Steps:  25%|██▌       | 3766/15001 [2:24:03<5:50:19,  1.87s/it, loss=0.098, lr=1e-5]Steps:  25%|██▌       | 3766/15001 [2:24:04<5:50:19,  1.87s/it, loss=0.0494, lr=1e-5]Steps:  25%|██▌       | 3767/15001 [2:24:05<5:57:34,  1.91s/it, loss=0.0494, lr=1e-5]Steps:  25%|██▌       | 3767/15001 [2:24:06<5:57:34,  1.91s/it, loss=0.365, lr=1e-5] Steps:  25%|██▌       | 3768/15001 [2:24:08<6:05:45,  1.95s/it, loss=0.365, lr=1e-5]Steps:  25%|██▌       | 3768/15001 [2:24:08<6:05:45,  1.95s/it, loss=0.222, lr=1e-5]Steps:  25%|██▌       | 3769/15001 [2:24:10<6:13:51,  2.00s/it, loss=0.222, lr=1e-5]Steps:  25%|██▌       | 3769/15001 [2:24:10<6:13:51,  2.00s/it, loss=0.141, lr=1e-5]Steps:  25%|██▌       | 3770/15001 [2:24:12<6:11:28,  1.98s/it, loss=0.141, lr=1e-5]Steps:  25%|██▌       | 3770/15001 [2:24:12<6:11:28,  1.98s/it, loss=0.312, lr=1e-5]Steps:  25%|██▌       | 3771/15001 [2:24:13<6:00:12,  1.92s/it, loss=0.312, lr=1e-5]Steps:  25%|██▌       | 3771/15001 [2:24:14<6:00:12,  1.92s/it, loss=0.0799, lr=1e-5]Steps:  25%|██▌       | 3772/15001 [2:24:15<5:57:04,  1.91s/it, loss=0.0799, lr=1e-5]Steps:  25%|██▌       | 3772/15001 [2:24:15<5:57:04,  1.91s/it, loss=0.139, lr=1e-5] Steps:  25%|██▌       | 3773/15001 [2:24:17<5:46:26,  1.85s/it, loss=0.139, lr=1e-5]Steps:  25%|██▌       | 3773/15001 [2:24:17<5:46:26,  1.85s/it, loss=0.0481, lr=1e-5]Steps:  25%|██▌       | 3774/15001 [2:24:19<5:46:56,  1.85s/it, loss=0.0481, lr=1e-5]Steps:  25%|██▌       | 3774/15001 [2:24:19<5:46:56,  1.85s/it, loss=0.156, lr=1e-5] Steps:  25%|██▌       | 3775/15001 [2:24:21<5:56:29,  1.91s/it, loss=0.156, lr=1e-5]Steps:  25%|██▌       | 3775/15001 [2:24:21<5:56:29,  1.91s/it, loss=0.229, lr=1e-5]Steps:  25%|██▌       | 3776/15001 [2:24:23<5:45:46,  1.85s/it, loss=0.229, lr=1e-5]Steps:  25%|██▌       | 3776/15001 [2:24:23<5:45:46,  1.85s/it, loss=0.216, lr=1e-5]Steps:  25%|██▌       | 3777/15001 [2:24:24<5:49:36,  1.87s/it, loss=0.216, lr=1e-5]Steps:  25%|██▌       | 3777/15001 [2:24:25<5:49:36,  1.87s/it, loss=0.212, lr=1e-5]Steps:  25%|██▌       | 3778/15001 [2:24:26<5:39:35,  1.82s/it, loss=0.212, lr=1e-5]Steps:  25%|██▌       | 3778/15001 [2:24:26<5:39:35,  1.82s/it, loss=0.396, lr=1e-5]Steps:  25%|██▌       | 3779/15001 [2:24:28<5:40:53,  1.82s/it, loss=0.396, lr=1e-5]Steps:  25%|██▌       | 3779/15001 [2:24:28<5:40:53,  1.82s/it, loss=0.344, lr=1e-5]Steps:  25%|██▌       | 3780/15001 [2:24:30<5:37:21,  1.80s/it, loss=0.344, lr=1e-5]Steps:  25%|██▌       | 3780/15001 [2:24:30<5:37:21,  1.80s/it, loss=0.21, lr=1e-5] Steps:  25%|██▌       | 3781/15001 [2:24:31<5:28:16,  1.76s/it, loss=0.21, lr=1e-5]Steps:  25%|██▌       | 3781/15001 [2:24:32<5:28:16,  1.76s/it, loss=0.0872, lr=1e-5]Steps:  25%|██▌       | 3782/15001 [2:24:33<5:33:39,  1.78s/it, loss=0.0872, lr=1e-5]Steps:  25%|██▌       | 3782/15001 [2:24:34<5:33:39,  1.78s/it, loss=0.124, lr=1e-5] Steps:  25%|██▌       | 3783/15001 [2:24:35<5:39:12,  1.81s/it, loss=0.124, lr=1e-5]Steps:  25%|██▌       | 3783/15001 [2:24:35<5:39:12,  1.81s/it, loss=0.196, lr=1e-5]Steps:  25%|██▌       | 3784/15001 [2:24:37<5:34:33,  1.79s/it, loss=0.196, lr=1e-5]Steps:  25%|██▌       | 3784/15001 [2:24:37<5:34:33,  1.79s/it, loss=0.0758, lr=1e-5]Steps:  25%|██▌       | 3785/15001 [2:24:39<5:25:15,  1.74s/it, loss=0.0758, lr=1e-5]Steps:  25%|██▌       | 3785/15001 [2:24:39<5:25:15,  1.74s/it, loss=0.237, lr=1e-5] Steps:  25%|██▌       | 3786/15001 [2:24:41<5:50:50,  1.88s/it, loss=0.237, lr=1e-5]Steps:  25%|██▌       | 3786/15001 [2:24:41<5:50:50,  1.88s/it, loss=0.229, lr=1e-5]Steps:  25%|██▌       | 3787/15001 [2:24:42<5:44:59,  1.85s/it, loss=0.229, lr=1e-5]Steps:  25%|██▌       | 3787/15001 [2:24:43<5:44:59,  1.85s/it, loss=0.209, lr=1e-5]Steps:  25%|██▌       | 3788/15001 [2:24:45<6:05:40,  1.96s/it, loss=0.209, lr=1e-5]Steps:  25%|██▌       | 3788/15001 [2:24:45<6:05:40,  1.96s/it, loss=0.0747, lr=1e-5]Steps:  25%|██▌       | 3789/15001 [2:24:47<6:00:03,  1.93s/it, loss=0.0747, lr=1e-5]Steps:  25%|██▌       | 3789/15001 [2:24:47<6:00:03,  1.93s/it, loss=0.109, lr=1e-5] Steps:  25%|██▌       | 3790/15001 [2:24:49<6:08:47,  1.97s/it, loss=0.109, lr=1e-5]Steps:  25%|██▌       | 3790/15001 [2:24:49<6:08:47,  1.97s/it, loss=0.183, lr=1e-5]Steps:  25%|██▌       | 3791/15001 [2:24:51<6:08:41,  1.97s/it, loss=0.183, lr=1e-5]Steps:  25%|██▌       | 3791/15001 [2:24:51<6:08:41,  1.97s/it, loss=0.116, lr=1e-5]Steps:  25%|██▌       | 3792/15001 [2:24:53<6:07:05,  1.96s/it, loss=0.116, lr=1e-5]Steps:  25%|██▌       | 3792/15001 [2:24:53<6:07:05,  1.96s/it, loss=0.142, lr=1e-5]Steps:  25%|██▌       | 3793/15001 [2:24:55<6:14:52,  2.01s/it, loss=0.142, lr=1e-5]Steps:  25%|██▌       | 3793/15001 [2:24:55<6:14:52,  2.01s/it, loss=0.115, lr=1e-5]Steps:  25%|██▌       | 3794/15001 [2:24:56<6:03:36,  1.95s/it, loss=0.115, lr=1e-5]Steps:  25%|██▌       | 3794/15001 [2:24:57<6:03:36,  1.95s/it, loss=0.076, lr=1e-5]Steps:  25%|██▌       | 3795/15001 [2:24:58<5:58:00,  1.92s/it, loss=0.076, lr=1e-5]Steps:  25%|██▌       | 3795/15001 [2:24:59<5:58:00,  1.92s/it, loss=0.191, lr=1e-5]Steps:  25%|██▌       | 3796/15001 [2:25:00<5:45:11,  1.85s/it, loss=0.191, lr=1e-5]Steps:  25%|██▌       | 3796/15001 [2:25:00<5:45:11,  1.85s/it, loss=0.272, lr=1e-5]Steps:  25%|██▌       | 3797/15001 [2:25:02<5:55:27,  1.90s/it, loss=0.272, lr=1e-5]Steps:  25%|██▌       | 3797/15001 [2:25:02<5:55:27,  1.90s/it, loss=0.258, lr=1e-5]Steps:  25%|██▌       | 3798/15001 [2:25:05<6:46:09,  2.18s/it, loss=0.258, lr=1e-5]Steps:  25%|██▌       | 3798/15001 [2:25:05<6:46:09,  2.18s/it, loss=0.16, lr=1e-5] Steps:  25%|██▌       | 3799/15001 [2:25:07<6:29:05,  2.08s/it, loss=0.16, lr=1e-5]Steps:  25%|██▌       | 3799/15001 [2:25:07<6:29:05,  2.08s/it, loss=0.215, lr=1e-5]Steps:  25%|██▌       | 3800/15001 [2:25:09<6:14:52,  2.01s/it, loss=0.215, lr=1e-5]Steps:  25%|██▌       | 3800/15001 [2:25:09<6:14:52,  2.01s/it, loss=0.111, lr=1e-5]Steps:  25%|██▌       | 3801/15001 [2:25:10<6:05:53,  1.96s/it, loss=0.111, lr=1e-5]Steps:  25%|██▌       | 3801/15001 [2:25:10<6:05:53,  1.96s/it, loss=0.108, lr=1e-5]Steps:  25%|██▌       | 3802/15001 [2:25:12<5:58:40,  1.92s/it, loss=0.108, lr=1e-5]Steps:  25%|██▌       | 3802/15001 [2:25:12<5:58:40,  1.92s/it, loss=0.0153, lr=1e-5]Steps:  25%|██▌       | 3803/15001 [2:25:14<5:54:49,  1.90s/it, loss=0.0153, lr=1e-5]Steps:  25%|██▌       | 3803/15001 [2:25:14<5:54:49,  1.90s/it, loss=0.0908, lr=1e-5]Steps:  25%|██▌       | 3804/15001 [2:25:16<5:48:29,  1.87s/it, loss=0.0908, lr=1e-5]Steps:  25%|██▌       | 3804/15001 [2:25:16<5:48:29,  1.87s/it, loss=0.0796, lr=1e-5]Steps:  25%|██▌       | 3805/15001 [2:25:17<5:28:36,  1.76s/it, loss=0.0796, lr=1e-5]Steps:  25%|██▌       | 3805/15001 [2:25:18<5:28:36,  1.76s/it, loss=0.152, lr=1e-5] Steps:  25%|██▌       | 3806/15001 [2:25:19<5:38:32,  1.81s/it, loss=0.152, lr=1e-5]Steps:  25%|██▌       | 3806/15001 [2:25:19<5:38:32,  1.81s/it, loss=0.26, lr=1e-5] Steps:  25%|██▌       | 3807/15001 [2:25:21<5:26:48,  1.75s/it, loss=0.26, lr=1e-5]Steps:  25%|██▌       | 3807/15001 [2:25:21<5:26:48,  1.75s/it, loss=0.275, lr=1e-5]Steps:  25%|██▌       | 3808/15001 [2:25:23<5:41:18,  1.83s/it, loss=0.275, lr=1e-5]Steps:  25%|██▌       | 3808/15001 [2:25:23<5:41:18,  1.83s/it, loss=0.187, lr=1e-5]Steps:  25%|██▌       | 3809/15001 [2:25:25<5:39:53,  1.82s/it, loss=0.187, lr=1e-5]Steps:  25%|██▌       | 3809/15001 [2:25:25<5:39:53,  1.82s/it, loss=0.187, lr=1e-5]Steps:  25%|██▌       | 3810/15001 [2:25:27<5:58:48,  1.92s/it, loss=0.187, lr=1e-5]Steps:  25%|██▌       | 3810/15001 [2:25:27<5:58:48,  1.92s/it, loss=0.212, lr=1e-5]Steps:  25%|██▌       | 3811/15001 [2:25:29<5:57:43,  1.92s/it, loss=0.212, lr=1e-5]Steps:  25%|██▌       | 3811/15001 [2:25:29<5:57:43,  1.92s/it, loss=0.157, lr=1e-5]Steps:  25%|██▌       | 3812/15001 [2:25:31<5:55:42,  1.91s/it, loss=0.157, lr=1e-5]Steps:  25%|██▌       | 3812/15001 [2:25:31<5:55:42,  1.91s/it, loss=0.189, lr=1e-5]Steps:  25%|██▌       | 3813/15001 [2:25:33<6:08:33,  1.98s/it, loss=0.189, lr=1e-5]Steps:  25%|██▌       | 3813/15001 [2:25:33<6:08:33,  1.98s/it, loss=0.19, lr=1e-5] Steps:  25%|██▌       | 3814/15001 [2:25:35<6:02:33,  1.94s/it, loss=0.19, lr=1e-5]Steps:  25%|██▌       | 3814/15001 [2:25:35<6:02:33,  1.94s/it, loss=0.104, lr=1e-5]Steps:  25%|██▌       | 3815/15001 [2:25:37<6:11:14,  1.99s/it, loss=0.104, lr=1e-5]Steps:  25%|██▌       | 3815/15001 [2:25:37<6:11:14,  1.99s/it, loss=0.0958, lr=1e-5]Steps:  25%|██▌       | 3816/15001 [2:25:38<5:54:18,  1.90s/it, loss=0.0958, lr=1e-5]Steps:  25%|██▌       | 3816/15001 [2:25:39<5:54:18,  1.90s/it, loss=0.0602, lr=1e-5]Steps:  25%|██▌       | 3817/15001 [2:25:40<5:55:33,  1.91s/it, loss=0.0602, lr=1e-5]Steps:  25%|██▌       | 3817/15001 [2:25:41<5:55:33,  1.91s/it, loss=0.183, lr=1e-5] Steps:  25%|██▌       | 3818/15001 [2:25:42<5:51:59,  1.89s/it, loss=0.183, lr=1e-5]Steps:  25%|██▌       | 3818/15001 [2:25:42<5:51:59,  1.89s/it, loss=0.0912, lr=1e-5]Steps:  25%|██▌       | 3819/15001 [2:25:44<5:54:48,  1.90s/it, loss=0.0912, lr=1e-5]Steps:  25%|██▌       | 3819/15001 [2:25:44<5:54:48,  1.90s/it, loss=0.203, lr=1e-5] Steps:  25%|██▌       | 3820/15001 [2:25:46<5:32:45,  1.79s/it, loss=0.203, lr=1e-5]Steps:  25%|██▌       | 3820/15001 [2:25:46<5:32:45,  1.79s/it, loss=0.133, lr=1e-5]Steps:  25%|██▌       | 3821/15001 [2:25:48<5:55:02,  1.91s/it, loss=0.133, lr=1e-5]Steps:  25%|██▌       | 3821/15001 [2:25:48<5:55:02,  1.91s/it, loss=0.168, lr=1e-5]Steps:  25%|██▌       | 3822/15001 [2:25:50<5:42:02,  1.84s/it, loss=0.168, lr=1e-5]Steps:  25%|██▌       | 3822/15001 [2:25:50<5:42:02,  1.84s/it, loss=0.204, lr=1e-5]Steps:  25%|██▌       | 3823/15001 [2:25:51<5:34:06,  1.79s/it, loss=0.204, lr=1e-5]Steps:  25%|██▌       | 3823/15001 [2:25:52<5:34:06,  1.79s/it, loss=0.208, lr=1e-5]Steps:  25%|██▌       | 3824/15001 [2:25:54<6:02:07,  1.94s/it, loss=0.208, lr=1e-5]Steps:  25%|██▌       | 3824/15001 [2:25:54<6:02:07,  1.94s/it, loss=0.063, lr=1e-5]Steps:  25%|██▌       | 3825/15001 [2:25:55<5:44:39,  1.85s/it, loss=0.063, lr=1e-5]Steps:  25%|██▌       | 3825/15001 [2:25:55<5:44:39,  1.85s/it, loss=0.198, lr=1e-5]Steps:  26%|██▌       | 3826/15001 [2:25:57<6:00:05,  1.93s/it, loss=0.198, lr=1e-5]Steps:  26%|██▌       | 3826/15001 [2:25:57<6:00:05,  1.93s/it, loss=0.22, lr=1e-5] Steps:  26%|██▌       | 3827/15001 [2:25:59<5:47:30,  1.87s/it, loss=0.22, lr=1e-5]Steps:  26%|██▌       | 3827/15001 [2:25:59<5:47:30,  1.87s/it, loss=0.118, lr=1e-5]Steps:  26%|██▌       | 3828/15001 [2:26:01<5:56:06,  1.91s/it, loss=0.118, lr=1e-5]Steps:  26%|██▌       | 3828/15001 [2:26:01<5:56:06,  1.91s/it, loss=0.223, lr=1e-5]Steps:  26%|██▌       | 3829/15001 [2:26:03<5:41:29,  1.83s/it, loss=0.223, lr=1e-5]Steps:  26%|██▌       | 3829/15001 [2:26:03<5:41:29,  1.83s/it, loss=0.0568, lr=1e-5]Steps:  26%|██▌       | 3830/15001 [2:26:04<5:38:37,  1.82s/it, loss=0.0568, lr=1e-5]Steps:  26%|██▌       | 3830/15001 [2:26:05<5:38:37,  1.82s/it, loss=0.22, lr=1e-5]  Steps:  26%|██▌       | 3831/15001 [2:26:06<5:30:27,  1.78s/it, loss=0.22, lr=1e-5]Steps:  26%|██▌       | 3831/15001 [2:26:07<5:30:27,  1.78s/it, loss=0.16, lr=1e-5]Steps:  26%|██▌       | 3832/15001 [2:26:08<5:37:17,  1.81s/it, loss=0.16, lr=1e-5]Steps:  26%|██▌       | 3832/15001 [2:26:08<5:37:17,  1.81s/it, loss=0.0329, lr=1e-5]Steps:  26%|██▌       | 3833/15001 [2:26:10<5:41:03,  1.83s/it, loss=0.0329, lr=1e-5]Steps:  26%|██▌       | 3833/15001 [2:26:10<5:41:03,  1.83s/it, loss=0.313, lr=1e-5] Steps:  26%|██▌       | 3834/15001 [2:26:12<5:50:15,  1.88s/it, loss=0.313, lr=1e-5]Steps:  26%|██▌       | 3834/15001 [2:26:12<5:50:15,  1.88s/it, loss=0.248, lr=1e-5]Steps:  26%|██▌       | 3835/15001 [2:26:14<6:09:43,  1.99s/it, loss=0.248, lr=1e-5]Steps:  26%|██▌       | 3835/15001 [2:26:14<6:09:43,  1.99s/it, loss=0.211, lr=1e-5]Steps:  26%|██▌       | 3836/15001 [2:26:16<6:21:52,  2.05s/it, loss=0.211, lr=1e-5]Steps:  26%|██▌       | 3836/15001 [2:26:16<6:21:52,  2.05s/it, loss=0.175, lr=1e-5]Steps:  26%|██▌       | 3837/15001 [2:26:18<6:16:25,  2.02s/it, loss=0.175, lr=1e-5]Steps:  26%|██▌       | 3837/15001 [2:26:18<6:16:25,  2.02s/it, loss=0.152, lr=1e-5]Steps:  26%|██▌       | 3838/15001 [2:26:20<6:05:42,  1.97s/it, loss=0.152, lr=1e-5]Steps:  26%|██▌       | 3838/15001 [2:26:20<6:05:42,  1.97s/it, loss=0.0476, lr=1e-5]Steps:  26%|██▌       | 3839/15001 [2:26:22<6:04:20,  1.96s/it, loss=0.0476, lr=1e-5]Steps:  26%|██▌       | 3839/15001 [2:26:22<6:04:20,  1.96s/it, loss=0.173, lr=1e-5] Steps:  26%|██▌       | 3840/15001 [2:26:24<5:58:19,  1.93s/it, loss=0.173, lr=1e-5]Steps:  26%|██▌       | 3840/15001 [2:26:24<5:58:19,  1.93s/it, loss=0.136, lr=1e-5]Steps:  26%|██▌       | 3841/15001 [2:26:26<5:46:45,  1.86s/it, loss=0.136, lr=1e-5]Steps:  26%|██▌       | 3841/15001 [2:26:26<5:46:45,  1.86s/it, loss=0.134, lr=1e-5]Steps:  26%|██▌       | 3842/15001 [2:26:28<5:54:33,  1.91s/it, loss=0.134, lr=1e-5]Steps:  26%|██▌       | 3842/15001 [2:26:28<5:54:33,  1.91s/it, loss=0.0524, lr=1e-5]Steps:  26%|██▌       | 3843/15001 [2:26:29<5:37:00,  1.81s/it, loss=0.0524, lr=1e-5]Steps:  26%|██▌       | 3843/15001 [2:26:30<5:37:00,  1.81s/it, loss=0.119, lr=1e-5] Steps:  26%|██▌       | 3844/15001 [2:26:31<5:48:57,  1.88s/it, loss=0.119, lr=1e-5]Steps:  26%|██▌       | 3844/15001 [2:26:31<5:48:57,  1.88s/it, loss=0.0163, lr=1e-5]Steps:  26%|██▌       | 3845/15001 [2:26:33<5:31:27,  1.78s/it, loss=0.0163, lr=1e-5]Steps:  26%|██▌       | 3845/15001 [2:26:33<5:31:27,  1.78s/it, loss=0.231, lr=1e-5] Steps:  26%|██▌       | 3846/15001 [2:26:35<5:41:36,  1.84s/it, loss=0.231, lr=1e-5]Steps:  26%|██▌       | 3846/15001 [2:26:35<5:41:36,  1.84s/it, loss=0.0854, lr=1e-5]Steps:  26%|██▌       | 3847/15001 [2:26:37<5:40:38,  1.83s/it, loss=0.0854, lr=1e-5]Steps:  26%|██▌       | 3847/15001 [2:26:37<5:40:38,  1.83s/it, loss=0.039, lr=1e-5] Steps:  26%|██▌       | 3848/15001 [2:26:39<5:46:35,  1.86s/it, loss=0.039, lr=1e-5]Steps:  26%|██▌       | 3848/15001 [2:26:39<5:46:35,  1.86s/it, loss=0.0399, lr=1e-5]Steps:  26%|██▌       | 3849/15001 [2:26:40<5:22:35,  1.74s/it, loss=0.0399, lr=1e-5]Steps:  26%|██▌       | 3849/15001 [2:26:40<5:22:35,  1.74s/it, loss=0.145, lr=1e-5] Steps:  26%|██▌       | 3850/15001 [2:26:42<5:41:30,  1.84s/it, loss=0.145, lr=1e-5]Steps:  26%|██▌       | 3850/15001 [2:26:42<5:41:30,  1.84s/it, loss=0.11, lr=1e-5] Steps:  26%|██▌       | 3851/15001 [2:26:44<5:42:50,  1.84s/it, loss=0.11, lr=1e-5]Steps:  26%|██▌       | 3851/15001 [2:26:44<5:42:50,  1.84s/it, loss=0.187, lr=1e-5]Steps:  26%|██▌       | 3852/15001 [2:26:46<5:38:40,  1.82s/it, loss=0.187, lr=1e-5]Steps:  26%|██▌       | 3852/15001 [2:26:46<5:38:40,  1.82s/it, loss=0.23, lr=1e-5] Steps:  26%|██▌       | 3853/15001 [2:26:47<5:34:06,  1.80s/it, loss=0.23, lr=1e-5]Steps:  26%|██▌       | 3853/15001 [2:26:48<5:34:06,  1.80s/it, loss=0.291, lr=1e-5]Steps:  26%|██▌       | 3854/15001 [2:26:49<5:24:36,  1.75s/it, loss=0.291, lr=1e-5]Steps:  26%|██▌       | 3854/15001 [2:26:49<5:24:36,  1.75s/it, loss=0.21, lr=1e-5] Steps:  26%|██▌       | 3855/15001 [2:26:51<5:38:00,  1.82s/it, loss=0.21, lr=1e-5]Steps:  26%|██▌       | 3855/15001 [2:26:51<5:38:00,  1.82s/it, loss=0.242, lr=1e-5]Steps:  26%|██▌       | 3856/15001 [2:26:53<5:51:02,  1.89s/it, loss=0.242, lr=1e-5]Steps:  26%|██▌       | 3856/15001 [2:26:53<5:51:02,  1.89s/it, loss=0.208, lr=1e-5]Steps:  26%|██▌       | 3857/15001 [2:26:55<6:04:21,  1.96s/it, loss=0.208, lr=1e-5]Steps:  26%|██▌       | 3857/15001 [2:26:55<6:04:21,  1.96s/it, loss=0.346, lr=1e-5]Steps:  26%|██▌       | 3858/15001 [2:26:57<6:04:11,  1.96s/it, loss=0.346, lr=1e-5]Steps:  26%|██▌       | 3858/15001 [2:26:57<6:04:11,  1.96s/it, loss=0.14, lr=1e-5] Steps:  26%|██▌       | 3859/15001 [2:26:59<5:56:51,  1.92s/it, loss=0.14, lr=1e-5]Steps:  26%|██▌       | 3859/15001 [2:26:59<5:56:51,  1.92s/it, loss=0.0833, lr=1e-5]Steps:  26%|██▌       | 3860/15001 [2:27:01<5:47:57,  1.87s/it, loss=0.0833, lr=1e-5]Steps:  26%|██▌       | 3860/15001 [2:27:01<5:47:57,  1.87s/it, loss=0.099, lr=1e-5] Steps:  26%|██▌       | 3861/15001 [2:27:03<6:07:37,  1.98s/it, loss=0.099, lr=1e-5]Steps:  26%|██▌       | 3861/15001 [2:27:03<6:07:37,  1.98s/it, loss=0.188, lr=1e-5]Steps:  26%|██▌       | 3862/15001 [2:27:05<5:53:08,  1.90s/it, loss=0.188, lr=1e-5]Steps:  26%|██▌       | 3862/15001 [2:27:05<5:53:08,  1.90s/it, loss=0.138, lr=1e-5]Steps:  26%|██▌       | 3863/15001 [2:27:07<5:56:58,  1.92s/it, loss=0.138, lr=1e-5]Steps:  26%|██▌       | 3863/15001 [2:27:07<5:56:58,  1.92s/it, loss=0.107, lr=1e-5]Steps:  26%|██▌       | 3864/15001 [2:27:08<5:32:03,  1.79s/it, loss=0.107, lr=1e-5]Steps:  26%|██▌       | 3864/15001 [2:27:09<5:32:03,  1.79s/it, loss=0.141, lr=1e-5]Steps:  26%|██▌       | 3865/15001 [2:27:10<5:35:11,  1.81s/it, loss=0.141, lr=1e-5]Steps:  26%|██▌       | 3865/15001 [2:27:10<5:35:11,  1.81s/it, loss=0.41, lr=1e-5] Steps:  26%|██▌       | 3866/15001 [2:27:12<5:42:14,  1.84s/it, loss=0.41, lr=1e-5]Steps:  26%|██▌       | 3866/15001 [2:27:12<5:42:14,  1.84s/it, loss=0.28, lr=1e-5]Steps:  26%|██▌       | 3867/15001 [2:27:14<5:51:38,  1.89s/it, loss=0.28, lr=1e-5]Steps:  26%|██▌       | 3867/15001 [2:27:14<5:51:38,  1.89s/it, loss=0.0665, lr=1e-5]Steps:  26%|██▌       | 3868/15001 [2:27:16<5:43:22,  1.85s/it, loss=0.0665, lr=1e-5]Steps:  26%|██▌       | 3868/15001 [2:27:16<5:43:22,  1.85s/it, loss=0.0439, lr=1e-5]Steps:  26%|██▌       | 3869/15001 [2:27:18<5:43:05,  1.85s/it, loss=0.0439, lr=1e-5]Steps:  26%|██▌       | 3869/15001 [2:27:18<5:43:05,  1.85s/it, loss=0.214, lr=1e-5] Steps:  26%|██▌       | 3870/15001 [2:27:19<5:37:25,  1.82s/it, loss=0.214, lr=1e-5]Steps:  26%|██▌       | 3870/15001 [2:27:20<5:37:25,  1.82s/it, loss=0.261, lr=1e-5]Steps:  26%|██▌       | 3871/15001 [2:27:21<5:39:41,  1.83s/it, loss=0.261, lr=1e-5]Steps:  26%|██▌       | 3871/15001 [2:27:21<5:39:41,  1.83s/it, loss=0.182, lr=1e-5]Steps:  26%|██▌       | 3872/15001 [2:27:23<5:39:52,  1.83s/it, loss=0.182, lr=1e-5]Steps:  26%|██▌       | 3872/15001 [2:27:23<5:39:52,  1.83s/it, loss=0.23, lr=1e-5] Steps:  26%|██▌       | 3873/15001 [2:27:25<5:42:19,  1.85s/it, loss=0.23, lr=1e-5]Steps:  26%|██▌       | 3873/15001 [2:27:25<5:42:19,  1.85s/it, loss=0.0719, lr=1e-5]Steps:  26%|██▌       | 3874/15001 [2:27:27<5:29:48,  1.78s/it, loss=0.0719, lr=1e-5]Steps:  26%|██▌       | 3874/15001 [2:27:27<5:29:48,  1.78s/it, loss=0.206, lr=1e-5] Steps:  26%|██▌       | 3875/15001 [2:27:28<5:37:16,  1.82s/it, loss=0.206, lr=1e-5]Steps:  26%|██▌       | 3875/15001 [2:27:29<5:37:16,  1.82s/it, loss=0.0785, lr=1e-5]Steps:  26%|██▌       | 3876/15001 [2:27:30<5:39:25,  1.83s/it, loss=0.0785, lr=1e-5]Steps:  26%|██▌       | 3876/15001 [2:27:30<5:39:25,  1.83s/it, loss=0.286, lr=1e-5] Steps:  26%|██▌       | 3877/15001 [2:27:32<5:31:43,  1.79s/it, loss=0.286, lr=1e-5]Steps:  26%|██▌       | 3877/15001 [2:27:32<5:31:43,  1.79s/it, loss=0.109, lr=1e-5]Steps:  26%|██▌       | 3878/15001 [2:27:34<5:33:32,  1.80s/it, loss=0.109, lr=1e-5]Steps:  26%|██▌       | 3878/15001 [2:27:34<5:33:32,  1.80s/it, loss=0.232, lr=1e-5]Steps:  26%|██▌       | 3879/15001 [2:27:36<5:36:48,  1.82s/it, loss=0.232, lr=1e-5]Steps:  26%|██▌       | 3879/15001 [2:27:36<5:36:48,  1.82s/it, loss=0.0529, lr=1e-5]Steps:  26%|██▌       | 3880/15001 [2:27:38<5:47:13,  1.87s/it, loss=0.0529, lr=1e-5]Steps:  26%|██▌       | 3880/15001 [2:27:38<5:47:13,  1.87s/it, loss=0.173, lr=1e-5] Steps:  26%|██▌       | 3881/15001 [2:27:40<6:00:49,  1.95s/it, loss=0.173, lr=1e-5]Steps:  26%|██▌       | 3881/15001 [2:27:40<6:00:49,  1.95s/it, loss=0.402, lr=1e-5]Steps:  26%|██▌       | 3882/15001 [2:27:42<6:21:07,  2.06s/it, loss=0.402, lr=1e-5]Steps:  26%|██▌       | 3882/15001 [2:27:42<6:21:07,  2.06s/it, loss=0.151, lr=1e-5]Steps:  26%|██▌       | 3883/15001 [2:27:44<6:26:29,  2.09s/it, loss=0.151, lr=1e-5]Steps:  26%|██▌       | 3883/15001 [2:27:44<6:26:29,  2.09s/it, loss=0.246, lr=1e-5]Steps:  26%|██▌       | 3884/15001 [2:27:46<6:16:30,  2.03s/it, loss=0.246, lr=1e-5]Steps:  26%|██▌       | 3884/15001 [2:27:46<6:16:30,  2.03s/it, loss=0.153, lr=1e-5]Steps:  26%|██▌       | 3885/15001 [2:27:48<6:05:31,  1.97s/it, loss=0.153, lr=1e-5]Steps:  26%|██▌       | 3885/15001 [2:27:48<6:05:31,  1.97s/it, loss=0.229, lr=1e-5]Steps:  26%|██▌       | 3886/15001 [2:27:50<6:00:24,  1.95s/it, loss=0.229, lr=1e-5]Steps:  26%|██▌       | 3886/15001 [2:27:50<6:00:24,  1.95s/it, loss=0.0974, lr=1e-5]Steps:  26%|██▌       | 3887/15001 [2:27:52<5:47:13,  1.87s/it, loss=0.0974, lr=1e-5]Steps:  26%|██▌       | 3887/15001 [2:27:52<5:47:13,  1.87s/it, loss=0.113, lr=1e-5] Steps:  26%|██▌       | 3888/15001 [2:27:54<5:54:23,  1.91s/it, loss=0.113, lr=1e-5]Steps:  26%|██▌       | 3888/15001 [2:27:54<5:54:23,  1.91s/it, loss=0.314, lr=1e-5]Steps:  26%|██▌       | 3889/15001 [2:27:55<5:40:24,  1.84s/it, loss=0.314, lr=1e-5]Steps:  26%|██▌       | 3889/15001 [2:27:56<5:40:24,  1.84s/it, loss=0.0617, lr=1e-5]Steps:  26%|██▌       | 3890/15001 [2:27:57<5:49:48,  1.89s/it, loss=0.0617, lr=1e-5]Steps:  26%|██▌       | 3890/15001 [2:27:57<5:49:48,  1.89s/it, loss=0.225, lr=1e-5] Steps:  26%|██▌       | 3891/15001 [2:27:59<5:54:30,  1.91s/it, loss=0.225, lr=1e-5]Steps:  26%|██▌       | 3891/15001 [2:27:59<5:54:30,  1.91s/it, loss=0.267, lr=1e-5]Steps:  26%|██▌       | 3892/15001 [2:28:01<5:48:14,  1.88s/it, loss=0.267, lr=1e-5]Steps:  26%|██▌       | 3892/15001 [2:28:01<5:48:14,  1.88s/it, loss=0.134, lr=1e-5]Steps:  26%|██▌       | 3893/15001 [2:28:03<5:30:02,  1.78s/it, loss=0.134, lr=1e-5]Steps:  26%|██▌       | 3893/15001 [2:28:03<5:30:02,  1.78s/it, loss=0.244, lr=1e-5]Steps:  26%|██▌       | 3894/15001 [2:28:04<5:34:19,  1.81s/it, loss=0.244, lr=1e-5]Steps:  26%|██▌       | 3894/15001 [2:28:05<5:34:19,  1.81s/it, loss=0.367, lr=1e-5]Steps:  26%|██▌       | 3895/15001 [2:28:06<5:43:17,  1.85s/it, loss=0.367, lr=1e-5]Steps:  26%|██▌       | 3895/15001 [2:28:06<5:43:17,  1.85s/it, loss=0.173, lr=1e-5]Steps:  26%|██▌       | 3896/15001 [2:28:08<5:35:45,  1.81s/it, loss=0.173, lr=1e-5]Steps:  26%|██▌       | 3896/15001 [2:28:08<5:35:45,  1.81s/it, loss=0.0613, lr=1e-5]Steps:  26%|██▌       | 3897/15001 [2:28:10<5:39:48,  1.84s/it, loss=0.0613, lr=1e-5]Steps:  26%|██▌       | 3897/15001 [2:28:10<5:39:48,  1.84s/it, loss=0.0899, lr=1e-5]Steps:  26%|██▌       | 3898/15001 [2:28:12<5:32:24,  1.80s/it, loss=0.0899, lr=1e-5]Steps:  26%|██▌       | 3898/15001 [2:28:12<5:32:24,  1.80s/it, loss=0.147, lr=1e-5] Steps:  26%|██▌       | 3899/15001 [2:28:14<5:33:33,  1.80s/it, loss=0.147, lr=1e-5]Steps:  26%|██▌       | 3899/15001 [2:28:14<5:33:33,  1.80s/it, loss=0.355, lr=1e-5]Steps:  26%|██▌       | 3900/15001 [2:28:15<5:36:42,  1.82s/it, loss=0.355, lr=1e-5]Steps:  26%|██▌       | 3900/15001 [2:28:15<5:36:42,  1.82s/it, loss=0.174, lr=1e-5]Steps:  26%|██▌       | 3901/15001 [2:28:17<5:20:08,  1.73s/it, loss=0.174, lr=1e-5]Steps:  26%|██▌       | 3901/15001 [2:28:17<5:20:08,  1.73s/it, loss=0.233, lr=1e-5]Steps:  26%|██▌       | 3902/15001 [2:28:19<5:41:03,  1.84s/it, loss=0.233, lr=1e-5]Steps:  26%|██▌       | 3902/15001 [2:28:19<5:41:03,  1.84s/it, loss=0.281, lr=1e-5]Steps:  26%|██▌       | 3903/15001 [2:28:21<6:10:43,  2.00s/it, loss=0.281, lr=1e-5]Steps:  26%|██▌       | 3903/15001 [2:28:21<6:10:43,  2.00s/it, loss=0.236, lr=1e-5]Steps:  26%|██▌       | 3904/15001 [2:28:23<6:10:36,  2.00s/it, loss=0.236, lr=1e-5]Steps:  26%|██▌       | 3904/15001 [2:28:23<6:10:36,  2.00s/it, loss=0.198, lr=1e-5]Steps:  26%|██▌       | 3905/15001 [2:28:25<6:08:27,  1.99s/it, loss=0.198, lr=1e-5]Steps:  26%|██▌       | 3905/15001 [2:28:25<6:08:27,  1.99s/it, loss=0.401, lr=1e-5]Steps:  26%|██▌       | 3906/15001 [2:28:27<6:04:59,  1.97s/it, loss=0.401, lr=1e-5]Steps:  26%|██▌       | 3906/15001 [2:28:27<6:04:59,  1.97s/it, loss=0.186, lr=1e-5]Steps:  26%|██▌       | 3907/15001 [2:28:29<5:54:28,  1.92s/it, loss=0.186, lr=1e-5]Steps:  26%|██▌       | 3907/15001 [2:28:29<5:54:28,  1.92s/it, loss=0.279, lr=1e-5]Steps:  26%|██▌       | 3908/15001 [2:28:31<5:47:38,  1.88s/it, loss=0.279, lr=1e-5]Steps:  26%|██▌       | 3908/15001 [2:28:31<5:47:38,  1.88s/it, loss=0.0483, lr=1e-5]Steps:  26%|██▌       | 3909/15001 [2:28:33<5:44:01,  1.86s/it, loss=0.0483, lr=1e-5]Steps:  26%|██▌       | 3909/15001 [2:28:33<5:44:01,  1.86s/it, loss=0.102, lr=1e-5] Steps:  26%|██▌       | 3910/15001 [2:28:35<5:53:54,  1.91s/it, loss=0.102, lr=1e-5]Steps:  26%|██▌       | 3910/15001 [2:28:35<5:53:54,  1.91s/it, loss=0.0767, lr=1e-5]Steps:  26%|██▌       | 3911/15001 [2:28:36<5:41:04,  1.85s/it, loss=0.0767, lr=1e-5]Steps:  26%|██▌       | 3911/15001 [2:28:37<5:41:04,  1.85s/it, loss=0.216, lr=1e-5] Steps:  26%|██▌       | 3912/15001 [2:28:38<5:43:45,  1.86s/it, loss=0.216, lr=1e-5]Steps:  26%|██▌       | 3912/15001 [2:28:38<5:43:45,  1.86s/it, loss=0.21, lr=1e-5] Steps:  26%|██▌       | 3913/15001 [2:28:40<5:30:54,  1.79s/it, loss=0.21, lr=1e-5]Steps:  26%|██▌       | 3913/15001 [2:28:40<5:30:54,  1.79s/it, loss=0.3, lr=1e-5] Steps:  26%|██▌       | 3914/15001 [2:28:42<5:42:41,  1.85s/it, loss=0.3, lr=1e-5]Steps:  26%|██▌       | 3914/15001 [2:28:42<5:42:41,  1.85s/it, loss=0.0483, lr=1e-5]Steps:  26%|██▌       | 3915/15001 [2:28:44<5:40:31,  1.84s/it, loss=0.0483, lr=1e-5]Steps:  26%|██▌       | 3915/15001 [2:28:44<5:40:31,  1.84s/it, loss=0.0856, lr=1e-5]Steps:  26%|██▌       | 3916/15001 [2:28:46<5:41:17,  1.85s/it, loss=0.0856, lr=1e-5]Steps:  26%|██▌       | 3916/15001 [2:28:46<5:41:17,  1.85s/it, loss=0.319, lr=1e-5] Steps:  26%|██▌       | 3917/15001 [2:28:48<5:58:08,  1.94s/it, loss=0.319, lr=1e-5]Steps:  26%|██▌       | 3917/15001 [2:28:48<5:58:08,  1.94s/it, loss=0.0628, lr=1e-5]Steps:  26%|██▌       | 3918/15001 [2:28:50<5:49:33,  1.89s/it, loss=0.0628, lr=1e-5]Steps:  26%|██▌       | 3918/15001 [2:28:50<5:49:33,  1.89s/it, loss=0.262, lr=1e-5] Steps:  26%|██▌       | 3919/15001 [2:28:51<5:40:07,  1.84s/it, loss=0.262, lr=1e-5]Steps:  26%|██▌       | 3919/15001 [2:28:51<5:40:07,  1.84s/it, loss=0.271, lr=1e-5]Steps:  26%|██▌       | 3920/15001 [2:28:53<5:30:53,  1.79s/it, loss=0.271, lr=1e-5]Steps:  26%|██▌       | 3920/15001 [2:28:53<5:30:53,  1.79s/it, loss=0.174, lr=1e-5]Steps:  26%|██▌       | 3921/15001 [2:28:55<5:27:19,  1.77s/it, loss=0.174, lr=1e-5]Steps:  26%|██▌       | 3921/15001 [2:28:55<5:27:19,  1.77s/it, loss=0.211, lr=1e-5]Steps:  26%|██▌       | 3922/15001 [2:28:57<5:38:21,  1.83s/it, loss=0.211, lr=1e-5]Steps:  26%|██▌       | 3922/15001 [2:28:57<5:38:21,  1.83s/it, loss=0.211, lr=1e-5]Steps:  26%|██▌       | 3923/15001 [2:28:59<5:46:08,  1.87s/it, loss=0.211, lr=1e-5]Steps:  26%|██▌       | 3923/15001 [2:28:59<5:46:08,  1.87s/it, loss=0.0427, lr=1e-5]Steps:  26%|██▌       | 3924/15001 [2:29:00<5:39:06,  1.84s/it, loss=0.0427, lr=1e-5]Steps:  26%|██▌       | 3924/15001 [2:29:00<5:39:06,  1.84s/it, loss=0.183, lr=1e-5] Steps:  26%|██▌       | 3925/15001 [2:29:02<5:41:52,  1.85s/it, loss=0.183, lr=1e-5]Steps:  26%|██▌       | 3925/15001 [2:29:03<5:41:52,  1.85s/it, loss=0.114, lr=1e-5]Steps:  26%|██▌       | 3926/15001 [2:29:04<5:53:31,  1.92s/it, loss=0.114, lr=1e-5]Steps:  26%|██▌       | 3926/15001 [2:29:04<5:53:31,  1.92s/it, loss=0.274, lr=1e-5]Steps:  26%|██▌       | 3927/15001 [2:29:06<5:47:49,  1.88s/it, loss=0.274, lr=1e-5]Steps:  26%|██▌       | 3927/15001 [2:29:07<5:47:49,  1.88s/it, loss=0.0969, lr=1e-5]Steps:  26%|██▌       | 3928/15001 [2:29:08<6:12:03,  2.02s/it, loss=0.0969, lr=1e-5]Steps:  26%|██▌       | 3928/15001 [2:29:09<6:12:03,  2.02s/it, loss=0.173, lr=1e-5] Steps:  26%|██▌       | 3929/15001 [2:29:10<5:56:40,  1.93s/it, loss=0.173, lr=1e-5]Steps:  26%|██▌       | 3929/15001 [2:29:11<5:56:40,  1.93s/it, loss=0.256, lr=1e-5]Steps:  26%|██▌       | 3930/15001 [2:29:12<6:11:58,  2.02s/it, loss=0.256, lr=1e-5]Steps:  26%|██▌       | 3930/15001 [2:29:12<6:11:58,  2.02s/it, loss=0.181, lr=1e-5]Steps:  26%|██▌       | 3931/15001 [2:29:14<5:48:33,  1.89s/it, loss=0.181, lr=1e-5]Steps:  26%|██▌       | 3931/15001 [2:29:14<5:48:33,  1.89s/it, loss=0.218, lr=1e-5]Steps:  26%|██▌       | 3932/15001 [2:29:16<5:41:02,  1.85s/it, loss=0.218, lr=1e-5]Steps:  26%|██▌       | 3932/15001 [2:29:16<5:41:02,  1.85s/it, loss=0.19, lr=1e-5] Steps:  26%|██▌       | 3933/15001 [2:29:18<5:36:02,  1.82s/it, loss=0.19, lr=1e-5]Steps:  26%|██▌       | 3933/15001 [2:29:18<5:36:02,  1.82s/it, loss=0.12, lr=1e-5]Steps:  26%|██▌       | 3934/15001 [2:29:19<5:40:10,  1.84s/it, loss=0.12, lr=1e-5]Steps:  26%|██▌       | 3934/15001 [2:29:20<5:40:10,  1.84s/it, loss=0.041, lr=1e-5]Steps:  26%|██▌       | 3935/15001 [2:29:21<5:49:00,  1.89s/it, loss=0.041, lr=1e-5]Steps:  26%|██▌       | 3935/15001 [2:29:22<5:49:00,  1.89s/it, loss=0.0914, lr=1e-5]Steps:  26%|██▌       | 3936/15001 [2:29:23<5:35:58,  1.82s/it, loss=0.0914, lr=1e-5]Steps:  26%|██▌       | 3936/15001 [2:29:23<5:35:58,  1.82s/it, loss=0.25, lr=1e-5]  Steps:  26%|██▌       | 3937/15001 [2:29:25<5:45:42,  1.87s/it, loss=0.25, lr=1e-5]Steps:  26%|██▌       | 3937/15001 [2:29:25<5:45:42,  1.87s/it, loss=0.297, lr=1e-5]Steps:  26%|██▋       | 3938/15001 [2:29:27<5:32:39,  1.80s/it, loss=0.297, lr=1e-5]Steps:  26%|██▋       | 3938/15001 [2:29:27<5:32:39,  1.80s/it, loss=0.139, lr=1e-5]Steps:  26%|██▋       | 3939/15001 [2:29:29<5:32:51,  1.81s/it, loss=0.139, lr=1e-5]Steps:  26%|██▋       | 3939/15001 [2:29:29<5:32:51,  1.81s/it, loss=0.0799, lr=1e-5]Steps:  26%|██▋       | 3940/15001 [2:29:31<5:42:17,  1.86s/it, loss=0.0799, lr=1e-5]Steps:  26%|██▋       | 3940/15001 [2:29:31<5:42:17,  1.86s/it, loss=0.457, lr=1e-5] Steps:  26%|██▋       | 3941/15001 [2:29:32<5:42:07,  1.86s/it, loss=0.457, lr=1e-5]Steps:  26%|██▋       | 3941/15001 [2:29:32<5:42:07,  1.86s/it, loss=0.0848, lr=1e-5]Steps:  26%|██▋       | 3942/15001 [2:29:34<5:27:41,  1.78s/it, loss=0.0848, lr=1e-5]Steps:  26%|██▋       | 3942/15001 [2:29:34<5:27:41,  1.78s/it, loss=0.339, lr=1e-5] Steps:  26%|██▋       | 3943/15001 [2:29:36<5:26:31,  1.77s/it, loss=0.339, lr=1e-5]Steps:  26%|██▋       | 3943/15001 [2:29:36<5:26:31,  1.77s/it, loss=0.313, lr=1e-5]Steps:  26%|██▋       | 3944/15001 [2:29:38<5:47:09,  1.88s/it, loss=0.313, lr=1e-5]Steps:  26%|██▋       | 3944/15001 [2:29:38<5:47:09,  1.88s/it, loss=0.346, lr=1e-5]Steps:  26%|██▋       | 3945/15001 [2:29:39<5:30:37,  1.79s/it, loss=0.346, lr=1e-5]Steps:  26%|██▋       | 3945/15001 [2:29:40<5:30:37,  1.79s/it, loss=0.278, lr=1e-5]Steps:  26%|██▋       | 3946/15001 [2:29:41<5:43:06,  1.86s/it, loss=0.278, lr=1e-5]Steps:  26%|██▋       | 3946/15001 [2:29:42<5:43:06,  1.86s/it, loss=0.074, lr=1e-5]Steps:  26%|██▋       | 3947/15001 [2:29:43<5:30:58,  1.80s/it, loss=0.074, lr=1e-5]Steps:  26%|██▋       | 3947/15001 [2:29:43<5:30:58,  1.80s/it, loss=0.133, lr=1e-5]Steps:  26%|██▋       | 3948/15001 [2:29:45<5:38:00,  1.83s/it, loss=0.133, lr=1e-5]Steps:  26%|██▋       | 3948/15001 [2:29:45<5:38:00,  1.83s/it, loss=0.0279, lr=1e-5]Steps:  26%|██▋       | 3949/15001 [2:29:47<5:54:03,  1.92s/it, loss=0.0279, lr=1e-5]Steps:  26%|██▋       | 3949/15001 [2:29:47<5:54:03,  1.92s/it, loss=0.031, lr=1e-5] Steps:  26%|██▋       | 3950/15001 [2:29:49<6:02:18,  1.97s/it, loss=0.031, lr=1e-5]Steps:  26%|██▋       | 3950/15001 [2:29:49<6:02:18,  1.97s/it, loss=0.341, lr=1e-5]Steps:  26%|██▋       | 3951/15001 [2:29:51<6:04:39,  1.98s/it, loss=0.341, lr=1e-5]Steps:  26%|██▋       | 3951/15001 [2:29:51<6:04:39,  1.98s/it, loss=0.186, lr=1e-5]Steps:  26%|██▋       | 3952/15001 [2:29:53<5:59:14,  1.95s/it, loss=0.186, lr=1e-5]Steps:  26%|██▋       | 3952/15001 [2:29:53<5:59:14,  1.95s/it, loss=0.104, lr=1e-5]Steps:  26%|██▋       | 3953/15001 [2:29:55<6:04:06,  1.98s/it, loss=0.104, lr=1e-5]Steps:  26%|██▋       | 3953/15001 [2:29:55<6:04:06,  1.98s/it, loss=0.103, lr=1e-5]Steps:  26%|██▋       | 3954/15001 [2:29:57<6:03:55,  1.98s/it, loss=0.103, lr=1e-5]Steps:  26%|██▋       | 3954/15001 [2:29:57<6:03:55,  1.98s/it, loss=0.113, lr=1e-5]Steps:  26%|██▋       | 3955/15001 [2:29:59<5:39:11,  1.84s/it, loss=0.113, lr=1e-5]Steps:  26%|██▋       | 3955/15001 [2:29:59<5:39:11,  1.84s/it, loss=0.129, lr=1e-5]Steps:  26%|██▋       | 3956/15001 [2:30:01<5:47:34,  1.89s/it, loss=0.129, lr=1e-5]Steps:  26%|██▋       | 3956/15001 [2:30:01<5:47:34,  1.89s/it, loss=0.185, lr=1e-5]Steps:  26%|██▋       | 3957/15001 [2:30:02<5:36:02,  1.83s/it, loss=0.185, lr=1e-5]Steps:  26%|██▋       | 3957/15001 [2:30:03<5:36:02,  1.83s/it, loss=0.139, lr=1e-5]Steps:  26%|██▋       | 3958/15001 [2:30:04<5:52:23,  1.91s/it, loss=0.139, lr=1e-5]Steps:  26%|██▋       | 3958/15001 [2:30:05<5:52:23,  1.91s/it, loss=0.0808, lr=1e-5]Steps:  26%|██▋       | 3959/15001 [2:30:06<5:44:31,  1.87s/it, loss=0.0808, lr=1e-5]Steps:  26%|██▋       | 3959/15001 [2:30:06<5:44:31,  1.87s/it, loss=0.155, lr=1e-5] Steps:  26%|██▋       | 3960/15001 [2:30:08<5:28:27,  1.78s/it, loss=0.155, lr=1e-5]Steps:  26%|██▋       | 3960/15001 [2:30:08<5:28:27,  1.78s/it, loss=0.15, lr=1e-5] Steps:  26%|██▋       | 3961/15001 [2:30:10<5:32:14,  1.81s/it, loss=0.15, lr=1e-5]Steps:  26%|██▋       | 3961/15001 [2:30:10<5:32:14,  1.81s/it, loss=0.141, lr=1e-5]Steps:  26%|██▋       | 3962/15001 [2:30:11<5:28:12,  1.78s/it, loss=0.141, lr=1e-5]Steps:  26%|██▋       | 3962/15001 [2:30:12<5:28:12,  1.78s/it, loss=0.0963, lr=1e-5]Steps:  26%|██▋       | 3963/15001 [2:30:13<5:35:42,  1.82s/it, loss=0.0963, lr=1e-5]Steps:  26%|██▋       | 3963/15001 [2:30:14<5:35:42,  1.82s/it, loss=0.314, lr=1e-5] Steps:  26%|██▋       | 3964/15001 [2:30:15<5:31:40,  1.80s/it, loss=0.314, lr=1e-5]Steps:  26%|██▋       | 3964/15001 [2:30:15<5:31:40,  1.80s/it, loss=0.286, lr=1e-5]Steps:  26%|██▋       | 3965/15001 [2:30:17<5:40:26,  1.85s/it, loss=0.286, lr=1e-5]Steps:  26%|██▋       | 3965/15001 [2:30:17<5:40:26,  1.85s/it, loss=0.199, lr=1e-5]Steps:  26%|██▋       | 3966/15001 [2:30:19<5:28:42,  1.79s/it, loss=0.199, lr=1e-5]Steps:  26%|██▋       | 3966/15001 [2:30:19<5:28:42,  1.79s/it, loss=0.285, lr=1e-5]Steps:  26%|██▋       | 3967/15001 [2:30:21<5:41:15,  1.86s/it, loss=0.285, lr=1e-5]Steps:  26%|██▋       | 3967/15001 [2:30:21<5:41:15,  1.86s/it, loss=0.151, lr=1e-5]Steps:  26%|██▋       | 3968/15001 [2:30:23<5:41:01,  1.85s/it, loss=0.151, lr=1e-5]Steps:  26%|██▋       | 3968/15001 [2:30:23<5:41:01,  1.85s/it, loss=0.083, lr=1e-5]Steps:  26%|██▋       | 3969/15001 [2:30:24<5:20:44,  1.74s/it, loss=0.083, lr=1e-5]Steps:  26%|██▋       | 3969/15001 [2:30:24<5:20:44,  1.74s/it, loss=0.235, lr=1e-5]Steps:  26%|██▋       | 3970/15001 [2:30:26<5:40:34,  1.85s/it, loss=0.235, lr=1e-5]Steps:  26%|██▋       | 3970/15001 [2:30:26<5:40:34,  1.85s/it, loss=0.241, lr=1e-5]Steps:  26%|██▋       | 3971/15001 [2:30:28<5:36:40,  1.83s/it, loss=0.241, lr=1e-5]Steps:  26%|██▋       | 3971/15001 [2:30:28<5:36:40,  1.83s/it, loss=0.0796, lr=1e-5]Steps:  26%|██▋       | 3972/15001 [2:30:30<5:44:48,  1.88s/it, loss=0.0796, lr=1e-5]Steps:  26%|██▋       | 3972/15001 [2:30:30<5:44:48,  1.88s/it, loss=0.153, lr=1e-5] Steps:  26%|██▋       | 3973/15001 [2:30:32<5:53:49,  1.93s/it, loss=0.153, lr=1e-5]Steps:  26%|██▋       | 3973/15001 [2:30:32<5:53:49,  1.93s/it, loss=0.188, lr=1e-5]Steps:  26%|██▋       | 3974/15001 [2:30:34<6:00:53,  1.96s/it, loss=0.188, lr=1e-5]Steps:  26%|██▋       | 3974/15001 [2:30:34<6:00:53,  1.96s/it, loss=0.171, lr=1e-5]Steps:  26%|██▋       | 3975/15001 [2:30:36<5:51:35,  1.91s/it, loss=0.171, lr=1e-5]Steps:  26%|██▋       | 3975/15001 [2:30:36<5:51:35,  1.91s/it, loss=0.175, lr=1e-5]Steps:  27%|██▋       | 3976/15001 [2:30:38<6:02:16,  1.97s/it, loss=0.175, lr=1e-5]Steps:  27%|██▋       | 3976/15001 [2:30:38<6:02:16,  1.97s/it, loss=0.102, lr=1e-5]Steps:  27%|██▋       | 3977/15001 [2:30:40<5:53:52,  1.93s/it, loss=0.102, lr=1e-5]Steps:  27%|██▋       | 3977/15001 [2:30:40<5:53:52,  1.93s/it, loss=0.242, lr=1e-5]Steps:  27%|██▋       | 3978/15001 [2:30:42<6:04:30,  1.98s/it, loss=0.242, lr=1e-5]Steps:  27%|██▋       | 3978/15001 [2:30:42<6:04:30,  1.98s/it, loss=0.109, lr=1e-5]Steps:  27%|██▋       | 3979/15001 [2:30:43<5:41:55,  1.86s/it, loss=0.109, lr=1e-5]Steps:  27%|██▋       | 3979/15001 [2:30:44<5:41:55,  1.86s/it, loss=0.119, lr=1e-5]Steps:  27%|██▋       | 3980/15001 [2:30:45<5:48:33,  1.90s/it, loss=0.119, lr=1e-5]Steps:  27%|██▋       | 3980/15001 [2:30:46<5:48:33,  1.90s/it, loss=0.0854, lr=1e-5]Steps:  27%|██▋       | 3981/15001 [2:30:47<5:49:00,  1.90s/it, loss=0.0854, lr=1e-5]Steps:  27%|██▋       | 3981/15001 [2:30:47<5:49:00,  1.90s/it, loss=0.145, lr=1e-5] Steps:  27%|██▋       | 3982/15001 [2:30:49<5:52:12,  1.92s/it, loss=0.145, lr=1e-5]Steps:  27%|██▋       | 3982/15001 [2:30:49<5:52:12,  1.92s/it, loss=0.0678, lr=1e-5]Steps:  27%|██▋       | 3983/15001 [2:30:51<5:38:04,  1.84s/it, loss=0.0678, lr=1e-5]Steps:  27%|██▋       | 3983/15001 [2:30:51<5:38:04,  1.84s/it, loss=0.124, lr=1e-5] Steps:  27%|██▋       | 3984/15001 [2:30:53<5:40:14,  1.85s/it, loss=0.124, lr=1e-5]Steps:  27%|██▋       | 3984/15001 [2:30:53<5:40:14,  1.85s/it, loss=0.324, lr=1e-5]Steps:  27%|██▋       | 3985/15001 [2:30:54<5:23:20,  1.76s/it, loss=0.324, lr=1e-5]Steps:  27%|██▋       | 3985/15001 [2:30:55<5:23:20,  1.76s/it, loss=0.0531, lr=1e-5]Steps:  27%|██▋       | 3986/15001 [2:30:57<5:44:29,  1.88s/it, loss=0.0531, lr=1e-5]Steps:  27%|██▋       | 3986/15001 [2:30:57<5:44:29,  1.88s/it, loss=0.0866, lr=1e-5]Steps:  27%|██▋       | 3987/15001 [2:30:58<5:35:39,  1.83s/it, loss=0.0866, lr=1e-5]Steps:  27%|██▋       | 3987/15001 [2:30:58<5:35:39,  1.83s/it, loss=0.294, lr=1e-5] Steps:  27%|██▋       | 3988/15001 [2:31:00<5:38:25,  1.84s/it, loss=0.294, lr=1e-5]Steps:  27%|██▋       | 3988/15001 [2:31:00<5:38:25,  1.84s/it, loss=0.0965, lr=1e-5]Steps:  27%|██▋       | 3989/15001 [2:31:02<5:33:40,  1.82s/it, loss=0.0965, lr=1e-5]Steps:  27%|██▋       | 3989/15001 [2:31:02<5:33:40,  1.82s/it, loss=0.198, lr=1e-5] Steps:  27%|██▋       | 3990/15001 [2:31:03<5:11:57,  1.70s/it, loss=0.198, lr=1e-5]Steps:  27%|██▋       | 3990/15001 [2:31:04<5:11:57,  1.70s/it, loss=0.106, lr=1e-5]Steps:  27%|██▋       | 3991/15001 [2:31:06<5:41:42,  1.86s/it, loss=0.106, lr=1e-5]Steps:  27%|██▋       | 3991/15001 [2:31:06<5:41:42,  1.86s/it, loss=0.14, lr=1e-5] Steps:  27%|██▋       | 3992/15001 [2:31:07<5:39:52,  1.85s/it, loss=0.14, lr=1e-5]Steps:  27%|██▋       | 3992/15001 [2:31:08<5:39:52,  1.85s/it, loss=0.181, lr=1e-5]Steps:  27%|██▋       | 3993/15001 [2:31:09<5:54:45,  1.93s/it, loss=0.181, lr=1e-5]Steps:  27%|██▋       | 3993/15001 [2:31:10<5:54:45,  1.93s/it, loss=0.0818, lr=1e-5]Steps:  27%|██▋       | 3994/15001 [2:31:11<5:51:07,  1.91s/it, loss=0.0818, lr=1e-5]Steps:  27%|██▋       | 3994/15001 [2:31:12<5:51:07,  1.91s/it, loss=0.142, lr=1e-5] Steps:  27%|██▋       | 3995/15001 [2:31:13<5:55:51,  1.94s/it, loss=0.142, lr=1e-5]Steps:  27%|██▋       | 3995/15001 [2:31:13<5:55:51,  1.94s/it, loss=0.215, lr=1e-5]Steps:  27%|██▋       | 3996/15001 [2:31:15<5:57:51,  1.95s/it, loss=0.215, lr=1e-5]Steps:  27%|██▋       | 3996/15001 [2:31:16<5:57:51,  1.95s/it, loss=0.0737, lr=1e-5]Steps:  27%|██▋       | 3997/15001 [2:31:17<6:04:49,  1.99s/it, loss=0.0737, lr=1e-5]Steps:  27%|██▋       | 3997/15001 [2:31:18<6:04:49,  1.99s/it, loss=0.434, lr=1e-5] Steps:  27%|██▋       | 3998/15001 [2:31:19<6:05:51,  2.00s/it, loss=0.434, lr=1e-5]Steps:  27%|██▋       | 3998/15001 [2:31:20<6:05:51,  2.00s/it, loss=0.205, lr=1e-5]Steps:  27%|██▋       | 3999/15001 [2:31:21<5:50:27,  1.91s/it, loss=0.205, lr=1e-5]Steps:  27%|██▋       | 3999/15001 [2:31:22<5:50:27,  1.91s/it, loss=0.183, lr=1e-5]Steps:  27%|██▋       | 4000/15001 [2:31:23<5:49:58,  1.91s/it, loss=0.183, lr=1e-5]02/04/2024 15:33:42 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1630.97it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  27%|██▋       | 4000/15001 [2:35:01<5:49:58,  1.91s/it, loss=0.0681, lr=1e-5]Steps:  27%|██▋       | 4001/15001 [2:35:03<205:24:56, 67.23s/it, loss=0.0681, lr=1e-5]Steps:  27%|██▋       | 4001/15001 [2:35:03<205:24:56, 67.23s/it, loss=0.139, lr=1e-5] Steps:  27%|██▋       | 4002/15001 [2:35:04<145:26:47, 47.61s/it, loss=0.139, lr=1e-5]Steps:  27%|██▋       | 4002/15001 [2:35:05<145:26:47, 47.61s/it, loss=0.218, lr=1e-5]Steps:  27%|██▋       | 4003/15001 [2:35:06<103:34:11, 33.90s/it, loss=0.218, lr=1e-5]Steps:  27%|██▋       | 4003/15001 [2:35:06<103:34:11, 33.90s/it, loss=0.0565, lr=1e-5]Steps:  27%|██▋       | 4004/15001 [2:35:08<74:15:35, 24.31s/it, loss=0.0565, lr=1e-5] Steps:  27%|██▋       | 4004/15001 [2:35:08<74:15:35, 24.31s/it, loss=0.197, lr=1e-5] Steps:  27%|██▋       | 4005/15001 [2:35:10<53:39:10, 17.57s/it, loss=0.197, lr=1e-5]Steps:  27%|██▋       | 4005/15001 [2:35:10<53:39:10, 17.57s/it, loss=0.172, lr=1e-5]Steps:  27%|██▋       | 4006/15001 [2:35:12<39:08:28, 12.82s/it, loss=0.172, lr=1e-5]Steps:  27%|██▋       | 4006/15001 [2:35:13<39:08:28, 12.82s/it, loss=0.129, lr=1e-5]Steps:  27%|██▋       | 4007/15001 [2:35:14<29:41:36,  9.72s/it, loss=0.129, lr=1e-5]Steps:  27%|██▋       | 4007/15001 [2:35:15<29:41:36,  9.72s/it, loss=0.189, lr=1e-5]Steps:  27%|██▋       | 4008/15001 [2:35:16<22:33:13,  7.39s/it, loss=0.189, lr=1e-5]Steps:  27%|██▋       | 4008/15001 [2:35:17<22:33:13,  7.39s/it, loss=0.0733, lr=1e-5]Steps:  27%|██▋       | 4009/15001 [2:35:18<17:40:25,  5.79s/it, loss=0.0733, lr=1e-5]Steps:  27%|██▋       | 4009/15001 [2:35:19<17:40:25,  5.79s/it, loss=0.237, lr=1e-5] Steps:  27%|██▋       | 4010/15001 [2:35:20<14:08:55,  4.63s/it, loss=0.237, lr=1e-5]Steps:  27%|██▋       | 4010/15001 [2:35:20<14:08:55,  4.63s/it, loss=0.0651, lr=1e-5]Steps:  27%|██▋       | 4011/15001 [2:35:22<11:21:53,  3.72s/it, loss=0.0651, lr=1e-5]Steps:  27%|██▋       | 4011/15001 [2:35:22<11:21:53,  3.72s/it, loss=0.216, lr=1e-5] Steps:  27%|██▋       | 4012/15001 [2:35:24<9:51:12,  3.23s/it, loss=0.216, lr=1e-5] Steps:  27%|██▋       | 4012/15001 [2:35:24<9:51:12,  3.23s/it, loss=0.0847, lr=1e-5]Steps:  27%|██▋       | 4013/15001 [2:35:26<8:26:44,  2.77s/it, loss=0.0847, lr=1e-5]Steps:  27%|██▋       | 4013/15001 [2:35:26<8:26:44,  2.77s/it, loss=0.144, lr=1e-5] Steps:  27%|██▋       | 4014/15001 [2:35:28<7:35:49,  2.49s/it, loss=0.144, lr=1e-5]Steps:  27%|██▋       | 4014/15001 [2:35:28<7:35:49,  2.49s/it, loss=0.108, lr=1e-5]Steps:  27%|██▋       | 4015/15001 [2:35:29<6:52:46,  2.25s/it, loss=0.108, lr=1e-5]Steps:  27%|██▋       | 4015/15001 [2:35:29<6:52:46,  2.25s/it, loss=0.105, lr=1e-5]Steps:  27%|██▋       | 4016/15001 [2:35:31<6:32:27,  2.14s/it, loss=0.105, lr=1e-5]Steps:  27%|██▋       | 4016/15001 [2:35:31<6:32:27,  2.14s/it, loss=0.205, lr=1e-5]Steps:  27%|██▋       | 4017/15001 [2:35:33<6:07:58,  2.01s/it, loss=0.205, lr=1e-5]Steps:  27%|██▋       | 4017/15001 [2:35:33<6:07:58,  2.01s/it, loss=0.164, lr=1e-5]Steps:  27%|██▋       | 4018/15001 [2:35:35<5:57:06,  1.95s/it, loss=0.164, lr=1e-5]Steps:  27%|██▋       | 4018/15001 [2:35:35<5:57:06,  1.95s/it, loss=0.278, lr=1e-5]Steps:  27%|██▋       | 4019/15001 [2:35:36<5:47:52,  1.90s/it, loss=0.278, lr=1e-5]Steps:  27%|██▋       | 4019/15001 [2:35:37<5:47:52,  1.90s/it, loss=0.0256, lr=1e-5]Steps:  27%|██▋       | 4020/15001 [2:35:38<5:49:46,  1.91s/it, loss=0.0256, lr=1e-5]Steps:  27%|██▋       | 4020/15001 [2:35:39<5:49:46,  1.91s/it, loss=0.177, lr=1e-5] Steps:  27%|██▋       | 4021/15001 [2:35:40<5:45:58,  1.89s/it, loss=0.177, lr=1e-5]Steps:  27%|██▋       | 4021/15001 [2:35:40<5:45:58,  1.89s/it, loss=0.123, lr=1e-5]Steps:  27%|██▋       | 4022/15001 [2:35:42<5:48:08,  1.90s/it, loss=0.123, lr=1e-5]Steps:  27%|██▋       | 4022/15001 [2:35:42<5:48:08,  1.90s/it, loss=0.29, lr=1e-5] Steps:  27%|██▋       | 4023/15001 [2:35:44<5:26:48,  1.79s/it, loss=0.29, lr=1e-5]Steps:  27%|██▋       | 4023/15001 [2:35:44<5:26:48,  1.79s/it, loss=0.21, lr=1e-5]Steps:  27%|██▋       | 4024/15001 [2:35:45<5:27:42,  1.79s/it, loss=0.21, lr=1e-5]Steps:  27%|██▋       | 4024/15001 [2:35:46<5:27:42,  1.79s/it, loss=0.13, lr=1e-5]Steps:  27%|██▋       | 4025/15001 [2:35:47<5:34:33,  1.83s/it, loss=0.13, lr=1e-5]Steps:  27%|██▋       | 4025/15001 [2:35:48<5:34:33,  1.83s/it, loss=0.0525, lr=1e-5]Steps:  27%|██▋       | 4026/15001 [2:35:49<5:47:14,  1.90s/it, loss=0.0525, lr=1e-5]Steps:  27%|██▋       | 4026/15001 [2:35:50<5:47:14,  1.90s/it, loss=0.198, lr=1e-5] Steps:  27%|██▋       | 4027/15001 [2:35:51<5:48:31,  1.91s/it, loss=0.198, lr=1e-5]Steps:  27%|██▋       | 4027/15001 [2:35:52<5:48:31,  1.91s/it, loss=0.216, lr=1e-5]Steps:  27%|██▋       | 4028/15001 [2:35:53<5:52:44,  1.93s/it, loss=0.216, lr=1e-5]Steps:  27%|██▋       | 4028/15001 [2:35:53<5:52:44,  1.93s/it, loss=0.179, lr=1e-5]Steps:  27%|██▋       | 4029/15001 [2:35:55<5:53:40,  1.93s/it, loss=0.179, lr=1e-5]Steps:  27%|██▋       | 4029/15001 [2:35:55<5:53:40,  1.93s/it, loss=0.203, lr=1e-5]Steps:  27%|██▋       | 4030/15001 [2:35:57<5:59:01,  1.96s/it, loss=0.203, lr=1e-5]Steps:  27%|██▋       | 4030/15001 [2:35:57<5:59:01,  1.96s/it, loss=0.247, lr=1e-5]Steps:  27%|██▋       | 4031/15001 [2:35:59<5:58:05,  1.96s/it, loss=0.247, lr=1e-5]Steps:  27%|██▋       | 4031/15001 [2:36:00<5:58:05,  1.96s/it, loss=0.0286, lr=1e-5]Steps:  27%|██▋       | 4032/15001 [2:36:01<5:55:05,  1.94s/it, loss=0.0286, lr=1e-5]Steps:  27%|██▋       | 4032/15001 [2:36:02<5:55:05,  1.94s/it, loss=0.119, lr=1e-5] Steps:  27%|██▋       | 4033/15001 [2:36:03<6:05:22,  2.00s/it, loss=0.119, lr=1e-5]Steps:  27%|██▋       | 4033/15001 [2:36:04<6:05:22,  2.00s/it, loss=0.2, lr=1e-5]  Steps:  27%|██▋       | 4034/15001 [2:36:05<6:05:34,  2.00s/it, loss=0.2, lr=1e-5]Steps:  27%|██▋       | 4034/15001 [2:36:05<6:05:34,  2.00s/it, loss=0.104, lr=1e-5]Steps:  27%|██▋       | 4035/15001 [2:36:07<5:54:38,  1.94s/it, loss=0.104, lr=1e-5]Steps:  27%|██▋       | 4035/15001 [2:36:07<5:54:38,  1.94s/it, loss=0.0459, lr=1e-5]Steps:  27%|██▋       | 4036/15001 [2:36:09<5:45:32,  1.89s/it, loss=0.0459, lr=1e-5]Steps:  27%|██▋       | 4036/15001 [2:36:09<5:45:32,  1.89s/it, loss=0.166, lr=1e-5] Steps:  27%|██▋       | 4037/15001 [2:36:10<5:29:39,  1.80s/it, loss=0.166, lr=1e-5]Steps:  27%|██▋       | 4037/15001 [2:36:11<5:29:39,  1.80s/it, loss=0.149, lr=1e-5]Steps:  27%|██▋       | 4038/15001 [2:36:12<5:34:12,  1.83s/it, loss=0.149, lr=1e-5]Steps:  27%|██▋       | 4038/15001 [2:36:13<5:34:12,  1.83s/it, loss=0.154, lr=1e-5]Steps:  27%|██▋       | 4039/15001 [2:36:14<5:43:29,  1.88s/it, loss=0.154, lr=1e-5]Steps:  27%|██▋       | 4039/15001 [2:36:14<5:43:29,  1.88s/it, loss=0.165, lr=1e-5]Steps:  27%|██▋       | 4040/15001 [2:36:16<5:31:54,  1.82s/it, loss=0.165, lr=1e-5]Steps:  27%|██▋       | 4040/15001 [2:36:16<5:31:54,  1.82s/it, loss=0.219, lr=1e-5]Steps:  27%|██▋       | 4041/15001 [2:36:18<5:40:49,  1.87s/it, loss=0.219, lr=1e-5]Steps:  27%|██▋       | 4041/15001 [2:36:18<5:40:49,  1.87s/it, loss=0.0831, lr=1e-5]Steps:  27%|██▋       | 4042/15001 [2:36:20<5:48:04,  1.91s/it, loss=0.0831, lr=1e-5]Steps:  27%|██▋       | 4042/15001 [2:36:20<5:48:04,  1.91s/it, loss=0.0785, lr=1e-5]Steps:  27%|██▋       | 4043/15001 [2:36:22<5:36:20,  1.84s/it, loss=0.0785, lr=1e-5]Steps:  27%|██▋       | 4043/15001 [2:36:22<5:36:20,  1.84s/it, loss=0.114, lr=1e-5] Steps:  27%|██▋       | 4044/15001 [2:36:23<5:26:53,  1.79s/it, loss=0.114, lr=1e-5]Steps:  27%|██▋       | 4044/15001 [2:36:24<5:26:53,  1.79s/it, loss=0.0951, lr=1e-5]Steps:  27%|██▋       | 4045/15001 [2:36:25<5:28:32,  1.80s/it, loss=0.0951, lr=1e-5]Steps:  27%|██▋       | 4045/15001 [2:36:26<5:28:32,  1.80s/it, loss=0.0608, lr=1e-5]Steps:  27%|██▋       | 4046/15001 [2:36:27<5:47:39,  1.90s/it, loss=0.0608, lr=1e-5]Steps:  27%|██▋       | 4046/15001 [2:36:27<5:47:39,  1.90s/it, loss=0.183, lr=1e-5] Steps:  27%|██▋       | 4047/15001 [2:36:29<5:42:23,  1.88s/it, loss=0.183, lr=1e-5]Steps:  27%|██▋       | 4047/15001 [2:36:29<5:42:23,  1.88s/it, loss=0.136, lr=1e-5]Steps:  27%|██▋       | 4048/15001 [2:36:31<5:34:31,  1.83s/it, loss=0.136, lr=1e-5]Steps:  27%|██▋       | 4048/15001 [2:36:31<5:34:31,  1.83s/it, loss=0.227, lr=1e-5]Steps:  27%|██▋       | 4049/15001 [2:36:33<5:34:56,  1.84s/it, loss=0.227, lr=1e-5]Steps:  27%|██▋       | 4049/15001 [2:36:33<5:34:56,  1.84s/it, loss=0.387, lr=1e-5]Steps:  27%|██▋       | 4050/15001 [2:36:35<5:53:10,  1.94s/it, loss=0.387, lr=1e-5]Steps:  27%|██▋       | 4050/15001 [2:36:35<5:53:10,  1.94s/it, loss=0.152, lr=1e-5]Steps:  27%|██▋       | 4051/15001 [2:36:37<5:54:39,  1.94s/it, loss=0.152, lr=1e-5]Steps:  27%|██▋       | 4051/15001 [2:36:37<5:54:39,  1.94s/it, loss=0.281, lr=1e-5]Steps:  27%|██▋       | 4052/15001 [2:36:39<6:19:09,  2.08s/it, loss=0.281, lr=1e-5]Steps:  27%|██▋       | 4052/15001 [2:36:39<6:19:09,  2.08s/it, loss=0.0975, lr=1e-5]Steps:  27%|██▋       | 4053/15001 [2:36:41<6:07:11,  2.01s/it, loss=0.0975, lr=1e-5]Steps:  27%|██▋       | 4053/15001 [2:36:41<6:07:11,  2.01s/it, loss=0.0941, lr=1e-5]Steps:  27%|██▋       | 4054/15001 [2:36:43<6:10:22,  2.03s/it, loss=0.0941, lr=1e-5]Steps:  27%|██▋       | 4054/15001 [2:36:43<6:10:22,  2.03s/it, loss=0.312, lr=1e-5] Steps:  27%|██▋       | 4055/15001 [2:36:45<6:12:45,  2.04s/it, loss=0.312, lr=1e-5]Steps:  27%|██▋       | 4055/15001 [2:36:45<6:12:45,  2.04s/it, loss=0.16, lr=1e-5] Steps:  27%|██▋       | 4056/15001 [2:36:47<6:01:40,  1.98s/it, loss=0.16, lr=1e-5]Steps:  27%|██▋       | 4056/15001 [2:36:47<6:01:40,  1.98s/it, loss=0.406, lr=1e-5]Steps:  27%|██▋       | 4057/15001 [2:36:49<5:38:58,  1.86s/it, loss=0.406, lr=1e-5]Steps:  27%|██▋       | 4057/15001 [2:36:49<5:38:58,  1.86s/it, loss=0.232, lr=1e-5]Steps:  27%|██▋       | 4058/15001 [2:36:51<5:41:29,  1.87s/it, loss=0.232, lr=1e-5]Steps:  27%|██▋       | 4058/15001 [2:36:51<5:41:29,  1.87s/it, loss=0.219, lr=1e-5]Steps:  27%|██▋       | 4059/15001 [2:36:52<5:40:28,  1.87s/it, loss=0.219, lr=1e-5]Steps:  27%|██▋       | 4059/15001 [2:36:53<5:40:28,  1.87s/it, loss=0.12, lr=1e-5] Steps:  27%|██▋       | 4060/15001 [2:36:54<5:47:01,  1.90s/it, loss=0.12, lr=1e-5]Steps:  27%|██▋       | 4060/15001 [2:36:54<5:47:01,  1.90s/it, loss=0.131, lr=1e-5]Steps:  27%|██▋       | 4061/15001 [2:36:56<5:25:44,  1.79s/it, loss=0.131, lr=1e-5]Steps:  27%|██▋       | 4061/15001 [2:36:56<5:25:44,  1.79s/it, loss=0.163, lr=1e-5]Steps:  27%|██▋       | 4062/15001 [2:36:58<5:22:44,  1.77s/it, loss=0.163, lr=1e-5]Steps:  27%|██▋       | 4062/15001 [2:36:58<5:22:44,  1.77s/it, loss=0.174, lr=1e-5]Steps:  27%|██▋       | 4063/15001 [2:36:59<5:23:55,  1.78s/it, loss=0.174, lr=1e-5]Steps:  27%|██▋       | 4063/15001 [2:37:00<5:23:55,  1.78s/it, loss=0.253, lr=1e-5]Steps:  27%|██▋       | 4064/15001 [2:37:01<5:33:39,  1.83s/it, loss=0.253, lr=1e-5]Steps:  27%|██▋       | 4064/15001 [2:37:02<5:33:39,  1.83s/it, loss=0.0788, lr=1e-5]Steps:  27%|██▋       | 4065/15001 [2:37:03<5:41:44,  1.87s/it, loss=0.0788, lr=1e-5]Steps:  27%|██▋       | 4065/15001 [2:37:04<5:41:44,  1.87s/it, loss=0.187, lr=1e-5] Steps:  27%|██▋       | 4066/15001 [2:37:05<5:32:28,  1.82s/it, loss=0.187, lr=1e-5]Steps:  27%|██▋       | 4066/15001 [2:37:05<5:32:28,  1.82s/it, loss=0.102, lr=1e-5]Steps:  27%|██▋       | 4067/15001 [2:37:07<5:38:57,  1.86s/it, loss=0.102, lr=1e-5]Steps:  27%|██▋       | 4067/15001 [2:37:07<5:38:57,  1.86s/it, loss=0.4, lr=1e-5]  Steps:  27%|██▋       | 4068/15001 [2:37:09<5:42:17,  1.88s/it, loss=0.4, lr=1e-5]Steps:  27%|██▋       | 4068/15001 [2:37:09<5:42:17,  1.88s/it, loss=0.198, lr=1e-5]Steps:  27%|██▋       | 4069/15001 [2:37:11<5:27:46,  1.80s/it, loss=0.198, lr=1e-5]Steps:  27%|██▋       | 4069/15001 [2:37:11<5:27:46,  1.80s/it, loss=0.225, lr=1e-5]Steps:  27%|██▋       | 4070/15001 [2:37:13<5:45:35,  1.90s/it, loss=0.225, lr=1e-5]Steps:  27%|██▋       | 4070/15001 [2:37:13<5:45:35,  1.90s/it, loss=0.2, lr=1e-5]  Steps:  27%|██▋       | 4071/15001 [2:37:14<5:38:08,  1.86s/it, loss=0.2, lr=1e-5]Steps:  27%|██▋       | 4071/15001 [2:37:15<5:38:08,  1.86s/it, loss=0.246, lr=1e-5]Steps:  27%|██▋       | 4072/15001 [2:37:16<5:34:59,  1.84s/it, loss=0.246, lr=1e-5]Steps:  27%|██▋       | 4072/15001 [2:37:16<5:34:59,  1.84s/it, loss=0.158, lr=1e-5]Steps:  27%|██▋       | 4073/15001 [2:37:18<5:39:12,  1.86s/it, loss=0.158, lr=1e-5]Steps:  27%|██▋       | 4073/15001 [2:37:19<5:39:12,  1.86s/it, loss=0.222, lr=1e-5]Steps:  27%|██▋       | 4074/15001 [2:37:20<5:58:38,  1.97s/it, loss=0.222, lr=1e-5]Steps:  27%|██▋       | 4074/15001 [2:37:21<5:58:38,  1.97s/it, loss=0.393, lr=1e-5]Steps:  27%|██▋       | 4075/15001 [2:37:23<6:12:29,  2.05s/it, loss=0.393, lr=1e-5]Steps:  27%|██▋       | 4075/15001 [2:37:23<6:12:29,  2.05s/it, loss=0.0944, lr=1e-5]Steps:  27%|██▋       | 4076/15001 [2:37:25<6:09:18,  2.03s/it, loss=0.0944, lr=1e-5]Steps:  27%|██▋       | 4076/15001 [2:37:25<6:09:18,  2.03s/it, loss=0.137, lr=1e-5] Steps:  27%|██▋       | 4077/15001 [2:37:26<6:01:36,  1.99s/it, loss=0.137, lr=1e-5]Steps:  27%|██▋       | 4077/15001 [2:37:27<6:01:36,  1.99s/it, loss=0.23, lr=1e-5] Steps:  27%|██▋       | 4078/15001 [2:37:29<6:07:05,  2.02s/it, loss=0.23, lr=1e-5]Steps:  27%|██▋       | 4078/15001 [2:37:29<6:07:05,  2.02s/it, loss=0.251, lr=1e-5]Steps:  27%|██▋       | 4079/15001 [2:37:30<5:52:34,  1.94s/it, loss=0.251, lr=1e-5]Steps:  27%|██▋       | 4079/15001 [2:37:31<5:52:34,  1.94s/it, loss=0.253, lr=1e-5]Steps:  27%|██▋       | 4080/15001 [2:37:32<5:51:43,  1.93s/it, loss=0.253, lr=1e-5]Steps:  27%|██▋       | 4080/15001 [2:37:32<5:51:43,  1.93s/it, loss=0.178, lr=1e-5]Steps:  27%|██▋       | 4081/15001 [2:37:34<5:56:22,  1.96s/it, loss=0.178, lr=1e-5]Steps:  27%|██▋       | 4081/15001 [2:37:34<5:56:22,  1.96s/it, loss=0.347, lr=1e-5]Steps:  27%|██▋       | 4082/15001 [2:37:36<5:30:39,  1.82s/it, loss=0.347, lr=1e-5]Steps:  27%|██▋       | 4082/15001 [2:37:36<5:30:39,  1.82s/it, loss=0.181, lr=1e-5]Steps:  27%|██▋       | 4083/15001 [2:37:38<5:34:07,  1.84s/it, loss=0.181, lr=1e-5]Steps:  27%|██▋       | 4083/15001 [2:37:38<5:34:07,  1.84s/it, loss=0.402, lr=1e-5]Steps:  27%|██▋       | 4084/15001 [2:37:40<5:37:49,  1.86s/it, loss=0.402, lr=1e-5]Steps:  27%|██▋       | 4084/15001 [2:37:40<5:37:49,  1.86s/it, loss=0.188, lr=1e-5]Steps:  27%|██▋       | 4085/15001 [2:37:41<5:42:50,  1.88s/it, loss=0.188, lr=1e-5]Steps:  27%|██▋       | 4085/15001 [2:37:42<5:42:50,  1.88s/it, loss=0.121, lr=1e-5]Steps:  27%|██▋       | 4086/15001 [2:37:43<5:43:37,  1.89s/it, loss=0.121, lr=1e-5]Steps:  27%|██▋       | 4086/15001 [2:37:44<5:43:37,  1.89s/it, loss=0.202, lr=1e-5]Steps:  27%|██▋       | 4087/15001 [2:37:45<5:39:57,  1.87s/it, loss=0.202, lr=1e-5]Steps:  27%|██▋       | 4087/15001 [2:37:45<5:39:57,  1.87s/it, loss=0.205, lr=1e-5]Steps:  27%|██▋       | 4088/15001 [2:37:47<5:39:17,  1.87s/it, loss=0.205, lr=1e-5]Steps:  27%|██▋       | 4088/15001 [2:37:47<5:39:17,  1.87s/it, loss=0.223, lr=1e-5]Steps:  27%|██▋       | 4089/15001 [2:37:49<5:26:30,  1.80s/it, loss=0.223, lr=1e-5]Steps:  27%|██▋       | 4089/15001 [2:37:49<5:26:30,  1.80s/it, loss=0.223, lr=1e-5]Steps:  27%|██▋       | 4090/15001 [2:37:51<5:28:12,  1.80s/it, loss=0.223, lr=1e-5]Steps:  27%|██▋       | 4090/15001 [2:37:51<5:28:12,  1.80s/it, loss=0.0254, lr=1e-5]Steps:  27%|██▋       | 4091/15001 [2:37:52<5:27:15,  1.80s/it, loss=0.0254, lr=1e-5]Steps:  27%|██▋       | 4091/15001 [2:37:52<5:27:15,  1.80s/it, loss=0.249, lr=1e-5] Steps:  27%|██▋       | 4092/15001 [2:37:54<5:29:30,  1.81s/it, loss=0.249, lr=1e-5]Steps:  27%|██▋       | 4092/15001 [2:37:54<5:29:30,  1.81s/it, loss=0.114, lr=1e-5]Steps:  27%|██▋       | 4093/15001 [2:37:56<5:12:50,  1.72s/it, loss=0.114, lr=1e-5]Steps:  27%|██▋       | 4093/15001 [2:37:56<5:12:50,  1.72s/it, loss=0.26, lr=1e-5] Steps:  27%|██▋       | 4094/15001 [2:37:58<5:26:56,  1.80s/it, loss=0.26, lr=1e-5]Steps:  27%|██▋       | 4094/15001 [2:37:58<5:26:56,  1.80s/it, loss=0.0598, lr=1e-5]Steps:  27%|██▋       | 4095/15001 [2:37:59<5:23:37,  1.78s/it, loss=0.0598, lr=1e-5]Steps:  27%|██▋       | 4095/15001 [2:38:00<5:23:37,  1.78s/it, loss=0.252, lr=1e-5] Steps:  27%|██▋       | 4096/15001 [2:38:02<5:44:57,  1.90s/it, loss=0.252, lr=1e-5]Steps:  27%|██▋       | 4096/15001 [2:38:02<5:44:57,  1.90s/it, loss=0.327, lr=1e-5]Steps:  27%|██▋       | 4097/15001 [2:38:04<6:01:51,  1.99s/it, loss=0.327, lr=1e-5]Steps:  27%|██▋       | 4097/15001 [2:38:04<6:01:51,  1.99s/it, loss=0.12, lr=1e-5] Steps:  27%|██▋       | 4098/15001 [2:38:06<6:03:16,  2.00s/it, loss=0.12, lr=1e-5]Steps:  27%|██▋       | 4098/15001 [2:38:06<6:03:16,  2.00s/it, loss=0.261, lr=1e-5]Steps:  27%|██▋       | 4099/15001 [2:38:08<5:56:10,  1.96s/it, loss=0.261, lr=1e-5]Steps:  27%|██▋       | 4099/15001 [2:38:08<5:56:10,  1.96s/it, loss=0.129, lr=1e-5]Steps:  27%|██▋       | 4100/15001 [2:38:09<5:42:35,  1.89s/it, loss=0.129, lr=1e-5]Steps:  27%|██▋       | 4100/15001 [2:38:10<5:42:35,  1.89s/it, loss=0.157, lr=1e-5]Steps:  27%|██▋       | 4101/15001 [2:38:11<5:50:57,  1.93s/it, loss=0.157, lr=1e-5]Steps:  27%|██▋       | 4101/15001 [2:38:12<5:50:57,  1.93s/it, loss=0.209, lr=1e-5]Steps:  27%|██▋       | 4102/15001 [2:38:14<6:09:38,  2.03s/it, loss=0.209, lr=1e-5]Steps:  27%|██▋       | 4102/15001 [2:38:14<6:09:38,  2.03s/it, loss=0.0168, lr=1e-5]Steps:  27%|██▋       | 4103/15001 [2:38:15<5:52:40,  1.94s/it, loss=0.0168, lr=1e-5]Steps:  27%|██▋       | 4103/15001 [2:38:15<5:52:40,  1.94s/it, loss=0.0858, lr=1e-5]Steps:  27%|██▋       | 4104/15001 [2:38:17<5:37:51,  1.86s/it, loss=0.0858, lr=1e-5]Steps:  27%|██▋       | 4104/15001 [2:38:17<5:37:51,  1.86s/it, loss=0.11, lr=1e-5]  Steps:  27%|██▋       | 4105/15001 [2:38:19<5:44:11,  1.90s/it, loss=0.11, lr=1e-5]Steps:  27%|██▋       | 4105/15001 [2:38:19<5:44:11,  1.90s/it, loss=0.206, lr=1e-5]Steps:  27%|██▋       | 4106/15001 [2:38:21<5:37:44,  1.86s/it, loss=0.206, lr=1e-5]Steps:  27%|██▋       | 4106/15001 [2:38:21<5:37:44,  1.86s/it, loss=0.046, lr=1e-5]Steps:  27%|██▋       | 4107/15001 [2:38:23<5:35:40,  1.85s/it, loss=0.046, lr=1e-5]Steps:  27%|██▋       | 4107/15001 [2:38:23<5:35:40,  1.85s/it, loss=0.412, lr=1e-5]Steps:  27%|██▋       | 4108/15001 [2:38:24<5:32:01,  1.83s/it, loss=0.412, lr=1e-5]Steps:  27%|██▋       | 4108/15001 [2:38:25<5:32:01,  1.83s/it, loss=0.113, lr=1e-5]Steps:  27%|██▋       | 4109/15001 [2:38:26<5:30:20,  1.82s/it, loss=0.113, lr=1e-5]Steps:  27%|██▋       | 4109/15001 [2:38:26<5:30:20,  1.82s/it, loss=0.579, lr=1e-5]Steps:  27%|██▋       | 4110/15001 [2:38:28<5:35:16,  1.85s/it, loss=0.579, lr=1e-5]Steps:  27%|██▋       | 4110/15001 [2:38:28<5:35:16,  1.85s/it, loss=0.111, lr=1e-5]Steps:  27%|██▋       | 4111/15001 [2:38:30<5:31:06,  1.82s/it, loss=0.111, lr=1e-5]Steps:  27%|██▋       | 4111/15001 [2:38:30<5:31:06,  1.82s/it, loss=0.256, lr=1e-5]Steps:  27%|██▋       | 4112/15001 [2:38:32<5:38:37,  1.87s/it, loss=0.256, lr=1e-5]Steps:  27%|██▋       | 4112/15001 [2:38:32<5:38:37,  1.87s/it, loss=0.183, lr=1e-5]Steps:  27%|██▋       | 4113/15001 [2:38:33<5:21:49,  1.77s/it, loss=0.183, lr=1e-5]Steps:  27%|██▋       | 4113/15001 [2:38:34<5:21:49,  1.77s/it, loss=0.207, lr=1e-5]Steps:  27%|██▋       | 4114/15001 [2:38:35<5:11:30,  1.72s/it, loss=0.207, lr=1e-5]Steps:  27%|██▋       | 4114/15001 [2:38:36<5:11:30,  1.72s/it, loss=0.345, lr=1e-5]Steps:  27%|██▋       | 4115/15001 [2:38:37<5:31:35,  1.83s/it, loss=0.345, lr=1e-5]Steps:  27%|██▋       | 4115/15001 [2:38:37<5:31:35,  1.83s/it, loss=0.172, lr=1e-5]Steps:  27%|██▋       | 4116/15001 [2:38:39<5:37:45,  1.86s/it, loss=0.172, lr=1e-5]Steps:  27%|██▋       | 4116/15001 [2:38:39<5:37:45,  1.86s/it, loss=0.0859, lr=1e-5]Steps:  27%|██▋       | 4117/15001 [2:38:41<5:27:02,  1.80s/it, loss=0.0859, lr=1e-5]Steps:  27%|██▋       | 4117/15001 [2:38:41<5:27:02,  1.80s/it, loss=0.209, lr=1e-5] Steps:  27%|██▋       | 4118/15001 [2:38:43<5:41:31,  1.88s/it, loss=0.209, lr=1e-5]Steps:  27%|██▋       | 4118/15001 [2:38:43<5:41:31,  1.88s/it, loss=0.277, lr=1e-5]Steps:  27%|██▋       | 4119/15001 [2:38:45<5:40:34,  1.88s/it, loss=0.277, lr=1e-5]Steps:  27%|██▋       | 4119/15001 [2:38:45<5:40:34,  1.88s/it, loss=0.223, lr=1e-5]Steps:  27%|██▋       | 4120/15001 [2:38:46<5:37:52,  1.86s/it, loss=0.223, lr=1e-5]Steps:  27%|██▋       | 4120/15001 [2:38:47<5:37:52,  1.86s/it, loss=0.0999, lr=1e-5]Steps:  27%|██▋       | 4121/15001 [2:38:49<5:54:19,  1.95s/it, loss=0.0999, lr=1e-5]Steps:  27%|██▋       | 4121/15001 [2:38:49<5:54:19,  1.95s/it, loss=0.21, lr=1e-5]  Steps:  27%|██▋       | 4122/15001 [2:38:51<6:13:51,  2.06s/it, loss=0.21, lr=1e-5]Steps:  27%|██▋       | 4122/15001 [2:38:51<6:13:51,  2.06s/it, loss=0.174, lr=1e-5]Steps:  27%|██▋       | 4123/15001 [2:38:53<6:06:39,  2.02s/it, loss=0.174, lr=1e-5]Steps:  27%|██▋       | 4123/15001 [2:38:53<6:06:39,  2.02s/it, loss=0.0998, lr=1e-5]Steps:  27%|██▋       | 4124/15001 [2:38:55<5:56:31,  1.97s/it, loss=0.0998, lr=1e-5]Steps:  27%|██▋       | 4124/15001 [2:38:55<5:56:31,  1.97s/it, loss=0.256, lr=1e-5] Steps:  27%|██▋       | 4125/15001 [2:38:56<5:39:23,  1.87s/it, loss=0.256, lr=1e-5]Steps:  27%|██▋       | 4125/15001 [2:38:57<5:39:23,  1.87s/it, loss=0.196, lr=1e-5]Steps:  28%|██▊       | 4126/15001 [2:38:58<5:42:04,  1.89s/it, loss=0.196, lr=1e-5]Steps:  28%|██▊       | 4126/15001 [2:38:58<5:42:04,  1.89s/it, loss=0.133, lr=1e-5]Steps:  28%|██▊       | 4127/15001 [2:39:00<5:37:16,  1.86s/it, loss=0.133, lr=1e-5]Steps:  28%|██▊       | 4127/15001 [2:39:00<5:37:16,  1.86s/it, loss=0.0541, lr=1e-5]Steps:  28%|██▊       | 4128/15001 [2:39:02<5:34:46,  1.85s/it, loss=0.0541, lr=1e-5]Steps:  28%|██▊       | 4128/15001 [2:39:02<5:34:46,  1.85s/it, loss=0.102, lr=1e-5] Steps:  28%|██▊       | 4129/15001 [2:39:04<5:38:38,  1.87s/it, loss=0.102, lr=1e-5]Steps:  28%|██▊       | 4129/15001 [2:39:04<5:38:38,  1.87s/it, loss=0.239, lr=1e-5]Steps:  28%|██▊       | 4130/15001 [2:39:06<5:35:12,  1.85s/it, loss=0.239, lr=1e-5]Steps:  28%|██▊       | 4130/15001 [2:39:06<5:35:12,  1.85s/it, loss=0.137, lr=1e-5]Steps:  28%|██▊       | 4131/15001 [2:39:07<5:24:32,  1.79s/it, loss=0.137, lr=1e-5]Steps:  28%|██▊       | 4131/15001 [2:39:07<5:24:32,  1.79s/it, loss=0.103, lr=1e-5]Steps:  28%|██▊       | 4132/15001 [2:39:09<5:26:34,  1.80s/it, loss=0.103, lr=1e-5]Steps:  28%|██▊       | 4132/15001 [2:39:09<5:26:34,  1.80s/it, loss=0.101, lr=1e-5]Steps:  28%|██▊       | 4133/15001 [2:39:11<5:27:04,  1.81s/it, loss=0.101, lr=1e-5]Steps:  28%|██▊       | 4133/15001 [2:39:11<5:27:04,  1.81s/it, loss=0.0436, lr=1e-5]Steps:  28%|██▊       | 4134/15001 [2:39:13<5:31:10,  1.83s/it, loss=0.0436, lr=1e-5]Steps:  28%|██▊       | 4134/15001 [2:39:13<5:31:10,  1.83s/it, loss=0.0973, lr=1e-5]Steps:  28%|██▊       | 4135/15001 [2:39:15<5:22:56,  1.78s/it, loss=0.0973, lr=1e-5]Steps:  28%|██▊       | 4135/15001 [2:39:15<5:22:56,  1.78s/it, loss=0.226, lr=1e-5] Steps:  28%|██▊       | 4136/15001 [2:39:16<5:21:21,  1.77s/it, loss=0.226, lr=1e-5]Steps:  28%|██▊       | 4136/15001 [2:39:17<5:21:21,  1.77s/it, loss=0.134, lr=1e-5]Steps:  28%|██▊       | 4137/15001 [2:39:18<5:37:33,  1.86s/it, loss=0.134, lr=1e-5]Steps:  28%|██▊       | 4137/15001 [2:39:18<5:37:33,  1.86s/it, loss=0.19, lr=1e-5] Steps:  28%|██▊       | 4138/15001 [2:39:20<5:09:30,  1.71s/it, loss=0.19, lr=1e-5]Steps:  28%|██▊       | 4138/15001 [2:39:20<5:09:30,  1.71s/it, loss=0.237, lr=1e-5]Steps:  28%|██▊       | 4139/15001 [2:39:22<5:37:12,  1.86s/it, loss=0.237, lr=1e-5]Steps:  28%|██▊       | 4139/15001 [2:39:22<5:37:12,  1.86s/it, loss=0.0625, lr=1e-5]Steps:  28%|██▊       | 4140/15001 [2:39:24<5:38:31,  1.87s/it, loss=0.0625, lr=1e-5]Steps:  28%|██▊       | 4140/15001 [2:39:24<5:38:31,  1.87s/it, loss=0.108, lr=1e-5] Steps:  28%|██▊       | 4141/15001 [2:39:25<5:29:59,  1.82s/it, loss=0.108, lr=1e-5]Steps:  28%|██▊       | 4141/15001 [2:39:26<5:29:59,  1.82s/it, loss=0.104, lr=1e-5]Steps:  28%|██▊       | 4142/15001 [2:39:27<5:38:59,  1.87s/it, loss=0.104, lr=1e-5]Steps:  28%|██▊       | 4142/15001 [2:39:28<5:38:59,  1.87s/it, loss=0.316, lr=1e-5]Steps:  28%|██▊       | 4143/15001 [2:39:30<5:54:45,  1.96s/it, loss=0.316, lr=1e-5]Steps:  28%|██▊       | 4143/15001 [2:39:30<5:54:45,  1.96s/it, loss=0.108, lr=1e-5]Steps:  28%|██▊       | 4144/15001 [2:39:32<5:48:43,  1.93s/it, loss=0.108, lr=1e-5]Steps:  28%|██▊       | 4144/15001 [2:39:32<5:48:43,  1.93s/it, loss=0.217, lr=1e-5]Steps:  28%|██▊       | 4145/15001 [2:39:34<6:06:10,  2.02s/it, loss=0.217, lr=1e-5]Steps:  28%|██▊       | 4145/15001 [2:39:34<6:06:10,  2.02s/it, loss=0.0491, lr=1e-5]Steps:  28%|██▊       | 4146/15001 [2:39:36<6:04:32,  2.01s/it, loss=0.0491, lr=1e-5]Steps:  28%|██▊       | 4146/15001 [2:39:36<6:04:32,  2.01s/it, loss=0.347, lr=1e-5] Steps:  28%|██▊       | 4147/15001 [2:39:38<5:57:23,  1.98s/it, loss=0.347, lr=1e-5]Steps:  28%|██▊       | 4147/15001 [2:39:38<5:57:23,  1.98s/it, loss=0.078, lr=1e-5]Steps:  28%|██▊       | 4148/15001 [2:39:39<5:37:20,  1.86s/it, loss=0.078, lr=1e-5]Steps:  28%|██▊       | 4148/15001 [2:39:40<5:37:20,  1.86s/it, loss=0.132, lr=1e-5]Steps:  28%|██▊       | 4149/15001 [2:39:41<5:52:40,  1.95s/it, loss=0.132, lr=1e-5]Steps:  28%|██▊       | 4149/15001 [2:39:42<5:52:40,  1.95s/it, loss=0.0942, lr=1e-5]Steps:  28%|██▊       | 4150/15001 [2:39:43<5:43:31,  1.90s/it, loss=0.0942, lr=1e-5]Steps:  28%|██▊       | 4150/15001 [2:39:44<5:43:31,  1.90s/it, loss=0.161, lr=1e-5] Steps:  28%|██▊       | 4151/15001 [2:39:45<5:47:08,  1.92s/it, loss=0.161, lr=1e-5]Steps:  28%|██▊       | 4151/15001 [2:39:45<5:47:08,  1.92s/it, loss=0.159, lr=1e-5]Steps:  28%|██▊       | 4152/15001 [2:39:47<5:36:13,  1.86s/it, loss=0.159, lr=1e-5]Steps:  28%|██▊       | 4152/15001 [2:39:47<5:36:13,  1.86s/it, loss=0.251, lr=1e-5]Steps:  28%|██▊       | 4153/15001 [2:39:48<5:23:58,  1.79s/it, loss=0.251, lr=1e-5]Steps:  28%|██▊       | 4153/15001 [2:39:49<5:23:58,  1.79s/it, loss=0.0375, lr=1e-5]Steps:  28%|██▊       | 4154/15001 [2:39:51<5:39:04,  1.88s/it, loss=0.0375, lr=1e-5]Steps:  28%|██▊       | 4154/15001 [2:39:51<5:39:04,  1.88s/it, loss=0.192, lr=1e-5] Steps:  28%|██▊       | 4155/15001 [2:39:52<5:23:36,  1.79s/it, loss=0.192, lr=1e-5]Steps:  28%|██▊       | 4155/15001 [2:39:53<5:23:36,  1.79s/it, loss=0.194, lr=1e-5]Steps:  28%|██▊       | 4156/15001 [2:39:54<5:26:50,  1.81s/it, loss=0.194, lr=1e-5]Steps:  28%|██▊       | 4156/15001 [2:39:54<5:26:50,  1.81s/it, loss=0.118, lr=1e-5]Steps:  28%|██▊       | 4157/15001 [2:39:56<5:28:53,  1.82s/it, loss=0.118, lr=1e-5]Steps:  28%|██▊       | 4157/15001 [2:39:56<5:28:53,  1.82s/it, loss=0.122, lr=1e-5]Steps:  28%|██▊       | 4158/15001 [2:39:58<5:27:50,  1.81s/it, loss=0.122, lr=1e-5]Steps:  28%|██▊       | 4158/15001 [2:39:58<5:27:50,  1.81s/it, loss=0.164, lr=1e-5]Steps:  28%|██▊       | 4159/15001 [2:39:59<5:16:23,  1.75s/it, loss=0.164, lr=1e-5]Steps:  28%|██▊       | 4159/15001 [2:40:00<5:16:23,  1.75s/it, loss=0.338, lr=1e-5]Steps:  28%|██▊       | 4160/15001 [2:40:01<5:37:41,  1.87s/it, loss=0.338, lr=1e-5]Steps:  28%|██▊       | 4160/15001 [2:40:01<5:37:41,  1.87s/it, loss=0.104, lr=1e-5]Steps:  28%|██▊       | 4161/15001 [2:40:03<5:25:20,  1.80s/it, loss=0.104, lr=1e-5]Steps:  28%|██▊       | 4161/15001 [2:40:03<5:25:20,  1.80s/it, loss=0.0876, lr=1e-5]Steps:  28%|██▊       | 4162/15001 [2:40:05<5:21:22,  1.78s/it, loss=0.0876, lr=1e-5]Steps:  28%|██▊       | 4162/15001 [2:40:05<5:21:22,  1.78s/it, loss=0.158, lr=1e-5] Steps:  28%|██▊       | 4163/15001 [2:40:07<5:32:00,  1.84s/it, loss=0.158, lr=1e-5]Steps:  28%|██▊       | 4163/15001 [2:40:07<5:32:00,  1.84s/it, loss=0.312, lr=1e-5]Steps:  28%|██▊       | 4164/15001 [2:40:09<5:29:31,  1.82s/it, loss=0.312, lr=1e-5]Steps:  28%|██▊       | 4164/15001 [2:40:09<5:29:31,  1.82s/it, loss=0.228, lr=1e-5]Steps:  28%|██▊       | 4165/15001 [2:40:11<5:43:02,  1.90s/it, loss=0.228, lr=1e-5]Steps:  28%|██▊       | 4165/15001 [2:40:11<5:43:02,  1.90s/it, loss=0.06, lr=1e-5] Steps:  28%|██▊       | 4166/15001 [2:40:13<5:45:53,  1.92s/it, loss=0.06, lr=1e-5]Steps:  28%|██▊       | 4166/15001 [2:40:13<5:45:53,  1.92s/it, loss=0.158, lr=1e-5]Steps:  28%|██▊       | 4167/15001 [2:40:15<5:56:42,  1.98s/it, loss=0.158, lr=1e-5]Steps:  28%|██▊       | 4167/15001 [2:40:15<5:56:42,  1.98s/it, loss=0.176, lr=1e-5]Steps:  28%|██▊       | 4168/15001 [2:40:16<5:46:36,  1.92s/it, loss=0.176, lr=1e-5]Steps:  28%|���█▊       | 4168/15001 [2:40:17<5:46:36,  1.92s/it, loss=0.184, lr=1e-5]Steps:  28%|██▊       | 4169/15001 [2:40:19<6:06:18,  2.03s/it, loss=0.184, lr=1e-5]Steps:  28%|██▊       | 4169/15001 [2:40:19<6:06:18,  2.03s/it, loss=0.226, lr=1e-5]Steps:  28%|██▊       | 4170/15001 [2:40:21<6:02:38,  2.01s/it, loss=0.226, lr=1e-5]Steps:  28%|██▊       | 4170/15001 [2:40:21<6:02:38,  2.01s/it, loss=0.107, lr=1e-5]Steps:  28%|██▊       | 4171/15001 [2:40:22<5:41:28,  1.89s/it, loss=0.107, lr=1e-5]Steps:  28%|██▊       | 4171/15001 [2:40:23<5:41:28,  1.89s/it, loss=0.0615, lr=1e-5]Steps:  28%|██▊       | 4172/15001 [2:40:24<5:37:29,  1.87s/it, loss=0.0615, lr=1e-5]Steps:  28%|██▊       | 4172/15001 [2:40:24<5:37:29,  1.87s/it, loss=0.183, lr=1e-5] Steps:  28%|██▊       | 4173/15001 [2:40:26<5:42:55,  1.90s/it, loss=0.183, lr=1e-5]Steps:  28%|██▊       | 4173/15001 [2:40:26<5:42:55,  1.90s/it, loss=0.152, lr=1e-5]Steps:  28%|██▊       | 4174/15001 [2:40:28<5:45:27,  1.91s/it, loss=0.152, lr=1e-5]Steps:  28%|██▊       | 4174/15001 [2:40:28<5:45:27,  1.91s/it, loss=0.145, lr=1e-5]Steps:  28%|██▊       | 4175/15001 [2:40:30<5:28:03,  1.82s/it, loss=0.145, lr=1e-5]Steps:  28%|██▊       | 4175/15001 [2:40:30<5:28:03,  1.82s/it, loss=0.0901, lr=1e-5]Steps:  28%|██▊       | 4176/15001 [2:40:31<5:24:57,  1.80s/it, loss=0.0901, lr=1e-5]Steps:  28%|██▊       | 4176/15001 [2:40:32<5:24:57,  1.80s/it, loss=0.221, lr=1e-5] Steps:  28%|██▊       | 4177/15001 [2:40:33<5:35:10,  1.86s/it, loss=0.221, lr=1e-5]Steps:  28%|██▊       | 4177/15001 [2:40:33<5:35:10,  1.86s/it, loss=0.214, lr=1e-5]Steps:  28%|██▊       | 4178/15001 [2:40:35<5:21:44,  1.78s/it, loss=0.214, lr=1e-5]Steps:  28%|██▊       | 4178/15001 [2:40:35<5:21:44,  1.78s/it, loss=0.284, lr=1e-5]Steps:  28%|██▊       | 4179/15001 [2:40:37<5:31:29,  1.84s/it, loss=0.284, lr=1e-5]Steps:  28%|██▊       | 4179/15001 [2:40:37<5:31:29,  1.84s/it, loss=0.152, lr=1e-5]Steps:  28%|██▊       | 4180/15001 [2:40:39<5:21:02,  1.78s/it, loss=0.152, lr=1e-5]Steps:  28%|██▊       | 4180/15001 [2:40:39<5:21:02,  1.78s/it, loss=0.213, lr=1e-5]Steps:  28%|██▊       | 4181/15001 [2:40:40<5:20:37,  1.78s/it, loss=0.213, lr=1e-5]Steps:  28%|██▊       | 4181/15001 [2:40:41<5:20:37,  1.78s/it, loss=0.115, lr=1e-5]Steps:  28%|██▊       | 4182/15001 [2:40:42<5:19:32,  1.77s/it, loss=0.115, lr=1e-5]Steps:  28%|██▊       | 4182/15001 [2:40:43<5:19:32,  1.77s/it, loss=0.245, lr=1e-5]Steps:  28%|██▊       | 4183/15001 [2:40:44<5:27:48,  1.82s/it, loss=0.245, lr=1e-5]Steps:  28%|██▊       | 4183/15001 [2:40:44<5:27:48,  1.82s/it, loss=0.416, lr=1e-5]Steps:  28%|██▊       | 4184/15001 [2:40:46<5:38:43,  1.88s/it, loss=0.416, lr=1e-5]Steps:  28%|██▊       | 4184/15001 [2:40:46<5:38:43,  1.88s/it, loss=0.23, lr=1e-5] Steps:  28%|██▊       | 4185/15001 [2:40:48<5:32:35,  1.85s/it, loss=0.23, lr=1e-5]Steps:  28%|██▊       | 4185/15001 [2:40:48<5:32:35,  1.85s/it, loss=0.115, lr=1e-5]Steps:  28%|██▊       | 4186/15001 [2:40:50<5:30:27,  1.83s/it, loss=0.115, lr=1e-5]Steps:  28%|██▊       | 4186/15001 [2:40:50<5:30:27,  1.83s/it, loss=0.0658, lr=1e-5]Steps:  28%|██▊       | 4187/15001 [2:40:52<5:35:28,  1.86s/it, loss=0.0658, lr=1e-5]Steps:  28%|██▊       | 4187/15001 [2:40:52<5:35:28,  1.86s/it, loss=0.0759, lr=1e-5]Steps:  28%|██▊       | 4188/15001 [2:40:54<5:45:34,  1.92s/it, loss=0.0759, lr=1e-5]Steps:  28%|██▊       | 4188/15001 [2:40:54<5:45:34,  1.92s/it, loss=0.301, lr=1e-5] Steps:  28%|██▊       | 4189/15001 [2:40:56<5:50:33,  1.95s/it, loss=0.301, lr=1e-5]Steps:  28%|██▊       | 4189/15001 [2:40:56<5:50:33,  1.95s/it, loss=0.186, lr=1e-5]Steps:  28%|██▊       | 4190/15001 [2:40:58<5:55:20,  1.97s/it, loss=0.186, lr=1e-5]Steps:  28%|██▊       | 4190/15001 [2:40:58<5:55:20,  1.97s/it, loss=0.254, lr=1e-5]Steps:  28%|██▊       | 4191/15001 [2:41:00<5:59:27,  2.00s/it, loss=0.254, lr=1e-5]Steps:  28%|██▊       | 4191/15001 [2:41:00<5:59:27,  2.00s/it, loss=0.188, lr=1e-5]Steps:  28%|██▊       | 4192/15001 [2:41:02<5:56:13,  1.98s/it, loss=0.188, lr=1e-5]Steps:  28%|██▊       | 4192/15001 [2:41:02<5:56:13,  1.98s/it, loss=0.0839, lr=1e-5]Steps:  28%|██▊       | 4193/15001 [2:41:04<6:06:49,  2.04s/it, loss=0.0839, lr=1e-5]Steps:  28%|██▊       | 4193/15001 [2:41:04<6:06:49,  2.04s/it, loss=0.129, lr=1e-5] Steps:  28%|██▊       | 4194/15001 [2:41:06<5:59:53,  2.00s/it, loss=0.129, lr=1e-5]Steps:  28%|██▊       | 4194/15001 [2:41:06<5:59:53,  2.00s/it, loss=0.214, lr=1e-5]Steps:  28%|██▊       | 4195/15001 [2:41:07<5:41:44,  1.90s/it, loss=0.214, lr=1e-5]Steps:  28%|██▊       | 4195/15001 [2:41:08<5:41:44,  1.90s/it, loss=0.0419, lr=1e-5]Steps:  28%|██▊       | 4196/15001 [2:41:09<5:40:03,  1.89s/it, loss=0.0419, lr=1e-5]Steps:  28%|██▊       | 4196/15001 [2:41:10<5:40:03,  1.89s/it, loss=0.175, lr=1e-5] Steps:  28%|██▊       | 4197/15001 [2:41:11<5:46:13,  1.92s/it, loss=0.175, lr=1e-5]Steps:  28%|██▊       | 4197/15001 [2:41:11<5:46:13,  1.92s/it, loss=0.0681, lr=1e-5]Steps:  28%|██▊       | 4198/15001 [2:41:13<5:35:29,  1.86s/it, loss=0.0681, lr=1e-5]Steps:  28%|██▊       | 4198/15001 [2:41:13<5:35:29,  1.86s/it, loss=0.0464, lr=1e-5]Steps:  28%|██▊       | 4199/15001 [2:41:15<5:32:50,  1.85s/it, loss=0.0464, lr=1e-5]Steps:  28%|██▊       | 4199/15001 [2:41:15<5:32:50,  1.85s/it, loss=0.157, lr=1e-5] Steps:  28%|██▊       | 4200/15001 [2:41:16<5:19:30,  1.77s/it, loss=0.157, lr=1e-5]Steps:  28%|██▊       | 4200/15001 [2:41:17<5:19:30,  1.77s/it, loss=0.0949, lr=1e-5]Steps:  28%|██▊       | 4201/15001 [2:41:19<5:43:30,  1.91s/it, loss=0.0949, lr=1e-5]Steps:  28%|██▊       | 4201/15001 [2:41:19<5:43:30,  1.91s/it, loss=0.199, lr=1e-5] Steps:  28%|██▊       | 4202/15001 [2:41:20<5:36:45,  1.87s/it, loss=0.199, lr=1e-5]Steps:  28%|██▊       | 4202/15001 [2:41:20<5:36:45,  1.87s/it, loss=0.125, lr=1e-5]Steps:  28%|██▊       | 4203/15001 [2:41:22<5:36:08,  1.87s/it, loss=0.125, lr=1e-5]Steps:  28%|██▊       | 4203/15001 [2:41:22<5:36:08,  1.87s/it, loss=0.159, lr=1e-5]Steps:  28%|██▊       | 4204/15001 [2:41:24<5:24:14,  1.80s/it, loss=0.159, lr=1e-5]Steps:  28%|██▊       | 4204/15001 [2:41:24<5:24:14,  1.80s/it, loss=0.00989, lr=1e-5]Steps:  28%|██▊       | 4205/15001 [2:41:26<5:23:20,  1.80s/it, loss=0.00989, lr=1e-5]Steps:  28%|██▊       | 4205/15001 [2:41:26<5:23:20,  1.80s/it, loss=0.297, lr=1e-5]  Steps:  28%|██▊       | 4206/15001 [2:41:28<5:35:35,  1.87s/it, loss=0.297, lr=1e-5]Steps:  28%|██▊       | 4206/15001 [2:41:28<5:35:35,  1.87s/it, loss=0.151, lr=1e-5]Steps:  28%|██▊       | 4207/15001 [2:41:29<5:24:36,  1.80s/it, loss=0.151, lr=1e-5]Steps:  28%|██▊       | 4207/15001 [2:41:30<5:24:36,  1.80s/it, loss=0.214, lr=1e-5]Steps:  28%|██▊       | 4208/15001 [2:41:31<5:21:07,  1.79s/it, loss=0.214, lr=1e-5]Steps:  28%|██▊       | 4208/15001 [2:41:32<5:21:07,  1.79s/it, loss=0.0971, lr=1e-5]Steps:  28%|██▊       | 4209/15001 [2:41:33<5:24:31,  1.80s/it, loss=0.0971, lr=1e-5]Steps:  28%|██▊       | 4209/15001 [2:41:33<5:24:31,  1.80s/it, loss=0.102, lr=1e-5] Steps:  28%|██▊       | 4210/15001 [2:41:35<5:38:45,  1.88s/it, loss=0.102, lr=1e-5]Steps:  28%|██▊       | 4210/15001 [2:41:35<5:38:45,  1.88s/it, loss=0.123, lr=1e-5]Steps:  28%|██▊       | 4211/15001 [2:41:37<5:40:57,  1.90s/it, loss=0.123, lr=1e-5]Steps:  28%|██▊       | 4211/15001 [2:41:37<5:40:57,  1.90s/it, loss=0.334, lr=1e-5]Steps:  28%|██▊       | 4212/15001 [2:41:39<5:57:04,  1.99s/it, loss=0.334, lr=1e-5]Steps:  28%|██▊       | 4212/15001 [2:41:39<5:57:04,  1.99s/it, loss=0.172, lr=1e-5]Steps:  28%|██▊       | 4213/15001 [2:41:41<5:55:18,  1.98s/it, loss=0.172, lr=1e-5]Steps:  28%|██▊       | 4213/15001 [2:41:41<5:55:18,  1.98s/it, loss=0.217, lr=1e-5]Steps:  28%|██▊       | 4214/15001 [2:41:43<5:50:02,  1.95s/it, loss=0.217, lr=1e-5]Steps:  28%|██▊       | 4214/15001 [2:41:43<5:50:02,  1.95s/it, loss=0.0747, lr=1e-5]Steps:  28%|██▊       | 4215/15001 [2:41:45<6:04:52,  2.03s/it, loss=0.0747, lr=1e-5]Steps:  28%|██▊       | 4215/15001 [2:41:45<6:04:52,  2.03s/it, loss=0.0973, lr=1e-5]Steps:  28%|██▊       | 4216/15001 [2:41:47<5:43:52,  1.91s/it, loss=0.0973, lr=1e-5]Steps:  28%|██▊       | 4216/15001 [2:41:47<5:43:52,  1.91s/it, loss=0.0756, lr=1e-5]Steps:  28%|██▊       | 4217/15001 [2:41:49<5:31:50,  1.85s/it, loss=0.0756, lr=1e-5]Steps:  28%|██▊       | 4217/15001 [2:41:49<5:31:50,  1.85s/it, loss=0.264, lr=1e-5] Steps:  28%|██▊       | 4218/15001 [2:41:50<5:31:56,  1.85s/it, loss=0.264, lr=1e-5]Steps:  28%|██▊       | 4218/15001 [2:41:51<5:31:56,  1.85s/it, loss=0.211, lr=1e-5]Steps:  28%|██▊       | 4219/15001 [2:41:52<5:35:31,  1.87s/it, loss=0.211, lr=1e-5]Steps:  28%|██▊       | 4219/15001 [2:41:52<5:35:31,  1.87s/it, loss=0.0901, lr=1e-5]Steps:  28%|██▊       | 4220/15001 [2:41:54<5:19:08,  1.78s/it, loss=0.0901, lr=1e-5]Steps:  28%|██▊       | 4220/15001 [2:41:54<5:19:08,  1.78s/it, loss=0.176, lr=1e-5] Steps:  28%|██▊       | 4221/15001 [2:41:56<5:20:42,  1.79s/it, loss=0.176, lr=1e-5]Steps:  28%|██▊       | 4221/15001 [2:41:56<5:20:42,  1.79s/it, loss=0.259, lr=1e-5]Steps:  28%|██▊       | 4222/15001 [2:41:58<5:40:34,  1.90s/it, loss=0.259, lr=1e-5]Steps:  28%|██▊       | 4222/15001 [2:41:58<5:40:34,  1.90s/it, loss=0.115, lr=1e-5]Steps:  28%|██▊       | 4223/15001 [2:42:00<5:36:05,  1.87s/it, loss=0.115, lr=1e-5]Steps:  28%|██▊       | 4223/15001 [2:42:00<5:36:05,  1.87s/it, loss=0.128, lr=1e-5]Steps:  28%|██▊       | 4224/15001 [2:42:01<5:30:45,  1.84s/it, loss=0.128, lr=1e-5]Steps:  28%|██▊       | 4224/15001 [2:42:02<5:30:45,  1.84s/it, loss=0.0846, lr=1e-5]Steps:  28%|██▊       | 4225/15001 [2:42:03<5:30:58,  1.84s/it, loss=0.0846, lr=1e-5]Steps:  28%|██▊       | 4225/15001 [2:42:03<5:30:58,  1.84s/it, loss=0.118, lr=1e-5] Steps:  28%|██▊       | 4226/15001 [2:42:05<5:08:15,  1.72s/it, loss=0.118, lr=1e-5]Steps:  28%|██▊       | 4226/15001 [2:42:05<5:08:15,  1.72s/it, loss=0.144, lr=1e-5]Steps:  28%|██▊       | 4227/15001 [2:42:07<5:33:31,  1.86s/it, loss=0.144, lr=1e-5]Steps:  28%|██▊       | 4227/15001 [2:42:07<5:33:31,  1.86s/it, loss=0.21, lr=1e-5] Steps:  28%|██▊       | 4228/15001 [2:42:09<5:25:49,  1.81s/it, loss=0.21, lr=1e-5]Steps:  28%|██▊       | 4228/15001 [2:42:09<5:25:49,  1.81s/it, loss=0.195, lr=1e-5]Steps:  28%|██▊       | 4229/15001 [2:42:10<5:22:57,  1.80s/it, loss=0.195, lr=1e-5]Steps:  28%|██▊       | 4229/15001 [2:42:11<5:22:57,  1.80s/it, loss=0.181, lr=1e-5]Steps:  28%|██▊       | 4230/15001 [2:42:12<5:29:13,  1.83s/it, loss=0.181, lr=1e-5]Steps:  28%|██▊       | 4230/15001 [2:42:12<5:29:13,  1.83s/it, loss=0.0304, lr=1e-5]Steps:  28%|██▊       | 4231/15001 [2:42:14<5:26:50,  1.82s/it, loss=0.0304, lr=1e-5]Steps:  28%|██▊       | 4231/15001 [2:42:14<5:26:50,  1.82s/it, loss=0.03, lr=1e-5]  Steps:  28%|██▊       | 4232/15001 [2:42:16<5:21:06,  1.79s/it, loss=0.03, lr=1e-5]Steps:  28%|██▊       | 4232/15001 [2:42:16<5:21:06,  1.79s/it, loss=0.0438, lr=1e-5]Steps:  28%|██▊       | 4233/15001 [2:42:18<5:33:30,  1.86s/it, loss=0.0438, lr=1e-5]Steps:  28%|██▊       | 4233/15001 [2:42:18<5:33:30,  1.86s/it, loss=0.298, lr=1e-5] Steps:  28%|██▊       | 4234/15001 [2:42:20<5:50:11,  1.95s/it, loss=0.298, lr=1e-5]Steps:  28%|██▊       | 4234/15001 [2:42:20<5:50:11,  1.95s/it, loss=0.234, lr=1e-5]Steps:  28%|██▊       | 4235/15001 [2:42:22<5:41:25,  1.90s/it, loss=0.234, lr=1e-5]Steps:  28%|██▊       | 4235/15001 [2:42:22<5:41:25,  1.90s/it, loss=0.0633, lr=1e-5]Steps:  28%|██▊       | 4236/15001 [2:42:24<5:46:35,  1.93s/it, loss=0.0633, lr=1e-5]Steps:  28%|██▊       | 4236/15001 [2:42:24<5:46:35,  1.93s/it, loss=0.162, lr=1e-5] Steps:  28%|██▊       | 4237/15001 [2:42:26<5:57:25,  1.99s/it, loss=0.162, lr=1e-5]Steps:  28%|██▊       | 4237/15001 [2:42:26<5:57:25,  1.99s/it, loss=0.0109, lr=1e-5]Steps:  28%|██▊       | 4238/15001 [2:42:28<5:58:57,  2.00s/it, loss=0.0109, lr=1e-5]Steps:  28%|██▊       | 4238/15001 [2:42:28<5:58:57,  2.00s/it, loss=0.0823, lr=1e-5]Steps:  28%|██▊       | 4239/15001 [2:42:30<5:45:15,  1.92s/it, loss=0.0823, lr=1e-5]Steps:  28%|██▊       | 4239/15001 [2:42:30<5:45:15,  1.92s/it, loss=0.214, lr=1e-5] Steps:  28%|██▊       | 4240/15001 [2:42:32<5:42:36,  1.91s/it, loss=0.214, lr=1e-5]Steps:  28%|██▊       | 4240/15001 [2:42:32<5:42:36,  1.91s/it, loss=0.208, lr=1e-5]Steps:  28%|██▊       | 4241/15001 [2:42:33<5:35:53,  1.87s/it, loss=0.208, lr=1e-5]Steps:  28%|██▊       | 4241/15001 [2:42:33<5:35:53,  1.87s/it, loss=0.0325, lr=1e-5]Steps:  28%|██▊       | 4242/15001 [2:42:35<5:36:55,  1.88s/it, loss=0.0325, lr=1e-5]Steps:  28%|██▊       | 4242/15001 [2:42:35<5:36:55,  1.88s/it, loss=0.101, lr=1e-5] Steps:  28%|██▊       | 4243/15001 [2:42:37<5:30:30,  1.84s/it, loss=0.101, lr=1e-5]Steps:  28%|██▊       | 4243/15001 [2:42:37<5:30:30,  1.84s/it, loss=0.129, lr=1e-5]Steps:  28%|██▊       | 4244/15001 [2:42:39<5:30:38,  1.84s/it, loss=0.129, lr=1e-5]Steps:  28%|██▊       | 4244/15001 [2:42:39<5:30:38,  1.84s/it, loss=0.159, lr=1e-5]Steps:  28%|██▊       | 4245/15001 [2:42:41<5:29:01,  1.84s/it, loss=0.159, lr=1e-5]Steps:  28%|██▊       | 4245/15001 [2:42:41<5:29:01,  1.84s/it, loss=0.104, lr=1e-5]Steps:  28%|██▊       | 4246/15001 [2:42:42<5:21:36,  1.79s/it, loss=0.104, lr=1e-5]Steps:  28%|██▊       | 4246/15001 [2:42:43<5:21:36,  1.79s/it, loss=0.0676, lr=1e-5]Steps:  28%|██▊       | 4247/15001 [2:42:44<5:04:31,  1.70s/it, loss=0.0676, lr=1e-5]Steps:  28%|██▊       | 4247/15001 [2:42:46<5:04:31,  1.70s/it, loss=0.0817, lr=1e-5]Steps:  28%|██▊       | 4248/15001 [2:42:47<6:28:39,  2.17s/it, loss=0.0817, lr=1e-5]Steps:  28%|██▊       | 4248/15001 [2:42:47<6:28:39,  2.17s/it, loss=0.198, lr=1e-5] Steps:  28%|██▊       | 4249/15001 [2:42:49<6:07:47,  2.05s/it, loss=0.198, lr=1e-5]Steps:  28%|██▊       | 4249/15001 [2:42:49<6:07:47,  2.05s/it, loss=0.265, lr=1e-5]Steps:  28%|██▊       | 4250/15001 [2:42:51<6:06:44,  2.05s/it, loss=0.265, lr=1e-5]Steps:  28%|██▊       | 4250/15001 [2:42:51<6:06:44,  2.05s/it, loss=0.229, lr=1e-5]Steps:  28%|██▊       | 4251/15001 [2:42:53<5:52:24,  1.97s/it, loss=0.229, lr=1e-5]Steps:  28%|██▊       | 4251/15001 [2:42:53<5:52:24,  1.97s/it, loss=0.311, lr=1e-5]Steps:  28%|██▊       | 4252/15001 [2:42:54<5:28:40,  1.83s/it, loss=0.311, lr=1e-5]Steps:  28%|██���       | 4252/15001 [2:42:55<5:28:40,  1.83s/it, loss=0.172, lr=1e-5]Steps:  28%|██▊       | 4253/15001 [2:42:56<5:41:22,  1.91s/it, loss=0.172, lr=1e-5]Steps:  28%|██▊       | 4253/15001 [2:42:56<5:41:22,  1.91s/it, loss=0.291, lr=1e-5]Steps:  28%|██▊       | 4254/15001 [2:42:58<5:33:35,  1.86s/it, loss=0.291, lr=1e-5]Steps:  28%|██▊       | 4254/15001 [2:42:58<5:33:35,  1.86s/it, loss=0.183, lr=1e-5]Steps:  28%|██▊       | 4255/15001 [2:43:00<5:34:25,  1.87s/it, loss=0.183, lr=1e-5]Steps:  28%|██▊       | 4255/15001 [2:43:00<5:34:25,  1.87s/it, loss=0.165, lr=1e-5]Steps:  28%|██▊       | 4256/15001 [2:43:02<5:40:16,  1.90s/it, loss=0.165, lr=1e-5]Steps:  28%|██▊       | 4256/15001 [2:43:02<5:40:16,  1.90s/it, loss=0.36, lr=1e-5] Steps:  28%|██▊       | 4257/15001 [2:43:04<5:35:28,  1.87s/it, loss=0.36, lr=1e-5]Steps:  28%|██▊       | 4257/15001 [2:43:04<5:35:28,  1.87s/it, loss=0.21, lr=1e-5]Steps:  28%|██▊       | 4258/15001 [2:43:06<5:47:17,  1.94s/it, loss=0.21, lr=1e-5]Steps:  28%|██▊       | 4258/15001 [2:43:06<5:47:17,  1.94s/it, loss=0.14, lr=1e-5]Steps:  28%|██▊       | 4259/15001 [2:43:08<5:49:47,  1.95s/it, loss=0.14, lr=1e-5]Steps:  28%|██▊       | 4259/15001 [2:43:08<5:49:47,  1.95s/it, loss=0.356, lr=1e-5]Steps:  28%|██▊       | 4260/15001 [2:43:10<5:45:08,  1.93s/it, loss=0.356, lr=1e-5]Steps:  28%|██▊       | 4260/15001 [2:43:10<5:45:08,  1.93s/it, loss=0.168, lr=1e-5]Steps:  28%|██▊       | 4261/15001 [2:43:12<5:57:22,  2.00s/it, loss=0.168, lr=1e-5]Steps:  28%|██▊       | 4261/15001 [2:43:12<5:57:22,  2.00s/it, loss=0.0902, lr=1e-5]Steps:  28%|██▊       | 4262/15001 [2:43:14<5:51:10,  1.96s/it, loss=0.0902, lr=1e-5]Steps:  28%|██▊       | 4262/15001 [2:43:14<5:51:10,  1.96s/it, loss=0.044, lr=1e-5] Steps:  28%|██▊       | 4263/15001 [2:43:15<5:29:51,  1.84s/it, loss=0.044, lr=1e-5]Steps:  28%|██▊       | 4263/15001 [2:43:16<5:29:51,  1.84s/it, loss=0.0272, lr=1e-5]Steps:  28%|██▊       | 4264/15001 [2:43:17<5:44:13,  1.92s/it, loss=0.0272, lr=1e-5]Steps:  28%|██▊       | 4264/15001 [2:43:17<5:44:13,  1.92s/it, loss=0.157, lr=1e-5] Steps:  28%|██▊       | 4265/15001 [2:43:19<5:29:42,  1.84s/it, loss=0.157, lr=1e-5]Steps:  28%|██▊       | 4265/15001 [2:43:19<5:29:42,  1.84s/it, loss=0.0506, lr=1e-5]Steps:  28%|██▊       | 4266/15001 [2:43:21<5:20:45,  1.79s/it, loss=0.0506, lr=1e-5]Steps:  28%|██▊       | 4266/15001 [2:43:21<5:20:45,  1.79s/it, loss=0.162, lr=1e-5] Steps:  28%|██▊       | 4267/15001 [2:43:22<5:18:07,  1.78s/it, loss=0.162, lr=1e-5]Steps:  28%|██▊       | 4267/15001 [2:43:23<5:18:07,  1.78s/it, loss=0.0425, lr=1e-5]Steps:  28%|██▊       | 4268/15001 [2:43:24<5:21:50,  1.80s/it, loss=0.0425, lr=1e-5]Steps:  28%|██▊       | 4268/15001 [2:43:25<5:21:50,  1.80s/it, loss=0.206, lr=1e-5] Steps:  28%|██▊       | 4269/15001 [2:43:26<5:22:24,  1.80s/it, loss=0.206, lr=1e-5]Steps:  28%|██▊       | 4269/15001 [2:43:26<5:22:24,  1.80s/it, loss=0.0734, lr=1e-5]Steps:  28%|██▊       | 4270/15001 [2:43:28<5:31:58,  1.86s/it, loss=0.0734, lr=1e-5]Steps:  28%|██▊       | 4270/15001 [2:43:28<5:31:58,  1.86s/it, loss=0.121, lr=1e-5] Steps:  28%|██▊       | 4271/15001 [2:43:30<5:19:08,  1.78s/it, loss=0.121, lr=1e-5]Steps:  28%|██▊       | 4271/15001 [2:43:30<5:19:08,  1.78s/it, loss=0.0201, lr=1e-5]Steps:  28%|██▊       | 4272/15001 [2:43:32<5:30:27,  1.85s/it, loss=0.0201, lr=1e-5]Steps:  28%|██▊       | 4272/15001 [2:43:32<5:30:27,  1.85s/it, loss=0.135, lr=1e-5] Steps:  28%|██▊       | 4273/15001 [2:43:33<5:24:32,  1.82s/it, loss=0.135, lr=1e-5]Steps:  28%|██▊       | 4273/15001 [2:43:34<5:24:32,  1.82s/it, loss=0.135, lr=1e-5]Steps:  28%|██▊       | 4274/15001 [2:43:35<5:16:10,  1.77s/it, loss=0.135, lr=1e-5]Steps:  28%|██▊       | 4274/15001 [2:43:35<5:16:10,  1.77s/it, loss=0.293, lr=1e-5]Steps:  28%|██▊       | 4275/15001 [2:43:37<5:26:34,  1.83s/it, loss=0.293, lr=1e-5]Steps:  28%|██▊       | 4275/15001 [2:43:37<5:26:34,  1.83s/it, loss=0.173, lr=1e-5]Steps:  29%|██▊       | 4276/15001 [2:43:39<5:12:51,  1.75s/it, loss=0.173, lr=1e-5]Steps:  29%|██▊       | 4276/15001 [2:43:39<5:12:51,  1.75s/it, loss=0.0748, lr=1e-5]Steps:  29%|██▊       | 4277/15001 [2:43:41<5:26:43,  1.83s/it, loss=0.0748, lr=1e-5]Steps:  29%|██▊       | 4277/15001 [2:43:41<5:26:43,  1.83s/it, loss=0.0565, lr=1e-5]Steps:  29%|██▊       | 4278/15001 [2:43:42<5:10:43,  1.74s/it, loss=0.0565, lr=1e-5]Steps:  29%|██▊       | 4278/15001 [2:43:43<5:10:43,  1.74s/it, loss=0.238, lr=1e-5] Steps:  29%|██▊       | 4279/15001 [2:43:44<5:27:55,  1.84s/it, loss=0.238, lr=1e-5]Steps:  29%|██▊       | 4279/15001 [2:43:45<5:27:55,  1.84s/it, loss=0.33, lr=1e-5] Steps:  29%|██▊       | 4280/15001 [2:43:46<5:37:38,  1.89s/it, loss=0.33, lr=1e-5]Steps:  29%|██▊       | 4280/15001 [2:43:47<5:37:38,  1.89s/it, loss=0.179, lr=1e-5]Steps:  29%|██▊       | 4281/15001 [2:43:48<5:55:31,  1.99s/it, loss=0.179, lr=1e-5]Steps:  29%|██▊       | 4281/15001 [2:43:49<5:55:31,  1.99s/it, loss=0.0889, lr=1e-5]Steps:  29%|██▊       | 4282/15001 [2:43:51<6:02:35,  2.03s/it, loss=0.0889, lr=1e-5]Steps:  29%|██▊       | 4282/15001 [2:43:51<6:02:35,  2.03s/it, loss=0.205, lr=1e-5] Steps:  29%|██▊       | 4283/15001 [2:43:52<5:51:51,  1.97s/it, loss=0.205, lr=1e-5]Steps:  29%|██▊       | 4283/15001 [2:43:53<5:51:51,  1.97s/it, loss=0.32, lr=1e-5] Steps:  29%|██▊       | 4284/15001 [2:43:55<6:04:31,  2.04s/it, loss=0.32, lr=1e-5]Steps:  29%|██▊       | 4284/15001 [2:43:55<6:04:31,  2.04s/it, loss=0.198, lr=1e-5]Steps:  29%|██▊       | 4285/15001 [2:43:56<5:44:08,  1.93s/it, loss=0.198, lr=1e-5]Steps:  29%|██▊       | 4285/15001 [2:43:57<5:44:08,  1.93s/it, loss=0.212, lr=1e-5]Steps:  29%|██▊       | 4286/15001 [2:43:58<5:41:15,  1.91s/it, loss=0.212, lr=1e-5]Steps:  29%|██▊       | 4286/15001 [2:43:58<5:41:15,  1.91s/it, loss=0.36, lr=1e-5] Steps:  29%|██▊       | 4287/15001 [2:44:00<5:41:14,  1.91s/it, loss=0.36, lr=1e-5]Steps:  29%|██▊       | 4287/15001 [2:44:00<5:41:14,  1.91s/it, loss=0.161, lr=1e-5]Steps:  29%|██▊       | 4288/15001 [2:44:02<5:23:04,  1.81s/it, loss=0.161, lr=1e-5]Steps:  29%|██▊       | 4288/15001 [2:44:02<5:23:04,  1.81s/it, loss=0.277, lr=1e-5]Steps:  29%|██▊       | 4289/15001 [2:44:03<5:22:21,  1.81s/it, loss=0.277, lr=1e-5]Steps:  29%|██▊       | 4289/15001 [2:44:04<5:22:21,  1.81s/it, loss=0.0385, lr=1e-5]Steps:  29%|██▊       | 4290/15001 [2:44:06<5:36:43,  1.89s/it, loss=0.0385, lr=1e-5]Steps:  29%|██▊       | 4290/15001 [2:44:06<5:36:43,  1.89s/it, loss=0.102, lr=1e-5] Steps:  29%|██▊       | 4291/15001 [2:44:07<5:21:13,  1.80s/it, loss=0.102, lr=1e-5]Steps:  29%|██▊       | 4291/15001 [2:44:08<5:21:13,  1.80s/it, loss=0.192, lr=1e-5]Steps:  29%|██▊       | 4292/15001 [2:44:09<5:37:03,  1.89s/it, loss=0.192, lr=1e-5]Steps:  29%|██▊       | 4292/15001 [2:44:09<5:37:03,  1.89s/it, loss=0.0519, lr=1e-5]Steps:  29%|██▊       | 4293/15001 [2:44:11<5:30:00,  1.85s/it, loss=0.0519, lr=1e-5]Steps:  29%|██▊       | 4293/15001 [2:44:11<5:30:00,  1.85s/it, loss=0.424, lr=1e-5] Steps:  29%|██▊       | 4294/15001 [2:44:13<5:26:23,  1.83s/it, loss=0.424, lr=1e-5]Steps:  29%|██▊       | 4294/15001 [2:44:13<5:26:23,  1.83s/it, loss=0.103, lr=1e-5]Steps:  29%|██▊       | 4295/15001 [2:44:15<5:28:46,  1.84s/it, loss=0.103, lr=1e-5]Steps:  29%|██▊       | 4295/15001 [2:44:15<5:28:46,  1.84s/it, loss=0.325, lr=1e-5]Steps:  29%|██▊       | 4296/15001 [2:44:16<5:25:54,  1.83s/it, loss=0.325, lr=1e-5]Steps:  29%|██▊       | 4296/15001 [2:44:17<5:25:54,  1.83s/it, loss=0.21, lr=1e-5] Steps:  29%|██▊       | 4297/15001 [2:44:18<5:15:34,  1.77s/it, loss=0.21, lr=1e-5]Steps:  29%|██▊       | 4297/15001 [2:44:19<5:15:34,  1.77s/it, loss=0.0321, lr=1e-5]Steps:  29%|██▊       | 4298/15001 [2:44:20<5:35:42,  1.88s/it, loss=0.0321, lr=1e-5]Steps:  29%|██▊       | 4298/15001 [2:44:20<5:35:42,  1.88s/it, loss=0.277, lr=1e-5] Steps:  29%|██▊       | 4299/15001 [2:44:22<5:32:21,  1.86s/it, loss=0.277, lr=1e-5]Steps:  29%|██▊       | 4299/15001 [2:44:22<5:32:21,  1.86s/it, loss=0.286, lr=1e-5]Steps:  29%|██▊       | 4300/15001 [2:44:24<5:35:42,  1.88s/it, loss=0.286, lr=1e-5]Steps:  29%|██▊       | 4300/15001 [2:44:24<5:35:42,  1.88s/it, loss=0.147, lr=1e-5]Steps:  29%|██▊       | 4301/15001 [2:44:26<5:28:36,  1.84s/it, loss=0.147, lr=1e-5]Steps:  29%|██▊       | 4301/15001 [2:44:26<5:28:36,  1.84s/it, loss=0.282, lr=1e-5]Steps:  29%|██▊       | 4302/15001 [2:44:28<5:28:45,  1.84s/it, loss=0.282, lr=1e-5]Steps:  29%|██▊       | 4302/15001 [2:44:28<5:28:45,  1.84s/it, loss=0.189, lr=1e-5]Steps:  29%|██▊       | 4303/15001 [2:44:29<5:26:11,  1.83s/it, loss=0.189, lr=1e-5]Steps:  29%|██▊       | 4303/15001 [2:44:30<5:26:11,  1.83s/it, loss=0.37, lr=1e-5] Steps:  29%|██▊       | 4304/15001 [2:44:32<5:49:39,  1.96s/it, loss=0.37, lr=1e-5]Steps:  29%|██▊       | 4304/15001 [2:44:32<5:49:39,  1.96s/it, loss=0.167, lr=1e-5]Steps:  29%|██▊       | 4305/15001 [2:44:33<5:42:14,  1.92s/it, loss=0.167, lr=1e-5]Steps:  29%|██▊       | 4305/15001 [2:44:34<5:42:14,  1.92s/it, loss=0.329, lr=1e-5]Steps:  29%|██▊       | 4306/15001 [2:44:36<6:06:50,  2.06s/it, loss=0.329, lr=1e-5]Steps:  29%|██▊       | 4306/15001 [2:44:36<6:06:50,  2.06s/it, loss=0.132, lr=1e-5]Steps:  29%|██▊       | 4307/15001 [2:44:38<5:53:33,  1.98s/it, loss=0.132, lr=1e-5]Steps:  29%|██▊       | 4307/15001 [2:44:38<5:53:33,  1.98s/it, loss=0.0876, lr=1e-5]Steps:  29%|██▊       | 4308/15001 [2:44:39<5:40:23,  1.91s/it, loss=0.0876, lr=1e-5]Steps:  29%|██▊       | 4308/15001 [2:44:40<5:40:23,  1.91s/it, loss=0.0932, lr=1e-5]Steps:  29%|██▊       | 4309/15001 [2:44:41<5:37:41,  1.90s/it, loss=0.0932, lr=1e-5]Steps:  29%|██▊       | 4309/15001 [2:44:41<5:37:41,  1.90s/it, loss=0.217, lr=1e-5] Steps:  29%|██▊       | 4310/15001 [2:44:43<5:33:48,  1.87s/it, loss=0.217, lr=1e-5]Steps:  29%|██▊       | 4310/15001 [2:44:43<5:33:48,  1.87s/it, loss=0.078, lr=1e-5]Steps:  29%|██▊       | 4311/15001 [2:44:45<5:27:22,  1.84s/it, loss=0.078, lr=1e-5]Steps:  29%|██▊       | 4311/15001 [2:44:45<5:27:22,  1.84s/it, loss=0.35, lr=1e-5] Steps:  29%|██▊       | 4312/15001 [2:44:47<5:36:24,  1.89s/it, loss=0.35, lr=1e-5]Steps:  29%|██▊       | 4312/15001 [2:44:47<5:36:24,  1.89s/it, loss=0.319, lr=1e-5]Steps:  29%|██▉       | 4313/15001 [2:44:49<5:40:07,  1.91s/it, loss=0.319, lr=1e-5]Steps:  29%|██▉       | 4313/15001 [2:44:49<5:40:07,  1.91s/it, loss=0.259, lr=1e-5]Steps:  29%|██▉       | 4314/15001 [2:44:51<5:30:57,  1.86s/it, loss=0.259, lr=1e-5]Steps:  29%|██▉       | 4314/15001 [2:44:51<5:30:57,  1.86s/it, loss=0.189, lr=1e-5]Steps:  29%|██▉       | 4315/15001 [2:44:53<5:46:00,  1.94s/it, loss=0.189, lr=1e-5]Steps:  29%|██▉       | 4315/15001 [2:44:53<5:46:00,  1.94s/it, loss=0.22, lr=1e-5] Steps:  29%|██▉       | 4316/15001 [2:44:54<5:39:13,  1.90s/it, loss=0.22, lr=1e-5]Steps:  29%|██▉       | 4316/15001 [2:44:55<5:39:13,  1.90s/it, loss=0.0633, lr=1e-5]Steps:  29%|██▉       | 4317/15001 [2:44:56<5:17:29,  1.78s/it, loss=0.0633, lr=1e-5]Steps:  29%|██▉       | 4317/15001 [2:44:56<5:17:29,  1.78s/it, loss=0.0288, lr=1e-5]Steps:  29%|██▉       | 4318/15001 [2:44:58<5:30:46,  1.86s/it, loss=0.0288, lr=1e-5]Steps:  29%|██▉       | 4318/15001 [2:44:58<5:30:46,  1.86s/it, loss=0.21, lr=1e-5]  Steps:  29%|██▉       | 4319/15001 [2:45:00<5:22:03,  1.81s/it, loss=0.21, lr=1e-5]Steps:  29%|██▉       | 4319/15001 [2:45:00<5:22:03,  1.81s/it, loss=0.0978, lr=1e-5]Steps:  29%|██▉       | 4320/15001 [2:45:02<5:25:15,  1.83s/it, loss=0.0978, lr=1e-5]Steps:  29%|██▉       | 4320/15001 [2:45:02<5:25:15,  1.83s/it, loss=0.0948, lr=1e-5]Steps:  29%|██▉       | 4321/15001 [2:45:03<5:26:29,  1.83s/it, loss=0.0948, lr=1e-5]Steps:  29%|██▉       | 4321/15001 [2:45:03<5:26:29,  1.83s/it, loss=0.0599, lr=1e-5]Steps:  29%|██▉       | 4322/15001 [2:45:05<5:17:53,  1.79s/it, loss=0.0599, lr=1e-5]Steps:  29%|██▉       | 4322/15001 [2:45:05<5:17:53,  1.79s/it, loss=0.31, lr=1e-5]  Steps:  29%|██▉       | 4323/15001 [2:45:07<5:29:43,  1.85s/it, loss=0.31, lr=1e-5]Steps:  29%|██▉       | 4323/15001 [2:45:07<5:29:43,  1.85s/it, loss=0.298, lr=1e-5]Steps:  29%|██▉       | 4324/15001 [2:45:09<5:34:07,  1.88s/it, loss=0.298, lr=1e-5]Steps:  29%|██▉       | 4324/15001 [2:45:09<5:34:07,  1.88s/it, loss=0.157, lr=1e-5]Steps:  29%|██▉       | 4325/15001 [2:45:11<5:39:34,  1.91s/it, loss=0.157, lr=1e-5]Steps:  29%|██▉       | 4325/15001 [2:45:11<5:39:34,  1.91s/it, loss=0.0692, lr=1e-5]Steps:  29%|██▉       | 4326/15001 [2:45:13<5:38:40,  1.90s/it, loss=0.0692, lr=1e-5]Steps:  29%|██▉       | 4326/15001 [2:45:13<5:38:40,  1.90s/it, loss=0.138, lr=1e-5] Steps:  29%|██▉       | 4327/15001 [2:45:15<5:47:56,  1.96s/it, loss=0.138, lr=1e-5]Steps:  29%|██▉       | 4327/15001 [2:45:15<5:47:56,  1.96s/it, loss=0.144, lr=1e-5]Steps:  29%|██▉       | 4328/15001 [2:45:17<5:48:39,  1.96s/it, loss=0.144, lr=1e-5]Steps:  29%|██▉       | 4328/15001 [2:45:17<5:48:39,  1.96s/it, loss=0.032, lr=1e-5]Steps:  29%|██▉       | 4329/15001 [2:45:19<5:42:14,  1.92s/it, loss=0.032, lr=1e-5]Steps:  29%|██▉       | 4329/15001 [2:45:19<5:42:14,  1.92s/it, loss=0.102, lr=1e-5]Steps:  29%|██▉       | 4330/15001 [2:45:21<5:54:12,  1.99s/it, loss=0.102, lr=1e-5]Steps:  29%|██▉       | 4330/15001 [2:45:21<5:54:12,  1.99s/it, loss=0.087, lr=1e-5]Steps:  29%|██▉       | 4331/15001 [2:45:23<5:39:52,  1.91s/it, loss=0.087, lr=1e-5]Steps:  29%|██▉       | 4331/15001 [2:45:23<5:39:52,  1.91s/it, loss=0.264, lr=1e-5]Steps:  29%|██▉       | 4332/15001 [2:45:24<5:22:06,  1.81s/it, loss=0.264, lr=1e-5]Steps:  29%|██▉       | 4332/15001 [2:45:25<5:22:06,  1.81s/it, loss=0.278, lr=1e-5]Steps:  29%|██▉       | 4333/15001 [2:45:26<5:16:41,  1.78s/it, loss=0.278, lr=1e-5]Steps:  29%|██▉       | 4333/15001 [2:45:26<5:16:41,  1.78s/it, loss=0.186, lr=1e-5]Steps:  29%|██▉       | 4334/15001 [2:45:28<5:21:12,  1.81s/it, loss=0.186, lr=1e-5]Steps:  29%|██▉       | 4334/15001 [2:45:28<5:21:12,  1.81s/it, loss=0.344, lr=1e-5]Steps:  29%|██▉       | 4335/15001 [2:45:30<5:29:44,  1.85s/it, loss=0.344, lr=1e-5]Steps:  29%|██▉       | 4335/15001 [2:45:30<5:29:44,  1.85s/it, loss=0.457, lr=1e-5]Steps:  29%|██▉       | 4336/15001 [2:45:31<5:16:43,  1.78s/it, loss=0.457, lr=1e-5]Steps:  29%|██▉       | 4336/15001 [2:45:32<5:16:43,  1.78s/it, loss=0.115, lr=1e-5]Steps:  29%|██▉       | 4337/15001 [2:45:33<5:21:41,  1.81s/it, loss=0.115, lr=1e-5]Steps:  29%|██▉       | 4337/15001 [2:45:33<5:21:41,  1.81s/it, loss=0.194, lr=1e-5]Steps:  29%|██▉       | 4338/15001 [2:45:35<5:16:08,  1.78s/it, loss=0.194, lr=1e-5]Steps:  29%|██▉       | 4338/15001 [2:45:35<5:16:08,  1.78s/it, loss=0.0505, lr=1e-5]Steps:  29%|██▉       | 4339/15001 [2:45:37<5:18:00,  1.79s/it, loss=0.0505, lr=1e-5]Steps:  29%|██▉       | 4339/15001 [2:45:37<5:18:00,  1.79s/it, loss=0.18, lr=1e-5]  Steps:  29%|██▉       | 4340/15001 [2:45:39<5:21:19,  1.81s/it, loss=0.18, lr=1e-5]Steps:  29%|██▉       | 4340/15001 [2:45:39<5:21:19,  1.81s/it, loss=0.205, lr=1e-5]Steps:  29%|██▉       | 4341/15001 [2:45:41<5:30:55,  1.86s/it, loss=0.205, lr=1e-5]Steps:  29%|██▉       | 4341/15001 [2:45:41<5:30:55,  1.86s/it, loss=0.245, lr=1e-5]Steps:  29%|██▉       | 4342/15001 [2:45:43<5:32:43,  1.87s/it, loss=0.245, lr=1e-5]Steps:  29%|██▉       | 4342/15001 [2:45:43<5:32:43,  1.87s/it, loss=0.127, lr=1e-5]Steps:  29%|██▉       | 4343/15001 [2:45:44<5:30:26,  1.86s/it, loss=0.127, lr=1e-5]Steps:  29%|██▉       | 4343/15001 [2:45:44<5:30:26,  1.86s/it, loss=0.283, lr=1e-5]Steps:  29%|██▉       | 4344/15001 [2:45:46<5:34:32,  1.88s/it, loss=0.283, lr=1e-5]Steps:  29%|██▉       | 4344/15001 [2:45:46<5:34:32,  1.88s/it, loss=0.321, lr=1e-5]Steps:  29%|██▉       | 4345/15001 [2:45:48<5:33:34,  1.88s/it, loss=0.321, lr=1e-5]Steps:  29%|██▉       | 4345/15001 [2:45:48<5:33:34,  1.88s/it, loss=0.11, lr=1e-5] Steps:  29%|██▉       | 4346/15001 [2:45:50<5:25:21,  1.83s/it, loss=0.11, lr=1e-5]Steps:  29%|██▉       | 4346/15001 [2:45:50<5:25:21,  1.83s/it, loss=0.109, lr=1e-5]Steps:  29%|██▉       | 4347/15001 [2:45:52<5:28:46,  1.85s/it, loss=0.109, lr=1e-5]Steps:  29%|██▉       | 4347/15001 [2:45:52<5:28:46,  1.85s/it, loss=0.0361, lr=1e-5]Steps:  29%|██▉       | 4348/15001 [2:45:54<5:42:21,  1.93s/it, loss=0.0361, lr=1e-5]Steps:  29%|██▉       | 4348/15001 [2:45:54<5:42:21,  1.93s/it, loss=0.0775, lr=1e-5]Steps:  29%|██▉       | 4349/15001 [2:45:56<5:41:00,  1.92s/it, loss=0.0775, lr=1e-5]Steps:  29%|██▉       | 4349/15001 [2:45:56<5:41:00,  1.92s/it, loss=0.247, lr=1e-5] Steps:  29%|██▉       | 4350/15001 [2:45:58<5:39:25,  1.91s/it, loss=0.247, lr=1e-5]Steps:  29%|██▉       | 4350/15001 [2:45:58<5:39:25,  1.91s/it, loss=0.0927, lr=1e-5]Steps:  29%|██▉       | 4351/15001 [2:46:00<5:45:50,  1.95s/it, loss=0.0927, lr=1e-5]Steps:  29%|██▉       | 4351/15001 [2:46:00<5:45:50,  1.95s/it, loss=0.188, lr=1e-5] Steps:  29%|██▉       | 4352/15001 [2:46:02<5:55:36,  2.00s/it, loss=0.188, lr=1e-5]Steps:  29%|██▉       | 4352/15001 [2:46:02<5:55:36,  2.00s/it, loss=0.0205, lr=1e-5]Steps:  29%|██▉       | 4353/15001 [2:46:04<5:48:14,  1.96s/it, loss=0.0205, lr=1e-5]Steps:  29%|██▉       | 4353/15001 [2:46:04<5:48:14,  1.96s/it, loss=0.207, lr=1e-5] Steps:  29%|██▉       | 4354/15001 [2:46:06<5:46:56,  1.96s/it, loss=0.207, lr=1e-5]Steps:  29%|██▉       | 4354/15001 [2:46:06<5:46:56,  1.96s/it, loss=0.448, lr=1e-5]Steps:  29%|██▉       | 4355/15001 [2:46:07<5:25:41,  1.84s/it, loss=0.448, lr=1e-5]Steps:  29%|██▉       | 4355/15001 [2:46:08<5:25:41,  1.84s/it, loss=0.0374, lr=1e-5]Steps:  29%|██▉       | 4356/15001 [2:46:09<5:32:07,  1.87s/it, loss=0.0374, lr=1e-5]Steps:  29%|██▉       | 4356/15001 [2:46:09<5:32:07,  1.87s/it, loss=0.122, lr=1e-5] Steps:  29%|██▉       | 4357/15001 [2:46:11<5:37:21,  1.90s/it, loss=0.122, lr=1e-5]Steps:  29%|██▉       | 4357/15001 [2:46:11<5:37:21,  1.90s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4358/15001 [2:46:13<5:34:47,  1.89s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4358/15001 [2:46:13<5:34:47,  1.89s/it, loss=0.17, lr=1e-5] Steps:  29%|██▉       | 4359/15001 [2:46:15<5:21:47,  1.81s/it, loss=0.17, lr=1e-5]Steps:  29%|██▉       | 4359/15001 [2:46:15<5:21:47,  1.81s/it, loss=0.211, lr=1e-5]Steps:  29%|██▉       | 4360/15001 [2:46:16<5:18:48,  1.80s/it, loss=0.211, lr=1e-5]Steps:  29%|██▉       | 4360/15001 [2:46:17<5:18:48,  1.80s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4361/15001 [2:46:19<5:36:12,  1.90s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4361/15001 [2:46:19<5:36:12,  1.90s/it, loss=0.185, lr=1e-5]Steps:  29%|██▉       | 4362/15001 [2:46:20<5:10:44,  1.75s/it, loss=0.185, lr=1e-5]Steps:  29%|██▉       | 4362/15001 [2:46:20<5:10:44,  1.75s/it, loss=0.41, lr=1e-5] Steps:  29%|██▉       | 4363/15001 [2:46:22<5:34:38,  1.89s/it, loss=0.41, lr=1e-5]Steps:  29%|██▉       | 4363/15001 [2:46:22<5:34:38,  1.89s/it, loss=0.318, lr=1e-5]Steps:  29%|██▉       | 4364/15001 [2:46:24<5:15:54,  1.78s/it, loss=0.318, lr=1e-5]Steps:  29%|██▉       | 4364/15001 [2:46:24<5:15:54,  1.78s/it, loss=0.0274, lr=1e-5]Steps:  29%|██▉       | 4365/15001 [2:46:26<5:28:32,  1.85s/it, loss=0.0274, lr=1e-5]Steps:  29%|██▉       | 4365/15001 [2:46:26<5:28:32,  1.85s/it, loss=0.117, lr=1e-5] Steps:  29%|██▉       | 4366/15001 [2:46:28<5:25:54,  1.84s/it, loss=0.117, lr=1e-5]Steps:  29%|██▉       | 4366/15001 [2:46:28<5:25:54,  1.84s/it, loss=0.103, lr=1e-5]Steps:  29%|██▉       | 4367/15001 [2:46:30<5:39:31,  1.92s/it, loss=0.103, lr=1e-5]Steps:  29%|██▉       | 4367/15001 [2:46:30<5:39:31,  1.92s/it, loss=0.283, lr=1e-5]Steps:  29%|██▉       | 4368/15001 [2:46:31<5:33:36,  1.88s/it, loss=0.283, lr=1e-5]Steps:  29%|██▉       | 4368/15001 [2:46:32<5:33:36,  1.88s/it, loss=0.0937, lr=1e-5]Steps:  29%|██▉       | 4369/15001 [2:46:33<5:30:36,  1.87s/it, loss=0.0937, lr=1e-5]Steps:  29%|██▉       | 4369/15001 [2:46:33<5:30:36,  1.87s/it, loss=0.245, lr=1e-5] Steps:  29%|██▉       | 4370/15001 [2:46:35<5:26:39,  1.84s/it, loss=0.245, lr=1e-5]Steps:  29%|██▉       | 4370/15001 [2:46:35<5:26:39,  1.84s/it, loss=0.163, lr=1e-5]Steps:  29%|██▉       | 4371/15001 [2:46:37<5:33:26,  1.88s/it, loss=0.163, lr=1e-5]Steps:  29%|██▉       | 4371/15001 [2:46:37<5:33:26,  1.88s/it, loss=0.129, lr=1e-5]Steps:  29%|██▉       | 4372/15001 [2:46:39<5:52:05,  1.99s/it, loss=0.129, lr=1e-5]Steps:  29%|██▉       | 4372/15001 [2:46:39<5:52:05,  1.99s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4373/15001 [2:46:41<5:47:48,  1.96s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4373/15001 [2:46:41<5:47:48,  1.96s/it, loss=0.238, lr=1e-5]Steps:  29%|██▉       | 4374/15001 [2:46:43<5:44:15,  1.94s/it, loss=0.238, lr=1e-5]Steps:  29%|██▉       | 4374/15001 [2:46:43<5:44:15,  1.94s/it, loss=0.111, lr=1e-5]Steps:  29%|██▉       | 4375/15001 [2:46:45<5:38:28,  1.91s/it, loss=0.111, lr=1e-5]Steps:  29%|██▉       | 4375/15001 [2:46:45<5:38:28,  1.91s/it, loss=0.134, lr=1e-5]Steps:  29%|██▉       | 4376/15001 [2:46:47<5:44:10,  1.94s/it, loss=0.134, lr=1e-5]Steps:  29%|██▉       | 4376/15001 [2:46:47<5:44:10,  1.94s/it, loss=0.227, lr=1e-5]Steps:  29%|██▉       | 4377/15001 [2:46:49<5:45:11,  1.95s/it, loss=0.227, lr=1e-5]Steps:  29%|██▉       | 4377/15001 [2:46:49<5:45:11,  1.95s/it, loss=0.114, lr=1e-5]Steps:  29%|██▉       | 4378/15001 [2:46:51<5:31:02,  1.87s/it, loss=0.114, lr=1e-5]Steps:  29%|██▉       | 4378/15001 [2:46:51<5:31:02,  1.87s/it, loss=0.313, lr=1e-5]Steps:  29%|██▉       | 4379/15001 [2:46:52<5:31:47,  1.87s/it, loss=0.313, lr=1e-5]Steps:  29%|██▉       | 4379/15001 [2:46:53<5:31:47,  1.87s/it, loss=0.121, lr=1e-5]Steps:  29%|██▉       | 4380/15001 [2:46:54<5:35:01,  1.89s/it, loss=0.121, lr=1e-5]Steps:  29%|██▉       | 4380/15001 [2:46:55<5:35:01,  1.89s/it, loss=0.00969, lr=1e-5]Steps:  29%|██▉       | 4381/15001 [2:46:56<5:28:15,  1.85s/it, loss=0.00969, lr=1e-5]Steps:  29%|██▉       | 4381/15001 [2:46:56<5:28:15,  1.85s/it, loss=0.0861, lr=1e-5] Steps:  29%|██▉       | 4382/15001 [2:46:58<5:17:44,  1.80s/it, loss=0.0861, lr=1e-5]Steps:  29%|██▉       | 4382/15001 [2:46:58<5:17:44,  1.80s/it, loss=0.0327, lr=1e-5]Steps:  29%|██▉       | 4383/15001 [2:47:00<5:25:51,  1.84s/it, loss=0.0327, lr=1e-5]Steps:  29%|██▉       | 4383/15001 [2:47:00<5:25:51,  1.84s/it, loss=0.0517, lr=1e-5]Steps:  29%|██▉       | 4384/15001 [2:47:02<5:21:54,  1.82s/it, loss=0.0517, lr=1e-5]Steps:  29%|██▉       | 4384/15001 [2:47:02<5:21:54,  1.82s/it, loss=0.17, lr=1e-5]  Steps:  29%|██▉       | 4385/15001 [2:47:03<5:29:00,  1.86s/it, loss=0.17, lr=1e-5]Steps:  29%|██▉       | 4385/15001 [2:47:03<5:29:00,  1.86s/it, loss=0.255, lr=1e-5]Steps:  29%|██▉       | 4386/15001 [2:47:05<5:14:58,  1.78s/it, loss=0.255, lr=1e-5]Steps:  29%|██▉       | 4386/15001 [2:47:05<5:14:58,  1.78s/it, loss=0.188, lr=1e-5]Steps:  29%|██▉       | 4387/15001 [2:47:07<5:25:42,  1.84s/it, loss=0.188, lr=1e-5]Steps:  29%|██▉       | 4387/15001 [2:47:07<5:25:42,  1.84s/it, loss=0.191, lr=1e-5]Steps:  29%|██▉       | 4388/15001 [2:47:09<5:07:43,  1.74s/it, loss=0.191, lr=1e-5]Steps:  29%|██▉       | 4388/15001 [2:47:09<5:07:43,  1.74s/it, loss=0.06, lr=1e-5] Steps:  29%|██▉       | 4389/15001 [2:47:11<5:23:40,  1.83s/it, loss=0.06, lr=1e-5]Steps:  29%|██▉       | 4389/15001 [2:47:11<5:23:40,  1.83s/it, loss=0.0275, lr=1e-5]Steps:  29%|██▉       | 4390/15001 [2:47:12<5:19:07,  1.80s/it, loss=0.0275, lr=1e-5]Steps:  29%|██▉       | 4390/15001 [2:47:13<5:19:07,  1.80s/it, loss=0.0637, lr=1e-5]Steps:  29%|██▉       | 4391/15001 [2:47:14<5:14:36,  1.78s/it, loss=0.0637, lr=1e-5]Steps:  29%|██▉       | 4391/15001 [2:47:14<5:14:36,  1.78s/it, loss=0.175, lr=1e-5] Steps:  29%|██▉       | 4392/15001 [2:47:16<5:32:46,  1.88s/it, loss=0.175, lr=1e-5]Steps:  29%|██▉       | 4392/15001 [2:47:16<5:32:46,  1.88s/it, loss=0.147, lr=1e-5]Steps:  29%|██▉       | 4393/15001 [2:47:18<5:27:18,  1.85s/it, loss=0.147, lr=1e-5]Steps:  29%|██▉       | 4393/15001 [2:47:18<5:27:18,  1.85s/it, loss=0.0468, lr=1e-5]Steps:  29%|██▉       | 4394/15001 [2:47:20<5:32:23,  1.88s/it, loss=0.0468, lr=1e-5]Steps:  29%|██▉       | 4394/15001 [2:47:20<5:32:23,  1.88s/it, loss=0.109, lr=1e-5] Steps:  29%|██▉       | 4395/15001 [2:47:22<5:46:09,  1.96s/it, loss=0.109, lr=1e-5]Steps:  29%|██▉       | 4395/15001 [2:47:22<5:46:09,  1.96s/it, loss=0.108, lr=1e-5]Steps:  29%|██▉       | 4396/15001 [2:47:24<5:50:01,  1.98s/it, loss=0.108, lr=1e-5]Steps:  29%|██▉       | 4396/15001 [2:47:24<5:50:01,  1.98s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4397/15001 [2:47:26<5:36:56,  1.91s/it, loss=0.268, lr=1e-5]Steps:  29%|██▉       | 4397/15001 [2:47:26<5:36:56,  1.91s/it, loss=0.115, lr=1e-5]Steps:  29%|██▉       | 4398/15001 [2:47:28<5:52:52,  2.00s/it, loss=0.115, lr=1e-5]Steps:  29%|██▉       | 4398/15001 [2:47:28<5:52:52,  2.00s/it, loss=0.169, lr=1e-5]Steps:  29%|██▉       | 4399/15001 [2:47:30<5:51:25,  1.99s/it, loss=0.169, lr=1e-5]Steps:  29%|██▉       | 4399/15001 [2:47:30<5:51:25,  1.99s/it, loss=0.0718, lr=1e-5]Steps:  29%|██▉       | 4400/15001 [2:47:32<5:40:00,  1.92s/it, loss=0.0718, lr=1e-5]Steps:  29%|██▉       | 4400/15001 [2:47:32<5:40:00,  1.92s/it, loss=0.151, lr=1e-5] Steps:  29%|██▉       | 4401/15001 [2:47:34<5:31:43,  1.88s/it, loss=0.151, lr=1e-5]Steps:  29%|██▉       | 4401/15001 [2:47:34<5:31:43,  1.88s/it, loss=0.0601, lr=1e-5]Steps:  29%|██▉       | 4402/15001 [2:47:35<5:28:58,  1.86s/it, loss=0.0601, lr=1e-5]Steps:  29%|██▉       | 4402/15001 [2:47:36<5:28:58,  1.86s/it, loss=0.078, lr=1e-5] Steps:  29%|██▉       | 4403/15001 [2:47:37<5:31:47,  1.88s/it, loss=0.078, lr=1e-5]Steps:  29%|██▉       | 4403/15001 [2:47:37<5:31:47,  1.88s/it, loss=0.179, lr=1e-5]Steps:  29%|██▉       | 4404/15001 [2:47:39<5:23:17,  1.83s/it, loss=0.179, lr=1e-5]Steps:  29%|██▉       | 4404/15001 [2:47:39<5:23:17,  1.83s/it, loss=0.256, lr=1e-5]Steps:  29%|██▉       | 4405/15001 [2:47:41<5:23:51,  1.83s/it, loss=0.256, lr=1e-5]Steps:  29%|██▉       | 4405/15001 [2:47:41<5:23:51,  1.83s/it, loss=0.186, lr=1e-5]Steps:  29%|██▉       | 4406/15001 [2:47:43<5:32:57,  1.89s/it, loss=0.186, lr=1e-5]Steps:  29%|██▉       | 4406/15001 [2:47:43<5:32:57,  1.89s/it, loss=0.167, lr=1e-5]Steps:  29%|██▉       | 4407/15001 [2:47:45<5:36:28,  1.91s/it, loss=0.167, lr=1e-5]Steps:  29%|██▉       | 4407/15001 [2:47:45<5:36:28,  1.91s/it, loss=0.141, lr=1e-5]Steps:  29%|██▉       | 4408/15001 [2:47:47<5:30:30,  1.87s/it, loss=0.141, lr=1e-5]Steps:  29%|██▉       | 4408/15001 [2:47:47<5:30:30,  1.87s/it, loss=0.295, lr=1e-5]Steps:  29%|██▉       | 4409/15001 [2:47:48<5:18:11,  1.80s/it, loss=0.295, lr=1e-5]Steps:  29%|██▉       | 4409/15001 [2:47:48<5:18:11,  1.80s/it, loss=0.0329, lr=1e-5]Steps:  29%|██▉       | 4410/15001 [2:47:50<5:18:26,  1.80s/it, loss=0.0329, lr=1e-5]Steps:  29%|██▉       | 4410/15001 [2:47:50<5:18:26,  1.80s/it, loss=0.251, lr=1e-5] Steps:  29%|██▉       | 4411/15001 [2:47:52<5:19:15,  1.81s/it, loss=0.251, lr=1e-5]Steps:  29%|██▉       | 4411/15001 [2:47:52<5:19:15,  1.81s/it, loss=0.109, lr=1e-5]Steps:  29%|██▉       | 4412/15001 [2:47:54<5:20:15,  1.81s/it, loss=0.109, lr=1e-5]Steps:  29%|██▉       | 4412/15001 [2:47:54<5:20:15,  1.81s/it, loss=0.239, lr=1e-5]Steps:  29%|██▉       | 4413/15001 [2:47:55<5:19:49,  1.81s/it, loss=0.239, lr=1e-5]Steps:  29%|██▉       | 4413/15001 [2:47:56<5:19:49,  1.81s/it, loss=0.222, lr=1e-5]Steps:  29%|██▉       | 4414/15001 [2:47:57<5:21:35,  1.82s/it, loss=0.222, lr=1e-5]Steps:  29%|██▉       | 4414/15001 [2:47:58<5:21:35,  1.82s/it, loss=0.218, lr=1e-5]Steps:  29%|██▉       | 4415/15001 [2:47:59<5:22:02,  1.83s/it, loss=0.218, lr=1e-5]Steps:  29%|██▉       | 4415/15001 [2:47:59<5:22:02,  1.83s/it, loss=0.19, lr=1e-5] Steps:  29%|██▉       | 4416/15001 [2:48:01<5:22:46,  1.83s/it, loss=0.19, lr=1e-5]Steps:  29%|██▉       | 4416/15001 [2:48:01<5:22:46,  1.83s/it, loss=0.304, lr=1e-5]Steps:  29%|██▉       | 4417/15001 [2:48:03<5:22:24,  1.83s/it, loss=0.304, lr=1e-5]Steps:  29%|██▉       | 4417/15001 [2:48:03<5:22:24,  1.83s/it, loss=0.261, lr=1e-5]Steps:  29%|██▉       | 4418/15001 [2:48:05<5:40:16,  1.93s/it, loss=0.261, lr=1e-5]Steps:  29%|██▉       | 4418/15001 [2:48:05<5:40:16,  1.93s/it, loss=0.211, lr=1e-5]Steps:  29%|██▉       | 4419/15001 [2:48:07<5:28:44,  1.86s/it, loss=0.211, lr=1e-5]Steps:  29%|██▉       | 4419/15001 [2:48:07<5:28:44,  1.86s/it, loss=0.0787, lr=1e-5]Steps:  29%|██▉       | 4420/15001 [2:48:09<5:56:16,  2.02s/it, loss=0.0787, lr=1e-5]Steps:  29%|██▉       | 4420/15001 [2:48:09<5:56:16,  2.02s/it, loss=0.175, lr=1e-5] Steps:  29%|██▉       | 4421/15001 [2:48:11<5:49:36,  1.98s/it, loss=0.175, lr=1e-5]Steps:  29%|██▉       | 4421/15001 [2:48:11<5:49:36,  1.98s/it, loss=0.152, lr=1e-5]Steps:  29%|██▉       | 4422/15001 [2:48:13<5:57:15,  2.03s/it, loss=0.152, lr=1e-5]Steps:  29%|██▉       | 4422/15001 [2:48:13<5:57:15,  2.03s/it, loss=0.169, lr=1e-5]Steps:  29%|██▉       | 4423/15001 [2:48:15<5:47:47,  1.97s/it, loss=0.169, lr=1e-5]Steps:  29%|██▉       | 4423/15001 [2:48:15<5:47:47,  1.97s/it, loss=0.0408, lr=1e-5]Steps:  29%|██▉       | 4424/15001 [2:48:17<5:37:45,  1.92s/it, loss=0.0408, lr=1e-5]Steps:  29%|██▉       | 4424/15001 [2:48:17<5:37:45,  1.92s/it, loss=0.229, lr=1e-5] Steps:  29%|██▉       | 4425/15001 [2:48:18<5:28:35,  1.86s/it, loss=0.229, lr=1e-5]Steps:  29%|██▉       | 4425/15001 [2:48:19<5:28:35,  1.86s/it, loss=0.241, lr=1e-5]Steps:  30%|██▉       | 4426/15001 [2:48:20<5:28:36,  1.86s/it, loss=0.241, lr=1e-5]Steps:  30%|██▉       | 4426/15001 [2:48:20<5:28:36,  1.86s/it, loss=0.221, lr=1e-5]Steps:  30%|██▉       | 4427/15001 [2:48:22<5:08:56,  1.75s/it, loss=0.221, lr=1e-5]Steps:  30%|██▉       | 4427/15001 [2:48:22<5:08:56,  1.75s/it, loss=0.0435, lr=1e-5]Steps:  30%|██▉       | 4428/15001 [2:48:24<5:23:31,  1.84s/it, loss=0.0435, lr=1e-5]Steps:  30%|██▉       | 4428/15001 [2:48:24<5:23:31,  1.84s/it, loss=0.17, lr=1e-5]  Steps:  30%|██▉       | 4429/15001 [2:48:26<5:15:07,  1.79s/it, loss=0.17, lr=1e-5]Steps:  30%|██▉       | 4429/15001 [2:48:26<5:15:07,  1.79s/it, loss=0.151, lr=1e-5]Steps:  30%|██▉       | 4430/15001 [2:48:27<5:06:04,  1.74s/it, loss=0.151, lr=1e-5]Steps:  30%|██▉       | 4430/15001 [2:48:28<5:06:04,  1.74s/it, loss=0.212, lr=1e-5]Steps:  30%|██▉       | 4431/15001 [2:48:29<5:22:17,  1.83s/it, loss=0.212, lr=1e-5]Steps:  30%|██▉       | 4431/15001 [2:48:29<5:22:17,  1.83s/it, loss=0.239, lr=1e-5]Steps:  30%|██▉       | 4432/15001 [2:48:31<5:16:30,  1.80s/it, loss=0.239, lr=1e-5]Steps:  30%|██▉       | 4432/15001 [2:48:31<5:16:30,  1.80s/it, loss=0.0248, lr=1e-5]Steps:  30%|██▉       | 4433/15001 [2:48:33<5:24:47,  1.84s/it, loss=0.0248, lr=1e-5]Steps:  30%|██▉       | 4433/15001 [2:48:33<5:24:47,  1.84s/it, loss=0.534, lr=1e-5] Steps:  30%|██▉       | 4434/15001 [2:48:35<5:12:29,  1.77s/it, loss=0.534, lr=1e-5]Steps:  30%|██▉       | 4434/15001 [2:48:35<5:12:29,  1.77s/it, loss=0.0878, lr=1e-5]Steps:  30%|██▉       | 4435/15001 [2:48:36<5:23:54,  1.84s/it, loss=0.0878, lr=1e-5]Steps:  30%|██▉       | 4435/15001 [2:48:37<5:23:54,  1.84s/it, loss=0.038, lr=1e-5] Steps:  30%|██▉       | 4436/15001 [2:48:39<5:33:19,  1.89s/it, loss=0.038, lr=1e-5]Steps:  30%|██▉       | 4436/15001 [2:48:39<5:33:19,  1.89s/it, loss=0.146, lr=1e-5]Steps:  30%|██▉       | 4437/15001 [2:48:40<5:28:40,  1.87s/it, loss=0.146, lr=1e-5]Steps:  30%|██▉       | 4437/15001 [2:48:40<5:28:40,  1.87s/it, loss=0.163, lr=1e-5]Steps:  30%|██▉       | 4438/15001 [2:48:42<5:21:36,  1.83s/it, loss=0.163, lr=1e-5]Steps:  30%|██▉       | 4438/15001 [2:48:42<5:21:36,  1.83s/it, loss=0.317, lr=1e-5]Steps:  30%|██▉       | 4439/15001 [2:48:44<5:25:47,  1.85s/it, loss=0.317, lr=1e-5]Steps:  30%|██▉       | 4439/15001 [2:48:44<5:25:47,  1.85s/it, loss=0.124, lr=1e-5]Steps:  30%|██▉       | 4440/15001 [2:48:46<5:33:17,  1.89s/it, loss=0.124, lr=1e-5]Steps:  30%|██▉       | 4440/15001 [2:48:46<5:33:17,  1.89s/it, loss=0.0881, lr=1e-5]Steps:  30%|██▉       | 4441/15001 [2:48:48<5:37:53,  1.92s/it, loss=0.0881, lr=1e-5]Steps:  30%|██▉       | 4441/15001 [2:48:48<5:37:53,  1.92s/it, loss=0.154, lr=1e-5] Steps:  30%|██▉       | 4442/15001 [2:48:50<5:25:22,  1.85s/it, loss=0.154, lr=1e-5]Steps:  30%|██▉       | 4442/15001 [2:48:50<5:25:22,  1.85s/it, loss=0.29, lr=1e-5] Steps:  30%|██▉       | 4443/15001 [2:48:52<5:46:41,  1.97s/it, loss=0.29, lr=1e-5]Steps:  30%|██▉       | 4443/15001 [2:48:52<5:46:41,  1.97s/it, loss=0.273, lr=1e-5]Steps:  30%|██▉       | 4444/15001 [2:48:54<5:39:59,  1.93s/it, loss=0.273, lr=1e-5]Steps:  30%|██▉       | 4444/15001 [2:48:54<5:39:59,  1.93s/it, loss=0.102, lr=1e-5]Steps:  30%|██▉       | 4445/15001 [2:48:56<5:50:17,  1.99s/it, loss=0.102, lr=1e-5]Steps:  30%|██▉       | 4445/15001 [2:48:56<5:50:17,  1.99s/it, loss=0.13, lr=1e-5] Steps:  30%|██▉       | 4446/15001 [2:48:58<5:38:36,  1.92s/it, loss=0.13, lr=1e-5]Steps:  30%|██▉       | 4446/15001 [2:48:58<5:38:36,  1.92s/it, loss=0.331, lr=1e-5]Steps:  30%|██▉       | 4447/15001 [2:48:59<5:31:59,  1.89s/it, loss=0.331, lr=1e-5]Steps:  30%|██▉       | 4447/15001 [2:49:00<5:31:59,  1.89s/it, loss=0.139, lr=1e-5]Steps:  30%|██▉       | 4448/15001 [2:49:01<5:23:22,  1.84s/it, loss=0.139, lr=1e-5]Steps:  30%|██▉       | 4448/15001 [2:49:02<5:23:22,  1.84s/it, loss=0.189, lr=1e-5]Steps:  30%|██▉       | 4449/15001 [2:49:03<5:25:47,  1.85s/it, loss=0.189, lr=1e-5]Steps:  30%|██▉       | 4449/15001 [2:49:03<5:25:47,  1.85s/it, loss=0.0386, lr=1e-5]Steps:  30%|██▉       | 4450/15001 [2:49:05<5:34:23,  1.90s/it, loss=0.0386, lr=1e-5]Steps:  30%|██▉       | 4450/15001 [2:49:05<5:34:23,  1.90s/it, loss=0.201, lr=1e-5] Steps:  30%|██▉       | 4451/15001 [2:49:07<5:27:17,  1.86s/it, loss=0.201, lr=1e-5]Steps:  30%|██▉       | 4451/15001 [2:49:07<5:27:17,  1.86s/it, loss=0.0848, lr=1e-5]Steps:  30%|██▉       | 4452/15001 [2:49:08<5:16:43,  1.80s/it, loss=0.0848, lr=1e-5]Steps:  30%|██▉       | 4452/15001 [2:49:09<5:16:43,  1.80s/it, loss=0.325, lr=1e-5] Steps:  30%|██▉       | 4453/15001 [2:49:11<5:37:28,  1.92s/it, loss=0.325, lr=1e-5]Steps:  30%|██▉       | 4453/15001 [2:49:11<5:37:28,  1.92s/it, loss=0.231, lr=1e-5]Steps:  30%|██▉       | 4454/15001 [2:49:12<5:26:21,  1.86s/it, loss=0.231, lr=1e-5]Steps:  30%|██▉       | 4454/15001 [2:49:13<5:26:21,  1.86s/it, loss=0.139, lr=1e-5]Steps:  30%|██▉       | 4455/15001 [2:49:14<5:18:27,  1.81s/it, loss=0.139, lr=1e-5]Steps:  30%|██▉       | 4455/15001 [2:49:14<5:18:27,  1.81s/it, loss=0.0208, lr=1e-5]Steps:  30%|██▉       | 4456/15001 [2:49:16<5:26:32,  1.86s/it, loss=0.0208, lr=1e-5]Steps:  30%|██▉       | 4456/15001 [2:49:16<5:26:32,  1.86s/it, loss=0.0925, lr=1e-5]Steps:  30%|██▉       | 4457/15001 [2:49:18<5:13:21,  1.78s/it, loss=0.0925, lr=1e-5]Steps:  30%|██▉       | 4457/15001 [2:49:18<5:13:21,  1.78s/it, loss=0.0938, lr=1e-5]Steps:  30%|██▉       | 4458/15001 [2:49:19<5:16:32,  1.80s/it, loss=0.0938, lr=1e-5]Steps:  30%|██▉       | 4458/15001 [2:49:20<5:16:32,  1.80s/it, loss=0.246, lr=1e-5] Steps:  30%|██▉       | 4459/15001 [2:49:21<5:24:43,  1.85s/it, loss=0.246, lr=1e-5]Steps:  30%|██▉       | 4459/15001 [2:49:22<5:24:43,  1.85s/it, loss=0.164, lr=1e-5]Steps:  30%|██▉       | 4460/15001 [2:49:23<5:21:22,  1.83s/it, loss=0.164, lr=1e-5]Steps:  30%|██▉       | 4460/15001 [2:49:23<5:21:22,  1.83s/it, loss=0.194, lr=1e-5]Steps:  30%|██▉       | 4461/15001 [2:49:25<5:16:23,  1.80s/it, loss=0.194, lr=1e-5]Steps:  30%|██▉       | 4461/15001 [2:49:25<5:16:23,  1.80s/it, loss=0.057, lr=1e-5]Steps:  30%|██▉       | 4462/15001 [2:49:27<5:19:35,  1.82s/it, loss=0.057, lr=1e-5]Steps:  30%|██▉       | 4462/15001 [2:49:27<5:19:35,  1.82s/it, loss=0.242, lr=1e-5]Steps:  30%|██▉       | 4463/15001 [2:49:29<5:32:11,  1.89s/it, loss=0.242, lr=1e-5]Steps:  30%|██▉       | 4463/15001 [2:49:29<5:32:11,  1.89s/it, loss=0.0427, lr=1e-5]Steps:  30%|██▉       | 4464/15001 [2:49:31<5:32:35,  1.89s/it, loss=0.0427, lr=1e-5]Steps:  30%|██▉       | 4464/15001 [2:49:31<5:32:35,  1.89s/it, loss=0.204, lr=1e-5] Steps:  30%|██▉       | 4465/15001 [2:49:33<5:37:06,  1.92s/it, loss=0.204, lr=1e-5]Steps:  30%|██▉       | 4465/15001 [2:49:33<5:37:06,  1.92s/it, loss=0.271, lr=1e-5]Steps:  30%|██▉       | 4466/15001 [2:49:35<5:44:42,  1.96s/it, loss=0.271, lr=1e-5]Steps:  30%|██▉       | 4466/15001 [2:49:35<5:44:42,  1.96s/it, loss=0.0717, lr=1e-5]Steps:  30%|██▉       | 4467/15001 [2:49:37<5:46:45,  1.98s/it, loss=0.0717, lr=1e-5]Steps:  30%|██▉       | 4467/15001 [2:49:37<5:46:45,  1.98s/it, loss=0.176, lr=1e-5] Steps:  30%|██▉       | 4468/15001 [2:49:39<5:57:03,  2.03s/it, loss=0.176, lr=1e-5]Steps:  30%|██▉       | 4468/15001 [2:49:39<5:57:03,  2.03s/it, loss=0.194, lr=1e-5]Steps:  30%|██▉       | 4469/15001 [2:49:41<5:34:27,  1.91s/it, loss=0.194, lr=1e-5]Steps:  30%|██▉       | 4469/15001 [2:49:41<5:34:27,  1.91s/it, loss=0.0959, lr=1e-5]Steps:  30%|██▉       | 4470/15001 [2:49:43<5:35:33,  1.91s/it, loss=0.0959, lr=1e-5]Steps:  30%|██▉       | 4470/15001 [2:49:43<5:35:33,  1.91s/it, loss=0.199, lr=1e-5] Steps:  30%|██▉       | 4471/15001 [2:49:45<5:42:13,  1.95s/it, loss=0.199, lr=1e-5]Steps:  30%|██▉       | 4471/15001 [2:49:45<5:42:13,  1.95s/it, loss=0.127, lr=1e-5]Steps:  30%|██▉       | 4472/15001 [2:49:46<5:37:06,  1.92s/it, loss=0.127, lr=1e-5]Steps:  30%|██▉       | 4472/15001 [2:49:46<5:37:06,  1.92s/it, loss=0.0672, lr=1e-5]Steps:  30%|██▉       | 4473/15001 [2:49:48<5:28:05,  1.87s/it, loss=0.0672, lr=1e-5]Steps:  30%|██▉       | 4473/15001 [2:49:48<5:28:05,  1.87s/it, loss=0.0679, lr=1e-5]Steps:  30%|██▉       | 4474/15001 [2:49:50<5:28:06,  1.87s/it, loss=0.0679, lr=1e-5]Steps:  30%|██▉       | 4474/15001 [2:49:50<5:28:06,  1.87s/it, loss=0.0661, lr=1e-5]Steps:  30%|██▉       | 4475/15001 [2:49:52<5:24:50,  1.85s/it, loss=0.0661, lr=1e-5]Steps:  30%|██▉       | 4475/15001 [2:49:52<5:24:50,  1.85s/it, loss=0.173, lr=1e-5] Steps:  30%|██▉       | 4476/15001 [2:49:54<5:15:38,  1.80s/it, loss=0.173, lr=1e-5]Steps:  30%|██▉       | 4476/15001 [2:49:54<5:15:38,  1.80s/it, loss=0.0656, lr=1e-5]Steps:  30%|██▉       | 4477/15001 [2:49:56<5:26:23,  1.86s/it, loss=0.0656, lr=1e-5]Steps:  30%|██▉       | 4477/15001 [2:49:56<5:26:23,  1.86s/it, loss=0.277, lr=1e-5] Steps:  30%|██▉       | 4478/15001 [2:49:57<5:06:18,  1.75s/it, loss=0.277, lr=1e-5]Steps:  30%|██▉       | 4478/15001 [2:49:57<5:06:18,  1.75s/it, loss=0.0382, lr=1e-5]Steps:  30%|██▉       | 4479/15001 [2:49:59<5:26:24,  1.86s/it, loss=0.0382, lr=1e-5]Steps:  30%|██▉       | 4479/15001 [2:49:59<5:26:24,  1.86s/it, loss=0.224, lr=1e-5] Steps:  30%|██▉       | 4480/15001 [2:50:01<5:13:37,  1.79s/it, loss=0.224, lr=1e-5]Steps:  30%|██▉       | 4480/15001 [2:50:01<5:13:37,  1.79s/it, loss=0.0139, lr=1e-5]Steps:  30%|██▉       | 4481/15001 [2:50:03<5:18:50,  1.82s/it, loss=0.0139, lr=1e-5]Steps:  30%|██▉       | 4481/15001 [2:50:03<5:18:50,  1.82s/it, loss=0.316, lr=1e-5] Steps:  30%|██▉       | 4482/15001 [2:50:04<5:10:15,  1.77s/it, loss=0.316, lr=1e-5]Steps:  30%|██▉       | 4482/15001 [2:50:05<5:10:15,  1.77s/it, loss=0.313, lr=1e-5]Steps:  30%|██▉       | 4483/15001 [2:50:06<5:13:26,  1.79s/it, loss=0.313, lr=1e-5]Steps:  30%|██▉       | 4483/15001 [2:50:07<5:13:26,  1.79s/it, loss=0.0169, lr=1e-5]Steps:  30%|██▉       | 4484/15001 [2:50:08<5:14:51,  1.80s/it, loss=0.0169, lr=1e-5]Steps:  30%|██▉       | 4484/15001 [2:50:08<5:14:51,  1.80s/it, loss=0.141, lr=1e-5] Steps:  30%|██▉       | 4485/15001 [2:50:10<5:39:07,  1.93s/it, loss=0.141, lr=1e-5]Steps:  30%|██▉       | 4485/15001 [2:50:10<5:39:07,  1.93s/it, loss=0.0712, lr=1e-5]Steps:  30%|██▉       | 4486/15001 [2:50:12<5:32:52,  1.90s/it, loss=0.0712, lr=1e-5]Steps:  30%|██▉       | 4486/15001 [2:50:12<5:32:52,  1.90s/it, loss=0.281, lr=1e-5] Steps:  30%|██▉       | 4487/15001 [2:50:14<5:35:17,  1.91s/it, loss=0.281, lr=1e-5]Steps:  30%|██▉       | 4487/15001 [2:50:14<5:35:17,  1.91s/it, loss=0.0582, lr=1e-5]Steps:  30%|██▉       | 4488/15001 [2:50:16<5:45:08,  1.97s/it, loss=0.0582, lr=1e-5]Steps:  30%|██▉       | 4488/15001 [2:50:16<5:45:08,  1.97s/it, loss=0.141, lr=1e-5] Steps:  30%|██▉       | 4489/15001 [2:50:18<5:49:22,  1.99s/it, loss=0.141, lr=1e-5]Steps:  30%|██▉       | 4489/15001 [2:50:18<5:49:22,  1.99s/it, loss=0.0966, lr=1e-5]Steps:  30%|██▉       | 4490/15001 [2:50:20<5:47:01,  1.98s/it, loss=0.0966, lr=1e-5]Steps:  30%|██▉       | 4490/15001 [2:50:20<5:47:01,  1.98s/it, loss=0.151, lr=1e-5] Steps:  30%|██▉       | 4491/15001 [2:50:22<6:00:54,  2.06s/it, loss=0.151, lr=1e-5]Steps:  30%|██▉       | 4491/15001 [2:50:22<6:00:54,  2.06s/it, loss=0.0945, lr=1e-5]Steps:  30%|██▉       | 4492/15001 [2:50:24<5:37:35,  1.93s/it, loss=0.0945, lr=1e-5]Steps:  30%|██▉       | 4492/15001 [2:50:24<5:37:35,  1.93s/it, loss=0.216, lr=1e-5] Steps:  30%|██▉       | 4493/15001 [2:50:26<5:34:24,  1.91s/it, loss=0.216, lr=1e-5]Steps:  30%|██▉       | 4493/15001 [2:50:26<5:34:24,  1.91s/it, loss=0.239, lr=1e-5]Steps:  30%|██▉       | 4494/15001 [2:50:28<5:26:40,  1.87s/it, loss=0.239, lr=1e-5]Steps:  30%|██▉       | 4494/15001 [2:50:28<5:26:40,  1.87s/it, loss=0.0954, lr=1e-5]Steps:  30%|██▉       | 4495/15001 [2:50:29<5:22:29,  1.84s/it, loss=0.0954, lr=1e-5]Steps:  30%|██▉       | 4495/15001 [2:50:30<5:22:29,  1.84s/it, loss=0.194, lr=1e-5] Steps:  30%|██▉       | 4496/15001 [2:50:31<5:25:33,  1.86s/it, loss=0.194, lr=1e-5]Steps:  30%|██▉       | 4496/15001 [2:50:31<5:25:33,  1.86s/it, loss=0.121, lr=1e-5]Steps:  30%|██▉       | 4497/15001 [2:50:33<5:19:48,  1.83s/it, loss=0.121, lr=1e-5]Steps:  30%|██▉       | 4497/15001 [2:50:33<5:19:48,  1.83s/it, loss=0.188, lr=1e-5]Steps:  30%|██▉       | 4498/15001 [2:50:35<5:12:44,  1.79s/it, loss=0.188, lr=1e-5]Steps:  30%|██▉       | 4498/15001 [2:50:35<5:12:44,  1.79s/it, loss=0.19, lr=1e-5] Steps:  30%|██▉       | 4499/15001 [2:50:37<5:24:52,  1.86s/it, loss=0.19, lr=1e-5]Steps:  30%|██▉       | 4499/15001 [2:50:37<5:24:52,  1.86s/it, loss=0.122, lr=1e-5]Steps:  30%|██▉       | 4500/15001 [2:50:38<5:12:15,  1.78s/it, loss=0.122, lr=1e-5]02/04/2024 15:52:58 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1563.19it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  30%|██▉       | 4500/15001 [2:54:19<5:12:15,  1.78s/it, loss=0.273, lr=1e-5]Steps:  30%|███       | 4501/15001 [2:54:20<197:49:04, 67.82s/it, loss=0.273, lr=1e-5]Steps:  30%|███       | 4501/15001 [2:54:20<197:49:04, 67.82s/it, loss=0.0961, lr=1e-5]Steps:  30%|███       | 4502/15001 [2:54:22<140:04:27, 48.03s/it, loss=0.0961, lr=1e-5]Steps:  30%|███       | 4502/15001 [2:54:22<140:04:27, 48.03s/it, loss=0.211, lr=1e-5] Steps:  30%|███       | 4503/15001 [2:54:24<99:45:19, 34.21s/it, loss=0.211, lr=1e-5] Steps:  30%|███       | 4503/15001 [2:54:24<99:45:19, 34.21s/it, loss=0.198, lr=1e-5]Steps:  30%|███       | 4504/15001 [2:54:26<71:18:00, 24.45s/it, loss=0.198, lr=1e-5]Steps:  30%|███       | 4504/15001 [2:54:26<71:18:00, 24.45s/it, loss=0.127, lr=1e-5]Steps:  30%|███       | 4505/15001 [2:54:27<51:23:03, 17.62s/it, loss=0.127, lr=1e-5]Steps:  30%|███       | 4505/15001 [2:54:28<51:23:03, 17.62s/it, loss=0.279, lr=1e-5]Steps:  30%|███       | 4506/15001 [2:54:29<37:40:56, 12.93s/it, loss=0.279, lr=1e-5]Steps:  30%|███       | 4506/15001 [2:54:30<37:40:56, 12.93s/it, loss=0.273, lr=1e-5]Steps:  30%|███       | 4507/15001 [2:54:31<27:54:09,  9.57s/it, loss=0.273, lr=1e-5]Steps:  30%|███       | 4507/15001 [2:54:32<27:54:09,  9.57s/it, loss=0.275, lr=1e-5]Steps:  30%|███       | 4508/15001 [2:54:33<21:22:21,  7.33s/it, loss=0.275, lr=1e-5]Steps:  30%|███       | 4508/15001 [2:54:33<21:22:21,  7.33s/it, loss=0.083, lr=1e-5]Steps:  30%|███       | 4509/15001 [2:54:35<16:38:37,  5.71s/it, loss=0.083, lr=1e-5]Steps:  30%|███       | 4509/15001 [2:54:35<16:38:37,  5.71s/it, loss=0.0908, lr=1e-5]Steps:  30%|███       | 4510/15001 [2:54:37<13:01:12,  4.47s/it, loss=0.0908, lr=1e-5]Steps:  30%|███       | 4510/15001 [2:54:37<13:01:12,  4.47s/it, loss=0.28, lr=1e-5]  Steps:  30%|███       | 4511/15001 [2:54:39<10:54:05,  3.74s/it, loss=0.28, lr=1e-5]Steps:  30%|███       | 4511/15001 [2:54:39<10:54:05,  3.74s/it, loss=0.28, lr=1e-5]Steps:  30%|███       | 4512/15001 [2:54:41<9:07:14,  3.13s/it, loss=0.28, lr=1e-5] Steps:  30%|███       | 4512/15001 [2:54:41<9:07:14,  3.13s/it, loss=0.0296, lr=1e-5]Steps:  30%|███       | 4513/15001 [2:54:42<7:57:08,  2.73s/it, loss=0.0296, lr=1e-5]Steps:  30%|███       | 4513/15001 [2:54:43<7:57:08,  2.73s/it, loss=0.0977, lr=1e-5]Steps:  30%|███       | 4514/15001 [2:54:44<7:16:35,  2.50s/it, loss=0.0977, lr=1e-5]Steps:  30%|███       | 4514/15001 [2:54:44<7:16:35,  2.50s/it, loss=0.173, lr=1e-5] Steps:  30%|███       | 4515/15001 [2:54:46<6:32:11,  2.24s/it, loss=0.173, lr=1e-5]Steps:  30%|███       | 4515/15001 [2:54:46<6:32:11,  2.24s/it, loss=0.255, lr=1e-5]Steps:  30%|███       | 4516/15001 [2:54:48<6:24:12,  2.20s/it, loss=0.255, lr=1e-5]Steps:  30%|███       | 4516/15001 [2:54:48<6:24:12,  2.20s/it, loss=0.236, lr=1e-5]Steps:  30%|███       | 4517/15001 [2:54:50<6:05:57,  2.09s/it, loss=0.236, lr=1e-5]Steps:  30%|███       | 4517/15001 [2:54:50<6:05:57,  2.09s/it, loss=0.0952, lr=1e-5]Steps:  30%|███       | 4518/15001 [2:54:52<6:18:55,  2.17s/it, loss=0.0952, lr=1e-5]Steps:  30%|███       | 4518/15001 [2:54:52<6:18:55,  2.17s/it, loss=0.0963, lr=1e-5]Steps:  30%|███       | 4519/15001 [2:54:54<6:14:14,  2.14s/it, loss=0.0963, lr=1e-5]Steps:  30%|███       | 4519/15001 [2:54:54<6:14:14,  2.14s/it, loss=0.073, lr=1e-5] Steps:  30%|███       | 4520/15001 [2:54:56<6:07:38,  2.10s/it, loss=0.073, lr=1e-5]Steps:  30%|███       | 4520/15001 [2:54:56<6:07:38,  2.10s/it, loss=0.127, lr=1e-5]Steps:  30%|███       | 4521/15001 [2:54:58<5:59:35,  2.06s/it, loss=0.127, lr=1e-5]Steps:  30%|███       | 4521/15001 [2:54:58<5:59:35,  2.06s/it, loss=0.0263, lr=1e-5]Steps:  30%|███       | 4522/15001 [2:55:00<5:34:09,  1.91s/it, loss=0.0263, lr=1e-5]Steps:  30%|███       | 4522/15001 [2:55:00<5:34:09,  1.91s/it, loss=0.114, lr=1e-5] Steps:  30%|███       | 4523/15001 [2:55:02<5:50:00,  2.00s/it, loss=0.114, lr=1e-5]Steps:  30%|███       | 4523/15001 [2:55:02<5:50:00,  2.00s/it, loss=0.132, lr=1e-5]Steps:  30%|███       | 4524/15001 [2:55:04<5:33:06,  1.91s/it, loss=0.132, lr=1e-5]Steps:  30%|███       | 4524/15001 [2:55:04<5:33:06,  1.91s/it, loss=0.0694, lr=1e-5]Steps:  30%|███       | 4525/15001 [2:55:06<5:30:13,  1.89s/it, loss=0.0694, lr=1e-5]Steps:  30%|███       | 4525/15001 [2:55:06<5:30:13,  1.89s/it, loss=0.0468, lr=1e-5]Steps:  30%|███       | 4526/15001 [2:55:07<5:25:57,  1.87s/it, loss=0.0468, lr=1e-5]Steps:  30%|███       | 4526/15001 [2:55:08<5:25:57,  1.87s/it, loss=0.138, lr=1e-5] Steps:  30%|███       | 4527/15001 [2:55:09<5:19:32,  1.83s/it, loss=0.138, lr=1e-5]Steps:  30%|███       | 4527/15001 [2:55:09<5:19:32,  1.83s/it, loss=0.258, lr=1e-5]Steps:  30%|███       | 4528/15001 [2:55:11<5:31:22,  1.90s/it, loss=0.258, lr=1e-5]Steps:  30%|███       | 4528/15001 [2:55:11<5:31:22,  1.90s/it, loss=0.117, lr=1e-5]Steps:  30%|███       | 4529/15001 [2:55:13<5:25:29,  1.86s/it, loss=0.117, lr=1e-5]Steps:  30%|███       | 4529/15001 [2:55:13<5:25:29,  1.86s/it, loss=0.106, lr=1e-5]Steps:  30%|███       | 4530/15001 [2:55:15<5:13:04,  1.79s/it, loss=0.106, lr=1e-5]Steps:  30%|███       | 4530/15001 [2:55:15<5:13:04,  1.79s/it, loss=0.188, lr=1e-5]Steps:  30%|███       | 4531/15001 [2:55:17<5:21:22,  1.84s/it, loss=0.188, lr=1e-5]Steps:  30%|███       | 4531/15001 [2:55:17<5:21:22,  1.84s/it, loss=0.295, lr=1e-5]Steps:  30%|███       | 4532/15001 [2:55:18<5:15:35,  1.81s/it, loss=0.295, lr=1e-5]Steps:  30%|███       | 4532/15001 [2:55:18<5:15:35,  1.81s/it, loss=0.0885, lr=1e-5]Steps:  30%|███       | 4533/15001 [2:55:20<5:16:11,  1.81s/it, loss=0.0885, lr=1e-5]Steps:  30%|███       | 4533/15001 [2:55:20<5:16:11,  1.81s/it, loss=0.0905, lr=1e-5]Steps:  30%|███       | 4534/15001 [2:55:22<5:18:43,  1.83s/it, loss=0.0905, lr=1e-5]Steps:  30%|███       | 4534/15001 [2:55:22<5:18:43,  1.83s/it, loss=0.214, lr=1e-5] Steps:  30%|███       | 4535/15001 [2:55:24<5:09:06,  1.77s/it, loss=0.214, lr=1e-5]Steps:  30%|███       | 4535/15001 [2:55:24<5:09:06,  1.77s/it, loss=0.086, lr=1e-5]Steps:  30%|███       | 4536/15001 [2:55:26<5:15:11,  1.81s/it, loss=0.086, lr=1e-5]Steps:  30%|███       | 4536/15001 [2:55:26<5:15:11,  1.81s/it, loss=0.326, lr=1e-5]Steps:  30%|███       | 4537/15001 [2:55:27<5:10:54,  1.78s/it, loss=0.326, lr=1e-5]Steps:  30%|███       | 4537/15001 [2:55:28<5:10:54,  1.78s/it, loss=0.0876, lr=1e-5]Steps:  30%|███       | 4538/15001 [2:55:29<5:12:43,  1.79s/it, loss=0.0876, lr=1e-5]Steps:  30%|███       | 4538/15001 [2:55:29<5:12:43,  1.79s/it, loss=0.073, lr=1e-5] Steps:  30%|███       | 4539/15001 [2:55:31<5:37:32,  1.94s/it, loss=0.073, lr=1e-5]Steps:  30%|███       | 4539/15001 [2:55:31<5:37:32,  1.94s/it, loss=0.0438, lr=1e-5]Steps:  30%|███       | 4540/15001 [2:55:33<5:37:14,  1.93s/it, loss=0.0438, lr=1e-5]Steps:  30%|███       | 4540/15001 [2:55:33<5:37:14,  1.93s/it, loss=0.107, lr=1e-5] Steps:  30%|███       | 4541/15001 [2:55:35<5:32:14,  1.91s/it, loss=0.107, lr=1e-5]Steps:  30%|███       | 4541/15001 [2:55:35<5:32:14,  1.91s/it, loss=0.122, lr=1e-5]Steps:  30%|███       | 4542/15001 [2:55:37<5:38:15,  1.94s/it, loss=0.122, lr=1e-5]Steps:  30%|███       | 4542/15001 [2:55:38<5:38:15,  1.94s/it, loss=0.0261, lr=1e-5]Steps:  30%|███       | 4543/15001 [2:55:39<5:42:16,  1.96s/it, loss=0.0261, lr=1e-5]Steps:  30%|███       | 4543/15001 [2:55:40<5:42:16,  1.96s/it, loss=0.111, lr=1e-5] Steps:  30%|███       | 4544/15001 [2:55:41<5:58:15,  2.06s/it, loss=0.111, lr=1e-5]Steps:  30%|███       | 4544/15001 [2:55:42<5:58:15,  2.06s/it, loss=0.222, lr=1e-5]Steps:  30%|███       | 4545/15001 [2:55:43<5:52:39,  2.02s/it, loss=0.222, lr=1e-5]Steps:  30%|███       | 4545/15001 [2:55:43<5:52:39,  2.02s/it, loss=0.485, lr=1e-5]Steps:  30%|███       | 4546/15001 [2:55:45<5:48:22,  2.00s/it, loss=0.485, lr=1e-5]Steps:  30%|███       | 4546/15001 [2:55:45<5:48:22,  2.00s/it, loss=0.089, lr=1e-5]Steps:  30%|███       | 4547/15001 [2:55:47<5:31:38,  1.90s/it, loss=0.089, lr=1e-5]Steps:  30%|███       | 4547/15001 [2:55:47<5:31:38,  1.90s/it, loss=0.391, lr=1e-5]Steps:  30%|███       | 4548/15001 [2:55:49<5:12:47,  1.80s/it, loss=0.391, lr=1e-5]Steps:  30%|███       | 4548/15001 [2:55:49<5:12:47,  1.80s/it, loss=0.303, lr=1e-5]Steps:  30%|███       | 4549/15001 [2:55:50<5:11:22,  1.79s/it, loss=0.303, lr=1e-5]Steps:  30%|███       | 4549/15001 [2:55:51<5:11:22,  1.79s/it, loss=0.329, lr=1e-5]Steps:  30%|███       | 4550/15001 [2:55:52<5:31:09,  1.90s/it, loss=0.329, lr=1e-5]Steps:  30%|███       | 4550/15001 [2:55:52<5:31:09,  1.90s/it, loss=0.199, lr=1e-5]Steps:  30%|███       | 4551/15001 [2:55:54<5:23:32,  1.86s/it, loss=0.199, lr=1e-5]Steps:  30%|███       | 4551/15001 [2:55:54<5:23:32,  1.86s/it, loss=0.0582, lr=1e-5]Steps:  30%|███       | 4552/15001 [2:55:56<5:24:53,  1.87s/it, loss=0.0582, lr=1e-5]Steps:  30%|███       | 4552/15001 [2:55:56<5:24:53,  1.87s/it, loss=0.234, lr=1e-5] Steps:  30%|███       | 4553/15001 [2:55:58<5:24:30,  1.86s/it, loss=0.234, lr=1e-5]Steps:  30%|███       | 4553/15001 [2:55:58<5:24:30,  1.86s/it, loss=0.288, lr=1e-5]Steps:  30%|███       | 4554/15001 [2:56:00<5:19:54,  1.84s/it, loss=0.288, lr=1e-5]Steps:  30%|███       | 4554/15001 [2:56:00<5:19:54,  1.84s/it, loss=0.0765, lr=1e-5]Steps:  30%|█��█       | 4555/15001 [2:56:01<5:12:36,  1.80s/it, loss=0.0765, lr=1e-5]Steps:  30%|███       | 4555/15001 [2:56:02<5:12:36,  1.80s/it, loss=0.126, lr=1e-5] Steps:  30%|███       | 4556/15001 [2:56:03<5:19:46,  1.84s/it, loss=0.126, lr=1e-5]Steps:  30%|███       | 4556/15001 [2:56:03<5:19:46,  1.84s/it, loss=0.0935, lr=1e-5]Steps:  30%|███       | 4557/15001 [2:56:05<5:16:33,  1.82s/it, loss=0.0935, lr=1e-5]Steps:  30%|███       | 4557/15001 [2:56:05<5:16:33,  1.82s/it, loss=0.0383, lr=1e-5]Steps:  30%|███       | 4558/15001 [2:56:07<5:18:11,  1.83s/it, loss=0.0383, lr=1e-5]Steps:  30%|███       | 4558/15001 [2:56:07<5:18:11,  1.83s/it, loss=0.191, lr=1e-5] Steps:  30%|███       | 4559/15001 [2:56:09<5:20:01,  1.84s/it, loss=0.191, lr=1e-5]Steps:  30%|███       | 4559/15001 [2:56:09<5:20:01,  1.84s/it, loss=0.26, lr=1e-5] Steps:  30%|███       | 4560/15001 [2:56:11<5:11:23,  1.79s/it, loss=0.26, lr=1e-5]Steps:  30%|███       | 4560/15001 [2:56:11<5:11:23,  1.79s/it, loss=0.0533, lr=1e-5]Steps:  30%|███       | 4561/15001 [2:56:12<5:19:40,  1.84s/it, loss=0.0533, lr=1e-5]Steps:  30%|███       | 4561/15001 [2:56:13<5:19:40,  1.84s/it, loss=0.131, lr=1e-5] Steps:  30%|███       | 4562/15001 [2:56:14<5:12:16,  1.79s/it, loss=0.131, lr=1e-5]Steps:  30%|███       | 4562/15001 [2:56:15<5:12:16,  1.79s/it, loss=0.0632, lr=1e-5]Steps:  30%|███       | 4563/15001 [2:56:16<5:26:34,  1.88s/it, loss=0.0632, lr=1e-5]Steps:  30%|███       | 4563/15001 [2:56:16<5:26:34,  1.88s/it, loss=0.0587, lr=1e-5]Steps:  30%|███       | 4564/15001 [2:56:18<5:26:16,  1.88s/it, loss=0.0587, lr=1e-5]Steps:  30%|███       | 4564/15001 [2:56:18<5:26:16,  1.88s/it, loss=0.222, lr=1e-5] Steps:  30%|███       | 4565/15001 [2:56:20<5:34:48,  1.92s/it, loss=0.222, lr=1e-5]Steps:  30%|███       | 4565/15001 [2:56:20<5:34:48,  1.92s/it, loss=0.0596, lr=1e-5]Steps:  30%|███       | 4566/15001 [2:56:22<5:50:59,  2.02s/it, loss=0.0596, lr=1e-5]Steps:  30%|███       | 4566/15001 [2:56:22<5:50:59,  2.02s/it, loss=0.277, lr=1e-5] Steps:  30%|███       | 4567/15001 [2:56:24<5:30:09,  1.90s/it, loss=0.277, lr=1e-5]Steps:  30%|███       | 4567/15001 [2:56:24<5:30:09,  1.90s/it, loss=0.0813, lr=1e-5]Steps:  30%|███       | 4568/15001 [2:56:26<5:43:14,  1.97s/it, loss=0.0813, lr=1e-5]Steps:  30%|███       | 4568/15001 [2:56:26<5:43:14,  1.97s/it, loss=0.163, lr=1e-5] Steps:  30%|███       | 4569/15001 [2:56:28<5:37:30,  1.94s/it, loss=0.163, lr=1e-5]Steps:  30%|███       | 4569/15001 [2:56:28<5:37:30,  1.94s/it, loss=0.107, lr=1e-5]Steps:  30%|███       | 4570/15001 [2:56:30<5:18:24,  1.83s/it, loss=0.107, lr=1e-5]Steps:  30%|███       | 4570/15001 [2:56:30<5:18:24,  1.83s/it, loss=0.138, lr=1e-5]Steps:  30%|███       | 4571/15001 [2:56:32<5:25:12,  1.87s/it, loss=0.138, lr=1e-5]Steps:  30%|███       | 4571/15001 [2:56:32<5:25:12,  1.87s/it, loss=0.317, lr=1e-5]Steps:  30%|███       | 4572/15001 [2:56:33<5:26:41,  1.88s/it, loss=0.317, lr=1e-5]Steps:  30%|███       | 4572/15001 [2:56:34<5:26:41,  1.88s/it, loss=0.343, lr=1e-5]Steps:  30%|███       | 4573/15001 [2:56:35<5:14:51,  1.81s/it, loss=0.343, lr=1e-5]Steps:  30%|███       | 4573/15001 [2:56:35<5:14:51,  1.81s/it, loss=0.071, lr=1e-5]Steps:  30%|███       | 4574/15001 [2:56:37<5:15:15,  1.81s/it, loss=0.071, lr=1e-5]Steps:  30%|███       | 4574/15001 [2:56:37<5:15:15,  1.81s/it, loss=0.197, lr=1e-5]Steps:  30%|███       | 4575/15001 [2:56:39<5:29:11,  1.89s/it, loss=0.197, lr=1e-5]Steps:  30%|███       | 4575/15001 [2:56:39<5:29:11,  1.89s/it, loss=0.291, lr=1e-5]Steps:  31%|███       | 4576/15001 [2:56:41<5:19:45,  1.84s/it, loss=0.291, lr=1e-5]Steps:  31%|███       | 4576/15001 [2:56:41<5:19:45,  1.84s/it, loss=0.177, lr=1e-5]Steps:  31%|███       | 4577/15001 [2:56:42<5:12:23,  1.80s/it, loss=0.177, lr=1e-5]Steps:  31%|███       | 4577/15001 [2:56:43<5:12:23,  1.80s/it, loss=0.0524, lr=1e-5]Steps:  31%|███       | 4578/15001 [2:56:44<5:08:49,  1.78s/it, loss=0.0524, lr=1e-5]Steps:  31%|███       | 4578/15001 [2:56:44<5:08:49,  1.78s/it, loss=0.0565, lr=1e-5]Steps:  31%|███       | 4579/15001 [2:56:46<5:19:44,  1.84s/it, loss=0.0565, lr=1e-5]Steps:  31%|███       | 4579/15001 [2:56:46<5:19:44,  1.84s/it, loss=0.2, lr=1e-5]   Steps:  31%|███       | 4580/15001 [2:56:48<5:25:22,  1.87s/it, loss=0.2, lr=1e-5]Steps:  31%|███       | 4580/15001 [2:56:48<5:25:22,  1.87s/it, loss=0.0393, lr=1e-5]Steps:  31%|███       | 4581/15001 [2:56:50<5:07:03,  1.77s/it, loss=0.0393, lr=1e-5]Steps:  31%|███       | 4581/15001 [2:56:50<5:07:03,  1.77s/it, loss=0.0729, lr=1e-5]Steps:  31%|███       | 4582/15001 [2:56:52<5:24:04,  1.87s/it, loss=0.0729, lr=1e-5]Steps:  31%|███       | 4582/15001 [2:56:52<5:24:04,  1.87s/it, loss=0.0993, lr=1e-5]Steps:  31%|���██       | 4583/15001 [2:56:54<5:22:22,  1.86s/it, loss=0.0993, lr=1e-5]Steps:  31%|███       | 4583/15001 [2:56:54<5:22:22,  1.86s/it, loss=0.267, lr=1e-5] Steps:  31%|███       | 4584/15001 [2:56:55<5:19:46,  1.84s/it, loss=0.267, lr=1e-5]Steps:  31%|███       | 4584/15001 [2:56:55<5:19:46,  1.84s/it, loss=0.0283, lr=1e-5]Steps:  31%|███       | 4585/15001 [2:56:57<5:14:27,  1.81s/it, loss=0.0283, lr=1e-5]Steps:  31%|███       | 4585/15001 [2:56:58<5:14:27,  1.81s/it, loss=0.0395, lr=1e-5]Steps:  31%|███       | 4586/15001 [2:56:59<5:34:26,  1.93s/it, loss=0.0395, lr=1e-5]Steps:  31%|███       | 4586/15001 [2:56:59<5:34:26,  1.93s/it, loss=0.27, lr=1e-5]  Steps:  31%|███       | 4587/15001 [2:57:01<5:31:21,  1.91s/it, loss=0.27, lr=1e-5]Steps:  31%|███       | 4587/15001 [2:57:01<5:31:21,  1.91s/it, loss=0.127, lr=1e-5]Steps:  31%|███       | 4588/15001 [2:57:03<5:48:52,  2.01s/it, loss=0.127, lr=1e-5]Steps:  31%|███       | 4588/15001 [2:57:03<5:48:52,  2.01s/it, loss=0.183, lr=1e-5]Steps:  31%|███       | 4589/15001 [2:57:05<5:49:24,  2.01s/it, loss=0.183, lr=1e-5]Steps:  31%|███       | 4589/15001 [2:57:06<5:49:24,  2.01s/it, loss=0.111, lr=1e-5]Steps:  31%|███       | 4590/15001 [2:57:07<5:37:34,  1.95s/it, loss=0.111, lr=1e-5]Steps:  31%|███       | 4590/15001 [2:57:08<5:37:34,  1.95s/it, loss=0.0573, lr=1e-5]Steps:  31%|███       | 4591/15001 [2:57:09<5:41:01,  1.97s/it, loss=0.0573, lr=1e-5]Steps:  31%|███       | 4591/15001 [2:57:09<5:41:01,  1.97s/it, loss=0.243, lr=1e-5] Steps:  31%|███       | 4592/15001 [2:57:11<5:26:33,  1.88s/it, loss=0.243, lr=1e-5]Steps:  31%|███       | 4592/15001 [2:57:11<5:26:33,  1.88s/it, loss=0.291, lr=1e-5]Steps:  31%|███       | 4593/15001 [2:57:13<5:20:57,  1.85s/it, loss=0.291, lr=1e-5]Steps:  31%|███       | 4593/15001 [2:57:13<5:20:57,  1.85s/it, loss=0.0535, lr=1e-5]Steps:  31%|███       | 4594/15001 [2:57:15<5:31:19,  1.91s/it, loss=0.0535, lr=1e-5]Steps:  31%|███       | 4594/15001 [2:57:15<5:31:19,  1.91s/it, loss=0.246, lr=1e-5] Steps:  31%|███       | 4595/15001 [2:57:17<5:32:07,  1.92s/it, loss=0.246, lr=1e-5]Steps:  31%|███       | 4595/15001 [2:57:17<5:32:07,  1.92s/it, loss=0.278, lr=1e-5]Steps:  31%|███       | 4596/15001 [2:57:18<5:13:16,  1.81s/it, loss=0.278, lr=1e-5]Steps:  31%|███       | 4596/15001 [2:57:19<5:13:16,  1.81s/it, loss=0.179, lr=1e-5]Steps:  31%|███       | 4597/15001 [2:57:20<5:33:05,  1.92s/it, loss=0.179, lr=1e-5]Steps:  31%|███       | 4597/15001 [2:57:20<5:33:05,  1.92s/it, loss=0.219, lr=1e-5]Steps:  31%|███       | 4598/15001 [2:57:22<5:17:01,  1.83s/it, loss=0.219, lr=1e-5]Steps:  31%|███       | 4598/15001 [2:57:22<5:17:01,  1.83s/it, loss=0.19, lr=1e-5] Steps:  31%|███       | 4599/15001 [2:57:24<5:10:00,  1.79s/it, loss=0.19, lr=1e-5]Steps:  31%|███       | 4599/15001 [2:57:24<5:10:00,  1.79s/it, loss=0.111, lr=1e-5]Steps:  31%|███       | 4600/15001 [2:57:26<5:19:56,  1.85s/it, loss=0.111, lr=1e-5]Steps:  31%|███       | 4600/15001 [2:57:26<5:19:56,  1.85s/it, loss=0.228, lr=1e-5]Steps:  31%|███       | 4601/15001 [2:57:28<5:26:40,  1.88s/it, loss=0.228, lr=1e-5]Steps:  31%|███       | 4601/15001 [2:57:28<5:26:40,  1.88s/it, loss=0.207, lr=1e-5]Steps:  31%|███       | 4602/15001 [2:57:29<5:14:13,  1.81s/it, loss=0.207, lr=1e-5]Steps:  31%|███       | 4602/15001 [2:57:30<5:14:13,  1.81s/it, loss=0.239, lr=1e-5]Steps:  31%|███       | 4603/15001 [2:57:31<5:20:29,  1.85s/it, loss=0.239, lr=1e-5]Steps:  31%|███       | 4603/15001 [2:57:31<5:20:29,  1.85s/it, loss=0.197, lr=1e-5]Steps:  31%|███       | 4604/15001 [2:57:33<5:21:23,  1.85s/it, loss=0.197, lr=1e-5]Steps:  31%|███       | 4604/15001 [2:57:33<5:21:23,  1.85s/it, loss=0.267, lr=1e-5]Steps:  31%|███       | 4605/15001 [2:57:35<5:13:54,  1.81s/it, loss=0.267, lr=1e-5]Steps:  31%|███       | 4605/15001 [2:57:35<5:13:54,  1.81s/it, loss=0.114, lr=1e-5]Steps:  31%|███       | 4606/15001 [2:57:37<5:24:42,  1.87s/it, loss=0.114, lr=1e-5]Steps:  31%|███       | 4606/15001 [2:57:37<5:24:42,  1.87s/it, loss=0.193, lr=1e-5]Steps:  31%|███       | 4607/15001 [2:57:38<5:12:23,  1.80s/it, loss=0.193, lr=1e-5]Steps:  31%|███       | 4607/15001 [2:57:39<5:12:23,  1.80s/it, loss=0.328, lr=1e-5]Steps:  31%|███       | 4608/15001 [2:57:40<5:14:48,  1.82s/it, loss=0.328, lr=1e-5]Steps:  31%|███       | 4608/15001 [2:57:41<5:14:48,  1.82s/it, loss=0.254, lr=1e-5]Steps:  31%|███       | 4609/15001 [2:57:42<5:28:02,  1.89s/it, loss=0.254, lr=1e-5]Steps:  31%|███       | 4609/15001 [2:57:43<5:28:02,  1.89s/it, loss=0.363, lr=1e-5]Steps:  31%|███       | 4610/15001 [2:57:44<5:35:03,  1.93s/it, loss=0.363, lr=1e-5]Steps:  31%|███       | 4610/15001 [2:57:45<5:35:03,  1.93s/it, loss=0.107, lr=1e-5]Steps:  31%|███       | 4611/15001 [2:57:46<5:33:13,  1.92s/it, loss=0.107, lr=1e-5]Steps:  31%|███       | 4611/15001 [2:57:47<5:33:13,  1.92s/it, loss=0.297, lr=1e-5]Steps:  31%|███       | 4612/15001 [2:57:49<5:54:00,  2.04s/it, loss=0.297, lr=1e-5]Steps:  31%|███       | 4612/15001 [2:57:49<5:54:00,  2.04s/it, loss=0.159, lr=1e-5]Steps:  31%|███       | 4613/15001 [2:57:51<5:43:50,  1.99s/it, loss=0.159, lr=1e-5]Steps:  31%|███       | 4613/15001 [2:57:51<5:43:50,  1.99s/it, loss=0.0683, lr=1e-5]Steps:  31%|███       | 4614/15001 [2:57:53<5:46:41,  2.00s/it, loss=0.0683, lr=1e-5]Steps:  31%|███       | 4614/15001 [2:57:53<5:46:41,  2.00s/it, loss=0.117, lr=1e-5] Steps:  31%|███       | 4615/15001 [2:57:54<5:30:16,  1.91s/it, loss=0.117, lr=1e-5]Steps:  31%|███       | 4615/15001 [2:57:54<5:30:16,  1.91s/it, loss=0.156, lr=1e-5]Steps:  31%|███       | 4616/15001 [2:57:56<5:19:44,  1.85s/it, loss=0.156, lr=1e-5]Steps:  31%|███       | 4616/15001 [2:57:56<5:19:44,  1.85s/it, loss=0.213, lr=1e-5]Steps:  31%|███       | 4617/15001 [2:57:58<5:21:25,  1.86s/it, loss=0.213, lr=1e-5]Steps:  31%|███       | 4617/15001 [2:57:58<5:21:25,  1.86s/it, loss=0.143, lr=1e-5]Steps:  31%|███       | 4618/15001 [2:58:00<5:20:16,  1.85s/it, loss=0.143, lr=1e-5]Steps:  31%|███       | 4618/15001 [2:58:00<5:20:16,  1.85s/it, loss=0.109, lr=1e-5]Steps:  31%|███       | 4619/15001 [2:58:02<5:22:58,  1.87s/it, loss=0.109, lr=1e-5]Steps:  31%|███       | 4619/15001 [2:58:02<5:22:58,  1.87s/it, loss=0.152, lr=1e-5]Steps:  31%|███       | 4620/15001 [2:58:03<5:20:18,  1.85s/it, loss=0.152, lr=1e-5]Steps:  31%|███       | 4620/15001 [2:58:03<5:20:18,  1.85s/it, loss=0.0348, lr=1e-5]Steps:  31%|███       | 4621/15001 [2:58:05<5:21:01,  1.86s/it, loss=0.0348, lr=1e-5]Steps:  31%|███       | 4621/15001 [2:58:05<5:21:01,  1.86s/it, loss=0.0771, lr=1e-5]Steps:  31%|███       | 4622/15001 [2:58:07<5:19:56,  1.85s/it, loss=0.0771, lr=1e-5]Steps:  31%|███       | 4622/15001 [2:58:07<5:19:56,  1.85s/it, loss=0.2, lr=1e-5]   Steps:  31%|███       | 4623/15001 [2:58:09<5:12:37,  1.81s/it, loss=0.2, lr=1e-5]Steps:  31%|███       | 4623/15001 [2:58:09<5:12:37,  1.81s/it, loss=0.0168, lr=1e-5]Steps:  31%|███       | 4624/15001 [2:58:10<5:05:18,  1.77s/it, loss=0.0168, lr=1e-5]Steps:  31%|███       | 4624/15001 [2:58:11<5:05:18,  1.77s/it, loss=0.167, lr=1e-5] Steps:  31%|███       | 4625/15001 [2:58:12<5:15:20,  1.82s/it, loss=0.167, lr=1e-5]Steps:  31%|███       | 4625/15001 [2:58:13<5:15:20,  1.82s/it, loss=0.17, lr=1e-5] Steps:  31%|███       | 4626/15001 [2:58:14<5:17:14,  1.83s/it, loss=0.17, lr=1e-5]Steps:  31%|███       | 4626/15001 [2:58:14<5:17:14,  1.83s/it, loss=0.213, lr=1e-5]Steps:  31%|███       | 4627/15001 [2:58:16<5:13:16,  1.81s/it, loss=0.213, lr=1e-5]Steps:  31%|███       | 4627/15001 [2:58:16<5:13:16,  1.81s/it, loss=0.129, lr=1e-5]Steps:  31%|███       | 4628/15001 [2:58:18<5:24:16,  1.88s/it, loss=0.129, lr=1e-5]Steps:  31%|███       | 4628/15001 [2:58:18<5:24:16,  1.88s/it, loss=0.163, lr=1e-5]Steps:  31%|███       | 4629/15001 [2:58:20<5:16:01,  1.83s/it, loss=0.163, lr=1e-5]Steps:  31%|███       | 4629/15001 [2:58:20<5:16:01,  1.83s/it, loss=0.226, lr=1e-5]Steps:  31%|███       | 4630/15001 [2:58:21<5:07:55,  1.78s/it, loss=0.226, lr=1e-5]Steps:  31%|███       | 4630/15001 [2:58:22<5:07:55,  1.78s/it, loss=0.0856, lr=1e-5]Steps:  31%|███       | 4631/15001 [2:58:23<5:13:35,  1.81s/it, loss=0.0856, lr=1e-5]Steps:  31%|███       | 4631/15001 [2:58:24<5:13:35,  1.81s/it, loss=0.0705, lr=1e-5]Steps:  31%|███       | 4632/15001 [2:58:26<5:35:28,  1.94s/it, loss=0.0705, lr=1e-5]Steps:  31%|███       | 4632/15001 [2:58:26<5:35:28,  1.94s/it, loss=0.114, lr=1e-5] Steps:  31%|███       | 4633/15001 [2:58:28<5:46:00,  2.00s/it, loss=0.114, lr=1e-5]Steps:  31%|███       | 4633/15001 [2:58:28<5:46:00,  2.00s/it, loss=0.0495, lr=1e-5]Steps:  31%|███       | 4634/15001 [2:58:30<5:41:41,  1.98s/it, loss=0.0495, lr=1e-5]Steps:  31%|███       | 4634/15001 [2:58:30<5:41:41,  1.98s/it, loss=0.22, lr=1e-5]  Steps:  31%|███       | 4635/15001 [2:58:32<5:44:16,  1.99s/it, loss=0.22, lr=1e-5]Steps:  31%|███       | 4635/15001 [2:58:32<5:44:16,  1.99s/it, loss=0.176, lr=1e-5]Steps:  31%|███       | 4636/15001 [2:58:34<5:56:44,  2.07s/it, loss=0.176, lr=1e-5]Steps:  31%|███       | 4636/15001 [2:58:34<5:56:44,  2.07s/it, loss=0.0861, lr=1e-5]Steps:  31%|███       | 4637/15001 [2:58:36<5:44:41,  2.00s/it, loss=0.0861, lr=1e-5]Steps:  31%|███       | 4637/15001 [2:58:36<5:44:41,  2.00s/it, loss=0.106, lr=1e-5] Steps:  31%|███       | 4638/15001 [2:58:38<5:38:17,  1.96s/it, loss=0.106, lr=1e-5]Steps:  31%|███       | 4638/15001 [2:58:38<5:38:17,  1.96s/it, loss=0.168, lr=1e-5]Steps:  31%|███       | 4639/15001 [2:58:39<5:20:52,  1.86s/it, loss=0.168, lr=1e-5]Steps:  31%|███       | 4639/15001 [2:58:39<5:20:52,  1.86s/it, loss=0.272, lr=1e-5]Steps:  31%|███       | 4640/15001 [2:58:41<5:15:47,  1.83s/it, loss=0.272, lr=1e-5]Steps:  31%|███       | 4640/15001 [2:58:41<5:15:47,  1.83s/it, loss=0.253, lr=1e-5]Steps:  31%|███       | 4641/15001 [2:58:43<5:21:47,  1.86s/it, loss=0.253, lr=1e-5]Steps:  31%|███       | 4641/15001 [2:58:43<5:21:47,  1.86s/it, loss=0.282, lr=1e-5]Steps:  31%|███       | 4642/15001 [2:58:45<5:07:07,  1.78s/it, loss=0.282, lr=1e-5]Steps:  31%|███       | 4642/15001 [2:58:45<5:07:07,  1.78s/it, loss=0.154, lr=1e-5]Steps:  31%|███       | 4643/15001 [2:58:46<5:16:08,  1.83s/it, loss=0.154, lr=1e-5]Steps:  31%|███       | 4643/15001 [2:58:47<5:16:08,  1.83s/it, loss=0.153, lr=1e-5]Steps:  31%|███       | 4644/15001 [2:58:49<5:27:40,  1.90s/it, loss=0.153, lr=1e-5]Steps:  31%|███       | 4644/15001 [2:58:49<5:27:40,  1.90s/it, loss=0.319, lr=1e-5]Steps:  31%|███       | 4645/15001 [2:58:50<5:22:49,  1.87s/it, loss=0.319, lr=1e-5]Steps:  31%|███       | 4645/15001 [2:58:50<5:22:49,  1.87s/it, loss=0.109, lr=1e-5]Steps:  31%|███       | 4646/15001 [2:58:52<5:11:20,  1.80s/it, loss=0.109, lr=1e-5]Steps:  31%|███       | 4646/15001 [2:58:52<5:11:20,  1.80s/it, loss=0.133, lr=1e-5]Steps:  31%|███       | 4647/15001 [2:58:54<5:17:07,  1.84s/it, loss=0.133, lr=1e-5]Steps:  31%|███       | 4647/15001 [2:58:54<5:17:07,  1.84s/it, loss=0.212, lr=1e-5]Steps:  31%|███       | 4648/15001 [2:58:56<5:12:45,  1.81s/it, loss=0.212, lr=1e-5]Steps:  31%|███       | 4648/15001 [2:58:56<5:12:45,  1.81s/it, loss=0.179, lr=1e-5]Steps:  31%|███       | 4649/15001 [2:58:57<5:05:56,  1.77s/it, loss=0.179, lr=1e-5]Steps:  31%|███       | 4649/15001 [2:58:58<5:05:56,  1.77s/it, loss=0.21, lr=1e-5] Steps:  31%|███       | 4650/15001 [2:58:59<5:20:42,  1.86s/it, loss=0.21, lr=1e-5]Steps:  31%|███       | 4650/15001 [2:58:59<5:20:42,  1.86s/it, loss=0.231, lr=1e-5]Steps:  31%|███       | 4651/15001 [2:59:01<5:16:04,  1.83s/it, loss=0.231, lr=1e-5]Steps:  31%|███       | 4651/15001 [2:59:01<5:16:04,  1.83s/it, loss=0.294, lr=1e-5]Steps:  31%|███       | 4652/15001 [2:59:03<5:21:39,  1.86s/it, loss=0.294, lr=1e-5]Steps:  31%|███       | 4652/15001 [2:59:03<5:21:39,  1.86s/it, loss=0.0615, lr=1e-5]Steps:  31%|███       | 4653/15001 [2:59:05<5:09:42,  1.80s/it, loss=0.0615, lr=1e-5]Steps:  31%|███       | 4653/15001 [2:59:05<5:09:42,  1.80s/it, loss=0.0666, lr=1e-5]Steps:  31%|███       | 4654/15001 [2:59:07<5:27:53,  1.90s/it, loss=0.0666, lr=1e-5]Steps:  31%|███       | 4654/15001 [2:59:07<5:27:53,  1.90s/it, loss=0.264, lr=1e-5] Steps:  31%|███       | 4655/15001 [2:59:09<5:20:06,  1.86s/it, loss=0.264, lr=1e-5]Steps:  31%|███       | 4655/15001 [2:59:09<5:20:06,  1.86s/it, loss=0.102, lr=1e-5]Steps:  31%|███       | 4656/15001 [2:59:11<5:33:21,  1.93s/it, loss=0.102, lr=1e-5]Steps:  31%|███       | 4656/15001 [2:59:11<5:33:21,  1.93s/it, loss=0.297, lr=1e-5]Steps:  31%|███       | 4657/15001 [2:59:13<5:50:39,  2.03s/it, loss=0.297, lr=1e-5]Steps:  31%|███       | 4657/15001 [2:59:13<5:50:39,  2.03s/it, loss=0.121, lr=1e-5]Steps:  31%|███       | 4658/15001 [2:59:15<5:49:21,  2.03s/it, loss=0.121, lr=1e-5]Steps:  31%|███       | 4658/15001 [2:59:15<5:49:21,  2.03s/it, loss=0.136, lr=1e-5]Steps:  31%|███       | 4659/15001 [2:59:17<5:54:39,  2.06s/it, loss=0.136, lr=1e-5]Steps:  31%|███       | 4659/15001 [2:59:17<5:54:39,  2.06s/it, loss=0.189, lr=1e-5]Steps:  31%|███       | 4660/15001 [2:59:19<5:41:51,  1.98s/it, loss=0.189, lr=1e-5]Steps:  31%|███       | 4660/15001 [2:59:19<5:41:51,  1.98s/it, loss=0.0678, lr=1e-5]Steps:  31%|███       | 4661/15001 [2:59:21<5:28:17,  1.91s/it, loss=0.0678, lr=1e-5]Steps:  31%|███       | 4661/15001 [2:59:21<5:28:17,  1.91s/it, loss=0.268, lr=1e-5] Steps:  31%|███       | 4662/15001 [2:59:23<5:35:33,  1.95s/it, loss=0.268, lr=1e-5]Steps:  31%|███       | 4662/15001 [2:59:23<5:35:33,  1.95s/it, loss=0.303, lr=1e-5]Steps:  31%|███       | 4663/15001 [2:59:24<5:25:01,  1.89s/it, loss=0.303, lr=1e-5]Steps:  31%|███       | 4663/15001 [2:59:25<5:25:01,  1.89s/it, loss=0.128, lr=1e-5]Steps:  31%|███       | 4664/15001 [2:59:26<5:10:15,  1.80s/it, loss=0.128, lr=1e-5]Steps:  31%|███       | 4664/15001 [2:59:26<5:10:15,  1.80s/it, loss=0.14, lr=1e-5] Steps:  31%|███       | 4665/15001 [2:59:28<5:15:30,  1.83s/it, loss=0.14, lr=1e-5]Steps:  31%|███       | 4665/15001 [2:59:28<5:15:30,  1.83s/it, loss=0.153, lr=1e-5]Steps:  31%|███       | 4666/15001 [2:59:30<5:21:24,  1.87s/it, loss=0.153, lr=1e-5]Steps:  31%|███       | 4666/15001 [2:59:30<5:21:24,  1.87s/it, loss=0.316, lr=1e-5]Steps:  31%|███       | 4667/15001 [2:59:32<5:25:19,  1.89s/it, loss=0.316, lr=1e-5]Steps:  31%|███       | 4667/15001 [2:59:32<5:25:19,  1.89s/it, loss=0.213, lr=1e-5]Steps:  31%|███       | 4668/15001 [2:59:34<5:26:29,  1.90s/it, loss=0.213, lr=1e-5]Steps:  31%|███       | 4668/15001 [2:59:34<5:26:29,  1.90s/it, loss=0.175, lr=1e-5]Steps:  31%|███       | 4669/15001 [2:59:36<5:19:26,  1.86s/it, loss=0.175, lr=1e-5]Steps:  31%|███       | 4669/15001 [2:59:36<5:19:26,  1.86s/it, loss=0.159, lr=1e-5]Steps:  31%|███       | 4670/15001 [2:59:37<5:00:51,  1.75s/it, loss=0.159, lr=1e-5]Steps:  31%|███       | 4670/15001 [2:59:37<5:00:51,  1.75s/it, loss=0.0868, lr=1e-5]Steps:  31%|███       | 4671/15001 [2:59:39<5:04:26,  1.77s/it, loss=0.0868, lr=1e-5]Steps:  31%|███       | 4671/15001 [2:59:39<5:04:26,  1.77s/it, loss=0.0265, lr=1e-5]Steps:  31%|███       | 4672/15001 [2:59:41<5:11:47,  1.81s/it, loss=0.0265, lr=1e-5]Steps:  31%|███       | 4672/15001 [2:59:41<5:11:47,  1.81s/it, loss=0.274, lr=1e-5] Steps:  31%|███       | 4673/15001 [2:59:43<5:20:44,  1.86s/it, loss=0.274, lr=1e-5]Steps:  31%|███       | 4673/15001 [2:59:43<5:20:44,  1.86s/it, loss=0.0346, lr=1e-5]Steps:  31%|███       | 4674/15001 [2:59:44<5:12:29,  1.82s/it, loss=0.0346, lr=1e-5]Steps:  31%|███       | 4674/15001 [2:59:45<5:12:29,  1.82s/it, loss=0.373, lr=1e-5] Steps:  31%|███       | 4675/15001 [2:59:47<5:25:16,  1.89s/it, loss=0.373, lr=1e-5]Steps:  31%|███       | 4675/15001 [2:59:47<5:25:16,  1.89s/it, loss=0.256, lr=1e-5]Steps:  31%|███       | 4676/15001 [2:59:48<5:29:09,  1.91s/it, loss=0.256, lr=1e-5]Steps:  31%|███       | 4676/15001 [2:59:49<5:29:09,  1.91s/it, loss=0.0763, lr=1e-5]Steps:  31%|███       | 4677/15001 [2:59:50<5:22:20,  1.87s/it, loss=0.0763, lr=1e-5]Steps:  31%|███       | 4677/15001 [2:59:50<5:22:20,  1.87s/it, loss=0.0225, lr=1e-5]Steps:  31%|███       | 4678/15001 [2:59:52<5:23:36,  1.88s/it, loss=0.0225, lr=1e-5]Steps:  31%|███       | 4678/15001 [2:59:53<5:23:36,  1.88s/it, loss=0.0974, lr=1e-5]Steps:  31%|███       | 4679/15001 [2:59:54<5:44:05,  2.00s/it, loss=0.0974, lr=1e-5]Steps:  31%|███       | 4679/15001 [2:59:55<5:44:05,  2.00s/it, loss=0.0749, lr=1e-5]Steps:  31%|███       | 4680/15001 [2:59:56<5:41:22,  1.98s/it, loss=0.0749, lr=1e-5]Steps:  31%|███       | 4680/15001 [2:59:57<5:41:22,  1.98s/it, loss=0.149, lr=1e-5] Steps:  31%|███       | 4681/15001 [2:59:59<5:51:33,  2.04s/it, loss=0.149, lr=1e-5]Steps:  31%|███       | 4681/15001 [2:59:59<5:51:33,  2.04s/it, loss=0.215, lr=1e-5]Steps:  31%|███       | 4682/15001 [3:00:00<5:39:22,  1.97s/it, loss=0.215, lr=1e-5]Steps:  31%|███       | 4682/15001 [3:00:01<5:39:22,  1.97s/it, loss=0.0388, lr=1e-5]Steps:  31%|███       | 4683/15001 [3:00:02<5:32:16,  1.93s/it, loss=0.0388, lr=1e-5]Steps:  31%|███       | 4683/15001 [3:00:02<5:32:16,  1.93s/it, loss=0.299, lr=1e-5] Steps:  31%|███       | 4684/15001 [3:00:04<5:20:03,  1.86s/it, loss=0.299, lr=1e-5]Steps:  31%|███       | 4684/15001 [3:00:04<5:20:03,  1.86s/it, loss=0.0978, lr=1e-5]Steps:  31%|███       | 4685/15001 [3:00:06<5:17:59,  1.85s/it, loss=0.0978, lr=1e-5]Steps:  31%|███       | 4685/15001 [3:00:06<5:17:59,  1.85s/it, loss=0.0622, lr=1e-5]Steps:  31%|███       | 4686/15001 [3:00:08<5:19:10,  1.86s/it, loss=0.0622, lr=1e-5]Steps:  31%|███       | 4686/15001 [3:00:08<5:19:10,  1.86s/it, loss=0.2, lr=1e-5]   Steps:  31%|███       | 4687/15001 [3:00:09<5:11:00,  1.81s/it, loss=0.2, lr=1e-5]Steps:  31%|███       | 4687/15001 [3:00:10<5:11:00,  1.81s/it, loss=0.192, lr=1e-5]Steps:  31%|███▏      | 4688/15001 [3:00:11<5:20:46,  1.87s/it, loss=0.192, lr=1e-5]Steps:  31%|███▏      | 4688/15001 [3:00:11<5:20:46,  1.87s/it, loss=0.257, lr=1e-5]Steps:  31%|███▏      | 4689/15001 [3:00:13<5:19:14,  1.86s/it, loss=0.257, lr=1e-5]Steps:  31%|███▏      | 4689/15001 [3:00:13<5:19:14,  1.86s/it, loss=0.205, lr=1e-5]Steps:  31%|███▏      | 4690/15001 [3:00:15<5:17:59,  1.85s/it, loss=0.205, lr=1e-5]Steps:  31%|███▏      | 4690/15001 [3:00:15<5:17:59,  1.85s/it, loss=0.23, lr=1e-5] Steps:  31%|███▏      | 4691/15001 [3:00:17<5:16:57,  1.84s/it, loss=0.23, lr=1e-5]Steps:  31%|███▏      | 4691/15001 [3:00:17<5:16:57,  1.84s/it, loss=0.0751, lr=1e-5]Steps:  31%|███▏      | 4692/15001 [3:00:19<5:14:53,  1.83s/it, loss=0.0751, lr=1e-5]Steps:  31%|███▏      | 4692/15001 [3:00:19<5:14:53,  1.83s/it, loss=0.21, lr=1e-5]  Steps:  31%|███▏      | 4693/15001 [3:00:20<5:08:13,  1.79s/it, loss=0.21, lr=1e-5]Steps:  31%|███▏      | 4693/15001 [3:00:21<5:08:13,  1.79s/it, loss=0.149, lr=1e-5]Steps:  31%|███▏      | 4694/15001 [3:00:22<5:14:07,  1.83s/it, loss=0.149, lr=1e-5]Steps:  31%|███▏      | 4694/15001 [3:00:22<5:14:07,  1.83s/it, loss=0.134, lr=1e-5]Steps:  31%|███���      | 4695/15001 [3:00:24<5:09:29,  1.80s/it, loss=0.134, lr=1e-5]Steps:  31%|███▏      | 4695/15001 [3:00:24<5:09:29,  1.80s/it, loss=0.086, lr=1e-5]Steps:  31%|███▏      | 4696/15001 [3:00:26<5:21:54,  1.87s/it, loss=0.086, lr=1e-5]Steps:  31%|███▏      | 4696/15001 [3:00:26<5:21:54,  1.87s/it, loss=0.0916, lr=1e-5]Steps:  31%|███▏      | 4697/15001 [3:00:28<5:20:30,  1.87s/it, loss=0.0916, lr=1e-5]Steps:  31%|███▏      | 4697/15001 [3:00:28<5:20:30,  1.87s/it, loss=0.27, lr=1e-5]  Steps:  31%|███▏      | 4698/15001 [3:00:30<5:18:34,  1.86s/it, loss=0.27, lr=1e-5]Steps:  31%|███▏      | 4698/15001 [3:00:30<5:18:34,  1.86s/it, loss=0.378, lr=1e-5]Steps:  31%|███▏      | 4699/15001 [3:00:32<5:24:54,  1.89s/it, loss=0.378, lr=1e-5]Steps:  31%|███▏      | 4699/15001 [3:00:32<5:24:54,  1.89s/it, loss=0.212, lr=1e-5]Steps:  31%|███▏      | 4700/15001 [3:00:34<5:38:44,  1.97s/it, loss=0.212, lr=1e-5]Steps:  31%|███▏      | 4700/15001 [3:00:34<5:38:44,  1.97s/it, loss=0.217, lr=1e-5]Steps:  31%|███▏      | 4701/15001 [3:00:36<5:30:22,  1.92s/it, loss=0.217, lr=1e-5]Steps:  31%|███▏      | 4701/15001 [3:00:36<5:30:22,  1.92s/it, loss=0.209, lr=1e-5]Steps:  31%|███▏      | 4702/15001 [3:00:38<5:43:21,  2.00s/it, loss=0.209, lr=1e-5]Steps:  31%|███▏      | 4702/15001 [3:00:38<5:43:21,  2.00s/it, loss=0.258, lr=1e-5]Steps:  31%|███▏      | 4703/15001 [3:00:40<5:37:57,  1.97s/it, loss=0.258, lr=1e-5]Steps:  31%|███▏      | 4703/15001 [3:00:40<5:37:57,  1.97s/it, loss=0.152, lr=1e-5]Steps:  31%|███▏      | 4704/15001 [3:00:42<5:51:55,  2.05s/it, loss=0.152, lr=1e-5]Steps:  31%|███▏      | 4704/15001 [3:00:42<5:51:55,  2.05s/it, loss=0.0893, lr=1e-5]Steps:  31%|███▏      | 4705/15001 [3:00:44<5:41:23,  1.99s/it, loss=0.0893, lr=1e-5]Steps:  31%|███▏      | 4705/15001 [3:00:44<5:41:23,  1.99s/it, loss=0.266, lr=1e-5] Steps:  31%|███▏      | 4706/15001 [3:00:46<5:34:18,  1.95s/it, loss=0.266, lr=1e-5]Steps:  31%|███▏      | 4706/15001 [3:00:46<5:34:18,  1.95s/it, loss=0.258, lr=1e-5]Steps:  31%|███▏      | 4707/15001 [3:00:47<5:18:02,  1.85s/it, loss=0.258, lr=1e-5]Steps:  31%|███▏      | 4707/15001 [3:00:48<5:18:02,  1.85s/it, loss=0.152, lr=1e-5]Steps:  31%|███▏      | 4708/15001 [3:00:49<5:18:28,  1.86s/it, loss=0.152, lr=1e-5]Steps:  31%|███▏      | 4708/15001 [3:00:49<5:18:28,  1.86s/it, loss=0.0918, lr=1e-5]Steps:  31%|███▏      | 4709/15001 [3:00:51<5:16:01,  1.84s/it, loss=0.0918, lr=1e-5]Steps:  31%|███▏      | 4709/15001 [3:00:51<5:16:01,  1.84s/it, loss=0.147, lr=1e-5] Steps:  31%|███▏      | 4710/15001 [3:00:53<5:16:18,  1.84s/it, loss=0.147, lr=1e-5]Steps:  31%|███▏      | 4710/15001 [3:00:53<5:16:18,  1.84s/it, loss=0.165, lr=1e-5]Steps:  31%|███▏      | 4711/15001 [3:00:55<5:21:56,  1.88s/it, loss=0.165, lr=1e-5]Steps:  31%|███▏      | 4711/15001 [3:00:55<5:21:56,  1.88s/it, loss=0.262, lr=1e-5]Steps:  31%|███▏      | 4712/15001 [3:00:57<5:20:40,  1.87s/it, loss=0.262, lr=1e-5]Steps:  31%|███▏      | 4712/15001 [3:00:57<5:20:40,  1.87s/it, loss=0.167, lr=1e-5]Steps:  31%|███▏      | 4713/15001 [3:00:59<5:22:40,  1.88s/it, loss=0.167, lr=1e-5]Steps:  31%|███▏      | 4713/15001 [3:00:59<5:22:40,  1.88s/it, loss=0.288, lr=1e-5]Steps:  31%|███▏      | 4714/15001 [3:01:00<5:18:44,  1.86s/it, loss=0.288, lr=1e-5]Steps:  31%|███▏      | 4714/15001 [3:01:00<5:18:44,  1.86s/it, loss=0.0696, lr=1e-5]Steps:  31%|███▏      | 4715/15001 [3:01:02<5:11:49,  1.82s/it, loss=0.0696, lr=1e-5]Steps:  31%|███▏      | 4715/15001 [3:01:02<5:11:49,  1.82s/it, loss=0.0422, lr=1e-5]Steps:  31%|███▏      | 4716/15001 [3:01:04<5:05:21,  1.78s/it, loss=0.0422, lr=1e-5]Steps:  31%|███▏      | 4716/15001 [3:01:04<5:05:21,  1.78s/it, loss=0.161, lr=1e-5] Steps:  31%|███▏      | 4717/15001 [3:01:06<5:16:58,  1.85s/it, loss=0.161, lr=1e-5]Steps:  31%|███▏      | 4717/15001 [3:01:06<5:16:58,  1.85s/it, loss=0.11, lr=1e-5] Steps:  31%|███▏      | 4718/15001 [3:01:07<5:11:27,  1.82s/it, loss=0.11, lr=1e-5]Steps:  31%|███▏      | 4718/15001 [3:01:08<5:11:27,  1.82s/it, loss=0.0861, lr=1e-5]Steps:  31%|███▏      | 4719/15001 [3:01:09<5:13:03,  1.83s/it, loss=0.0861, lr=1e-5]Steps:  31%|███▏      | 4719/15001 [3:01:10<5:13:03,  1.83s/it, loss=0.0968, lr=1e-5]Steps:  31%|███▏      | 4720/15001 [3:01:11<5:14:11,  1.83s/it, loss=0.0968, lr=1e-5]Steps:  31%|███▏      | 4720/15001 [3:01:11<5:14:11,  1.83s/it, loss=0.0869, lr=1e-5]Steps:  31%|███▏      | 4721/15001 [3:01:13<5:09:16,  1.81s/it, loss=0.0869, lr=1e-5]Steps:  31%|███▏      | 4721/15001 [3:01:13<5:09:16,  1.81s/it, loss=0.231, lr=1e-5] Steps:  31%|███▏      | 4722/15001 [3:01:15<5:36:34,  1.96s/it, loss=0.231, lr=1e-5]Steps:  31%|███▏      | 4722/15001 [3:01:15<5:36:34,  1.96s/it, loss=0.316, lr=1e-5]Steps:  31%|███▏      | 4723/15001 [3:01:17<5:14:33,  1.84s/it, loss=0.316, lr=1e-5]Steps:  31%|███▏      | 4723/15001 [3:01:17<5:14:33,  1.84s/it, loss=0.109, lr=1e-5]Steps:  31%|███▏      | 4724/15001 [3:01:19<5:24:14,  1.89s/it, loss=0.109, lr=1e-5]Steps:  31%|███▏      | 4724/15001 [3:01:19<5:24:14,  1.89s/it, loss=0.124, lr=1e-5]Steps:  31%|███▏      | 4725/15001 [3:01:21<5:35:41,  1.96s/it, loss=0.124, lr=1e-5]Steps:  31%|███▏      | 4725/15001 [3:01:21<5:35:41,  1.96s/it, loss=0.254, lr=1e-5]Steps:  32%|███▏      | 4726/15001 [3:01:23<5:27:54,  1.91s/it, loss=0.254, lr=1e-5]Steps:  32%|███▏      | 4726/15001 [3:01:23<5:27:54,  1.91s/it, loss=0.187, lr=1e-5]Steps:  32%|███▏      | 4727/15001 [3:01:25<5:47:53,  2.03s/it, loss=0.187, lr=1e-5]Steps:  32%|███▏      | 4727/15001 [3:01:25<5:47:53,  2.03s/it, loss=0.141, lr=1e-5]Steps:  32%|███▏      | 4728/15001 [3:01:27<5:30:08,  1.93s/it, loss=0.141, lr=1e-5]Steps:  32%|███▏      | 4728/15001 [3:01:27<5:30:08,  1.93s/it, loss=0.172, lr=1e-5]Steps:  32%|███▏      | 4729/15001 [3:01:29<5:22:30,  1.88s/it, loss=0.172, lr=1e-5]Steps:  32%|███▏      | 4729/15001 [3:01:29<5:22:30,  1.88s/it, loss=0.314, lr=1e-5]Steps:  32%|███▏      | 4730/15001 [3:01:31<5:30:50,  1.93s/it, loss=0.314, lr=1e-5]Steps:  32%|███▏      | 4730/15001 [3:01:31<5:30:50,  1.93s/it, loss=0.262, lr=1e-5]Steps:  32%|███▏      | 4731/15001 [3:01:32<5:20:58,  1.88s/it, loss=0.262, lr=1e-5]Steps:  32%|███▏      | 4731/15001 [3:01:33<5:20:58,  1.88s/it, loss=0.229, lr=1e-5]Steps:  32%|███▏      | 4732/15001 [3:01:34<5:28:52,  1.92s/it, loss=0.229, lr=1e-5]Steps:  32%|███▏      | 4732/15001 [3:01:34<5:28:52,  1.92s/it, loss=0.124, lr=1e-5]Steps:  32%|███▏      | 4733/15001 [3:01:36<5:08:26,  1.80s/it, loss=0.124, lr=1e-5]Steps:  32%|███▏      | 4733/15001 [3:01:36<5:08:26,  1.80s/it, loss=0.0329, lr=1e-5]Steps:  32%|███▏      | 4734/15001 [3:01:38<5:11:37,  1.82s/it, loss=0.0329, lr=1e-5]Steps:  32%|███▏      | 4734/15001 [3:01:38<5:11:37,  1.82s/it, loss=0.227, lr=1e-5] Steps:  32%|███▏      | 4735/15001 [3:01:40<5:34:55,  1.96s/it, loss=0.227, lr=1e-5]Steps:  32%|███▏      | 4735/15001 [3:01:40<5:34:55,  1.96s/it, loss=0.204, lr=1e-5]Steps:  32%|███▏      | 4736/15001 [3:01:41<5:09:52,  1.81s/it, loss=0.204, lr=1e-5]Steps:  32%|███▏      | 4736/15001 [3:01:42<5:09:52,  1.81s/it, loss=0.194, lr=1e-5]Steps:  32%|███▏      | 4737/15001 [3:01:44<5:23:20,  1.89s/it, loss=0.194, lr=1e-5]Steps:  32%|███▏      | 4737/15001 [3:01:44<5:23:20,  1.89s/it, loss=0.172, lr=1e-5]Steps:  32%|███▏      | 4738/15001 [3:01:45<5:11:36,  1.82s/it, loss=0.172, lr=1e-5]Steps:  32%|███▏      | 4738/15001 [3:01:45<5:11:36,  1.82s/it, loss=0.0903, lr=1e-5]Steps:  32%|███▏      | 4739/15001 [3:01:47<5:20:07,  1.87s/it, loss=0.0903, lr=1e-5]Steps:  32%|███▏      | 4739/15001 [3:01:47<5:20:07,  1.87s/it, loss=0.188, lr=1e-5] Steps:  32%|███▏      | 4740/15001 [3:01:49<5:27:34,  1.92s/it, loss=0.188, lr=1e-5]Steps:  32%|███▏      | 4740/15001 [3:01:49<5:27:34,  1.92s/it, loss=0.174, lr=1e-5]Steps:  32%|███▏      | 4741/15001 [3:01:51<5:15:36,  1.85s/it, loss=0.174, lr=1e-5]Steps:  32%|███▏      | 4741/15001 [3:01:51<5:15:36,  1.85s/it, loss=0.211, lr=1e-5]Steps:  32%|███▏      | 4742/15001 [3:01:53<5:03:28,  1.77s/it, loss=0.211, lr=1e-5]Steps:  32%|███▏      | 4742/15001 [3:01:53<5:03:28,  1.77s/it, loss=0.243, lr=1e-5]Steps:  32%|███▏      | 4743/15001 [3:01:54<5:06:56,  1.80s/it, loss=0.243, lr=1e-5]Steps:  32%|███▏      | 4743/15001 [3:01:55<5:06:56,  1.80s/it, loss=0.0808, lr=1e-5]Steps:  32%|███▏      | 4744/15001 [3:01:56<5:03:04,  1.77s/it, loss=0.0808, lr=1e-5]Steps:  32%|███▏      | 4744/15001 [3:01:56<5:03:04,  1.77s/it, loss=0.173, lr=1e-5] Steps:  32%|███▏      | 4745/15001 [3:01:58<5:19:06,  1.87s/it, loss=0.173, lr=1e-5]Steps:  32%|███▏      | 4745/15001 [3:01:58<5:19:06,  1.87s/it, loss=0.119, lr=1e-5]Steps:  32%|███▏      | 4746/15001 [3:02:00<5:13:11,  1.83s/it, loss=0.119, lr=1e-5]Steps:  32%|███▏      | 4746/15001 [3:02:00<5:13:11,  1.83s/it, loss=0.294, lr=1e-5]Steps:  32%|███▏      | 4747/15001 [3:02:02<5:30:42,  1.94s/it, loss=0.294, lr=1e-5]Steps:  32%|███▏      | 4747/15001 [3:02:03<5:30:42,  1.94s/it, loss=0.063, lr=1e-5]Steps:  32%|███▏      | 4748/15001 [3:02:04<5:47:40,  2.03s/it, loss=0.063, lr=1e-5]Steps:  32%|███▏      | 4748/15001 [3:02:05<5:47:40,  2.03s/it, loss=0.172, lr=1e-5]Steps:  32%|███▏      | 4749/15001 [3:02:06<5:49:51,  2.05s/it, loss=0.172, lr=1e-5]Steps:  32%|███▏      | 4749/15001 [3:02:07<5:49:51,  2.05s/it, loss=0.159, lr=1e-5]Steps:  32%|███▏      | 4750/15001 [3:02:08<5:46:51,  2.03s/it, loss=0.159, lr=1e-5]Steps:  32%|███▏      | 4750/15001 [3:02:09<5:46:51,  2.03s/it, loss=0.0794, lr=1e-5]Steps:  32%|███▏      | 4751/15001 [3:02:10<5:44:57,  2.02s/it, loss=0.0794, lr=1e-5]Steps:  32%|███▏      | 4751/15001 [3:02:11<5:44:57,  2.02s/it, loss=0.0704, lr=1e-5]Steps:  32%|███▏      | 4752/15001 [3:02:12<5:31:52,  1.94s/it, loss=0.0704, lr=1e-5]Steps:  32%|███▏      | 4752/15001 [3:02:12<5:31:52,  1.94s/it, loss=0.145, lr=1e-5] Steps:  32%|███▏      | 4753/15001 [3:02:14<5:31:40,  1.94s/it, loss=0.145, lr=1e-5]Steps:  32%|███▏      | 4753/15001 [3:02:14<5:31:40,  1.94s/it, loss=0.187, lr=1e-5]Steps:  32%|███▏      | 4754/15001 [3:02:16<5:09:29,  1.81s/it, loss=0.187, lr=1e-5]Steps:  32%|███▏      | 4754/15001 [3:02:16<5:09:29,  1.81s/it, loss=0.113, lr=1e-5]Steps:  32%|███▏      | 4755/15001 [3:02:18<5:24:06,  1.90s/it, loss=0.113, lr=1e-5]Steps:  32%|███▏      | 4755/15001 [3:02:18<5:24:06,  1.90s/it, loss=0.154, lr=1e-5]Steps:  32%|███▏      | 4756/15001 [3:02:19<5:14:50,  1.84s/it, loss=0.154, lr=1e-5]Steps:  32%|███▏      | 4756/15001 [3:02:20<5:14:50,  1.84s/it, loss=0.117, lr=1e-5]Steps:  32%|███▏      | 4757/15001 [3:02:21<5:18:47,  1.87s/it, loss=0.117, lr=1e-5]Steps:  32%|███▏      | 4757/15001 [3:02:22<5:18:47,  1.87s/it, loss=0.113, lr=1e-5]Steps:  32%|███▏      | 4758/15001 [3:02:23<5:12:14,  1.83s/it, loss=0.113, lr=1e-5]Steps:  32%|███▏      | 4758/15001 [3:02:23<5:12:14,  1.83s/it, loss=0.251, lr=1e-5]Steps:  32%|███▏      | 4759/15001 [3:02:25<5:08:14,  1.81s/it, loss=0.251, lr=1e-5]Steps:  32%|███▏      | 4759/15001 [3:02:25<5:08:14,  1.81s/it, loss=0.18, lr=1e-5] Steps:  32%|███▏      | 4760/15001 [3:02:27<5:22:21,  1.89s/it, loss=0.18, lr=1e-5]Steps:  32%|███▏      | 4760/15001 [3:02:27<5:22:21,  1.89s/it, loss=0.114, lr=1e-5]Steps:  32%|███▏      | 4761/15001 [3:02:29<5:19:05,  1.87s/it, loss=0.114, lr=1e-5]Steps:  32%|███▏      | 4761/15001 [3:02:29<5:19:05,  1.87s/it, loss=0.17, lr=1e-5] Steps:  32%|███▏      | 4762/15001 [3:02:31<5:12:32,  1.83s/it, loss=0.17, lr=1e-5]Steps:  32%|███▏      | 4762/15001 [3:02:31<5:12:32,  1.83s/it, loss=0.162, lr=1e-5]Steps:  32%|███▏      | 4763/15001 [3:02:32<5:06:39,  1.80s/it, loss=0.162, lr=1e-5]Steps:  32%|███▏      | 4763/15001 [3:02:32<5:06:39,  1.80s/it, loss=0.194, lr=1e-5]Steps:  32%|███▏      | 4764/15001 [3:02:34<4:57:13,  1.74s/it, loss=0.194, lr=1e-5]Steps:  32%|███▏      | 4764/15001 [3:02:34<4:57:13,  1.74s/it, loss=0.107, lr=1e-5]Steps:  32%|███▏      | 4765/15001 [3:02:36<5:12:47,  1.83s/it, loss=0.107, lr=1e-5]Steps:  32%|███▏      | 4765/15001 [3:02:36<5:12:47,  1.83s/it, loss=0.126, lr=1e-5]Steps:  32%|███▏      | 4766/15001 [3:02:38<5:10:03,  1.82s/it, loss=0.126, lr=1e-5]Steps:  32%|███▏      | 4766/15001 [3:02:38<5:10:03,  1.82s/it, loss=0.184, lr=1e-5]Steps:  32%|███▏      | 4767/15001 [3:02:40<5:16:18,  1.85s/it, loss=0.184, lr=1e-5]Steps:  32%|███▏      | 4767/15001 [3:02:40<5:16:18,  1.85s/it, loss=0.124, lr=1e-5]Steps:  32%|███▏      | 4768/15001 [3:02:41<5:03:45,  1.78s/it, loss=0.124, lr=1e-5]Steps:  32%|███▏      | 4768/15001 [3:02:42<5:03:45,  1.78s/it, loss=0.151, lr=1e-5]Steps:  32%|███▏      | 4769/15001 [3:02:44<5:36:15,  1.97s/it, loss=0.151, lr=1e-5]Steps:  32%|███▏      | 4769/15001 [3:02:44<5:36:15,  1.97s/it, loss=0.0864, lr=1e-5]Steps:  32%|███▏      | 4770/15001 [3:02:46<5:35:26,  1.97s/it, loss=0.0864, lr=1e-5]Steps:  32%|███▏      | 4770/15001 [3:02:46<5:35:26,  1.97s/it, loss=0.258, lr=1e-5] Steps:  32%|███▏      | 4771/15001 [3:02:48<5:40:34,  2.00s/it, loss=0.258, lr=1e-5]Steps:  32%|███▏      | 4771/15001 [3:02:48<5:40:34,  2.00s/it, loss=0.183, lr=1e-5]Steps:  32%|███▏      | 4772/15001 [3:02:50<5:35:19,  1.97s/it, loss=0.183, lr=1e-5]Steps:  32%|███▏      | 4772/15001 [3:02:50<5:35:19,  1.97s/it, loss=0.161, lr=1e-5]Steps:  32%|███▏      | 4773/15001 [3:02:51<5:32:37,  1.95s/it, loss=0.161, lr=1e-5]Steps:  32%|███▏      | 4773/15001 [3:02:52<5:32:37,  1.95s/it, loss=0.00853, lr=1e-5]Steps:  32%|███▏      | 4774/15001 [3:02:53<5:26:31,  1.92s/it, loss=0.00853, lr=1e-5]Steps:  32%|███▏      | 4774/15001 [3:02:53<5:26:31,  1.92s/it, loss=0.0584, lr=1e-5] Steps:  32%|███▏      | 4775/15001 [3:02:55<5:17:37,  1.86s/it, loss=0.0584, lr=1e-5]Steps:  32%|███▏      | 4775/15001 [3:02:55<5:17:37,  1.86s/it, loss=0.173, lr=1e-5] Steps:  32%|███▏      | 4776/15001 [3:02:57<5:15:19,  1.85s/it, loss=0.173, lr=1e-5]Steps:  32%|███▏      | 4776/15001 [3:02:57<5:15:19,  1.85s/it, loss=0.217, lr=1e-5]Steps:  32%|███▏      | 4777/15001 [3:02:59<5:19:43,  1.88s/it, loss=0.217, lr=1e-5]Steps:  32%|███▏      | 4777/15001 [3:02:59<5:19:43,  1.88s/it, loss=0.253, lr=1e-5]Steps:  32%|███▏      | 4778/15001 [3:03:01<5:13:28,  1.84s/it, loss=0.253, lr=1e-5]Steps:  32%|███▏      | 4778/15001 [3:03:01<5:13:28,  1.84s/it, loss=0.163, lr=1e-5]Steps:  32%|███▏      | 4779/15001 [3:03:02<5:06:54,  1.80s/it, loss=0.163, lr=1e-5]Steps:  32%|███▏      | 4779/15001 [3:03:03<5:06:54,  1.80s/it, loss=0.144, lr=1e-5]Steps:  32%|███▏      | 4780/15001 [3:03:04<5:06:16,  1.80s/it, loss=0.144, lr=1e-5]Steps:  32%|███▏      | 4780/15001 [3:03:04<5:06:16,  1.80s/it, loss=0.2, lr=1e-5]  Steps:  32%|███▏      | 4781/15001 [3:03:06<5:16:26,  1.86s/it, loss=0.2, lr=1e-5]Steps:  32%|███▏      | 4781/15001 [3:03:06<5:16:26,  1.86s/it, loss=0.186, lr=1e-5]Steps:  32%|███▏      | 4782/15001 [3:03:08<5:05:42,  1.79s/it, loss=0.186, lr=1e-5]Steps:  32%|███▏      | 4782/15001 [3:03:08<5:05:42,  1.79s/it, loss=0.341, lr=1e-5]Steps:  32%|███▏      | 4783/15001 [3:03:10<5:14:12,  1.85s/it, loss=0.341, lr=1e-5]Steps:  32%|███▏      | 4783/15001 [3:03:10<5:14:12,  1.85s/it, loss=0.18, lr=1e-5] Steps:  32%|███▏      | 4784/15001 [3:03:11<5:12:34,  1.84s/it, loss=0.18, lr=1e-5]Steps:  32%|███▏      | 4784/15001 [3:03:12<5:12:34,  1.84s/it, loss=0.166, lr=1e-5]Steps:  32%|███▏      | 4785/15001 [3:03:13<5:12:58,  1.84s/it, loss=0.166, lr=1e-5]Steps:  32%|███▏      | 4785/15001 [3:03:14<5:12:58,  1.84s/it, loss=0.143, lr=1e-5]Steps:  32%|███▏      | 4786/15001 [3:03:15<5:16:55,  1.86s/it, loss=0.143, lr=1e-5]Steps:  32%|███▏      | 4786/15001 [3:03:15<5:16:55,  1.86s/it, loss=0.138, lr=1e-5]Steps:  32%|███▏      | 4787/15001 [3:03:17<5:14:57,  1.85s/it, loss=0.138, lr=1e-5]Steps:  32%|███▏      | 4787/15001 [3:03:17<5:14:57,  1.85s/it, loss=0.236, lr=1e-5]Steps:  32%|███▏      | 4788/15001 [3:03:19<5:11:10,  1.83s/it, loss=0.236, lr=1e-5]Steps:  32%|███▏      | 4788/15001 [3:03:19<5:11:10,  1.83s/it, loss=0.283, lr=1e-5]Steps:  32%|███▏      | 4789/15001 [3:03:21<5:03:43,  1.78s/it, loss=0.283, lr=1e-5]Steps:  32%|███▏      | 4789/15001 [3:03:21<5:03:43,  1.78s/it, loss=0.164, lr=1e-5]Steps:  32%|███▏      | 4790/15001 [3:03:23<5:13:28,  1.84s/it, loss=0.164, lr=1e-5]Steps:  32%|███▏      | 4790/15001 [3:03:23<5:13:28,  1.84s/it, loss=0.0242, lr=1e-5]Steps:  32%|███▏      | 4791/15001 [3:03:24<5:14:37,  1.85s/it, loss=0.0242, lr=1e-5]Steps:  32%|███▏      | 4791/15001 [3:03:25<5:14:37,  1.85s/it, loss=0.124, lr=1e-5] Steps:  32%|███▏      | 4792/15001 [3:03:26<5:24:23,  1.91s/it, loss=0.124, lr=1e-5]Steps:  32%|███▏      | 4792/15001 [3:03:27<5:24:23,  1.91s/it, loss=0.11, lr=1e-5] Steps:  32%|███▏      | 4793/15001 [3:03:28<5:30:53,  1.94s/it, loss=0.11, lr=1e-5]Steps:  32%|███▏      | 4793/15001 [3:03:29<5:30:53,  1.94s/it, loss=0.146, lr=1e-5]Steps:  32%|███▏      | 4794/15001 [3:03:31<5:43:13,  2.02s/it, loss=0.146, lr=1e-5]Steps:  32%|███▏      | 4794/15001 [3:03:31<5:43:13,  2.02s/it, loss=0.116, lr=1e-5]Steps:  32%|███▏      | 4795/15001 [3:03:33<5:45:31,  2.03s/it, loss=0.116, lr=1e-5]Steps:  32%|███▏      | 4795/15001 [3:03:33<5:45:31,  2.03s/it, loss=0.144, lr=1e-5]Steps:  32%|███▏      | 4796/15001 [3:03:35<5:56:16,  2.09s/it, loss=0.144, lr=1e-5]Steps:  32%|███▏      | 4796/15001 [3:03:35<5:56:16,  2.09s/it, loss=0.127, lr=1e-5]Steps:  32%|███▏      | 4797/15001 [3:03:37<5:33:08,  1.96s/it, loss=0.127, lr=1e-5]Steps:  32%|███▏      | 4797/15001 [3:03:37<5:33:08,  1.96s/it, loss=0.115, lr=1e-5]Steps:  32%|███▏      | 4798/15001 [3:03:38<5:27:32,  1.93s/it, loss=0.115, lr=1e-5]Steps:  32%|███▏      | 4798/15001 [3:03:39<5:27:32,  1.93s/it, loss=0.157, lr=1e-5]Steps:  32%|███▏      | 4799/15001 [3:03:40<5:23:02,  1.90s/it, loss=0.157, lr=1e-5]Steps:  32%|███▏      | 4799/15001 [3:03:41<5:23:02,  1.90s/it, loss=0.081, lr=1e-5]Steps:  32%|███▏      | 4800/15001 [3:03:42<5:30:55,  1.95s/it, loss=0.081, lr=1e-5]Steps:  32%|███▏      | 4800/15001 [3:03:42<5:30:55,  1.95s/it, loss=0.203, lr=1e-5]Steps:  32%|███▏      | 4801/15001 [3:03:44<5:17:22,  1.87s/it, loss=0.203, lr=1e-5]Steps:  32%|███▏      | 4801/15001 [3:03:44<5:17:22,  1.87s/it, loss=0.0467, lr=1e-5]Steps:  32%|███▏      | 4802/15001 [3:03:46<5:19:23,  1.88s/it, loss=0.0467, lr=1e-5]Steps:  32%|███▏      | 4802/15001 [3:03:46<5:19:23,  1.88s/it, loss=0.148, lr=1e-5] Steps:  32%|███▏      | 4803/15001 [3:03:48<5:11:54,  1.84s/it, loss=0.148, lr=1e-5]Steps:  32%|███▏      | 4803/15001 [3:03:48<5:11:54,  1.84s/it, loss=0.0935, lr=1e-5]Steps:  32%|███▏      | 4804/15001 [3:03:49<5:12:10,  1.84s/it, loss=0.0935, lr=1e-5]Steps:  32%|███▏      | 4804/15001 [3:03:50<5:12:10,  1.84s/it, loss=0.129, lr=1e-5] Steps:  32%|███▏      | 4805/15001 [3:03:51<5:13:34,  1.85s/it, loss=0.129, lr=1e-5]Steps:  32%|███▏      | 4805/15001 [3:03:51<5:13:34,  1.85s/it, loss=0.0268, lr=1e-5]Steps:  32%|███▏      | 4806/15001 [3:03:53<5:14:48,  1.85s/it, loss=0.0268, lr=1e-5]Steps:  32%|███▏      | 4806/15001 [3:03:53<5:14:48,  1.85s/it, loss=0.25, lr=1e-5]  Steps:  32%|███▏      | 4807/15001 [3:03:55<5:09:39,  1.82s/it, loss=0.25, lr=1e-5]Steps:  32%|███▏      | 4807/15001 [3:03:55<5:09:39,  1.82s/it, loss=0.137, lr=1e-5]Steps:  32%|███▏      | 4808/15001 [3:03:57<5:08:51,  1.82s/it, loss=0.137, lr=1e-5]Steps:  32%|███▏      | 4808/15001 [3:03:57<5:08:51,  1.82s/it, loss=0.0871, lr=1e-5]Steps:  32%|███▏      | 4809/15001 [3:03:59<5:05:32,  1.80s/it, loss=0.0871, lr=1e-5]Steps:  32%|███▏      | 4809/15001 [3:03:59<5:05:32,  1.80s/it, loss=0.196, lr=1e-5] Steps:  32%|███▏      | 4810/15001 [3:04:00<5:11:39,  1.83s/it, loss=0.196, lr=1e-5]Steps:  32%|███▏      | 4810/15001 [3:04:01<5:11:39,  1.83s/it, loss=0.234, lr=1e-5]Steps:  32%|███▏      | 4811/15001 [3:04:02<5:12:17,  1.84s/it, loss=0.234, lr=1e-5]Steps:  32%|███▏      | 4811/15001 [3:04:03<5:12:17,  1.84s/it, loss=0.169, lr=1e-5]Steps:  32%|███▏      | 4812/15001 [3:04:04<5:13:48,  1.85s/it, loss=0.169, lr=1e-5]Steps:  32%|███▏      | 4812/15001 [3:04:04<5:13:48,  1.85s/it, loss=0.197, lr=1e-5]Steps:  32%|███▏      | 4813/15001 [3:04:06<5:11:34,  1.83s/it, loss=0.197, lr=1e-5]Steps:  32%|███▏      | 4813/15001 [3:04:06<5:11:34,  1.83s/it, loss=0.116, lr=1e-5]Steps:  32%|███▏      | 4814/15001 [3:04:08<5:20:45,  1.89s/it, loss=0.116, lr=1e-5]Steps:  32%|███▏      | 4814/15001 [3:04:08<5:20:45,  1.89s/it, loss=0.167, lr=1e-5]Steps:  32%|███▏      | 4815/15001 [3:04:10<5:38:39,  1.99s/it, loss=0.167, lr=1e-5]Steps:  32%|███▏      | 4815/15001 [3:04:10<5:38:39,  1.99s/it, loss=0.125, lr=1e-5]Steps:  32%|███▏      | 4816/15001 [3:04:12<5:36:59,  1.99s/it, loss=0.125, lr=1e-5]Steps:  32%|███▏      | 4816/15001 [3:04:12<5:36:59,  1.99s/it, loss=0.134, lr=1e-5]Steps:  32%|███▏      | 4817/15001 [3:04:14<5:35:48,  1.98s/it, loss=0.134, lr=1e-5]Steps:  32%|███▏      | 4817/15001 [3:04:14<5:35:48,  1.98s/it, loss=0.223, lr=1e-5]Steps:  32%|███▏      | 4818/15001 [3:04:16<5:32:25,  1.96s/it, loss=0.223, lr=1e-5]Steps:  32%|███▏      | 4818/15001 [3:04:16<5:32:25,  1.96s/it, loss=0.314, lr=1e-5]Steps:  32%|███▏      | 4819/15001 [3:04:18<5:32:58,  1.96s/it, loss=0.314, lr=1e-5]Steps:  32%|███▏      | 4819/15001 [3:04:18<5:32:58,  1.96s/it, loss=0.13, lr=1e-5] Steps:  32%|███▏      | 4820/15001 [3:04:20<5:25:55,  1.92s/it, loss=0.13, lr=1e-5]Steps:  32%|███▏      | 4820/15001 [3:04:20<5:25:55,  1.92s/it, loss=0.125, lr=1e-5]Steps:  32%|███▏      | 4821/15001 [3:04:22<5:11:47,  1.84s/it, loss=0.125, lr=1e-5]Steps:  32%|███▏      | 4821/15001 [3:04:22<5:11:47,  1.84s/it, loss=0.141, lr=1e-5]Steps:  32%|███▏      | 4822/15001 [3:04:23<5:13:14,  1.85s/it, loss=0.141, lr=1e-5]Steps:  32%|███▏      | 4822/15001 [3:04:24<5:13:14,  1.85s/it, loss=0.189, lr=1e-5]Steps:  32%|███▏      | 4823/15001 [3:04:25<5:11:49,  1.84s/it, loss=0.189, lr=1e-5]Steps:  32%|███▏      | 4823/15001 [3:04:25<5:11:49,  1.84s/it, loss=0.239, lr=1e-5]Steps:  32%|███▏      | 4824/15001 [3:04:27<5:15:16,  1.86s/it, loss=0.239, lr=1e-5]Steps:  32%|███▏      | 4824/15001 [3:04:27<5:15:16,  1.86s/it, loss=0.126, lr=1e-5]Steps:  32%|███▏      | 4825/15001 [3:04:29<5:05:34,  1.80s/it, loss=0.126, lr=1e-5]Steps:  32%|███▏      | 4825/15001 [3:04:29<5:05:34,  1.80s/it, loss=0.116, lr=1e-5]Steps:  32%|███▏      | 4826/15001 [3:04:31<5:22:05,  1.90s/it, loss=0.116, lr=1e-5]Steps:  32%|███▏      | 4826/15001 [3:04:31<5:22:05,  1.90s/it, loss=0.0961, lr=1e-5]Steps:  32%|███▏      | 4827/15001 [3:04:33<5:11:07,  1.83s/it, loss=0.0961, lr=1e-5]Steps:  32%|███▏      | 4827/15001 [3:04:33<5:11:07,  1.83s/it, loss=0.0324, lr=1e-5]Steps:  32%|███▏      | 4828/15001 [3:04:35<5:19:54,  1.89s/it, loss=0.0324, lr=1e-5]Steps:  32%|███▏      | 4828/15001 [3:04:35<5:19:54,  1.89s/it, loss=0.3, lr=1e-5]   Steps:  32%|███▏      | 4829/15001 [3:04:36<5:10:27,  1.83s/it, loss=0.3, lr=1e-5]Steps:  32%|███▏      | 4829/15001 [3:04:37<5:10:27,  1.83s/it, loss=0.0452, lr=1e-5]Steps:  32%|███▏      | 4830/15001 [3:04:38<5:05:33,  1.80s/it, loss=0.0452, lr=1e-5]Steps:  32%|███▏      | 4830/15001 [3:04:38<5:05:33,  1.80s/it, loss=0.21, lr=1e-5]  Steps:  32%|███▏      | 4831/15001 [3:04:40<5:20:04,  1.89s/it, loss=0.21, lr=1e-5]Steps:  32%|███▏      | 4831/15001 [3:04:40<5:20:04,  1.89s/it, loss=0.0273, lr=1e-5]Steps:  32%|███▏      | 4832/15001 [3:04:42<5:20:01,  1.89s/it, loss=0.0273, lr=1e-5]Steps:  32%|███▏      | 4832/15001 [3:04:42<5:20:01,  1.89s/it, loss=0.0902, lr=1e-5]Steps:  32%|███▏      | 4833/15001 [3:04:44<5:12:40,  1.85s/it, loss=0.0902, lr=1e-5]Steps:  32%|███▏      | 4833/15001 [3:04:44<5:12:40,  1.85s/it, loss=0.0655, lr=1e-5]Steps:  32%|███▏      | 4834/15001 [3:04:46<5:11:40,  1.84s/it, loss=0.0655, lr=1e-5]Steps:  32%|███▏      | 4834/15001 [3:04:46<5:11:40,  1.84s/it, loss=0.121, lr=1e-5] Steps:  32%|███▏      | 4835/15001 [3:04:47<5:12:09,  1.84s/it, loss=0.121, lr=1e-5]Steps:  32%|███▏      | 4835/15001 [3:04:48<5:12:09,  1.84s/it, loss=0.118, lr=1e-5]Steps:  32%|███▏      | 4836/15001 [3:04:49<5:21:38,  1.90s/it, loss=0.118, lr=1e-5]Steps:  32%|███▏      | 4836/15001 [3:04:50<5:21:38,  1.90s/it, loss=0.21, lr=1e-5] Steps:  32%|███▏      | 4837/15001 [3:04:51<5:20:48,  1.89s/it, loss=0.21, lr=1e-5]Steps:  32%|███▏      | 4837/15001 [3:04:51<5:20:48,  1.89s/it, loss=0.3, lr=1e-5] Steps:  32%|███▏      | 4838/15001 [3:04:53<5:27:06,  1.93s/it, loss=0.3, lr=1e-5]Steps:  32%|███▏      | 4838/15001 [3:04:53<5:27:06,  1.93s/it, loss=0.125, lr=1e-5]Steps:  32%|███▏      | 4839/15001 [3:04:55<5:20:31,  1.89s/it, loss=0.125, lr=1e-5]Steps:  32%|███▏      | 4839/15001 [3:04:55<5:20:31,  1.89s/it, loss=0.0904, lr=1e-5]Steps:  32%|███▏      | 4840/15001 [3:04:57<5:18:52,  1.88s/it, loss=0.0904, lr=1e-5]Steps:  32%|███▏      | 4840/15001 [3:04:57<5:18:52,  1.88s/it, loss=0.165, lr=1e-5] Steps:  32%|███▏      | 4841/15001 [3:04:59<5:33:56,  1.97s/it, loss=0.165, lr=1e-5]Steps:  32%|███▏      | 4841/15001 [3:05:00<5:33:56,  1.97s/it, loss=0.299, lr=1e-5]Steps:  32%|███▏      | 4842/15001 [3:05:01<5:28:36,  1.94s/it, loss=0.299, lr=1e-5]Steps:  32%|███▏      | 4842/15001 [3:05:01<5:28:36,  1.94s/it, loss=0.25, lr=1e-5] Steps:  32%|███▏      | 4843/15001 [3:05:03<5:19:53,  1.89s/it, loss=0.25, lr=1e-5]Steps:  32%|███▏      | 4843/15001 [3:05:03<5:19:53,  1.89s/it, loss=0.193, lr=1e-5]Steps:  32%|███▏      | 4844/15001 [3:05:05<5:26:12,  1.93s/it, loss=0.193, lr=1e-5]Steps:  32%|███▏      | 4844/15001 [3:05:05<5:26:12,  1.93s/it, loss=0.127, lr=1e-5]Steps:  32%|███▏      | 4845/15001 [3:05:07<5:31:08,  1.96s/it, loss=0.127, lr=1e-5]Steps:  32%|███▏      | 4845/15001 [3:05:07<5:31:08,  1.96s/it, loss=0.25, lr=1e-5] Steps:  32%|███▏      | 4846/15001 [3:05:09<5:20:48,  1.90s/it, loss=0.25, lr=1e-5]Steps:  32%|███▏      | 4846/15001 [3:05:09<5:20:48,  1.90s/it, loss=0.105, lr=1e-5]Steps:  32%|███▏      | 4847/15001 [3:05:10<5:08:20,  1.82s/it, loss=0.105, lr=1e-5]Steps:  32%|███▏      | 4847/15001 [3:05:11<5:08:20,  1.82s/it, loss=0.117, lr=1e-5]Steps:  32%|███▏      | 4848/15001 [3:05:12<5:16:24,  1.87s/it, loss=0.117, lr=1e-5]Steps:  32%|███▏      | 4848/15001 [3:05:12<5:16:24,  1.87s/it, loss=0.178, lr=1e-5]Steps:  32%|███▏      | 4849/15001 [3:05:14<5:19:36,  1.89s/it, loss=0.178, lr=1e-5]Steps:  32%|███▏      | 4849/15001 [3:05:14<5:19:36,  1.89s/it, loss=0.268, lr=1e-5]Steps:  32%|███▏      | 4850/15001 [3:05:16<5:13:54,  1.86s/it, loss=0.268, lr=1e-5]Steps:  32%|███▏      | 4850/15001 [3:05:16<5:13:54,  1.86s/it, loss=0.188, lr=1e-5]Steps:  32%|███▏      | 4851/15001 [3:05:18<5:10:38,  1.84s/it, loss=0.188, lr=1e-5]Steps:  32%|███▏      | 4851/15001 [3:05:18<5:10:38,  1.84s/it, loss=0.123, lr=1e-5]Steps:  32%|███▏      | 4852/15001 [3:05:19<5:03:45,  1.80s/it, loss=0.123, lr=1e-5]Steps:  32%|███▏      | 4852/15001 [3:05:20<5:03:45,  1.80s/it, loss=0.178, lr=1e-5]Steps:  32%|███▏      | 4853/15001 [3:05:21<5:06:14,  1.81s/it, loss=0.178, lr=1e-5]Steps:  32%|███▏      | 4853/15001 [3:05:21<5:06:14,  1.81s/it, loss=0.267, lr=1e-5]Steps:  32%|███▏      | 4854/15001 [3:05:23<5:04:23,  1.80s/it, loss=0.267, lr=1e-5]Steps:  32%|███▏      | 4854/15001 [3:05:23<5:04:23,  1.80s/it, loss=0.315, lr=1e-5]Steps:  32%|███▏      | 4855/15001 [3:05:25<5:09:11,  1.83s/it, loss=0.315, lr=1e-5]Steps:  32%|███▏      | 4855/15001 [3:05:25<5:09:11,  1.83s/it, loss=0.12, lr=1e-5] Steps:  32%|███▏      | 4856/15001 [3:05:27<5:22:37,  1.91s/it, loss=0.12, lr=1e-5]Steps:  32%|███▏      | 4856/15001 [3:05:27<5:22:37,  1.91s/it, loss=0.281, lr=1e-5]Steps:  32%|███▏      | 4857/15001 [3:05:29<5:15:16,  1.86s/it, loss=0.281, lr=1e-5]Steps:  32%|███▏      | 4857/15001 [3:05:29<5:15:16,  1.86s/it, loss=0.246, lr=1e-5]Steps:  32%|███▏      | 4858/15001 [3:05:30<5:04:36,  1.80s/it, loss=0.246, lr=1e-5]Steps:  32%|███▏      | 4858/15001 [3:05:31<5:04:36,  1.80s/it, loss=0.154, lr=1e-5]Steps:  32%|███▏      | 4859/15001 [3:05:32<5:11:15,  1.84s/it, loss=0.154, lr=1e-5]Steps:  32%|███▏      | 4859/15001 [3:05:33<5:11:15,  1.84s/it, loss=0.195, lr=1e-5]Steps:  32%|███▏      | 4860/15001 [3:05:34<5:21:42,  1.90s/it, loss=0.195, lr=1e-5]Steps:  32%|███▏      | 4860/15001 [3:05:35<5:21:42,  1.90s/it, loss=0.11, lr=1e-5] Steps:  32%|███▏      | 4861/15001 [3:05:37<5:35:18,  1.98s/it, loss=0.11, lr=1e-5]Steps:  32%|███▏      | 4861/15001 [3:05:37<5:35:18,  1.98s/it, loss=0.104, lr=1e-5]Steps:  32%|███▏      | 4862/15001 [3:05:38<5:21:09,  1.90s/it, loss=0.104, lr=1e-5]Steps:  32%|███▏      | 4862/15001 [3:05:39<5:21:09,  1.90s/it, loss=0.288, lr=1e-5]Steps:  32%|███▏      | 4863/15001 [3:05:40<5:31:20,  1.96s/it, loss=0.288, lr=1e-5]Steps:  32%|███▏      | 4863/15001 [3:05:41<5:31:20,  1.96s/it, loss=0.11, lr=1e-5] Steps:  32%|███▏      | 4864/15001 [3:05:42<5:30:03,  1.95s/it, loss=0.11, lr=1e-5]Steps:  32%|███▏      | 4864/15001 [3:05:43<5:30:03,  1.95s/it, loss=0.228, lr=1e-5]Steps:  32%|███▏      | 4865/15001 [3:05:44<5:33:17,  1.97s/it, loss=0.228, lr=1e-5]Steps:  32%|███▏      | 4865/15001 [3:05:45<5:33:17,  1.97s/it, loss=0.148, lr=1e-5]Steps:  32%|███▏      | 4866/15001 [3:05:46<5:21:05,  1.90s/it, loss=0.148, lr=1e-5]Steps:  32%|███▏      | 4866/15001 [3:05:46<5:21:05,  1.90s/it, loss=0.324, lr=1e-5]Steps:  32%|███▏      | 4867/15001 [3:05:48<5:24:34,  1.92s/it, loss=0.324, lr=1e-5]Steps:  32%|███▏      | 4867/15001 [3:05:48<5:24:34,  1.92s/it, loss=0.136, lr=1e-5]Steps:  32%|███▏      | 4868/15001 [3:05:50<5:16:56,  1.88s/it, loss=0.136, lr=1e-5]Steps:  32%|███▏      | 4868/15001 [3:05:50<5:16:56,  1.88s/it, loss=0.0989, lr=1e-5]Steps:  32%|███▏      | 4869/15001 [3:05:52<5:11:11,  1.84s/it, loss=0.0989, lr=1e-5]Steps:  32%|███▏      | 4869/15001 [3:05:52<5:11:11,  1.84s/it, loss=0.0873, lr=1e-5]Steps:  32%|███▏      | 4870/15001 [3:05:53<5:03:02,  1.79s/it, loss=0.0873, lr=1e-5]Steps:  32%|███▏      | 4870/15001 [3:05:54<5:03:02,  1.79s/it, loss=0.0899, lr=1e-5]Steps:  32%|███▏      | 4871/15001 [3:05:55<5:07:41,  1.82s/it, loss=0.0899, lr=1e-5]Steps:  32%|███▏      | 4871/15001 [3:05:55<5:07:41,  1.82s/it, loss=0.304, lr=1e-5] Steps:  32%|███▏      | 4872/15001 [3:05:57<5:14:07,  1.86s/it, loss=0.304, lr=1e-5]Steps:  32%|███▏      | 4872/15001 [3:05:57<5:14:07,  1.86s/it, loss=0.119, lr=1e-5]Steps:  32%|███▏      | 4873/15001 [3:05:59<5:09:18,  1.83s/it, loss=0.119, lr=1e-5]Steps:  32%|███▏      | 4873/15001 [3:05:59<5:09:18,  1.83s/it, loss=0.438, lr=1e-5]Steps:  32%|███▏      | 4874/15001 [3:06:01<5:06:04,  1.81s/it, loss=0.438, lr=1e-5]Steps:  32%|███▏      | 4874/15001 [3:06:01<5:06:04,  1.81s/it, loss=0.168, lr=1e-5]Steps:  32%|███▏      | 4875/15001 [3:06:02<5:05:06,  1.81s/it, loss=0.168, lr=1e-5]Steps:  32%|███▏      | 4875/15001 [3:06:03<5:05:06,  1.81s/it, loss=0.146, lr=1e-5]Steps:  33%|███▎      | 4876/15001 [3:06:05<5:17:20,  1.88s/it, loss=0.146, lr=1e-5]Steps:  33%|███▎      | 4876/15001 [3:06:05<5:17:20,  1.88s/it, loss=0.12, lr=1e-5] Steps:  33%|███▎      | 4877/15001 [3:06:06<5:09:41,  1.84s/it, loss=0.12, lr=1e-5]Steps:  33%|███▎      | 4877/15001 [3:06:06<5:09:41,  1.84s/it, loss=0.0248, lr=1e-5]Steps:  33%|███▎      | 4878/15001 [3:06:08<5:09:56,  1.84s/it, loss=0.0248, lr=1e-5]Steps:  33%|███▎      | 4878/15001 [3:06:08<5:09:56,  1.84s/it, loss=0.171, lr=1e-5] Steps:  33%|███▎      | 4879/15001 [3:06:10<5:15:15,  1.87s/it, loss=0.171, lr=1e-5]Steps:  33%|███▎      | 4879/15001 [3:06:10<5:15:15,  1.87s/it, loss=0.174, lr=1e-5]Steps:  33%|███▎      | 4880/15001 [3:06:12<5:16:46,  1.88s/it, loss=0.174, lr=1e-5]Steps:  33%|███▎      | 4880/15001 [3:06:12<5:16:46,  1.88s/it, loss=0.211, lr=1e-5]Steps:  33%|███▎      | 4881/15001 [3:06:14<5:18:03,  1.89s/it, loss=0.211, lr=1e-5]Steps:  33%|███▎      | 4881/15001 [3:06:14<5:18:03,  1.89s/it, loss=0.316, lr=1e-5]Steps:  33%|███▎      | 4882/15001 [3:06:16<5:22:47,  1.91s/it, loss=0.316, lr=1e-5]Steps:  33%|███▎      | 4882/15001 [3:06:16<5:22:47,  1.91s/it, loss=0.111, lr=1e-5]Steps:  33%|███▎      | 4883/15001 [3:06:18<5:19:13,  1.89s/it, loss=0.111, lr=1e-5]Steps:  33%|███▎      | 4883/15001 [3:06:18<5:19:13,  1.89s/it, loss=0.153, lr=1e-5]Steps:  33%|███▎      | 4884/15001 [3:06:20<5:27:57,  1.94s/it, loss=0.153, lr=1e-5]Steps:  33%|███▎      | 4884/15001 [3:06:20<5:27:57,  1.94s/it, loss=0.111, lr=1e-5]Steps:  33%|███▎      | 4885/15001 [3:06:22<5:27:25,  1.94s/it, loss=0.111, lr=1e-5]Steps:  33%|███▎      | 4885/15001 [3:06:22<5:27:25,  1.94s/it, loss=0.0621, lr=1e-5]Steps:  33%|███▎      | 4886/15001 [3:06:24<5:29:57,  1.96s/it, loss=0.0621, lr=1e-5]Steps:  33%|███▎      | 4886/15001 [3:06:24<5:29:57,  1.96s/it, loss=0.166, lr=1e-5] Steps:  33%|███▎      | 4887/15001 [3:06:26<5:27:31,  1.94s/it, loss=0.166, lr=1e-5]Steps:  33%|███▎      | 4887/15001 [3:06:26<5:27:31,  1.94s/it, loss=0.164, lr=1e-5]Steps:  33%|███▎      | 4888/15001 [3:06:27<5:20:33,  1.90s/it, loss=0.164, lr=1e-5]Steps:  33%|███▎      | 4888/15001 [3:06:28<5:20:33,  1.90s/it, loss=0.16, lr=1e-5] Steps:  33%|███▎      | 4889/15001 [3:06:29<5:12:26,  1.85s/it, loss=0.16, lr=1e-5]Steps:  33%|███▎      | 4889/15001 [3:06:29<5:12:26,  1.85s/it, loss=0.0869, lr=1e-5]Steps:  33%|███▎      | 4890/15001 [3:06:31<5:09:40,  1.84s/it, loss=0.0869, lr=1e-5]Steps:  33%|███▎      | 4890/15001 [3:06:31<5:09:40,  1.84s/it, loss=0.217, lr=1e-5] Steps:  33%|███▎      | 4891/15001 [3:06:33<5:02:23,  1.79s/it, loss=0.217, lr=1e-5]Steps:  33%|███▎      | 4891/15001 [3:06:33<5:02:23,  1.79s/it, loss=0.111, lr=1e-5]Steps:  33%|███▎      | 4892/15001 [3:06:35<5:09:24,  1.84s/it, loss=0.111, lr=1e-5]Steps:  33%|███▎      | 4892/15001 [3:06:35<5:09:24,  1.84s/it, loss=0.222, lr=1e-5]Steps:  33%|███▎      | 4893/15001 [3:06:37<5:14:53,  1.87s/it, loss=0.222, lr=1e-5]Steps:  33%|███▎      | 4893/15001 [3:06:37<5:14:53,  1.87s/it, loss=0.185, lr=1e-5]Steps:  33%|███▎      | 4894/15001 [3:06:38<5:12:52,  1.86s/it, loss=0.185, lr=1e-5]Steps:  33%|███▎      | 4894/15001 [3:06:38<5:12:52,  1.86s/it, loss=0.169, lr=1e-5]Steps:  33%|███▎      | 4895/15001 [3:06:40<5:04:46,  1.81s/it, loss=0.169, lr=1e-5]Steps:  33%|███▎      | 4895/15001 [3:06:40<5:04:46,  1.81s/it, loss=0.0612, lr=1e-5]Steps:  33%|███▎      | 4896/15001 [3:06:42<5:01:52,  1.79s/it, loss=0.0612, lr=1e-5]Steps:  33%|███▎      | 4896/15001 [3:06:42<5:01:52,  1.79s/it, loss=0.117, lr=1e-5] Steps:  33%|███▎      | 4897/15001 [3:06:43<4:55:46,  1.76s/it, loss=0.117, lr=1e-5]Steps:  33%|███▎      | 4897/15001 [3:06:44<4:55:46,  1.76s/it, loss=0.25, lr=1e-5] Steps:  33%|███▎      | 4898/15001 [3:06:45<5:00:01,  1.78s/it, loss=0.25, lr=1e-5]Steps:  33%|███▎      | 4898/15001 [3:06:46<5:00:01,  1.78s/it, loss=0.222, lr=1e-5]Steps:  33%|███▎      | 4899/15001 [3:06:47<5:10:40,  1.85s/it, loss=0.222, lr=1e-5]Steps:  33%|███▎      | 4899/15001 [3:06:48<5:10:40,  1.85s/it, loss=0.046, lr=1e-5]Steps:  33%|███▎      | 4900/15001 [3:06:49<5:13:18,  1.86s/it, loss=0.046, lr=1e-5]Steps:  33%|███▎      | 4900/15001 [3:06:49<5:13:18,  1.86s/it, loss=0.133, lr=1e-5]Steps:  33%|███▎      | 4901/15001 [3:06:51<5:20:59,  1.91s/it, loss=0.133, lr=1e-5]Steps:  33%|███▎      | 4901/15001 [3:06:51<5:20:59,  1.91s/it, loss=0.0976, lr=1e-5]Steps:  33%|███▎      | 4902/15001 [3:06:53<5:08:17,  1.83s/it, loss=0.0976, lr=1e-5]Steps:  33%|███▎      | 4902/15001 [3:06:53<5:08:17,  1.83s/it, loss=0.159, lr=1e-5] Steps:  33%|███▎      | 4903/15001 [3:06:55<5:02:00,  1.79s/it, loss=0.159, lr=1e-5]Steps:  33%|███▎      | 4903/15001 [3:06:55<5:02:00,  1.79s/it, loss=0.254, lr=1e-5]Steps:  33%|███▎      | 4904/15001 [3:06:56<5:05:27,  1.82s/it, loss=0.254, lr=1e-5]Steps:  33%|███▎      | 4904/15001 [3:06:57<5:05:27,  1.82s/it, loss=0.168, lr=1e-5]Steps:  33%|███▎      | 4905/15001 [3:06:59<5:23:47,  1.92s/it, loss=0.168, lr=1e-5]Steps:  33%|███▎      | 4905/15001 [3:06:59<5:23:47,  1.92s/it, loss=0.172, lr=1e-5]Steps:  33%|███▎      | 4906/15001 [3:07:00<5:10:48,  1.85s/it, loss=0.172, lr=1e-5]Steps:  33%|███▎      | 4906/15001 [3:07:01<5:10:48,  1.85s/it, loss=0.126, lr=1e-5]Steps:  33%|███▎      | 4907/15001 [3:07:03<5:47:42,  2.07s/it, loss=0.126, lr=1e-5]Steps:  33%|███▎      | 4907/15001 [3:07:03<5:47:42,  2.07s/it, loss=0.26, lr=1e-5] Steps:  33%|███▎      | 4908/15001 [3:07:05<5:35:41,  2.00s/it, loss=0.26, lr=1e-5]Steps:  33%|███▎      | 4908/15001 [3:07:05<5:35:41,  2.00s/it, loss=0.00484, lr=1e-5]Steps:  33%|███▎      | 4909/15001 [3:07:07<5:34:56,  1.99s/it, loss=0.00484, lr=1e-5]Steps:  33%|███▎      | 4909/15001 [3:07:07<5:34:56,  1.99s/it, loss=0.203, lr=1e-5]  Steps:  33%|███▎      | 4910/15001 [3:07:09<5:46:05,  2.06s/it, loss=0.203, lr=1e-5]Steps:  33%|███▎      | 4910/15001 [3:07:09<5:46:05,  2.06s/it, loss=0.11, lr=1e-5] Steps:  33%|███▎      | 4911/15001 [3:07:11<5:37:45,  2.01s/it, loss=0.11, lr=1e-5]Steps:  33%|███▎      | 4911/15001 [3:07:11<5:37:45,  2.01s/it, loss=0.183, lr=1e-5]Steps:  33%|███▎      | 4912/15001 [3:07:13<5:29:25,  1.96s/it, loss=0.183, lr=1e-5]Steps:  33%|███▎      | 4912/15001 [3:07:13<5:29:25,  1.96s/it, loss=0.173, lr=1e-5]Steps:  33%|███▎      | 4913/15001 [3:07:14<5:14:29,  1.87s/it, loss=0.173, lr=1e-5]Steps:  33%|███▎      | 4913/15001 [3:07:14<5:14:29,  1.87s/it, loss=0.106, lr=1e-5]Steps:  33%|███▎      | 4914/15001 [3:07:16<5:16:16,  1.88s/it, loss=0.106, lr=1e-5]Steps:  33%|███▎      | 4914/15001 [3:07:16<5:16:16,  1.88s/it, loss=0.353, lr=1e-5]Steps:  33%|███▎      | 4915/15001 [3:07:18<5:02:59,  1.80s/it, loss=0.353, lr=1e-5]Steps:  33%|███▎      | 4915/15001 [3:07:18<5:02:59,  1.80s/it, loss=0.0871, lr=1e-5]Steps:  33%|███▎      | 4916/15001 [3:07:20<5:08:37,  1.84s/it, loss=0.0871, lr=1e-5]Steps:  33%|███▎      | 4916/15001 [3:07:20<5:08:37,  1.84s/it, loss=0.124, lr=1e-5] Steps:  33%|███▎      | 4917/15001 [3:07:21<5:04:49,  1.81s/it, loss=0.124, lr=1e-5]Steps:  33%|███▎      | 4917/15001 [3:07:22<5:04:49,  1.81s/it, loss=0.272, lr=1e-5]Steps:  33%|███▎      | 4918/15001 [3:07:23<5:08:34,  1.84s/it, loss=0.272, lr=1e-5]Steps:  33%|███▎      | 4918/15001 [3:07:23<5:08:34,  1.84s/it, loss=0.139, lr=1e-5]Steps:  33%|███▎      | 4919/15001 [3:07:25<5:06:53,  1.83s/it, loss=0.139, lr=1e-5]Steps:  33%|███▎      | 4919/15001 [3:07:25<5:06:53,  1.83s/it, loss=0.196, lr=1e-5]Steps:  33%|███▎      | 4920/15001 [3:07:27<5:05:08,  1.82s/it, loss=0.196, lr=1e-5]Steps:  33%|███▎      | 4920/15001 [3:07:27<5:05:08,  1.82s/it, loss=0.128, lr=1e-5]Steps:  33%|███▎      | 4921/15001 [3:07:29<5:06:47,  1.83s/it, loss=0.128, lr=1e-5]Steps:  33%|███▎      | 4921/15001 [3:07:29<5:06:47,  1.83s/it, loss=0.122, lr=1e-5]Steps:  33%|███▎      | 4922/15001 [3:07:31<5:09:00,  1.84s/it, loss=0.122, lr=1e-5]Steps:  33%|███▎      | 4922/15001 [3:07:31<5:09:00,  1.84s/it, loss=0.257, lr=1e-5]Steps:  33%|███▎      | 4923/15001 [3:07:33<5:13:54,  1.87s/it, loss=0.257, lr=1e-5]Steps:  33%|███▎      | 4923/15001 [3:07:33<5:13:54,  1.87s/it, loss=0.165, lr=1e-5]Steps:  33%|███▎      | 4924/15001 [3:07:34<5:04:55,  1.82s/it, loss=0.165, lr=1e-5]Steps:  33%|███▎      | 4924/15001 [3:07:35<5:04:55,  1.82s/it, loss=0.182, lr=1e-5]Steps:  33%|███▎      | 4925/15001 [3:07:36<5:09:37,  1.84s/it, loss=0.182, lr=1e-5]Steps:  33%|███▎      | 4925/15001 [3:07:36<5:09:37,  1.84s/it, loss=0.056, lr=1e-5]Steps:  33%|███▎      | 4926/15001 [3:07:38<4:56:10,  1.76s/it, loss=0.056, lr=1e-5]Steps:  33%|███▎      | 4926/15001 [3:07:38<4:56:10,  1.76s/it, loss=0.161, lr=1e-5]Steps:  33%|███▎      | 4927/15001 [3:07:40<5:08:43,  1.84s/it, loss=0.161, lr=1e-5]Steps:  33%|███▎      | 4927/15001 [3:07:40<5:08:43,  1.84s/it, loss=0.338, lr=1e-5]Steps:  33%|███▎      | 4928/15001 [3:07:42<5:11:39,  1.86s/it, loss=0.338, lr=1e-5]Steps:  33%|███▎      | 4928/15001 [3:07:42<5:11:39,  1.86s/it, loss=0.204, lr=1e-5]Steps:  33%|███▎      | 4929/15001 [3:07:44<5:21:51,  1.92s/it, loss=0.204, lr=1e-5]Steps:  33%|███▎      | 4929/15001 [3:07:44<5:21:51,  1.92s/it, loss=0.183, lr=1e-5]Steps:  33%|███▎      | 4930/15001 [3:07:46<5:36:52,  2.01s/it, loss=0.183, lr=1e-5]Steps:  33%|███▎      | 4930/15001 [3:07:46<5:36:52,  2.01s/it, loss=0.172, lr=1e-5]Steps:  33%|███▎      | 4931/15001 [3:07:48<5:30:42,  1.97s/it, loss=0.172, lr=1e-5]Steps:  33%|███▎      | 4931/15001 [3:07:48<5:30:42,  1.97s/it, loss=0.127, lr=1e-5]Steps:  33%|███▎      | 4932/15001 [3:07:50<5:23:50,  1.93s/it, loss=0.127, lr=1e-5]Steps:  33%|███▎      | 4932/15001 [3:07:50<5:23:50,  1.93s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4933/15001 [3:07:52<5:32:26,  1.98s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4933/15001 [3:07:52<5:32:26,  1.98s/it, loss=0.0875, lr=1e-5]Steps:  33%|███▎      | 4934/15001 [3:07:54<5:19:08,  1.90s/it, loss=0.0875, lr=1e-5]Steps:  33%|███▎      | 4934/15001 [3:07:54<5:19:08,  1.90s/it, loss=0.0446, lr=1e-5]Steps:  33%|███▎      | 4935/15001 [3:07:56<5:29:53,  1.97s/it, loss=0.0446, lr=1e-5]Steps:  33%|███▎      | 4935/15001 [3:07:56<5:29:53,  1.97s/it, loss=0.258, lr=1e-5] Steps:  33%|███▎      | 4936/15001 [3:07:57<5:16:27,  1.89s/it, loss=0.258, lr=1e-5]Steps:  33%|███▎      | 4936/15001 [3:07:58<5:16:27,  1.89s/it, loss=0.236, lr=1e-5]Steps:  33%|███▎      | 4937/15001 [3:07:59<5:07:58,  1.84s/it, loss=0.236, lr=1e-5]Steps:  33%|███▎      | 4937/15001 [3:07:59<5:07:58,  1.84s/it, loss=0.131, lr=1e-5]Steps:  33%|███▎      | 4938/15001 [3:08:01<5:07:24,  1.83s/it, loss=0.131, lr=1e-5]Steps:  33%|███▎      | 4938/15001 [3:08:01<5:07:24,  1.83s/it, loss=0.172, lr=1e-5]Steps:  33%|███▎      | 4939/15001 [3:08:03<4:59:35,  1.79s/it, loss=0.172, lr=1e-5]Steps:  33%|███▎      | 4939/15001 [3:08:03<4:59:35,  1.79s/it, loss=0.139, lr=1e-5]Steps:  33%|███▎      | 4940/15001 [3:08:04<5:05:37,  1.82s/it, loss=0.139, lr=1e-5]Steps:  33%|███▎      | 4940/15001 [3:08:05<5:05:37,  1.82s/it, loss=0.0793, lr=1e-5]Steps:  33%|███▎      | 4941/15001 [3:08:06<5:00:20,  1.79s/it, loss=0.0793, lr=1e-5]Steps:  33%|███▎      | 4941/15001 [3:08:07<5:00:20,  1.79s/it, loss=0.223, lr=1e-5] Steps:  33%|███▎      | 4942/15001 [3:08:08<5:06:09,  1.83s/it, loss=0.223, lr=1e-5]Steps:  33%|███▎      | 4942/15001 [3:08:08<5:06:09,  1.83s/it, loss=0.156, lr=1e-5]Steps:  33%|███▎      | 4943/15001 [3:08:10<5:09:10,  1.84s/it, loss=0.156, lr=1e-5]Steps:  33%|███▎      | 4943/15001 [3:08:10<5:09:10,  1.84s/it, loss=0.0953, lr=1e-5]Steps:  33%|███▎      | 4944/15001 [3:08:12<5:06:35,  1.83s/it, loss=0.0953, lr=1e-5]Steps:  33%|███▎      | 4944/15001 [3:08:12<5:06:35,  1.83s/it, loss=0.131, lr=1e-5] Steps:  33%|███▎      | 4945/15001 [3:08:14<5:11:02,  1.86s/it, loss=0.131, lr=1e-5]Steps:  33%|███▎      | 4945/15001 [3:08:14<5:11:02,  1.86s/it, loss=0.15, lr=1e-5] Steps:  33%|███▎      | 4946/15001 [3:08:16<5:15:11,  1.88s/it, loss=0.15, lr=1e-5]Steps:  33%|███▎      | 4946/15001 [3:08:16<5:15:11,  1.88s/it, loss=0.344, lr=1e-5]Steps:  33%|███▎      | 4947/15001 [3:08:17<5:07:56,  1.84s/it, loss=0.344, lr=1e-5]Steps:  33%|███▎      | 4947/15001 [3:08:17<5:07:56,  1.84s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4948/15001 [3:08:19<4:52:27,  1.75s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4948/15001 [3:08:19<4:52:27,  1.75s/it, loss=0.2, lr=1e-5]  Steps:  33%|███▎      | 4949/15001 [3:08:21<5:08:36,  1.84s/it, loss=0.2, lr=1e-5]Steps:  33%|███▎      | 4949/15001 [3:08:21<5:08:36,  1.84s/it, loss=0.11, lr=1e-5]Steps:  33%|███▎      | 4950/15001 [3:08:23<5:02:22,  1.81s/it, loss=0.11, lr=1e-5]Steps:  33%|███▎      | 4950/15001 [3:08:23<5:02:22,  1.81s/it, loss=0.0632, lr=1e-5]Steps:  33%|███▎      | 4951/15001 [3:08:25<5:26:09,  1.95s/it, loss=0.0632, lr=1e-5]Steps:  33%|███▎      | 4951/15001 [3:08:25<5:26:09,  1.95s/it, loss=0.111, lr=1e-5] Steps:  33%|███▎      | 4952/15001 [3:08:27<5:28:59,  1.96s/it, loss=0.111, lr=1e-5]Steps:  33%|███▎      | 4952/15001 [3:08:27<5:28:59,  1.96s/it, loss=0.022, lr=1e-5]Steps:  33%|███▎      | 4953/15001 [3:08:29<5:15:02,  1.88s/it, loss=0.022, lr=1e-5]Steps:  33%|███▎      | 4953/15001 [3:08:29<5:15:02,  1.88s/it, loss=0.23, lr=1e-5] Steps:  33%|███▎      | 4954/15001 [3:08:31<5:30:44,  1.98s/it, loss=0.23, lr=1e-5]Steps:  33%|███▎      | 4954/15001 [3:08:31<5:30:44,  1.98s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4955/15001 [3:08:33<5:37:49,  2.02s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4955/15001 [3:08:33<5:37:49,  2.02s/it, loss=0.105, lr=1e-5]Steps:  33%|███▎      | 4956/15001 [3:08:35<5:33:02,  1.99s/it, loss=0.105, lr=1e-5]Steps:  33%|███▎      | 4956/15001 [3:08:35<5:33:02,  1.99s/it, loss=0.0656, lr=1e-5]Steps:  33%|███▎      | 4957/15001 [3:08:37<5:33:25,  1.99s/it, loss=0.0656, lr=1e-5]Steps:  33%|███▎      | 4957/15001 [3:08:37<5:33:25,  1.99s/it, loss=0.0983, lr=1e-5]Steps:  33%|███▎      | 4958/15001 [3:08:39<5:20:50,  1.92s/it, loss=0.0983, lr=1e-5]Steps:  33%|███▎      | 4958/15001 [3:08:39<5:20:50,  1.92s/it, loss=0.0502, lr=1e-5]Steps:  33%|███▎      | 4959/15001 [3:08:40<5:15:58,  1.89s/it, loss=0.0502, lr=1e-5]Steps:  33%|███▎      | 4959/15001 [3:08:41<5:15:58,  1.89s/it, loss=0.304, lr=1e-5] Steps:  33%|███▎      | 4960/15001 [3:08:43<5:24:45,  1.94s/it, loss=0.304, lr=1e-5]Steps:  33%|███▎      | 4960/15001 [3:08:43<5:24:45,  1.94s/it, loss=0.095, lr=1e-5]Steps:  33%|███▎      | 4961/15001 [3:08:44<5:14:51,  1.88s/it, loss=0.095, lr=1e-5]Steps:  33%|███▎      | 4961/15001 [3:08:44<5:14:51,  1.88s/it, loss=0.296, lr=1e-5]Steps:  33%|███▎      | 4962/15001 [3:08:46<5:07:11,  1.84s/it, loss=0.296, lr=1e-5]Steps:  33%|███▎      | 4962/15001 [3:08:46<5:07:11,  1.84s/it, loss=0.183, lr=1e-5]Steps:  33%|███▎      | 4963/15001 [3:08:48<5:18:18,  1.90s/it, loss=0.183, lr=1e-5]Steps:  33%|███▎      | 4963/15001 [3:08:48<5:18:18,  1.90s/it, loss=0.198, lr=1e-5]Steps:  33%|███▎      | 4964/15001 [3:08:50<5:09:22,  1.85s/it, loss=0.198, lr=1e-5]Steps:  33%|███▎      | 4964/15001 [3:08:50<5:09:22,  1.85s/it, loss=0.0946, lr=1e-5]Steps:  33%|███▎      | 4965/15001 [3:08:52<5:14:54,  1.88s/it, loss=0.0946, lr=1e-5]Steps:  33%|███▎      | 4965/15001 [3:08:52<5:14:54,  1.88s/it, loss=0.177, lr=1e-5] Steps:  33%|███▎      | 4966/15001 [3:08:53<5:04:48,  1.82s/it, loss=0.177, lr=1e-5]Steps:  33%|███▎      | 4966/15001 [3:08:54<5:04:48,  1.82s/it, loss=0.186, lr=1e-5]Steps:  33%|███▎      | 4967/15001 [3:08:55<5:00:42,  1.80s/it, loss=0.186, lr=1e-5]Steps:  33%|███▎      | 4967/15001 [3:08:55<5:00:42,  1.80s/it, loss=0.177, lr=1e-5]Steps:  33%|███▎      | 4968/15001 [3:08:57<5:03:50,  1.82s/it, loss=0.177, lr=1e-5]Steps:  33%|███▎      | 4968/15001 [3:08:57<5:03:50,  1.82s/it, loss=0.227, lr=1e-5]Steps:  33%|███▎      | 4969/15001 [3:08:59<5:08:43,  1.85s/it, loss=0.227, lr=1e-5]Steps:  33%|███▎      | 4969/15001 [3:08:59<5:08:43,  1.85s/it, loss=0.0739, lr=1e-5]Steps:  33%|███▎      | 4970/15001 [3:09:01<5:08:55,  1.85s/it, loss=0.0739, lr=1e-5]Steps:  33%|███▎      | 4970/15001 [3:09:01<5:08:55,  1.85s/it, loss=0.128, lr=1e-5] Steps:  33%|███▎      | 4971/15001 [3:09:02<4:57:10,  1.78s/it, loss=0.128, lr=1e-5]Steps:  33%|███▎      | 4971/15001 [3:09:03<4:57:10,  1.78s/it, loss=0.196, lr=1e-5]Steps:  33%|███▎      | 4972/15001 [3:09:04<5:09:32,  1.85s/it, loss=0.196, lr=1e-5]Steps:  33%|███▎      | 4972/15001 [3:09:05<5:09:32,  1.85s/it, loss=0.0868, lr=1e-5]Steps:  33%|███▎      | 4973/15001 [3:09:06<5:04:46,  1.82s/it, loss=0.0868, lr=1e-5]Steps:  33%|███▎      | 4973/15001 [3:09:07<5:04:46,  1.82s/it, loss=0.114, lr=1e-5] Steps:  33%|███▎      | 4974/15001 [3:09:08<5:27:16,  1.96s/it, loss=0.114, lr=1e-5]Steps:  33%|███▎      | 4974/15001 [3:09:09<5:27:16,  1.96s/it, loss=0.149, lr=1e-5]Steps:  33%|███▎      | 4975/15001 [3:09:10<5:12:34,  1.87s/it, loss=0.149, lr=1e-5]Steps:  33%|███▎      | 4975/15001 [3:09:10<5:12:34,  1.87s/it, loss=0.305, lr=1e-5]Steps:  33%|███▎      | 4976/15001 [3:09:12<5:20:58,  1.92s/it, loss=0.305, lr=1e-5]Steps:  33%|███▎      | 4976/15001 [3:09:12<5:20:58,  1.92s/it, loss=0.174, lr=1e-5]Steps:  33%|███▎      | 4977/15001 [3:09:14<5:24:14,  1.94s/it, loss=0.174, lr=1e-5]Steps:  33%|███▎      | 4977/15001 [3:09:14<5:24:14,  1.94s/it, loss=0.332, lr=1e-5]Steps:  33%|███▎      | 4978/15001 [3:09:16<5:28:03,  1.96s/it, loss=0.332, lr=1e-5]Steps:  33%|███▎      | 4978/15001 [3:09:16<5:28:03,  1.96s/it, loss=0.194, lr=1e-5]Steps:  33%|███▎      | 4979/15001 [3:09:18<5:34:10,  2.00s/it, loss=0.194, lr=1e-5]Steps:  33%|███▎      | 4979/15001 [3:09:18<5:34:10,  2.00s/it, loss=0.181, lr=1e-5]Steps:  33%|███▎      | 4980/15001 [3:09:20<5:11:53,  1.87s/it, loss=0.181, lr=1e-5]Steps:  33%|███▎      | 4980/15001 [3:09:20<5:11:53,  1.87s/it, loss=0.268, lr=1e-5]Steps:  33%|███▎      | 4981/15001 [3:09:22<5:05:16,  1.83s/it, loss=0.268, lr=1e-5]Steps:  33%|███▎      | 4981/15001 [3:09:22<5:05:16,  1.83s/it, loss=0.163, lr=1e-5]Steps:  33%|███▎      | 4982/15001 [3:09:23<5:09:24,  1.85s/it, loss=0.163, lr=1e-5]Steps:  33%|███▎      | 4982/15001 [3:09:24<5:09:24,  1.85s/it, loss=0.0546, lr=1e-5]Steps:  33%|███▎      | 4983/15001 [3:09:25<5:15:52,  1.89s/it, loss=0.0546, lr=1e-5]Steps:  33%|███▎      | 4983/15001 [3:09:26<5:15:52,  1.89s/it, loss=0.146, lr=1e-5] Steps:  33%|███▎      | 4984/15001 [3:09:27<5:18:25,  1.91s/it, loss=0.146, lr=1e-5]Steps:  33%|███▎      | 4984/15001 [3:09:27<5:18:25,  1.91s/it, loss=0.0734, lr=1e-5]Steps:  33%|███▎      | 4985/15001 [3:09:29<5:08:08,  1.85s/it, loss=0.0734, lr=1e-5]Steps:  33%|███▎      | 4985/15001 [3:09:29<5:08:08,  1.85s/it, loss=0.11, lr=1e-5]  Steps:  33%|███▎      | 4986/15001 [3:09:31<5:13:24,  1.88s/it, loss=0.11, lr=1e-5]Steps:  33%|███▎      | 4986/15001 [3:09:31<5:13:24,  1.88s/it, loss=0.0737, lr=1e-5]Steps:  33%|███▎      | 4987/15001 [3:09:33<5:08:55,  1.85s/it, loss=0.0737, lr=1e-5]Steps:  33%|███▎      | 4987/15001 [3:09:33<5:08:55,  1.85s/it, loss=0.0744, lr=1e-5]Steps:  33%|███▎      | 4988/15001 [3:09:35<5:07:53,  1.84s/it, loss=0.0744, lr=1e-5]Steps:  33%|███▎      | 4988/15001 [3:09:35<5:07:53,  1.84s/it, loss=0.241, lr=1e-5] Steps:  33%|███▎      | 4989/15001 [3:09:37<5:10:10,  1.86s/it, loss=0.241, lr=1e-5]Steps:  33%|███▎      | 4989/15001 [3:09:37<5:10:10,  1.86s/it, loss=0.116, lr=1e-5]Steps:  33%|███▎      | 4990/15001 [3:09:38<5:11:37,  1.87s/it, loss=0.116, lr=1e-5]Steps:  33%|███▎      | 4990/15001 [3:09:39<5:11:37,  1.87s/it, loss=0.072, lr=1e-5]Steps:  33%|███▎      | 4991/15001 [3:09:40<5:16:47,  1.90s/it, loss=0.072, lr=1e-5]Steps:  33%|███▎      | 4991/15001 [3:09:41<5:16:47,  1.90s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4992/15001 [3:09:42<5:16:03,  1.89s/it, loss=0.148, lr=1e-5]Steps:  33%|███▎      | 4992/15001 [3:09:42<5:16:03,  1.89s/it, loss=0.313, lr=1e-5]Steps:  33%|███▎      | 4993/15001 [3:09:44<5:07:28,  1.84s/it, loss=0.313, lr=1e-5]Steps:  33%|███▎      | 4993/15001 [3:09:44<5:07:28,  1.84s/it, loss=0.3, lr=1e-5]  Steps:  33%|███▎      | 4994/15001 [3:09:46<4:52:18,  1.75s/it, loss=0.3, lr=1e-5]Steps:  33%|███▎      | 4994/15001 [3:09:46<4:52:18,  1.75s/it, loss=0.209, lr=1e-5]Steps:  33%|███▎      | 4995/15001 [3:09:48<5:09:35,  1.86s/it, loss=0.209, lr=1e-5]Steps:  33%|███▎      | 4995/15001 [3:09:48<5:09:35,  1.86s/it, loss=0.207, lr=1e-5]Steps:  33%|███▎      | 4996/15001 [3:09:49<5:07:27,  1.84s/it, loss=0.207, lr=1e-5]Steps:  33%|███▎      | 4996/15001 [3:09:50<5:07:27,  1.84s/it, loss=0.263, lr=1e-5]Steps:  33%|███▎      | 4997/15001 [3:09:52<5:28:06,  1.97s/it, loss=0.263, lr=1e-5]Steps:  33%|███▎      | 4997/15001 [3:09:52<5:28:06,  1.97s/it, loss=0.22, lr=1e-5] Steps:  33%|███▎      | 4998/15001 [3:09:54<5:26:45,  1.96s/it, loss=0.22, lr=1e-5]Steps:  33%|███▎      | 4998/15001 [3:09:54<5:26:45,  1.96s/it, loss=0.225, lr=1e-5]Steps:  33%|███▎      | 4999/15001 [3:09:56<5:29:03,  1.97s/it, loss=0.225, lr=1e-5]Steps:  33%|███▎      | 4999/15001 [3:09:56<5:29:03,  1.97s/it, loss=0.0898, lr=1e-5]Steps:  33%|███▎      | 5000/15001 [3:09:58<5:29:42,  1.98s/it, loss=0.0898, lr=1e-5]02/04/2024 16:12:17 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1069.61it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  33%|███▎      | 5000/15001 [3:13:36<5:29:42,  1.98s/it, loss=0.205, lr=1e-5] Steps:  33%|███▎      | 5001/15001 [3:13:39<188:23:04, 67.82s/it, loss=0.205, lr=1e-5]Steps:  33%|███▎      | 5001/15001 [3:13:39<188:23:04, 67.82s/it, loss=0.164, lr=1e-5]Steps:  33%|███▎      | 5002/15001 [3:13:41<133:14:05, 47.97s/it, loss=0.164, lr=1e-5]Steps:  33%|███▎      | 5002/15001 [3:13:41<133:14:05, 47.97s/it, loss=0.204, lr=1e-5]Steps:  33%|███▎      | 5003/15001 [3:13:42<94:35:52, 34.06s/it, loss=0.204, lr=1e-5] Steps:  33%|███▎      | 5003/15001 [3:13:43<94:35:52, 34.06s/it, loss=0.0457, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  33%|███▎      | 5004/15001 [3:13:44<67:51:06, 24.43s/it, loss=0.0457, lr=1e-5]Steps:  33%|███▎      | 5004/15001 [3:13:45<67:51:06, 24.43s/it, loss=0.129, lr=1e-5] Steps:  33%|███▎      | 5005/15001 [3:13:46<49:13:19, 17.73s/it, loss=0.129, lr=1e-5]Steps:  33%|███▎      | 5005/15001 [3:13:47<49:13:19, 17.73s/it, loss=0.0311, lr=1e-5]Steps:  33%|███▎      | 5006/15001 [3:13:48<36:06:43, 13.01s/it, loss=0.0311, lr=1e-5]Steps:  33%|███▎      | 5006/15001 [3:13:49<36:06:43, 13.01s/it, loss=0.308, lr=1e-5] Steps:  33%|███▎      | 5007/15001 [3:13:50<26:56:29,  9.70s/it, loss=0.308, lr=1e-5]Steps:  33%|███▎      | 5007/15001 [3:13:51<26:56:29,  9.70s/it, loss=0.254, lr=1e-5]Steps:  33%|███▎      | 5008/15001 [3:13:52<20:22:00,  7.34s/it, loss=0.254, lr=1e-5]Steps:  33%|███▎      | 5008/15001 [3:13:53<20:22:00,  7.34s/it, loss=0.161, lr=1e-5]Steps:  33%|███▎      | 5009/15001 [3:13:55<16:13:24,  5.85s/it, loss=0.161, lr=1e-5]Steps:  33%|███▎      | 5009/15001 [3:13:55<16:13:24,  5.85s/it, loss=0.27, lr=1e-5] Steps:  33%|███▎      | 5010/15001 [3:13:57<12:59:53,  4.68s/it, loss=0.27, lr=1e-5]Steps:  33%|███▎      | 5010/15001 [3:13:57<12:59:53,  4.68s/it, loss=0.118, lr=1e-5]Steps:  33%|███▎      | 5011/15001 [3:13:58<10:37:29,  3.83s/it, loss=0.118, lr=1e-5]Steps:  33%|███▎      | 5011/15001 [3:13:59<10:37:29,  3.83s/it, loss=0.395, lr=1e-5]Steps:  33%|███▎      | 5012/15001 [3:14:00<8:52:13,  3.20s/it, loss=0.395, lr=1e-5] Steps:  33%|███▎      | 5012/15001 [3:14:00<8:52:13,  3.20s/it, loss=0.136, lr=1e-5]Steps:  33%|███▎      | 5013/15001 [3:14:02<7:41:23,  2.77s/it, loss=0.136, lr=1e-5]Steps:  33%|███▎      | 5013/15001 [3:14:02<7:41:23,  2.77s/it, loss=0.0349, lr=1e-5]Steps:  33%|███▎      | 5014/15001 [3:14:04<7:06:35,  2.56s/it, loss=0.0349, lr=1e-5]Steps:  33%|███▎      | 5014/15001 [3:14:04<7:06:35,  2.56s/it, loss=0.126, lr=1e-5] Steps:  33%|███▎      | 5015/15001 [3:14:06<6:28:59,  2.34s/it, loss=0.126, lr=1e-5]Steps:  33%|███▎      | 5015/15001 [3:14:06<6:28:59,  2.34s/it, loss=0.191, lr=1e-5]Steps:  33%|███▎      | 5016/15001 [3:14:08<5:57:45,  2.15s/it, loss=0.191, lr=1e-5]Steps:  33%|███▎      | 5016/15001 [3:14:08<5:57:45,  2.15s/it, loss=0.182, lr=1e-5]Steps:  33%|███▎      | 5017/15001 [3:14:09<5:37:02,  2.03s/it, loss=0.182, lr=1e-5]Steps:  33%|███▎      | 5017/15001 [3:14:10<5:37:02,  2.03s/it, loss=0.371, lr=1e-5]Steps:  33%|███▎      | 5018/15001 [3:14:11<5:33:20,  2.00s/it, loss=0.371, lr=1e-5]Steps:  33%|███▎      | 5018/15001 [3:14:11<5:33:20,  2.00s/it, loss=0.326, lr=1e-5]Steps:  33%|███▎      | 5019/15001 [3:14:13<5:24:49,  1.95s/it, loss=0.326, lr=1e-5]Steps:  33%|███▎      | 5019/15001 [3:14:13<5:24:49,  1.95s/it, loss=0.0914, lr=1e-5]Steps:  33%|███▎      | 5020/15001 [3:14:15<5:09:59,  1.86s/it, loss=0.0914, lr=1e-5]Steps:  33%|███▎      | 5020/15001 [3:14:15<5:09:59,  1.86s/it, loss=0.139, lr=1e-5] Steps:  33%|███▎      | 5021/15001 [3:14:17<5:10:48,  1.87s/it, loss=0.139, lr=1e-5]Steps:  33%|███▎      | 5021/15001 [3:14:17<5:10:48,  1.87s/it, loss=0.0783, lr=1e-5]Steps:  33%|███▎      | 5022/15001 [3:14:19<5:24:13,  1.95s/it, loss=0.0783, lr=1e-5]Steps:  33%|███▎      | 5022/15001 [3:14:19<5:24:13,  1.95s/it, loss=0.108, lr=1e-5] Steps:  33%|███▎      | 5023/15001 [3:14:20<5:10:49,  1.87s/it, loss=0.108, lr=1e-5]Steps:  33%|███▎      | 5023/15001 [3:14:21<5:10:49,  1.87s/it, loss=0.208, lr=1e-5]Steps:  33%|███▎      | 5024/15001 [3:14:22<5:10:25,  1.87s/it, loss=0.208, lr=1e-5]Steps:  33%|███▎      | 5024/15001 [3:14:22<5:10:25,  1.87s/it, loss=0.258, lr=1e-5]Steps:  33%|███▎      | 5025/15001 [3:14:24<5:09:00,  1.86s/it, loss=0.258, lr=1e-5]Steps:  33%|███▎      | 5025/15001 [3:14:24<5:09:00,  1.86s/it, loss=0.202, lr=1e-5]Steps:  34%|███▎      | 5026/15001 [3:14:26<5:05:12,  1.84s/it, loss=0.202, lr=1e-5]Steps:  34%|███▎      | 5026/15001 [3:14:26<5:05:12,  1.84s/it, loss=0.256, lr=1e-5]Steps:  34%|███▎      | 5027/15001 [3:14:28<5:19:03,  1.92s/it, loss=0.256, lr=1e-5]Steps:  34%|███▎      | 5027/15001 [3:14:28<5:19:03,  1.92s/it, loss=0.203, lr=1e-5]Steps:  34%|███▎      | 5028/15001 [3:14:30<5:12:59,  1.88s/it, loss=0.203, lr=1e-5]Steps:  34%|███▎      | 5028/15001 [3:14:30<5:12:59,  1.88s/it, loss=0.0704, lr=1e-5]Steps:  34%|███▎      | 5029/15001 [3:14:32<5:15:50,  1.90s/it, loss=0.0704, lr=1e-5]Steps:  34%|███▎      | 5029/15001 [3:14:32<5:15:50,  1.90s/it, loss=0.153, lr=1e-5] Steps:  34%|███▎      | 5030/15001 [3:14:34<5:26:55,  1.97s/it, loss=0.153, lr=1e-5]Steps:  34%|███▎      | 5030/15001 [3:14:34<5:26:55,  1.97s/it, loss=0.466, lr=1e-5]Steps:  34%|███▎      | 5031/15001 [3:14:36<5:23:53,  1.95s/it, loss=0.466, lr=1e-5]Steps:  34%|███▎      | 5031/15001 [3:14:36<5:23:53,  1.95s/it, loss=0.166, lr=1e-5]Steps:  34%|███▎      | 5032/15001 [3:14:38<5:31:22,  1.99s/it, loss=0.166, lr=1e-5]Steps:  34%|███▎      | 5032/15001 [3:14:38<5:31:22,  1.99s/it, loss=0.264, lr=1e-5]Steps:  34%|███▎      | 5033/15001 [3:14:40<5:32:06,  2.00s/it, loss=0.264, lr=1e-5]Steps:  34%|███▎      | 5033/15001 [3:14:40<5:32:06,  2.00s/it, loss=0.342, lr=1e-5]Steps:  34%|███▎      | 5034/15001 [3:14:42<5:31:48,  2.00s/it, loss=0.342, lr=1e-5]Steps:  34%|███▎      | 5034/15001 [3:14:42<5:31:48,  2.00s/it, loss=0.252, lr=1e-5]Steps:  34%|███▎      | 5035/15001 [3:14:44<5:24:19,  1.95s/it, loss=0.252, lr=1e-5]Steps:  34%|███▎      | 5035/15001 [3:14:44<5:24:19,  1.95s/it, loss=0.109, lr=1e-5]Steps:  34%|███▎      | 5036/15001 [3:14:45<5:13:36,  1.89s/it, loss=0.109, lr=1e-5]Steps:  34%|███▎      | 5036/15001 [3:14:46<5:13:36,  1.89s/it, loss=0.126, lr=1e-5]Steps:  34%|███▎      | 5037/15001 [3:14:47<5:10:04,  1.87s/it, loss=0.126, lr=1e-5]Steps:  34%|███▎      | 5037/15001 [3:14:47<5:10:04,  1.87s/it, loss=0.0534, lr=1e-5]Steps:  34%|███▎      | 5038/15001 [3:14:49<4:57:35,  1.79s/it, loss=0.0534, lr=1e-5]Steps:  34%|███▎      | 5038/15001 [3:14:49<4:57:35,  1.79s/it, loss=0.134, lr=1e-5] Steps:  34%|███▎      | 5039/15001 [3:14:51<5:09:23,  1.86s/it, loss=0.134, lr=1e-5]Steps:  34%|███▎      | 5039/15001 [3:14:51<5:09:23,  1.86s/it, loss=0.231, lr=1e-5]Steps:  34%|███▎      | 5040/15001 [3:14:52<4:55:47,  1.78s/it, loss=0.231, lr=1e-5]Steps:  34%|███▎      | 5040/15001 [3:14:53<4:55:47,  1.78s/it, loss=0.212, lr=1e-5]Steps:  34%|███▎      | 5041/15001 [3:14:54<4:59:28,  1.80s/it, loss=0.212, lr=1e-5]Steps:  34%|███▎      | 5041/15001 [3:14:54<4:59:28,  1.80s/it, loss=0.146, lr=1e-5]Steps:  34%|███▎      | 5042/15001 [3:14:56<4:54:01,  1.77s/it, loss=0.146, lr=1e-5]Steps:  34%|███▎      | 5042/15001 [3:14:56<4:54:01,  1.77s/it, loss=0.427, lr=1e-5]Steps:  34%|███▎      | 5043/15001 [3:14:58<4:59:55,  1.81s/it, loss=0.427, lr=1e-5]Steps:  34%|███▎      | 5043/15001 [3:14:58<4:59:55,  1.81s/it, loss=0.22, lr=1e-5] Steps:  34%|███▎      | 5044/15001 [3:15:00<4:58:46,  1.80s/it, loss=0.22, lr=1e-5]Steps:  34%|███▎      | 5044/15001 [3:15:00<4:58:46,  1.80s/it, loss=0.177, lr=1e-5]Steps:  34%|███▎      | 5045/15001 [3:15:02<5:02:57,  1.83s/it, loss=0.177, lr=1e-5]Steps:  34%|███▎      | 5045/15001 [3:15:02<5:02:57,  1.83s/it, loss=0.356, lr=1e-5]Steps:  34%|███▎      | 5046/15001 [3:15:03<5:06:05,  1.84s/it, loss=0.356, lr=1e-5]Steps:  34%|███▎      | 5046/15001 [3:15:04<5:06:05,  1.84s/it, loss=0.272, lr=1e-5]Steps:  34%|███▎      | 5047/15001 [3:15:05<5:02:30,  1.82s/it, loss=0.272, lr=1e-5]Steps:  34%|███▎      | 5047/15001 [3:15:06<5:02:30,  1.82s/it, loss=0.223, lr=1e-5]Steps:  34%|███▎      | 5048/15001 [3:15:07<5:05:41,  1.84s/it, loss=0.223, lr=1e-5]Steps:  34%|███▎      | 5048/15001 [3:15:07<5:05:41,  1.84s/it, loss=0.335, lr=1e-5]Steps:  34%|███▎      | 5049/15001 [3:15:09<4:55:08,  1.78s/it, loss=0.335, lr=1e-5]Steps:  34%|███▎      | 5049/15001 [3:15:09<4:55:08,  1.78s/it, loss=0.0746, lr=1e-5]Steps:  34%|███▎      | 5050/15001 [3:15:11<5:13:17,  1.89s/it, loss=0.0746, lr=1e-5]Steps:  34%|███▎      | 5050/15001 [3:15:11<5:13:17,  1.89s/it, loss=0.363, lr=1e-5] Steps:  34%|███▎      | 5051/15001 [3:15:13<5:18:32,  1.92s/it, loss=0.363, lr=1e-5]Steps:  34%|███▎      | 5051/15001 [3:15:13<5:18:32,  1.92s/it, loss=0.112, lr=1e-5]Steps:  34%|███▎      | 5052/15001 [3:15:15<5:11:41,  1.88s/it, loss=0.112, lr=1e-5]Steps:  34%|███▎      | 5052/15001 [3:15:15<5:11:41,  1.88s/it, loss=0.228, lr=1e-5]Steps:  34%|███▎      | 5053/15001 [3:15:17<5:29:00,  1.98s/it, loss=0.228, lr=1e-5]Steps:  34%|███▎      | 5053/15001 [3:15:17<5:29:00,  1.98s/it, loss=0.311, lr=1e-5]Steps:  34%|███▎      | 5054/15001 [3:15:19<5:20:30,  1.93s/it, loss=0.311, lr=1e-5]Steps:  34%|███▎      | 5054/15001 [3:15:19<5:20:30,  1.93s/it, loss=0.0923, lr=1e-5]Steps:  34%|███▎      | 5055/15001 [3:15:21<5:25:49,  1.97s/it, loss=0.0923, lr=1e-5]Steps:  34%|███▎      | 5055/15001 [3:15:21<5:25:49,  1.97s/it, loss=0.455, lr=1e-5] Steps:  34%|███▎      | 5056/15001 [3:15:23<5:24:29,  1.96s/it, loss=0.455, lr=1e-5]Steps:  34%|███▎      | 5056/15001 [3:15:23<5:24:29,  1.96s/it, loss=0.368, lr=1e-5]Steps:  34%|███▎      | 5057/15001 [3:15:25<5:29:58,  1.99s/it, loss=0.368, lr=1e-5]Steps:  34%|███▎      | 5057/15001 [3:15:25<5:29:58,  1.99s/it, loss=0.0171, lr=1e-5]Steps:  34%|███▎      | 5058/15001 [3:15:27<5:25:32,  1.96s/it, loss=0.0171, lr=1e-5]Steps:  34%|███▎      | 5058/15001 [3:15:27<5:25:32,  1.96s/it, loss=0.26, lr=1e-5]  Steps:  34%|███▎      | 5059/15001 [3:15:28<5:09:47,  1.87s/it, loss=0.26, lr=1e-5]Steps:  34%|███▎      | 5059/15001 [3:15:29<5:09:47,  1.87s/it, loss=0.132, lr=1e-5]Steps:  34%|███▎      | 5060/15001 [3:15:30<5:06:23,  1.85s/it, loss=0.132, lr=1e-5]Steps:  34%|███▎      | 5060/15001 [3:15:31<5:06:23,  1.85s/it, loss=0.145, lr=1e-5]Steps:  34%|███▎      | 5061/15001 [3:15:32<5:19:44,  1.93s/it, loss=0.145, lr=1e-5]Steps:  34%|███▎      | 5061/15001 [3:15:32<5:19:44,  1.93s/it, loss=0.0662, lr=1e-5]Steps:  34%|███▎      | 5062/15001 [3:15:34<5:18:01,  1.92s/it, loss=0.0662, lr=1e-5]Steps:  34%|███▎      | 5062/15001 [3:15:34<5:18:01,  1.92s/it, loss=0.166, lr=1e-5] Steps:  34%|███▍      | 5063/15001 [3:15:36<5:18:06,  1.92s/it, loss=0.166, lr=1e-5]Steps:  34%|███▍      | 5063/15001 [3:15:36<5:18:06,  1.92s/it, loss=0.111, lr=1e-5]Steps:  34%|███▍      | 5064/15001 [3:15:38<4:55:44,  1.79s/it, loss=0.111, lr=1e-5]Steps:  34%|███▍      | 5064/15001 [3:15:38<4:55:44,  1.79s/it, loss=0.236, lr=1e-5]Steps:  34%|███▍      | 5065/15001 [3:15:40<5:12:14,  1.89s/it, loss=0.236, lr=1e-5]Steps:  34%|███▍      | 5065/15001 [3:15:40<5:12:14,  1.89s/it, loss=0.176, lr=1e-5]Steps:  34%|███▍      | 5066/15001 [3:15:41<5:06:45,  1.85s/it, loss=0.176, lr=1e-5]Steps:  34%|███▍      | 5066/15001 [3:15:42<5:06:45,  1.85s/it, loss=0.348, lr=1e-5]Steps:  34%|███▍      | 5067/15001 [3:15:43<5:13:14,  1.89s/it, loss=0.348, lr=1e-5]Steps:  34%|███▍      | 5067/15001 [3:15:44<5:13:14,  1.89s/it, loss=0.0755, lr=1e-5]Steps:  34%|███▍      | 5068/15001 [3:15:45<4:56:09,  1.79s/it, loss=0.0755, lr=1e-5]Steps:  34%|███▍      | 5068/15001 [3:15:45<4:56:09,  1.79s/it, loss=0.143, lr=1e-5] Steps:  34%|███▍      | 5069/15001 [3:15:47<4:55:51,  1.79s/it, loss=0.143, lr=1e-5]Steps:  34%|███▍      | 5069/15001 [3:15:47<4:55:51,  1.79s/it, loss=0.225, lr=1e-5]Steps:  34%|███▍      | 5070/15001 [3:15:49<4:57:27,  1.80s/it, loss=0.225, lr=1e-5]Steps:  34%|███▍      | 5070/15001 [3:15:49<4:57:27,  1.80s/it, loss=0.159, lr=1e-5]Steps:  34%|███▍      | 5071/15001 [3:15:50<4:50:31,  1.76s/it, loss=0.159, lr=1e-5]Steps:  34%|███▍      | 5071/15001 [3:15:51<4:50:31,  1.76s/it, loss=0.0801, lr=1e-5]Steps:  34%|███▍      | 5072/15001 [3:15:52<4:53:16,  1.77s/it, loss=0.0801, lr=1e-5]Steps:  34%|███▍      | 5072/15001 [3:15:52<4:53:16,  1.77s/it, loss=0.0313, lr=1e-5]Steps:  34%|███▍      | 5073/15001 [3:15:54<5:03:30,  1.83s/it, loss=0.0313, lr=1e-5]Steps:  34%|��██▍      | 5073/15001 [3:15:54<5:03:30,  1.83s/it, loss=0.163, lr=1e-5] Steps:  34%|███▍      | 5074/15001 [3:15:56<5:08:55,  1.87s/it, loss=0.163, lr=1e-5]Steps:  34%|███▍      | 5074/15001 [3:15:56<5:08:55,  1.87s/it, loss=0.122, lr=1e-5]Steps:  34%|███▍      | 5075/15001 [3:15:58<5:14:58,  1.90s/it, loss=0.122, lr=1e-5]Steps:  34%|███▍      | 5075/15001 [3:15:58<5:14:58,  1.90s/it, loss=0.141, lr=1e-5]Steps:  34%|███▍      | 5076/15001 [3:16:00<5:23:42,  1.96s/it, loss=0.141, lr=1e-5]Steps:  34%|███▍      | 5076/15001 [3:16:00<5:23:42,  1.96s/it, loss=0.224, lr=1e-5]Steps:  34%|███▍      | 5077/15001 [3:16:02<5:17:30,  1.92s/it, loss=0.224, lr=1e-5]Steps:  34%|███▍      | 5077/15001 [3:16:02<5:17:30,  1.92s/it, loss=0.227, lr=1e-5]Steps:  34%|███▍      | 5078/15001 [3:16:04<5:19:28,  1.93s/it, loss=0.227, lr=1e-5]Steps:  34%|███▍      | 5078/15001 [3:16:04<5:19:28,  1.93s/it, loss=0.0178, lr=1e-5]Steps:  34%|███▍      | 5079/15001 [3:16:06<5:25:08,  1.97s/it, loss=0.0178, lr=1e-5]Steps:  34%|███▍      | 5079/15001 [3:16:06<5:25:08,  1.97s/it, loss=0.175, lr=1e-5] Steps:  34%|███▍      | 5080/15001 [3:16:08<5:15:18,  1.91s/it, loss=0.175, lr=1e-5]Steps:  34%|███▍      | 5080/15001 [3:16:08<5:15:18,  1.91s/it, loss=0.169, lr=1e-5]Steps:  34%|███▍      | 5081/15001 [3:16:10<5:15:49,  1.91s/it, loss=0.169, lr=1e-5]Steps:  34%|███▍      | 5081/15001 [3:16:10<5:15:49,  1.91s/it, loss=0.158, lr=1e-5]Steps:  34%|███▍      | 5082/15001 [3:16:11<5:03:02,  1.83s/it, loss=0.158, lr=1e-5]Steps:  34%|███▍      | 5082/15001 [3:16:11<5:03:02,  1.83s/it, loss=0.139, lr=1e-5]Steps:  34%|███▍      | 5083/15001 [3:16:13<4:59:22,  1.81s/it, loss=0.139, lr=1e-5]Steps:  34%|███▍      | 5083/15001 [3:16:13<4:59:22,  1.81s/it, loss=0.0457, lr=1e-5]Steps:  34%|███▍      | 5084/15001 [3:16:15<5:05:09,  1.85s/it, loss=0.0457, lr=1e-5]Steps:  34%|███▍      | 5084/15001 [3:16:15<5:05:09,  1.85s/it, loss=0.237, lr=1e-5] Steps:  34%|███▍      | 5085/15001 [3:16:16<4:42:52,  1.71s/it, loss=0.237, lr=1e-5]Steps:  34%|███▍      | 5085/15001 [3:16:17<4:42:52,  1.71s/it, loss=0.0399, lr=1e-5]Steps:  34%|███▍      | 5086/15001 [3:16:18<4:55:04,  1.79s/it, loss=0.0399, lr=1e-5]Steps:  34%|███▍      | 5086/15001 [3:16:19<4:55:04,  1.79s/it, loss=0.25, lr=1e-5]  Steps:  34%|███▍      | 5087/15001 [3:16:20<5:10:24,  1.88s/it, loss=0.25, lr=1e-5]Steps:  34%|███▍      | 5087/15001 [3:16:20<5:10:24,  1.88s/it, loss=0.119, lr=1e-5]Steps:  34%|███▍      | 5088/15001 [3:16:22<5:00:04,  1.82s/it, loss=0.119, lr=1e-5]Steps:  34%|███▍      | 5088/15001 [3:16:22<5:00:04,  1.82s/it, loss=0.23, lr=1e-5] Steps:  34%|███▍      | 5089/15001 [3:16:24<5:05:37,  1.85s/it, loss=0.23, lr=1e-5]Steps:  34%|███▍      | 5089/15001 [3:16:24<5:05:37,  1.85s/it, loss=0.143, lr=1e-5]Steps:  34%|███▍      | 5090/15001 [3:16:26<4:51:33,  1.77s/it, loss=0.143, lr=1e-5]Steps:  34%|███▍      | 5090/15001 [3:16:26<4:51:33,  1.77s/it, loss=0.149, lr=1e-5]Steps:  34%|███▍      | 5091/15001 [3:16:27<5:01:10,  1.82s/it, loss=0.149, lr=1e-5]Steps:  34%|███▍      | 5091/15001 [3:16:28<5:01:10,  1.82s/it, loss=0.223, lr=1e-5]Steps:  34%|███▍      | 5092/15001 [3:16:29<4:59:59,  1.82s/it, loss=0.223, lr=1e-5]Steps:  34%|███▍      | 5092/15001 [3:16:30<4:59:59,  1.82s/it, loss=0.269, lr=1e-5]Steps:  34%|███▍      | 5093/15001 [3:16:31<5:02:12,  1.83s/it, loss=0.269, lr=1e-5]Steps:  34%|███▍      | 5093/15001 [3:16:31<5:02:12,  1.83s/it, loss=0.0344, lr=1e-5]Steps:  34%|███▍      | 5094/15001 [3:16:33<5:08:45,  1.87s/it, loss=0.0344, lr=1e-5]Steps:  34%|███▍      | 5094/15001 [3:16:33<5:08:45,  1.87s/it, loss=0.152, lr=1e-5] Steps:  34%|███▍      | 5095/15001 [3:16:35<4:59:12,  1.81s/it, loss=0.152, lr=1e-5]Steps:  34%|███▍      | 5095/15001 [3:16:35<4:59:12,  1.81s/it, loss=0.147, lr=1e-5]Steps:  34%|███▍      | 5096/15001 [3:16:37<5:09:18,  1.87s/it, loss=0.147, lr=1e-5]Steps:  34%|███▍      | 5096/15001 [3:16:37<5:09:18,  1.87s/it, loss=0.268, lr=1e-5]Steps:  34%|███▍      | 5097/15001 [3:16:39<5:23:14,  1.96s/it, loss=0.268, lr=1e-5]Steps:  34%|███▍      | 5097/15001 [3:16:39<5:23:14,  1.96s/it, loss=0.136, lr=1e-5]Steps:  34%|███▍      | 5098/15001 [3:16:41<5:14:44,  1.91s/it, loss=0.136, lr=1e-5]Steps:  34%|███▍      | 5098/15001 [3:16:41<5:14:44,  1.91s/it, loss=0.225, lr=1e-5]Steps:  34%|███▍      | 5099/15001 [3:16:43<5:34:13,  2.03s/it, loss=0.225, lr=1e-5]Steps:  34%|███▍      | 5099/15001 [3:16:43<5:34:13,  2.03s/it, loss=0.195, lr=1e-5]Steps:  34%|███▍      | 5100/15001 [3:16:45<5:37:54,  2.05s/it, loss=0.195, lr=1e-5]Steps:  34%|███▍      | 5100/15001 [3:16:45<5:37:54,  2.05s/it, loss=0.118, lr=1e-5]Steps:  34%|███▍      | 5101/15001 [3:16:47<5:23:14,  1.96s/it, loss=0.118, lr=1e-5]Steps:  34%|███▍      | 5101/15001 [3:16:47<5:23:14,  1.96s/it, loss=0.166, lr=1e-5]Steps:  34%|███▍      | 5102/15001 [3:16:49<5:26:26,  1.98s/it, loss=0.166, lr=1e-5]Steps:  34%|███▍      | 5102/15001 [3:16:49<5:26:26,  1.98s/it, loss=0.331, lr=1e-5]Steps:  34%|███▍      | 5103/15001 [3:16:51<5:26:12,  1.98s/it, loss=0.331, lr=1e-5]Steps:  34%|███▍      | 5103/15001 [3:16:51<5:26:12,  1.98s/it, loss=0.0803, lr=1e-5]Steps:  34%|███▍      | 5104/15001 [3:16:53<5:26:30,  1.98s/it, loss=0.0803, lr=1e-5]Steps:  34%|███▍      | 5104/15001 [3:16:53<5:26:30,  1.98s/it, loss=0.143, lr=1e-5] Steps:  34%|███▍      | 5105/15001 [3:16:55<5:12:37,  1.90s/it, loss=0.143, lr=1e-5]Steps:  34%|███▍      | 5105/15001 [3:16:55<5:12:37,  1.90s/it, loss=0.109, lr=1e-5]Steps:  34%|███▍      | 5106/15001 [3:16:56<4:58:34,  1.81s/it, loss=0.109, lr=1e-5]Steps:  34%|███▍      | 5106/15001 [3:16:57<4:58:34,  1.81s/it, loss=0.196, lr=1e-5]Steps:  34%|███▍      | 5107/15001 [3:16:58<5:05:36,  1.85s/it, loss=0.196, lr=1e-5]Steps:  34%|███▍      | 5107/15001 [3:16:58<5:05:36,  1.85s/it, loss=0.148, lr=1e-5]Steps:  34%|███▍      | 5108/15001 [3:17:00<5:00:51,  1.82s/it, loss=0.148, lr=1e-5]Steps:  34%|███▍      | 5108/15001 [3:17:00<5:00:51,  1.82s/it, loss=0.0413, lr=1e-5]Steps:  34%|███▍      | 5109/15001 [3:17:02<5:12:30,  1.90s/it, loss=0.0413, lr=1e-5]Steps:  34%|███▍      | 5109/15001 [3:17:02<5:12:30,  1.90s/it, loss=0.224, lr=1e-5] Steps:  34%|███▍      | 5110/15001 [3:17:04<5:05:49,  1.86s/it, loss=0.224, lr=1e-5]Steps:  34%|███▍      | 5110/15001 [3:17:04<5:05:49,  1.86s/it, loss=0.117, lr=1e-5]Steps:  34%|███▍      | 5111/15001 [3:17:06<5:03:36,  1.84s/it, loss=0.117, lr=1e-5]Steps:  34%|███▍      | 5111/15001 [3:17:06<5:03:36,  1.84s/it, loss=0.00854, lr=1e-5]Steps:  34%|███▍      | 5112/15001 [3:17:07<4:49:40,  1.76s/it, loss=0.00854, lr=1e-5]Steps:  34%|███▍      | 5112/15001 [3:17:07<4:49:40,  1.76s/it, loss=0.113, lr=1e-5]  Steps:  34%|███▍      | 5113/15001 [3:17:09<4:52:45,  1.78s/it, loss=0.113, lr=1e-5]Steps:  34%|███▍      | 5113/15001 [3:17:09<4:52:45,  1.78s/it, loss=0.237, lr=1e-5]Steps:  34%|███▍      | 5114/15001 [3:17:11<4:57:25,  1.80s/it, loss=0.237, lr=1e-5]Steps:  34%|███▍      | 5114/15001 [3:17:11<4:57:25,  1.80s/it, loss=0.197, lr=1e-5]Steps:  34%|███▍      | 5115/15001 [3:17:13<5:18:15,  1.93s/it, loss=0.197, lr=1e-5]Steps:  34%|███▍      | 5115/15001 [3:17:13<5:18:15,  1.93s/it, loss=0.0935, lr=1e-5]Steps:  34%|███▍      | 5116/15001 [3:17:15<5:14:44,  1.91s/it, loss=0.0935, lr=1e-5]Steps:  34%|███▍      | 5116/15001 [3:17:15<5:14:44,  1.91s/it, loss=0.15, lr=1e-5]  Steps:  34%|███▍      | 5117/15001 [3:17:17<5:02:20,  1.84s/it, loss=0.15, lr=1e-5]Steps:  34%|███▍      | 5117/15001 [3:17:17<5:02:20,  1.84s/it, loss=0.321, lr=1e-5]Steps:  34%|███▍      | 5118/15001 [3:17:18<4:54:46,  1.79s/it, loss=0.321, lr=1e-5]Steps:  34%|███▍      | 5118/15001 [3:17:19<4:54:46,  1.79s/it, loss=0.0823, lr=1e-5]Steps:  34%|███▍      | 5119/15001 [3:17:20<4:58:33,  1.81s/it, loss=0.0823, lr=1e-5]Steps:  34%|███▍      | 5119/15001 [3:17:21<4:58:33,  1.81s/it, loss=0.432, lr=1e-5] Steps:  34%|███▍      | 5120/15001 [3:17:22<5:18:02,  1.93s/it, loss=0.432, lr=1e-5]Steps:  34%|███▍      | 5120/15001 [3:17:22<5:18:02,  1.93s/it, loss=0.079, lr=1e-5]Steps:  34%|███▍      | 5121/15001 [3:17:24<5:11:10,  1.89s/it, loss=0.079, lr=1e-5]Steps:  34%|███▍      | 5121/15001 [3:17:24<5:11:10,  1.89s/it, loss=0.156, lr=1e-5]Steps:  34%|███▍      | 5122/15001 [3:17:26<5:25:34,  1.98s/it, loss=0.156, lr=1e-5]Steps:  34%|███▍      | 5122/15001 [3:17:26<5:25:34,  1.98s/it, loss=0.0902, lr=1e-5]Steps:  34%|███▍      | 5123/15001 [3:17:28<5:30:39,  2.01s/it, loss=0.0902, lr=1e-5]Steps:  34%|███▍      | 5123/15001 [3:17:28<5:30:39,  2.01s/it, loss=0.104, lr=1e-5] Steps:  34%|███▍      | 5124/15001 [3:17:30<5:27:47,  1.99s/it, loss=0.104, lr=1e-5]Steps:  34%|███▍      | 5124/15001 [3:17:30<5:27:47,  1.99s/it, loss=0.321, lr=1e-5]Steps:  34%|███▍      | 5125/15001 [3:17:32<5:30:54,  2.01s/it, loss=0.321, lr=1e-5]Steps:  34%|███▍      | 5125/15001 [3:17:32<5:30:54,  2.01s/it, loss=0.3, lr=1e-5]  Steps:  34%|███▍      | 5126/15001 [3:17:34<5:21:04,  1.95s/it, loss=0.3, lr=1e-5]Steps:  34%|███▍      | 5126/15001 [3:17:34<5:21:04,  1.95s/it, loss=0.189, lr=1e-5]Steps:  34%|███▍      | 5127/15001 [3:17:36<5:03:00,  1.84s/it, loss=0.189, lr=1e-5]Steps:  34%|███▍      | 5127/15001 [3:17:36<5:03:00,  1.84s/it, loss=0.0583, lr=1e-5]Steps:  34%|███▍      | 5128/15001 [3:17:38<5:01:59,  1.84s/it, loss=0.0583, lr=1e-5]Steps:  34%|███▍      | 5128/15001 [3:17:38<5:01:59,  1.84s/it, loss=0.183, lr=1e-5] Steps:  34%|███▍      | 5129/15001 [3:17:40<5:05:36,  1.86s/it, loss=0.183, lr=1e-5]Steps:  34%|███▍      | 5129/15001 [3:17:40<5:05:36,  1.86s/it, loss=0.11, lr=1e-5] Steps:  34%|███▍      | 5130/15001 [3:17:41<4:58:00,  1.81s/it, loss=0.11, lr=1e-5]Steps:  34%|███▍      | 5130/15001 [3:17:41<4:58:00,  1.81s/it, loss=0.153, lr=1e-5]Steps:  34%|███▍      | 5131/15001 [3:17:43<5:10:34,  1.89s/it, loss=0.153, lr=1e-5]Steps:  34%|███▍      | 5131/15001 [3:17:43<5:10:34,  1.89s/it, loss=0.236, lr=1e-5]Steps:  34%|███▍      | 5132/15001 [3:17:45<4:59:58,  1.82s/it, loss=0.236, lr=1e-5]Steps:  34%|███▍      | 5132/15001 [3:17:45<4:59:58,  1.82s/it, loss=0.182, lr=1e-5]Steps:  34%|███▍      | 5133/15001 [3:17:47<5:07:20,  1.87s/it, loss=0.182, lr=1e-5]Steps:  34%|███▍      | 5133/15001 [3:17:47<5:07:20,  1.87s/it, loss=0.174, lr=1e-5]Steps:  34%|███▍      | 5134/15001 [3:17:49<5:10:11,  1.89s/it, loss=0.174, lr=1e-5]Steps:  34%|███▍      | 5134/15001 [3:17:49<5:10:11,  1.89s/it, loss=0.219, lr=1e-5]Steps:  34%|███▍      | 5135/15001 [3:17:50<4:53:42,  1.79s/it, loss=0.219, lr=1e-5]Steps:  34%|███▍      | 5135/15001 [3:17:51<4:53:42,  1.79s/it, loss=0.0802, lr=1e-5]Steps:  34%|███▍      | 5136/15001 [3:17:52<5:06:53,  1.87s/it, loss=0.0802, lr=1e-5]Steps:  34%|███▍      | 5136/15001 [3:17:53<5:06:53,  1.87s/it, loss=0.115, lr=1e-5] Steps:  34%|███▍      | 5137/15001 [3:17:54<5:05:51,  1.86s/it, loss=0.115, lr=1e-5]Steps:  34%|███▍      | 5137/15001 [3:17:54<5:05:51,  1.86s/it, loss=0.225, lr=1e-5]Steps:  34%|███▍      | 5138/15001 [3:17:56<5:06:23,  1.86s/it, loss=0.225, lr=1e-5]Steps:  34%|███▍      | 5138/15001 [3:17:56<5:06:23,  1.86s/it, loss=0.282, lr=1e-5]Steps:  34%|███▍      | 5139/15001 [3:17:58<5:03:07,  1.84s/it, loss=0.282, lr=1e-5]Steps:  34%|███▍      | 5139/15001 [3:17:58<5:03:07,  1.84s/it, loss=0.244, lr=1e-5]Steps:  34%|███▍      | 5140/15001 [3:18:00<4:59:12,  1.82s/it, loss=0.244, lr=1e-5]Steps:  34%|███▍      | 5140/15001 [3:18:00<4:59:12,  1.82s/it, loss=0.122, lr=1e-5]Steps:  34%|███▍      | 5141/15001 [3:18:02<5:01:33,  1.83s/it, loss=0.122, lr=1e-5]Steps:  34%|███▍      | 5141/15001 [3:18:02<5:01:33,  1.83s/it, loss=0.171, lr=1e-5]Steps:  34%|███▍      | 5142/15001 [3:18:03<5:01:33,  1.84s/it, loss=0.171, lr=1e-5]Steps:  34%|███▍      | 5142/15001 [3:18:04<5:01:33,  1.84s/it, loss=0.331, lr=1e-5]Steps:  34%|███▍      | 5143/15001 [3:18:05<5:03:47,  1.85s/it, loss=0.331, lr=1e-5]Steps:  34%|███▍      | 5143/15001 [3:18:06<5:03:47,  1.85s/it, loss=0.0924, lr=1e-5]Steps:  34%|███▍      | 5144/15001 [3:18:08<5:27:33,  1.99s/it, loss=0.0924, lr=1e-5]Steps:  34%|███▍      | 5144/15001 [3:18:08<5:27:33,  1.99s/it, loss=0.186, lr=1e-5] Steps:  34%|███▍      | 5145/15001 [3:18:09<5:16:31,  1.93s/it, loss=0.186, lr=1e-5]Steps:  34%|███▍      | 5145/15001 [3:18:10<5:16:31,  1.93s/it, loss=0.255, lr=1e-5]Steps:  34%|███▍      | 5146/15001 [3:18:12<5:32:30,  2.02s/it, loss=0.255, lr=1e-5]Steps:  34%|███▍      | 5146/15001 [3:18:12<5:32:30,  2.02s/it, loss=0.289, lr=1e-5]Steps:  34%|███▍      | 5147/15001 [3:18:14<5:35:26,  2.04s/it, loss=0.289, lr=1e-5]Steps:  34%|███▍      | 5147/15001 [3:18:14<5:35:26,  2.04s/it, loss=0.0979, lr=1e-5]Steps:  34%|███▍      | 5148/15001 [3:18:16<5:30:46,  2.01s/it, loss=0.0979, lr=1e-5]Steps:  34%|███▍      | 5148/15001 [3:18:16<5:30:46,  2.01s/it, loss=0.0929, lr=1e-5]Steps:  34%|███▍      | 5149/15001 [3:18:18<5:22:30,  1.96s/it, loss=0.0929, lr=1e-5]Steps:  34%|███▍      | 5149/15001 [3:18:18<5:22:30,  1.96s/it, loss=0.253, lr=1e-5] Steps:  34%|███▍      | 5150/15001 [3:18:19<5:12:35,  1.90s/it, loss=0.253, lr=1e-5]Steps:  34%|███▍      | 5150/15001 [3:18:19<5:12:35,  1.90s/it, loss=0.257, lr=1e-5]Steps:  34%|███▍      | 5151/15001 [3:18:21<4:53:45,  1.79s/it, loss=0.257, lr=1e-5]Steps:  34%|███▍      | 5151/15001 [3:18:21<4:53:45,  1.79s/it, loss=0.0195, lr=1e-5]Steps:  34%|███▍      | 5152/15001 [3:18:23<4:56:52,  1.81s/it, loss=0.0195, lr=1e-5]Steps:  34%|███▍      | 5152/15001 [3:18:23<4:56:52,  1.81s/it, loss=0.0951, lr=1e-5]Steps:  34%|███▍      | 5153/15001 [3:18:25<5:12:08,  1.90s/it, loss=0.0951, lr=1e-5]Steps:  34%|███▍      | 5153/15001 [3:18:25<5:12:08,  1.90s/it, loss=0.0724, lr=1e-5]Steps:  34%|███▍      | 5154/15001 [3:18:26<4:59:07,  1.82s/it, loss=0.0724, lr=1e-5]Steps:  34%|███▍      | 5154/15001 [3:18:27<4:59:07,  1.82s/it, loss=0.133, lr=1e-5] Steps:  34%|███▍      | 5155/15001 [3:18:28<5:01:21,  1.84s/it, loss=0.133, lr=1e-5]Steps:  34%|███▍      | 5155/15001 [3:18:29<5:01:21,  1.84s/it, loss=0.465, lr=1e-5]Steps:  34%|███▍      | 5156/15001 [3:18:30<4:58:06,  1.82s/it, loss=0.465, lr=1e-5]Steps:  34%|███▍      | 5156/15001 [3:18:30<4:58:06,  1.82s/it, loss=0.0345, lr=1e-5]Steps:  34%|███▍      | 5157/15001 [3:18:32<5:01:23,  1.84s/it, loss=0.0345, lr=1e-5]Steps:  34%|███▍      | 5157/15001 [3:18:32<5:01:23,  1.84s/it, loss=0.0815, lr=1e-5]Steps:  34%|███▍      | 5158/15001 [3:18:34<5:01:19,  1.84s/it, loss=0.0815, lr=1e-5]Steps:  34%|███▍      | 5158/15001 [3:18:34<5:01:19,  1.84s/it, loss=0.157, lr=1e-5] Steps:  34%|███▍      | 5159/15001 [3:18:36<4:59:59,  1.83s/it, loss=0.157, lr=1e-5]Steps:  34%|███▍      | 5159/15001 [3:18:36<4:59:59,  1.83s/it, loss=0.467, lr=1e-5]Steps:  34%|███▍      | 5160/15001 [3:18:38<5:09:18,  1.89s/it, loss=0.467, lr=1e-5]Steps:  34%|███▍      | 5160/15001 [3:18:38<5:09:18,  1.89s/it, loss=0.146, lr=1e-5]Steps:  34%|███▍      | 5161/15001 [3:18:39<5:04:53,  1.86s/it, loss=0.146, lr=1e-5]Steps:  34%|███▍      | 5161/15001 [3:18:40<5:04:53,  1.86s/it, loss=0.137, lr=1e-5]Steps:  34%|███▍      | 5162/15001 [3:18:41<5:11:16,  1.90s/it, loss=0.137, lr=1e-5]Steps:  34%|███▍      | 5162/15001 [3:18:42<5:11:16,  1.90s/it, loss=0.0768, lr=1e-5]Steps:  34%|███▍      | 5163/15001 [3:18:43<5:08:23,  1.88s/it, loss=0.0768, lr=1e-5]Steps:  34%|███▍      | 5163/15001 [3:18:43<5:08:23,  1.88s/it, loss=0.126, lr=1e-5] Steps:  34%|███▍      | 5164/15001 [3:18:45<4:56:15,  1.81s/it, loss=0.126, lr=1e-5]Steps:  34%|███▍      | 5164/15001 [3:18:45<4:56:15,  1.81s/it, loss=0.206, lr=1e-5]Steps:  34%|███▍      | 5165/15001 [3:18:47<5:05:13,  1.86s/it, loss=0.206, lr=1e-5]Steps:  34%|███▍      | 5165/15001 [3:18:48<5:05:13,  1.86s/it, loss=0.195, lr=1e-5]Steps:  34%|███▍      | 5166/15001 [3:18:49<5:30:30,  2.02s/it, loss=0.195, lr=1e-5]Steps:  34%|███▍      | 5166/15001 [3:18:49<5:30:30,  2.02s/it, loss=0.289, lr=1e-5]Steps:  34%|███▍      | 5167/15001 [3:18:51<5:33:20,  2.03s/it, loss=0.289, lr=1e-5]Steps:  34%|███▍      | 5167/15001 [3:18:51<5:33:20,  2.03s/it, loss=0.39, lr=1e-5] Steps:  34%|███▍      | 5168/15001 [3:18:53<5:32:00,  2.03s/it, loss=0.39, lr=1e-5]Steps:  34%|███▍      | 5168/15001 [3:18:53<5:32:00,  2.03s/it, loss=0.292, lr=1e-5]Steps:  34%|███▍      | 5169/15001 [3:18:55<5:21:05,  1.96s/it, loss=0.292, lr=1e-5]Steps:  34%|███▍      | 5169/15001 [3:18:55<5:21:05,  1.96s/it, loss=0.206, lr=1e-5]Steps:  34%|███▍      | 5170/15001 [3:18:57<5:29:10,  2.01s/it, loss=0.206, lr=1e-5]Steps:  34%|███▍      | 5170/15001 [3:18:58<5:29:10,  2.01s/it, loss=0.229, lr=1e-5]Steps:  34%|███▍      | 5171/15001 [3:18:59<5:29:43,  2.01s/it, loss=0.229, lr=1e-5]Steps:  34%|███▍      | 5171/15001 [3:18:59<5:29:43,  2.01s/it, loss=0.105, lr=1e-5]Steps:  34%|███▍      | 5172/15001 [3:19:01<5:25:20,  1.99s/it, loss=0.105, lr=1e-5]Steps:  34%|███▍      | 5172/15001 [3:19:01<5:25:20,  1.99s/it, loss=0.156, lr=1e-5]Steps:  34%|███▍      | 5173/15001 [3:19:03<4:58:40,  1.82s/it, loss=0.156, lr=1e-5]Steps:  34%|███▍      | 5173/15001 [3:19:03<4:58:40,  1.82s/it, loss=0.18, lr=1e-5] Steps:  34%|███▍      | 5174/15001 [3:19:05<5:09:22,  1.89s/it, loss=0.18, lr=1e-5]Steps:  34%|███▍      | 5174/15001 [3:19:05<5:09:22,  1.89s/it, loss=0.195, lr=1e-5]Steps:  34%|███▍      | 5175/15001 [3:19:07<5:05:06,  1.86s/it, loss=0.195, lr=1e-5]Steps:  34%|███▍      | 5175/15001 [3:19:07<5:05:06,  1.86s/it, loss=0.0431, lr=1e-5]Steps:  35%|███▍      | 5176/15001 [3:19:09<5:12:13,  1.91s/it, loss=0.0431, lr=1e-5]Steps:  35%|███▍      | 5176/15001 [3:19:09<5:12:13,  1.91s/it, loss=0.0488, lr=1e-5]Steps:  35%|███▍      | 5177/15001 [3:19:10<5:02:30,  1.85s/it, loss=0.0488, lr=1e-5]Steps:  35%|███▍      | 5177/15001 [3:19:10<5:02:30,  1.85s/it, loss=0.335, lr=1e-5] Steps:  35%|███▍      | 5178/15001 [3:19:12<5:04:00,  1.86s/it, loss=0.335, lr=1e-5]Steps:  35%|███▍      | 5178/15001 [3:19:12<5:04:00,  1.86s/it, loss=0.226, lr=1e-5]Steps:  35%|███▍      | 5179/15001 [3:19:14<4:50:59,  1.78s/it, loss=0.226, lr=1e-5]Steps:  35%|███▍      | 5179/15001 [3:19:14<4:50:59,  1.78s/it, loss=0.217, lr=1e-5]Steps:  35%|███▍      | 5180/15001 [3:19:16<5:05:36,  1.87s/it, loss=0.217, lr=1e-5]Steps:  35%|███▍      | 5180/15001 [3:19:16<5:05:36,  1.87s/it, loss=0.0942, lr=1e-5]Steps:  35%|███▍      | 5181/15001 [3:19:18<5:01:02,  1.84s/it, loss=0.0942, lr=1e-5]Steps:  35%|███▍      | 5181/15001 [3:19:18<5:01:02,  1.84s/it, loss=0.368, lr=1e-5] Steps:  35%|███▍      | 5182/15001 [3:19:19<4:44:28,  1.74s/it, loss=0.368, lr=1e-5]Steps:  35%|███▍      | 5182/15001 [3:19:19<4:44:28,  1.74s/it, loss=0.21, lr=1e-5] Steps:  35%|███▍      | 5183/15001 [3:19:21<4:59:03,  1.83s/it, loss=0.21, lr=1e-5]Steps:  35%|███▍      | 5183/15001 [3:19:21<4:59:03,  1.83s/it, loss=0.075, lr=1e-5]Steps:  35%|███▍      | 5184/15001 [3:19:23<5:00:54,  1.84s/it, loss=0.075, lr=1e-5]Steps:  35%|███▍      | 5184/15001 [3:19:23<5:00:54,  1.84s/it, loss=0.195, lr=1e-5]Steps:  35%|███▍      | 5185/15001 [3:19:25<5:06:49,  1.88s/it, loss=0.195, lr=1e-5]Steps:  35%|███▍      | 5185/15001 [3:19:25<5:06:49,  1.88s/it, loss=0.252, lr=1e-5]Steps:  35%|███▍      | 5186/15001 [3:19:26<4:49:57,  1.77s/it, loss=0.252, lr=1e-5]Steps:  35%|███▍      | 5186/15001 [3:19:27<4:49:57,  1.77s/it, loss=0.0227, lr=1e-5]Steps:  35%|███▍      | 5187/15001 [3:19:28<4:58:38,  1.83s/it, loss=0.0227, lr=1e-5]Steps:  35%|███▍      | 5187/15001 [3:19:29<4:58:38,  1.83s/it, loss=0.234, lr=1e-5] Steps:  35%|███▍      | 5188/15001 [3:19:30<4:56:56,  1.82s/it, loss=0.234, lr=1e-5]Steps:  35%|███▍      | 5188/15001 [3:19:30<4:56:56,  1.82s/it, loss=0.0799, lr=1e-5]Steps:  35%|███▍      | 5189/15001 [3:19:32<5:08:28,  1.89s/it, loss=0.0799, lr=1e-5]Steps:  35%|███▍      | 5189/15001 [3:19:32<5:08:28,  1.89s/it, loss=0.0325, lr=1e-5]Steps:  35%|███▍      | 5190/15001 [3:19:34<5:16:18,  1.93s/it, loss=0.0325, lr=1e-5]Steps:  35%|███▍      | 5190/15001 [3:19:34<5:16:18,  1.93s/it, loss=0.0635, lr=1e-5]Steps:  35%|███▍      | 5191/15001 [3:19:36<5:16:49,  1.94s/it, loss=0.0635, lr=1e-5]Steps:  35%|███▍      | 5191/15001 [3:19:37<5:16:49,  1.94s/it, loss=0.0799, lr=1e-5]Steps:  35%|███▍      | 5192/15001 [3:19:38<5:15:48,  1.93s/it, loss=0.0799, lr=1e-5]Steps:  35%|███▍      | 5192/15001 [3:19:38<5:15:48,  1.93s/it, loss=0.244, lr=1e-5] Steps:  35%|███▍      | 5193/15001 [3:19:40<5:15:29,  1.93s/it, loss=0.244, lr=1e-5]Steps:  35%|███▍      | 5193/15001 [3:19:40<5:15:29,  1.93s/it, loss=0.259, lr=1e-5]Steps:  35%|███▍      | 5194/15001 [3:19:42<5:24:06,  1.98s/it, loss=0.259, lr=1e-5]Steps:  35%|███▍      | 5194/15001 [3:19:42<5:24:06,  1.98s/it, loss=0.197, lr=1e-5]Steps:  35%|███▍      | 5195/15001 [3:19:44<5:11:19,  1.90s/it, loss=0.197, lr=1e-5]Steps:  35%|███▍      | 5195/15001 [3:19:44<5:11:19,  1.90s/it, loss=0.287, lr=1e-5]Steps:  35%|███▍      | 5196/15001 [3:19:46<5:19:44,  1.96s/it, loss=0.287, lr=1e-5]Steps:  35%|███▍      | 5196/15001 [3:19:46<5:19:44,  1.96s/it, loss=0.0327, lr=1e-5]Steps:  35%|███▍      | 5197/15001 [3:19:48<5:20:56,  1.96s/it, loss=0.0327, lr=1e-5]Steps:  35%|███▍      | 5197/15001 [3:19:48<5:20:56,  1.96s/it, loss=0.0695, lr=1e-5]Steps:  35%|███▍      | 5198/15001 [3:19:50<5:15:13,  1.93s/it, loss=0.0695, lr=1e-5]Steps:  35%|███▍      | 5198/15001 [3:19:50<5:15:13,  1.93s/it, loss=0.11, lr=1e-5]  Steps:  35%|███▍      | 5199/15001 [3:19:52<5:09:07,  1.89s/it, loss=0.11, lr=1e-5]Steps:  35%|███▍      | 5199/15001 [3:19:52<5:09:07,  1.89s/it, loss=0.168, lr=1e-5]Steps:  35%|███▍      | 5200/15001 [3:19:54<5:11:33,  1.91s/it, loss=0.168, lr=1e-5]Steps:  35%|███▍      | 5200/15001 [3:19:54<5:11:33,  1.91s/it, loss=0.117, lr=1e-5]Steps:  35%|███▍      | 5201/15001 [3:19:55<5:03:31,  1.86s/it, loss=0.117, lr=1e-5]Steps:  35%|███▍      | 5201/15001 [3:19:55<5:03:31,  1.86s/it, loss=0.0651, lr=1e-5]Steps:  35%|███▍      | 5202/15001 [3:19:57<5:03:17,  1.86s/it, loss=0.0651, lr=1e-5]Steps:  35%|███▍      | 5202/15001 [3:19:57<5:03:17,  1.86s/it, loss=0.213, lr=1e-5] Steps:  35%|███▍      | 5203/15001 [3:19:59<4:58:07,  1.83s/it, loss=0.213, lr=1e-5]Steps:  35%|███▍      | 5203/15001 [3:19:59<4:58:07,  1.83s/it, loss=0.187, lr=1e-5]Steps:  35%|███▍      | 5204/15001 [3:20:01<4:58:04,  1.83s/it, loss=0.187, lr=1e-5]Steps:  35%|███▍      | 5204/15001 [3:20:01<4:58:04,  1.83s/it, loss=0.197, lr=1e-5]Steps:  35%|███▍      | 5205/15001 [3:20:02<4:48:29,  1.77s/it, loss=0.197, lr=1e-5]Steps:  35%|███▍      | 5205/15001 [3:20:03<4:48:29,  1.77s/it, loss=0.156, lr=1e-5]Steps:  35%|███▍      | 5206/15001 [3:20:04<4:51:44,  1.79s/it, loss=0.156, lr=1e-5]Steps:  35%|███▍      | 5206/15001 [3:20:04<4:51:44,  1.79s/it, loss=0.301, lr=1e-5]Steps:  35%|███▍      | 5207/15001 [3:20:06<4:57:33,  1.82s/it, loss=0.301, lr=1e-5]Steps:  35%|███▍      | 5207/15001 [3:20:06<4:57:33,  1.82s/it, loss=0.23, lr=1e-5] Steps:  35%|███▍      | 5208/15001 [3:20:08<4:42:25,  1.73s/it, loss=0.23, lr=1e-5]Steps:  35%|███▍      | 5208/15001 [3:20:08<4:42:25,  1.73s/it, loss=0.172, lr=1e-5]Steps:  35%|███▍      | 5209/15001 [3:20:09<4:49:15,  1.77s/it, loss=0.172, lr=1e-5]Steps:  35%|███▍      | 5209/15001 [3:20:10<4:49:15,  1.77s/it, loss=0.139, lr=1e-5]Steps:  35%|███▍      | 5210/15001 [3:20:11<5:00:31,  1.84s/it, loss=0.139, lr=1e-5]Steps:  35%|███▍      | 5210/15001 [3:20:12<5:00:31,  1.84s/it, loss=0.186, lr=1e-5]Steps:  35%|███▍      | 5211/15001 [3:20:13<4:55:10,  1.81s/it, loss=0.186, lr=1e-5]Steps:  35%|███▍      | 5211/15001 [3:20:14<4:55:10,  1.81s/it, loss=0.0851, lr=1e-5]Steps:  35%|███▍      | 5212/15001 [3:20:15<5:12:53,  1.92s/it, loss=0.0851, lr=1e-5]Steps:  35%|███▍      | 5212/15001 [3:20:15<5:12:53,  1.92s/it, loss=0.159, lr=1e-5] Steps:  35%|███▍      | 5213/15001 [3:20:17<5:13:46,  1.92s/it, loss=0.159, lr=1e-5]Steps:  35%|███▍      | 5213/15001 [3:20:17<5:13:46,  1.92s/it, loss=0.259, lr=1e-5]Steps:  35%|███▍      | 5214/15001 [3:20:19<5:15:20,  1.93s/it, loss=0.259, lr=1e-5]Steps:  35%|███▍      | 5214/15001 [3:20:19<5:15:20,  1.93s/it, loss=0.149, lr=1e-5]Steps:  35%|███▍      | 5215/15001 [3:20:21<5:17:09,  1.94s/it, loss=0.149, lr=1e-5]Steps:  35%|███▍      | 5215/15001 [3:20:22<5:17:09,  1.94s/it, loss=0.209, lr=1e-5]Steps:  35%|███▍      | 5216/15001 [3:20:23<5:27:32,  2.01s/it, loss=0.209, lr=1e-5]Steps:  35%|███▍      | 5216/15001 [3:20:24<5:27:32,  2.01s/it, loss=0.108, lr=1e-5]Steps:  35%|███▍      | 5217/15001 [3:20:25<5:18:45,  1.95s/it, loss=0.108, lr=1e-5]Steps:  35%|███▍      | 5217/15001 [3:20:25<5:18:45,  1.95s/it, loss=0.191, lr=1e-5]Steps:  35%|███▍      | 5218/15001 [3:20:27<5:04:45,  1.87s/it, loss=0.191, lr=1e-5]Steps:  35%|███▍      | 5218/15001 [3:20:27<5:04:45,  1.87s/it, loss=0.0999, lr=1e-5]Steps:  35%|███▍      | 5219/15001 [3:20:29<5:06:48,  1.88s/it, loss=0.0999, lr=1e-5]Steps:  35%|███▍      | 5219/15001 [3:20:29<5:06:48,  1.88s/it, loss=0.211, lr=1e-5] Steps:  35%|███▍      | 5220/15001 [3:20:31<5:09:59,  1.90s/it, loss=0.211, lr=1e-5]Steps:  35%|███▍      | 5220/15001 [3:20:31<5:09:59,  1.90s/it, loss=0.258, lr=1e-5]Steps:  35%|███▍      | 5221/15001 [3:20:32<4:48:58,  1.77s/it, loss=0.258, lr=1e-5]Steps:  35%|███▍      | 5221/15001 [3:20:33<4:48:58,  1.77s/it, loss=0.0212, lr=1e-5]Steps:  35%|███▍      | 5222/15001 [3:20:34<4:51:50,  1.79s/it, loss=0.0212, lr=1e-5]Steps:  35%|███▍      | 5222/15001 [3:20:34<4:51:50,  1.79s/it, loss=0.119, lr=1e-5] Steps:  35%|███▍      | 5223/15001 [3:20:36<4:59:30,  1.84s/it, loss=0.119, lr=1e-5]Steps:  35%|███▍      | 5223/15001 [3:20:36<4:59:30,  1.84s/it, loss=0.13, lr=1e-5] Steps:  35%|███▍      | 5224/15001 [3:20:38<4:56:51,  1.82s/it, loss=0.13, lr=1e-5]Steps:  35%|███▍      | 5224/15001 [3:20:38<4:56:51,  1.82s/it, loss=0.348, lr=1e-5]Steps:  35%|███▍      | 5225/15001 [3:20:40<4:51:27,  1.79s/it, loss=0.348, lr=1e-5]Steps:  35%|███▍      | 5225/15001 [3:20:40<4:51:27,  1.79s/it, loss=0.203, lr=1e-5]Steps:  35%|███▍      | 5226/15001 [3:20:42<5:01:32,  1.85s/it, loss=0.203, lr=1e-5]Steps:  35%|███▍      | 5226/15001 [3:20:42<5:01:32,  1.85s/it, loss=0.0741, lr=1e-5]Steps:  35%|███▍      | 5227/15001 [3:20:44<5:08:58,  1.90s/it, loss=0.0741, lr=1e-5]Steps:  35%|███▍      | 5227/15001 [3:20:44<5:08:58,  1.90s/it, loss=0.0787, lr=1e-5]Steps:  35%|███▍      | 5228/15001 [3:20:45<5:03:27,  1.86s/it, loss=0.0787, lr=1e-5]Steps:  35%|███▍      | 5228/15001 [3:20:45<5:03:27,  1.86s/it, loss=0.263, lr=1e-5] Steps:  35%|███▍      | 5229/15001 [3:20:47<4:54:59,  1.81s/it, loss=0.263, lr=1e-5]Steps:  35%|███▍      | 5229/15001 [3:20:47<4:54:59,  1.81s/it, loss=0.367, lr=1e-5]Steps:  35%|███▍      | 5230/15001 [3:20:49<4:52:07,  1.79s/it, loss=0.367, lr=1e-5]Steps:  35%|███▍      | 5230/15001 [3:20:49<4:52:07,  1.79s/it, loss=0.0942, lr=1e-5]Steps:  35%|███▍      | 5231/15001 [3:20:51<4:58:00,  1.83s/it, loss=0.0942, lr=1e-5]Steps:  35%|███▍      | 5231/15001 [3:20:51<4:58:00,  1.83s/it, loss=0.158, lr=1e-5] Steps:  35%|███▍      | 5232/15001 [3:20:52<4:57:38,  1.83s/it, loss=0.158, lr=1e-5]Steps:  35%|███▍      | 5232/15001 [3:20:53<4:57:38,  1.83s/it, loss=0.109, lr=1e-5]Steps:  35%|███▍      | 5233/15001 [3:20:54<4:44:33,  1.75s/it, loss=0.109, lr=1e-5]Steps:  35%|███▍      | 5233/15001 [3:20:54<4:44:33,  1.75s/it, loss=0.313, lr=1e-5]Steps:  35%|███▍      | 5234/15001 [3:20:56<5:03:03,  1.86s/it, loss=0.313, lr=1e-5]Steps:  35%|███▍      | 5234/15001 [3:20:56<5:03:03,  1.86s/it, loss=0.0579, lr=1e-5]Steps:  35%|███▍      | 5235/15001 [3:20:58<5:07:58,  1.89s/it, loss=0.0579, lr=1e-5]Steps:  35%|███▍      | 5235/15001 [3:20:58<5:07:58,  1.89s/it, loss=0.265, lr=1e-5] Steps:  35%|███▍      | 5236/15001 [3:21:00<5:08:03,  1.89s/it, loss=0.265, lr=1e-5]Steps:  35%|███▍      | 5236/15001 [3:21:00<5:08:03,  1.89s/it, loss=0.151, lr=1e-5]Steps:  35%|███▍      | 5237/15001 [3:21:02<5:01:25,  1.85s/it, loss=0.151, lr=1e-5]Steps:  35%|███▍      | 5237/15001 [3:21:02<5:01:25,  1.85s/it, loss=0.155, lr=1e-5]Steps:  35%|███▍      | 5238/15001 [3:21:04<5:28:55,  2.02s/it, loss=0.155, lr=1e-5]Steps:  35%|███▍      | 5238/15001 [3:21:04<5:28:55,  2.02s/it, loss=0.241, lr=1e-5]Steps:  35%|███▍      | 5239/15001 [3:21:06<5:26:26,  2.01s/it, loss=0.241, lr=1e-5]Steps:  35%|███▍      | 5239/15001 [3:21:06<5:26:26,  2.01s/it, loss=0.0571, lr=1e-5]Steps:  35%|███▍      | 5240/15001 [3:21:08<5:20:03,  1.97s/it, loss=0.0571, lr=1e-5]Steps:  35%|███▍      | 5240/15001 [3:21:08<5:20:03,  1.97s/it, loss=0.2, lr=1e-5]   Steps:  35%|███▍      | 5241/15001 [3:21:10<5:14:14,  1.93s/it, loss=0.2, lr=1e-5]Steps:  35%|███▍      | 5241/15001 [3:21:10<5:14:14,  1.93s/it, loss=0.0915, lr=1e-5]Steps:  35%|███▍      | 5242/15001 [3:21:12<5:10:58,  1.91s/it, loss=0.0915, lr=1e-5]Steps:  35%|███▍      | 5242/15001 [3:21:12<5:10:58,  1.91s/it, loss=0.122, lr=1e-5] Steps:  35%|███▍      | 5243/15001 [3:21:14<5:06:32,  1.88s/it, loss=0.122, lr=1e-5]Steps:  35%|███▍      | 5243/15001 [3:21:14<5:06:32,  1.88s/it, loss=0.126, lr=1e-5]Steps:  35%|███▍      | 5244/15001 [3:21:15<4:59:02,  1.84s/it, loss=0.126, lr=1e-5]Steps:  35%|███▍      | 5244/15001 [3:21:16<4:59:02,  1.84s/it, loss=0.166, lr=1e-5]Steps:  35%|███▍      | 5245/15001 [3:21:17<5:02:11,  1.86s/it, loss=0.166, lr=1e-5]Steps:  35%|███▍      | 5245/15001 [3:21:17<5:02:11,  1.86s/it, loss=0.0779, lr=1e-5]Steps:  35%|███▍      | 5246/15001 [3:21:19<5:02:55,  1.86s/it, loss=0.0779, lr=1e-5]Steps:  35%|███▍      | 5246/15001 [3:21:19<5:02:55,  1.86s/it, loss=0.179, lr=1e-5] Steps:  35%|███▍      | 5247/15001 [3:21:21<4:49:31,  1.78s/it, loss=0.179, lr=1e-5]Steps:  35%|███▍      | 5247/15001 [3:21:21<4:49:31,  1.78s/it, loss=0.136, lr=1e-5]Steps:  35%|███▍      | 5248/15001 [3:21:23<5:00:43,  1.85s/it, loss=0.136, lr=1e-5]Steps:  35%|███▍      | 5248/15001 [3:21:23<5:00:43,  1.85s/it, loss=0.311, lr=1e-5]Steps:  35%|███▍      | 5249/15001 [3:21:25<5:04:45,  1.88s/it, loss=0.311, lr=1e-5]Steps:  35%|███▍      | 5249/15001 [3:21:25<5:04:45,  1.88s/it, loss=0.448, lr=1e-5]Steps:  35%|███▍      | 5250/15001 [3:21:26<4:47:29,  1.77s/it, loss=0.448, lr=1e-5]Steps:  35%|███▍      | 5250/15001 [3:21:27<4:47:29,  1.77s/it, loss=0.11, lr=1e-5] Steps:  35%|███▌      | 5251/15001 [3:21:28<5:05:14,  1.88s/it, loss=0.11, lr=1e-5]Steps:  35%|███▌      | 5251/15001 [3:21:28<5:05:14,  1.88s/it, loss=0.142, lr=1e-5]Steps:  35%|███▌      | 5252/15001 [3:21:30<4:57:46,  1.83s/it, loss=0.142, lr=1e-5]Steps:  35%|███▌      | 5252/15001 [3:21:30<4:57:46,  1.83s/it, loss=0.0113, lr=1e-5]Steps:  35%|███▌      | 5253/15001 [3:21:32<4:54:47,  1.81s/it, loss=0.0113, lr=1e-5]Steps:  35%|███▌      | 5253/15001 [3:21:32<4:54:47,  1.81s/it, loss=0.0311, lr=1e-5]Steps:  35%|███▌      | 5254/15001 [3:21:34<4:52:06,  1.80s/it, loss=0.0311, lr=1e-5]Steps:  35%|███▌      | 5254/15001 [3:21:34<4:52:06,  1.80s/it, loss=0.277, lr=1e-5] Steps:  35%|███▌      | 5255/15001 [3:21:35<4:50:47,  1.79s/it, loss=0.277, lr=1e-5]Steps:  35%|███▌      | 5255/15001 [3:21:36<4:50:47,  1.79s/it, loss=0.0322, lr=1e-5]Steps:  35%|███▌      | 5256/15001 [3:21:37<4:57:45,  1.83s/it, loss=0.0322, lr=1e-5]Steps:  35%|███▌      | 5256/15001 [3:21:37<4:57:45,  1.83s/it, loss=0.285, lr=1e-5] Steps:  35%|███▌      | 5257/15001 [3:21:39<5:09:32,  1.91s/it, loss=0.285, lr=1e-5]Steps:  35%|███▌      | 5257/15001 [3:21:39<5:09:32,  1.91s/it, loss=0.0594, lr=1e-5]Steps:  35%|███▌      | 5258/15001 [3:21:41<5:03:43,  1.87s/it, loss=0.0594, lr=1e-5]Steps:  35%|███▌      | 5258/15001 [3:21:41<5:03:43,  1.87s/it, loss=0.0585, lr=1e-5]Steps:  35%|███▌      | 5259/15001 [3:21:43<5:23:37,  1.99s/it, loss=0.0585, lr=1e-5]Steps:  35%|███▌      | 5259/15001 [3:21:43<5:23:37,  1.99s/it, loss=0.0931, lr=1e-5]Steps:  35%|███▌      | 5260/15001 [3:21:45<5:24:54,  2.00s/it, loss=0.0931, lr=1e-5]Steps:  35%|███▌      | 5260/15001 [3:21:46<5:24:54,  2.00s/it, loss=0.0184, lr=1e-5]Steps:  35%|███▌      | 5261/15001 [3:21:47<5:27:23,  2.02s/it, loss=0.0184, lr=1e-5]Steps:  35%|███▌      | 5261/15001 [3:21:48<5:27:23,  2.02s/it, loss=0.0228, lr=1e-5]Steps:  35%|███▌      | 5262/15001 [3:21:49<5:15:55,  1.95s/it, loss=0.0228, lr=1e-5]Steps:  35%|███▌      | 5262/15001 [3:21:49<5:15:55,  1.95s/it, loss=0.313, lr=1e-5] Steps:  35%|███▌      | 5263/15001 [3:21:51<5:18:01,  1.96s/it, loss=0.313, lr=1e-5]Steps:  35%|███▌      | 5263/15001 [3:21:52<5:18:01,  1.96s/it, loss=0.425, lr=1e-5]Steps:  35%|███▌      | 5264/15001 [3:21:53<5:15:18,  1.94s/it, loss=0.425, lr=1e-5]Steps:  35%|███▌      | 5264/15001 [3:21:53<5:15:18,  1.94s/it, loss=0.0739, lr=1e-5]Steps:  35%|███▌      | 5265/15001 [3:21:55<5:06:20,  1.89s/it, loss=0.0739, lr=1e-5]Steps:  35%|█���█▌      | 5265/15001 [3:21:55<5:06:20,  1.89s/it, loss=0.113, lr=1e-5] Steps:  35%|███▌      | 5266/15001 [3:21:57<5:12:28,  1.93s/it, loss=0.113, lr=1e-5]Steps:  35%|███▌      | 5266/15001 [3:21:57<5:12:28,  1.93s/it, loss=0.326, lr=1e-5]Steps:  35%|███▌      | 5267/15001 [3:21:59<5:03:13,  1.87s/it, loss=0.326, lr=1e-5]Steps:  35%|███▌      | 5267/15001 [3:21:59<5:03:13,  1.87s/it, loss=0.178, lr=1e-5]Steps:  35%|███▌      | 5268/15001 [3:22:01<5:03:35,  1.87s/it, loss=0.178, lr=1e-5]Steps:  35%|███▌      | 5268/15001 [3:22:01<5:03:35,  1.87s/it, loss=0.176, lr=1e-5]Steps:  35%|███▌      | 5269/15001 [3:22:02<4:58:05,  1.84s/it, loss=0.176, lr=1e-5]Steps:  35%|███▌      | 5269/15001 [3:22:02<4:58:05,  1.84s/it, loss=0.102, lr=1e-5]Steps:  35%|███▌      | 5270/15001 [3:22:04<4:55:56,  1.82s/it, loss=0.102, lr=1e-5]Steps:  35%|███▌      | 5270/15001 [3:22:04<4:55:56,  1.82s/it, loss=0.158, lr=1e-5]Steps:  35%|███▌      | 5271/15001 [3:22:06<4:49:49,  1.79s/it, loss=0.158, lr=1e-5]Steps:  35%|███▌      | 5271/15001 [3:22:06<4:49:49,  1.79s/it, loss=0.229, lr=1e-5]Steps:  35%|███▌      | 5272/15001 [3:22:08<5:00:21,  1.85s/it, loss=0.229, lr=1e-5]Steps:  35%|███▌      | 5272/15001 [3:22:08<5:00:21,  1.85s/it, loss=0.183, lr=1e-5]Steps:  35%|███▌      | 5273/15001 [3:22:10<4:53:52,  1.81s/it, loss=0.183, lr=1e-5]Steps:  35%|███▌      | 5273/15001 [3:22:10<4:53:52,  1.81s/it, loss=0.138, lr=1e-5]Steps:  35%|███▌      | 5274/15001 [3:22:11<4:46:17,  1.77s/it, loss=0.138, lr=1e-5]Steps:  35%|███▌      | 5274/15001 [3:22:12<4:46:17,  1.77s/it, loss=0.153, lr=1e-5]Steps:  35%|███▌      | 5275/15001 [3:22:13<5:00:24,  1.85s/it, loss=0.153, lr=1e-5]Steps:  35%|███▌      | 5275/15001 [3:22:13<5:00:24,  1.85s/it, loss=0.18, lr=1e-5] Steps:  35%|███▌      | 5276/15001 [3:22:15<4:44:51,  1.76s/it, loss=0.18, lr=1e-5]Steps:  35%|███▌      | 5276/15001 [3:22:15<4:44:51,  1.76s/it, loss=0.103, lr=1e-5]Steps:  35%|███▌      | 5277/15001 [3:22:17<4:48:26,  1.78s/it, loss=0.103, lr=1e-5]Steps:  35%|███▌      | 5277/15001 [3:22:17<4:48:26,  1.78s/it, loss=0.0736, lr=1e-5]Steps:  35%|███▌      | 5278/15001 [3:22:19<5:07:12,  1.90s/it, loss=0.0736, lr=1e-5]Steps:  35%|███▌      | 5278/15001 [3:22:19<5:07:12,  1.90s/it, loss=0.0983, lr=1e-5]Steps:  35%|███▌      | 5279/15001 [3:22:21<5:01:35,  1.86s/it, loss=0.0983, lr=1e-5]Steps:  35%|███▌      | 5279/15001 [3:22:21<5:01:35,  1.86s/it, loss=0.0959, lr=1e-5]Steps:  35%|███▌      | 5280/15001 [3:22:23<5:08:37,  1.90s/it, loss=0.0959, lr=1e-5]Steps:  35%|███▌      | 5280/15001 [3:22:23<5:08:37,  1.90s/it, loss=0.0815, lr=1e-5]Steps:  35%|███▌      | 5281/15001 [3:22:24<5:07:58,  1.90s/it, loss=0.0815, lr=1e-5]Steps:  35%|███▌      | 5281/15001 [3:22:25<5:07:58,  1.90s/it, loss=0.173, lr=1e-5] Steps:  35%|███▌      | 5282/15001 [3:22:27<5:16:26,  1.95s/it, loss=0.173, lr=1e-5]Steps:  35%|███▌      | 5282/15001 [3:22:27<5:16:26,  1.95s/it, loss=0.183, lr=1e-5]Steps:  35%|███▌      | 5283/15001 [3:22:28<5:12:34,  1.93s/it, loss=0.183, lr=1e-5]Steps:  35%|███▌      | 5283/15001 [3:22:29<5:12:34,  1.93s/it, loss=0.164, lr=1e-5]Steps:  35%|███▌      | 5284/15001 [3:22:31<5:25:20,  2.01s/it, loss=0.164, lr=1e-5]Steps:  35%|███▌      | 5284/15001 [3:22:31<5:25:20,  2.01s/it, loss=0.147, lr=1e-5]Steps:  35%|███▌      | 5285/15001 [3:22:32<5:08:05,  1.90s/it, loss=0.147, lr=1e-5]Steps:  35%|███▌      | 5285/15001 [3:22:33<5:08:05,  1.90s/it, loss=0.226, lr=1e-5]Steps:  35%|███▌      | 5286/15001 [3:22:35<5:27:10,  2.02s/it, loss=0.226, lr=1e-5]Steps:  35%|███▌      | 5286/15001 [3:22:35<5:27:10,  2.02s/it, loss=0.265, lr=1e-5]Steps:  35%|███▌      | 5287/15001 [3:22:36<5:16:10,  1.95s/it, loss=0.265, lr=1e-5]Steps:  35%|███▌      | 5287/15001 [3:22:36<5:16:10,  1.95s/it, loss=0.183, lr=1e-5]Steps:  35%|███▌      | 5288/15001 [3:22:38<5:01:07,  1.86s/it, loss=0.183, lr=1e-5]Steps:  35%|███▌      | 5288/15001 [3:22:38<5:01:07,  1.86s/it, loss=0.173, lr=1e-5]Steps:  35%|███▌      | 5289/15001 [3:22:40<5:02:54,  1.87s/it, loss=0.173, lr=1e-5]Steps:  35%|███▌      | 5289/15001 [3:22:40<5:02:54,  1.87s/it, loss=0.0859, lr=1e-5]Steps:  35%|███▌      | 5290/15001 [3:22:42<5:06:17,  1.89s/it, loss=0.0859, lr=1e-5]Steps:  35%|███▌      | 5290/15001 [3:22:42<5:06:17,  1.89s/it, loss=0.229, lr=1e-5] Steps:  35%|███▌      | 5291/15001 [3:22:43<4:53:04,  1.81s/it, loss=0.229, lr=1e-5]Steps:  35%|███▌      | 5291/15001 [3:22:44<4:53:04,  1.81s/it, loss=0.301, lr=1e-5]Steps:  35%|███▌      | 5292/15001 [3:22:45<5:03:52,  1.88s/it, loss=0.301, lr=1e-5]Steps:  35%|███▌      | 5292/15001 [3:22:46<5:03:52,  1.88s/it, loss=0.278, lr=1e-5]Steps:  35%|███▌      | 5293/15001 [3:22:47<4:57:10,  1.84s/it, loss=0.278, lr=1e-5]Steps:  35%|███▌      | 5293/15001 [3:22:47<4:57:10,  1.84s/it, loss=0.211, lr=1e-5]Steps:  35%|███▌      | 5294/15001 [3:22:49<4:58:45,  1.85s/it, loss=0.211, lr=1e-5]Steps:  35%|███▌      | 5294/15001 [3:22:49<4:58:45,  1.85s/it, loss=0.283, lr=1e-5]Steps:  35%|███▌      | 5295/15001 [3:22:51<4:43:48,  1.75s/it, loss=0.283, lr=1e-5]Steps:  35%|███▌      | 5295/15001 [3:22:51<4:43:48,  1.75s/it, loss=0.0978, lr=1e-5]Steps:  35%|███▌      | 5296/15001 [3:22:52<4:46:46,  1.77s/it, loss=0.0978, lr=1e-5]Steps:  35%|███▌      | 5296/15001 [3:22:53<4:46:46,  1.77s/it, loss=0.222, lr=1e-5] Steps:  35%|███▌      | 5297/15001 [3:22:54<4:58:27,  1.85s/it, loss=0.222, lr=1e-5]Steps:  35%|███▌      | 5297/15001 [3:22:55<4:58:27,  1.85s/it, loss=0.29, lr=1e-5] Steps:  35%|███▌      | 5298/15001 [3:22:56<4:55:08,  1.83s/it, loss=0.29, lr=1e-5]Steps:  35%|███▌      | 5298/15001 [3:22:56<4:55:08,  1.83s/it, loss=0.276, lr=1e-5]Steps:  35%|███▌      | 5299/15001 [3:22:58<4:57:10,  1.84s/it, loss=0.276, lr=1e-5]Steps:  35%|███▌      | 5299/15001 [3:22:58<4:57:10,  1.84s/it, loss=0.189, lr=1e-5]Steps:  35%|███▌      | 5300/15001 [3:23:00<4:58:50,  1.85s/it, loss=0.189, lr=1e-5]Steps:  35%|███▌      | 5300/15001 [3:23:00<4:58:50,  1.85s/it, loss=0.199, lr=1e-5]Steps:  35%|███▌      | 5301/15001 [3:23:02<4:53:26,  1.82s/it, loss=0.199, lr=1e-5]Steps:  35%|███▌      | 5301/15001 [3:23:02<4:53:26,  1.82s/it, loss=0.0866, lr=1e-5]Steps:  35%|███▌      | 5302/15001 [3:23:04<4:58:34,  1.85s/it, loss=0.0866, lr=1e-5]Steps:  35%|███▌      | 5302/15001 [3:23:04<4:58:34,  1.85s/it, loss=0.0832, lr=1e-5]Steps:  35%|███▌      | 5303/15001 [3:23:06<5:02:38,  1.87s/it, loss=0.0832, lr=1e-5]Steps:  35%|███▌      | 5303/15001 [3:23:06<5:02:38,  1.87s/it, loss=0.175, lr=1e-5] Steps:  35%|███▌      | 5304/15001 [3:23:08<5:12:24,  1.93s/it, loss=0.175, lr=1e-5]Steps:  35%|███▌      | 5304/15001 [3:23:08<5:12:24,  1.93s/it, loss=0.199, lr=1e-5]Steps:  35%|███▌      | 5305/15001 [3:23:10<5:25:37,  2.01s/it, loss=0.199, lr=1e-5]Steps:  35%|███▌      | 5305/15001 [3:23:10<5:25:37,  2.01s/it, loss=0.213, lr=1e-5]Steps:  35%|███▌      | 5306/15001 [3:23:12<5:16:23,  1.96s/it, loss=0.213, lr=1e-5]Steps:  35%|███▌      | 5306/15001 [3:23:12<5:16:23,  1.96s/it, loss=0.118, lr=1e-5]Steps:  35%|███▌      | 5307/15001 [3:23:14<5:32:41,  2.06s/it, loss=0.118, lr=1e-5]Steps:  35%|███▌      | 5307/15001 [3:23:14<5:32:41,  2.06s/it, loss=0.0826, lr=1e-5]Steps:  35%|███▌      | 5308/15001 [3:23:16<5:29:46,  2.04s/it, loss=0.0826, lr=1e-5]Steps:  35%|███▌      | 5308/15001 [3:23:16<5:29:46,  2.04s/it, loss=0.214, lr=1e-5] Steps:  35%|███▌      | 5309/15001 [3:23:18<5:14:24,  1.95s/it, loss=0.214, lr=1e-5]Steps:  35%|███▌      | 5309/15001 [3:23:18<5:14:24,  1.95s/it, loss=0.452, lr=1e-5]Steps:  35%|███▌      | 5310/15001 [3:23:19<4:50:35,  1.80s/it, loss=0.452, lr=1e-5]Steps:  35%|███▌      | 5310/15001 [3:23:20<4:50:35,  1.80s/it, loss=0.28, lr=1e-5] Steps:  35%|███▌      | 5311/15001 [3:23:21<4:58:48,  1.85s/it, loss=0.28, lr=1e-5]Steps:  35%|███▌      | 5311/15001 [3:23:21<4:58:48,  1.85s/it, loss=0.212, lr=1e-5]Steps:  35%|███▌      | 5312/15001 [3:23:23<4:58:00,  1.85s/it, loss=0.212, lr=1e-5]Steps:  35%|███▌      | 5312/15001 [3:23:23<4:58:00,  1.85s/it, loss=0.14, lr=1e-5] Steps:  35%|███▌      | 5313/15001 [3:23:25<5:13:35,  1.94s/it, loss=0.14, lr=1e-5]Steps:  35%|███▌      | 5313/15001 [3:23:25<5:13:35,  1.94s/it, loss=0.134, lr=1e-5]Steps:  35%|███▌      | 5314/15001 [3:23:27<5:02:24,  1.87s/it, loss=0.134, lr=1e-5]Steps:  35%|███▌      | 5314/15001 [3:23:27<5:02:24,  1.87s/it, loss=0.168, lr=1e-5]Steps:  35%|███▌      | 5315/15001 [3:23:28<4:51:04,  1.80s/it, loss=0.168, lr=1e-5]Steps:  35%|███▌      | 5315/15001 [3:23:29<4:51:04,  1.80s/it, loss=0.151, lr=1e-5]Steps:  35%|███▌      | 5316/15001 [3:23:31<5:06:02,  1.90s/it, loss=0.151, lr=1e-5]Steps:  35%|███▌      | 5316/15001 [3:23:31<5:06:02,  1.90s/it, loss=0.185, lr=1e-5]Steps:  35%|███▌      | 5317/15001 [3:23:32<4:53:23,  1.82s/it, loss=0.185, lr=1e-5]Steps:  35%|███▌      | 5317/15001 [3:23:32<4:53:23,  1.82s/it, loss=0.0199, lr=1e-5]Steps:  35%|███▌      | 5318/15001 [3:23:34<4:52:35,  1.81s/it, loss=0.0199, lr=1e-5]Steps:  35%|███▌      | 5318/15001 [3:23:34<4:52:35,  1.81s/it, loss=0.141, lr=1e-5] Steps:  35%|███▌      | 5319/15001 [3:23:36<4:56:41,  1.84s/it, loss=0.141, lr=1e-5]Steps:  35%|███▌      | 5319/15001 [3:23:36<4:56:41,  1.84s/it, loss=0.143, lr=1e-5]Steps:  35%|███▌      | 5320/15001 [3:23:38<4:54:29,  1.83s/it, loss=0.143, lr=1e-5]Steps:  35%|███▌      | 5320/15001 [3:23:38<4:54:29,  1.83s/it, loss=0.114, lr=1e-5]Steps:  35%|███▌      | 5321/15001 [3:23:40<4:59:47,  1.86s/it, loss=0.114, lr=1e-5]Steps:  35%|███▌      | 5321/15001 [3:23:40<4:59:47,  1.86s/it, loss=0.192, lr=1e-5]Steps:  35%|███▌      | 5322/15001 [3:23:41<4:50:01,  1.80s/it, loss=0.192, lr=1e-5]Steps:  35%|███▌      | 5322/15001 [3:23:42<4:50:01,  1.80s/it, loss=0.19, lr=1e-5] Steps:  35%|███▌      | 5323/15001 [3:23:43<4:56:59,  1.84s/it, loss=0.19, lr=1e-5]Steps:  35%|███▌      | 5323/15001 [3:23:43<4:56:59,  1.84s/it, loss=0.337, lr=1e-5]Steps:  35%|███▌      | 5324/15001 [3:23:45<4:52:04,  1.81s/it, loss=0.337, lr=1e-5]Steps:  35%|███▌      | 5324/15001 [3:23:45<4:52:04,  1.81s/it, loss=0.114, lr=1e-5]Steps:  35%|███▌      | 5325/15001 [3:23:47<5:14:14,  1.95s/it, loss=0.114, lr=1e-5]Steps:  35%|███▌      | 5325/15001 [3:23:48<5:14:14,  1.95s/it, loss=0.198, lr=1e-5]Steps:  36%|███▌      | 5326/15001 [3:23:49<5:19:41,  1.98s/it, loss=0.198, lr=1e-5]Steps:  36%|███▌      | 5326/15001 [3:23:49<5:19:41,  1.98s/it, loss=0.136, lr=1e-5]Steps:  36%|███▌      | 5327/15001 [3:23:51<5:22:12,  2.00s/it, loss=0.136, lr=1e-5]Steps:  36%|███▌      | 5327/15001 [3:23:52<5:22:12,  2.00s/it, loss=0.164, lr=1e-5]Steps:  36%|███▌      | 5328/15001 [3:23:53<5:22:39,  2.00s/it, loss=0.164, lr=1e-5]Steps:  36%|███▌      | 5328/15001 [3:23:54<5:22:39,  2.00s/it, loss=0.115, lr=1e-5]Steps:  36%|███▌      | 5329/15001 [3:23:55<5:11:24,  1.93s/it, loss=0.115, lr=1e-5]Steps:  36%|███▌      | 5329/15001 [3:23:55<5:11:24,  1.93s/it, loss=0.115, lr=1e-5]Steps:  36%|███▌      | 5330/15001 [3:23:57<5:26:03,  2.02s/it, loss=0.115, lr=1e-5]Steps:  36%|███▌      | 5330/15001 [3:23:58<5:26:03,  2.02s/it, loss=0.169, lr=1e-5]Steps:  36%|███▌      | 5331/15001 [3:23:59<5:25:01,  2.02s/it, loss=0.169, lr=1e-5]Steps:  36%|███▌      | 5331/15001 [3:23:59<5:25:01,  2.02s/it, loss=0.155, lr=1e-5]Steps:  36%|███▌      | 5332/15001 [3:24:01<5:13:13,  1.94s/it, loss=0.155, lr=1e-5]Steps:  36%|███▌      | 5332/15001 [3:24:01<5:13:13,  1.94s/it, loss=0.151, lr=1e-5]Steps:  36%|███▌      | 5333/15001 [3:24:03<5:03:04,  1.88s/it, loss=0.151, lr=1e-5]Steps:  36%|███▌      | 5333/15001 [3:24:03<5:03:04,  1.88s/it, loss=0.0712, lr=1e-5]Steps:  36%|███▌      | 5334/15001 [3:24:05<5:13:25,  1.95s/it, loss=0.0712, lr=1e-5]Steps:  36%|███▌      | 5334/15001 [3:24:05<5:13:25,  1.95s/it, loss=0.127, lr=1e-5] Steps:  36%|███▌      | 5335/15001 [3:24:06<4:51:37,  1.81s/it, loss=0.127, lr=1e-5]Steps:  36%|███▌      | 5335/15001 [3:24:07<4:51:37,  1.81s/it, loss=0.0235, lr=1e-5]Steps:  36%|███▌      | 5336/15001 [3:24:08<4:56:18,  1.84s/it, loss=0.0235, lr=1e-5]Steps:  36%|███▌      | 5336/15001 [3:24:09<4:56:18,  1.84s/it, loss=0.00628, lr=1e-5]Steps:  36%|███▌      | 5337/15001 [3:24:10<5:01:16,  1.87s/it, loss=0.00628, lr=1e-5]Steps:  36%|███▌      | 5337/15001 [3:24:11<5:01:16,  1.87s/it, loss=0.121, lr=1e-5]  Steps:  36%|███▌      | 5338/15001 [3:24:12<5:01:29,  1.87s/it, loss=0.121, lr=1e-5]Steps:  36%|███▌      | 5338/15001 [3:24:12<5:01:29,  1.87s/it, loss=0.0614, lr=1e-5]Steps:  36%|███▌      | 5339/15001 [3:24:14<4:56:38,  1.84s/it, loss=0.0614, lr=1e-5]Steps:  36%|███▌      | 5339/15001 [3:24:14<4:56:38,  1.84s/it, loss=0.169, lr=1e-5] Steps:  36%|███▌      | 5340/15001 [3:24:16<4:46:18,  1.78s/it, loss=0.169, lr=1e-5]Steps:  36%|███▌      | 5340/15001 [3:24:16<4:46:18,  1.78s/it, loss=0.105, lr=1e-5]Steps:  36%|███▌      | 5341/15001 [3:24:17<4:52:19,  1.82s/it, loss=0.105, lr=1e-5]Steps:  36%|███▌      | 5341/15001 [3:24:18<4:52:19,  1.82s/it, loss=0.234, lr=1e-5]Steps:  36%|███▌      | 5342/15001 [3:24:19<4:55:04,  1.83s/it, loss=0.234, lr=1e-5]Steps:  36%|███▌      | 5342/15001 [3:24:20<4:55:04,  1.83s/it, loss=0.154, lr=1e-5]Steps:  36%|███▌      | 5343/15001 [3:24:21<4:50:30,  1.80s/it, loss=0.154, lr=1e-5]Steps:  36%|███▌      | 5343/15001 [3:24:22<4:50:30,  1.80s/it, loss=0.299, lr=1e-5]Steps:  36%|███▌      | 5344/15001 [3:24:23<5:02:45,  1.88s/it, loss=0.299, lr=1e-5]Steps:  36%|███▌      | 5344/15001 [3:24:23<5:02:45,  1.88s/it, loss=0.0977, lr=1e-5]Steps:  36%|███▌      | 5345/15001 [3:24:25<4:55:42,  1.84s/it, loss=0.0977, lr=1e-5]Steps:  36%|███▌      | 5345/15001 [3:24:25<4:55:42,  1.84s/it, loss=0.371, lr=1e-5] Steps:  36%|███▌      | 5346/15001 [3:24:27<5:04:53,  1.89s/it, loss=0.371, lr=1e-5]Steps:  36%|███▌      | 5346/15001 [3:24:27<5:04:53,  1.89s/it, loss=0.142, lr=1e-5]Steps:  36%|███▌      | 5347/15001 [3:24:29<5:00:59,  1.87s/it, loss=0.142, lr=1e-5]Steps:  36%|███▌      | 5347/15001 [3:24:29<5:00:59,  1.87s/it, loss=0.19, lr=1e-5] Steps:  36%|███▌      | 5348/15001 [3:24:31<5:08:16,  1.92s/it, loss=0.19, lr=1e-5]Steps:  36%|███▌      | 5348/15001 [3:24:31<5:08:16,  1.92s/it, loss=0.102, lr=1e-5]Steps:  36%|███▌      | 5349/15001 [3:24:33<5:13:58,  1.95s/it, loss=0.102, lr=1e-5]Steps:  36%|███▌      | 5349/15001 [3:24:33<5:13:58,  1.95s/it, loss=0.27, lr=1e-5] Steps:  36%|███▌      | 5350/15001 [3:24:35<5:16:16,  1.97s/it, loss=0.27, lr=1e-5]Steps:  36%|███▌      | 5350/15001 [3:24:35<5:16:16,  1.97s/it, loss=0.172, lr=1e-5]Steps:  36%|███▌      | 5351/15001 [3:24:37<5:14:43,  1.96s/it, loss=0.172, lr=1e-5]Steps:  36%|███▌      | 5351/15001 [3:24:37<5:14:43,  1.96s/it, loss=0.182, lr=1e-5]Steps:  36%|███▌      | 5352/15001 [3:24:39<5:26:42,  2.03s/it, loss=0.182, lr=1e-5]Steps:  36%|███▌      | 5352/15001 [3:24:39<5:26:42,  2.03s/it, loss=0.154, lr=1e-5]Steps:  36%|███▌      | 5353/15001 [3:24:41<5:29:10,  2.05s/it, loss=0.154, lr=1e-5]Steps:  36%|███▌      | 5353/15001 [3:24:41<5:29:10,  2.05s/it, loss=0.345, lr=1e-5]Steps:  36%|███▌      | 5354/15001 [3:24:43<5:10:57,  1.93s/it, loss=0.345, lr=1e-5]Steps:  36%|███▌      | 5354/15001 [3:24:43<5:10:57,  1.93s/it, loss=0.113, lr=1e-5]Steps:  36%|███▌      | 5355/15001 [3:24:45<5:06:49,  1.91s/it, loss=0.113, lr=1e-5]Steps:  36%|███▌      | 5355/15001 [3:24:45<5:06:49,  1.91s/it, loss=0.239, lr=1e-5]Steps:  36%|███▌      | 5356/15001 [3:24:46<5:07:52,  1.92s/it, loss=0.239, lr=1e-5]Steps:  36%|███▌      | 5356/15001 [3:24:47<5:07:52,  1.92s/it, loss=0.224, lr=1e-5]Steps:  36%|███▌      | 5357/15001 [3:24:48<4:55:46,  1.84s/it, loss=0.224, lr=1e-5]Steps:  36%|███▌      | 5357/15001 [3:24:48<4:55:46,  1.84s/it, loss=0.0733, lr=1e-5]Steps:  36%|███▌      | 5358/15001 [3:24:50<5:01:38,  1.88s/it, loss=0.0733, lr=1e-5]Steps:  36%|███▌      | 5358/15001 [3:24:50<5:01:38,  1.88s/it, loss=0.0294, lr=1e-5]Steps:  36%|███▌      | 5359/15001 [3:24:52<4:54:53,  1.84s/it, loss=0.0294, lr=1e-5]Steps:  36%|███▌      | 5359/15001 [3:24:52<4:54:53,  1.84s/it, loss=0.284, lr=1e-5] Steps:  36%|███▌      | 5360/15001 [3:24:54<5:12:00,  1.94s/it, loss=0.284, lr=1e-5]Steps:  36%|███▌      | 5360/15001 [3:24:54<5:12:00,  1.94s/it, loss=0.102, lr=1e-5]Steps:  36%|███▌      | 5361/15001 [3:24:56<5:02:53,  1.89s/it, loss=0.102, lr=1e-5]Steps:  36%|███▌      | 5361/15001 [3:24:56<5:02:53,  1.89s/it, loss=0.138, lr=1e-5]Steps:  36%|███▌      | 5362/15001 [3:24:58<5:10:09,  1.93s/it, loss=0.138, lr=1e-5]Steps:  36%|███▌      | 5362/15001 [3:24:58<5:10:09,  1.93s/it, loss=0.418, lr=1e-5]Steps:  36%|███▌      | 5363/15001 [3:25:00<5:04:52,  1.90s/it, loss=0.418, lr=1e-5]Steps:  36%|███▌      | 5363/15001 [3:25:00<5:04:52,  1.90s/it, loss=0.132, lr=1e-5]Steps:  36%|███▌      | 5364/15001 [3:25:01<4:55:38,  1.84s/it, loss=0.132, lr=1e-5]Steps:  36%|███▌      | 5364/15001 [3:25:02<4:55:38,  1.84s/it, loss=0.0337, lr=1e-5]Steps:  36%|███▌      | 5365/15001 [3:25:03<4:59:57,  1.87s/it, loss=0.0337, lr=1e-5]Steps:  36%|███▌      | 5365/15001 [3:25:03<4:59:57,  1.87s/it, loss=0.29, lr=1e-5]  Steps:  36%|███▌      | 5366/15001 [3:25:05<4:52:14,  1.82s/it, loss=0.29, lr=1e-5]Steps:  36%|███▌      | 5366/15001 [3:25:05<4:52:14,  1.82s/it, loss=0.333, lr=1e-5]Steps:  36%|███▌      | 5367/15001 [3:25:07<4:49:09,  1.80s/it, loss=0.333, lr=1e-5]Steps:  36%|███▌      | 5367/15001 [3:25:07<4:49:09,  1.80s/it, loss=0.185, lr=1e-5]Steps:  36%|███▌      | 5368/15001 [3:25:09<5:01:25,  1.88s/it, loss=0.185, lr=1e-5]Steps:  36%|███▌      | 5368/15001 [3:25:09<5:01:25,  1.88s/it, loss=0.195, lr=1e-5]Steps:  36%|███▌      | 5369/15001 [3:25:11<5:03:27,  1.89s/it, loss=0.195, lr=1e-5]Steps:  36%|███▌      | 5369/15001 [3:25:11<5:03:27,  1.89s/it, loss=0.185, lr=1e-5]Steps:  36%|███▌      | 5370/15001 [3:25:12<4:49:30,  1.80s/it, loss=0.185, lr=1e-5]Steps:  36%|███▌      | 5370/15001 [3:25:13<4:49:30,  1.80s/it, loss=0.342, lr=1e-5]Steps:  36%|███▌      | 5371/15001 [3:25:15<5:13:32,  1.95s/it, loss=0.342, lr=1e-5]Steps:  36%|███▌      | 5371/15001 [3:25:15<5:13:32,  1.95s/it, loss=0.212, lr=1e-5]Steps:  36%|███▌      | 5372/15001 [3:25:16<5:03:40,  1.89s/it, loss=0.212, lr=1e-5]Steps:  36%|███▌      | 5372/15001 [3:25:17<5:03:40,  1.89s/it, loss=0.256, lr=1e-5]Steps:  36%|███▌      | 5373/15001 [3:25:18<5:11:39,  1.94s/it, loss=0.256, lr=1e-5]Steps:  36%|███▌      | 5373/15001 [3:25:19<5:11:39,  1.94s/it, loss=0.244, lr=1e-5]Steps:  36%|███▌      | 5374/15001 [3:25:21<5:28:47,  2.05s/it, loss=0.244, lr=1e-5]Steps:  36%|███▌      | 5374/15001 [3:25:21<5:28:47,  2.05s/it, loss=0.0767, lr=1e-5]Steps:  36%|███▌      | 5375/15001 [3:25:23<5:27:11,  2.04s/it, loss=0.0767, lr=1e-5]Steps:  36%|███▌      | 5375/15001 [3:25:23<5:27:11,  2.04s/it, loss=0.268, lr=1e-5] Steps:  36%|███▌      | 5376/15001 [3:25:24<5:12:55,  1.95s/it, loss=0.268, lr=1e-5]Steps:  36%|███▌      | 5376/15001 [3:25:25<5:12:55,  1.95s/it, loss=0.0859, lr=1e-5]Steps:  36%|███▌      | 5377/15001 [3:25:26<5:13:52,  1.96s/it, loss=0.0859, lr=1e-5]Steps:  36%|███▌      | 5377/15001 [3:25:27<5:13:52,  1.96s/it, loss=0.189, lr=1e-5] Steps:  36%|███▌      | 5378/15001 [3:25:28<5:10:09,  1.93s/it, loss=0.189, lr=1e-5]Steps:  36%|███▌      | 5378/15001 [3:25:29<5:10:09,  1.93s/it, loss=0.0656, lr=1e-5]Steps:  36%|███▌      | 5379/15001 [3:25:30<5:00:25,  1.87s/it, loss=0.0656, lr=1e-5]Steps:  36%|███▌      | 5379/15001 [3:25:30<5:00:25,  1.87s/it, loss=0.247, lr=1e-5] Steps:  36%|███▌      | 5380/15001 [3:25:32<5:01:05,  1.88s/it, loss=0.247, lr=1e-5]Steps:  36%|███▌      | 5380/15001 [3:25:32<5:01:05,  1.88s/it, loss=0.276, lr=1e-5]Steps:  36%|███▌      | 5381/15001 [3:25:34<5:02:42,  1.89s/it, loss=0.276, lr=1e-5]Steps:  36%|███▌      | 5381/15001 [3:25:34<5:02:42,  1.89s/it, loss=0.17, lr=1e-5] Steps:  36%|███▌      | 5382/15001 [3:25:36<4:52:32,  1.82s/it, loss=0.17, lr=1e-5]Steps:  36%|███▌      | 5382/15001 [3:25:36<4:52:32,  1.82s/it, loss=0.0616, lr=1e-5]Steps:  36%|███▌      | 5383/15001 [3:25:38<5:13:38,  1.96s/it, loss=0.0616, lr=1e-5]Steps:  36%|███▌      | 5383/15001 [3:25:38<5:13:38,  1.96s/it, loss=0.135, lr=1e-5] Steps:  36%|███▌      | 5384/15001 [3:25:40<5:01:23,  1.88s/it, loss=0.135, lr=1e-5]Steps:  36%|███▌      | 5384/15001 [3:25:40<5:01:23,  1.88s/it, loss=0.305, lr=1e-5]Steps:  36%|███▌      | 5385/15001 [3:25:41<5:00:41,  1.88s/it, loss=0.305, lr=1e-5]Steps:  36%|███▌      | 5385/15001 [3:25:42<5:00:41,  1.88s/it, loss=0.137, lr=1e-5]Steps:  36%|███▌      | 5386/15001 [3:25:43<4:45:57,  1.78s/it, loss=0.137, lr=1e-5]Steps:  36%|███▌      | 5386/15001 [3:25:43<4:45:57,  1.78s/it, loss=0.0759, lr=1e-5]Steps:  36%|███▌      | 5387/15001 [3:25:45<4:53:26,  1.83s/it, loss=0.0759, lr=1e-5]Steps:  36%|███▌      | 5387/15001 [3:25:45<4:53:26,  1.83s/it, loss=0.0234, lr=1e-5]Steps:  36%|███▌      | 5388/15001 [3:25:47<4:49:42,  1.81s/it, loss=0.0234, lr=1e-5]Steps:  36%|███▌      | 5388/15001 [3:25:47<4:49:42,  1.81s/it, loss=0.159, lr=1e-5] Steps:  36%|███▌      | 5389/15001 [3:25:48<4:50:07,  1.81s/it, loss=0.159, lr=1e-5]Steps:  36%|███▌      | 5389/15001 [3:25:49<4:50:07,  1.81s/it, loss=0.169, lr=1e-5]Steps:  36%|███▌      | 5390/15001 [3:25:50<4:53:23,  1.83s/it, loss=0.169, lr=1e-5]Steps:  36%|███▌      | 5390/15001 [3:25:51<4:53:23,  1.83s/it, loss=0.189, lr=1e-5]Steps:  36%|███▌      | 5391/15001 [3:25:52<4:47:03,  1.79s/it, loss=0.189, lr=1e-5]Steps:  36%|███▌      | 5391/15001 [3:25:52<4:47:03,  1.79s/it, loss=0.146, lr=1e-5]Steps:  36%|███▌      | 5392/15001 [3:25:54<4:53:38,  1.83s/it, loss=0.146, lr=1e-5]Steps:  36%|███▌      | 5392/15001 [3:25:54<4:53:38,  1.83s/it, loss=0.451, lr=1e-5]Steps:  36%|███▌      | 5393/15001 [3:25:56<4:53:15,  1.83s/it, loss=0.451, lr=1e-5]Steps:  36%|███▌      | 5393/15001 [3:25:56<4:53:15,  1.83s/it, loss=0.0299, lr=1e-5]Steps:  36%|███▌      | 5394/15001 [3:25:58<5:14:41,  1.97s/it, loss=0.0299, lr=1e-5]Steps:  36%|███▌      | 5394/15001 [3:25:58<5:14:41,  1.97s/it, loss=0.18, lr=1e-5]  Steps:  36%|███▌      | 5395/15001 [3:26:00<5:17:39,  1.98s/it, loss=0.18, lr=1e-5]Steps:  36%|███▌      | 5395/15001 [3:26:00<5:17:39,  1.98s/it, loss=0.0467, lr=1e-5]Steps:  36%|███▌      | 5396/15001 [3:26:02<5:21:39,  2.01s/it, loss=0.0467, lr=1e-5]Steps:  36%|███▌      | 5396/15001 [3:26:02<5:21:39,  2.01s/it, loss=0.129, lr=1e-5] Steps:  36%|███▌      | 5397/15001 [3:26:04<5:07:34,  1.92s/it, loss=0.129, lr=1e-5]Steps:  36%|███▌      | 5397/15001 [3:26:04<5:07:34,  1.92s/it, loss=0.234, lr=1e-5]Steps:  36%|███▌      | 5398/15001 [3:26:06<5:20:39,  2.00s/it, loss=0.234, lr=1e-5]Steps:  36%|███▌      | 5398/15001 [3:26:06<5:20:39,  2.00s/it, loss=0.143, lr=1e-5]Steps:  36%|███▌      | 5399/15001 [3:26:08<5:07:09,  1.92s/it, loss=0.143, lr=1e-5]Steps:  36%|███▌      | 5399/15001 [3:26:08<5:07:09,  1.92s/it, loss=0.161, lr=1e-5]Steps:  36%|███▌      | 5400/15001 [3:26:10<5:19:15,  2.00s/it, loss=0.161, lr=1e-5]Steps:  36%|███▌      | 5400/15001 [3:26:10<5:19:15,  2.00s/it, loss=0.518, lr=1e-5]Steps:  36%|███▌      | 5401/15001 [3:26:12<5:04:11,  1.90s/it, loss=0.518, lr=1e-5]Steps:  36%|███▌      | 5401/15001 [3:26:12<5:04:11,  1.90s/it, loss=0.289, lr=1e-5]Steps:  36%|███▌      | 5402/15001 [3:26:13<4:51:53,  1.82s/it, loss=0.289, lr=1e-5]Steps:  36%|███▌      | 5402/15001 [3:26:14<4:51:53,  1.82s/it, loss=0.149, lr=1e-5]Steps:  36%|███▌      | 5403/15001 [3:26:15<4:52:07,  1.83s/it, loss=0.149, lr=1e-5]Steps:  36%|███▌      | 5403/15001 [3:26:15<4:52:07,  1.83s/it, loss=0.205, lr=1e-5]Steps:  36%|███▌      | 5404/15001 [3:26:17<4:56:48,  1.86s/it, loss=0.205, lr=1e-5]Steps:  36%|███▌      | 5404/15001 [3:26:17<4:56:48,  1.86s/it, loss=0.0608, lr=1e-5]Steps:  36%|███▌      | 5405/15001 [3:26:19<4:57:54,  1.86s/it, loss=0.0608, lr=1e-5]Steps:  36%|███▌      | 5405/15001 [3:26:19<4:57:54,  1.86s/it, loss=0.335, lr=1e-5] Steps:  36%|███▌      | 5406/15001 [3:26:21<4:50:56,  1.82s/it, loss=0.335, lr=1e-5]Steps:  36%|███▌      | 5406/15001 [3:26:21<4:50:56,  1.82s/it, loss=0.133, lr=1e-5]Steps:  36%|███▌      | 5407/15001 [3:26:22<4:48:47,  1.81s/it, loss=0.133, lr=1e-5]Steps:  36%|███▌      | 5407/15001 [3:26:23<4:48:47,  1.81s/it, loss=0.035, lr=1e-5]Steps:  36%|███▌      | 5408/15001 [3:26:24<5:00:25,  1.88s/it, loss=0.035, lr=1e-5]Steps:  36%|███▌      | 5408/15001 [3:26:25<5:00:25,  1.88s/it, loss=0.23, lr=1e-5] Steps:  36%|███▌      | 5409/15001 [3:26:26<4:45:11,  1.78s/it, loss=0.23, lr=1e-5]Steps:  36%|███▌      | 5409/15001 [3:26:26<4:45:11,  1.78s/it, loss=0.104, lr=1e-5]Steps:  36%|███▌      | 5410/15001 [3:26:28<4:52:43,  1.83s/it, loss=0.104, lr=1e-5]Steps:  36%|███▌      | 5410/15001 [3:26:28<4:52:43,  1.83s/it, loss=0.263, lr=1e-5]Steps:  36%|███▌      | 5411/15001 [3:26:30<4:54:53,  1.84s/it, loss=0.263, lr=1e-5]Steps:  36%|███▌      | 5411/15001 [3:26:30<4:54:53,  1.84s/it, loss=0.113, lr=1e-5]Steps:  36%|███▌      | 5412/15001 [3:26:31<4:40:49,  1.76s/it, loss=0.113, lr=1e-5]Steps:  36%|███▌      | 5412/15001 [3:26:32<4:40:49,  1.76s/it, loss=0.221, lr=1e-5]Steps:  36%|███▌      | 5413/15001 [3:26:33<4:45:35,  1.79s/it, loss=0.221, lr=1e-5]Steps:  36%|███▌      | 5413/15001 [3:26:34<4:45:35,  1.79s/it, loss=0.0474, lr=1e-5]Steps:  36%|███▌      | 5414/15001 [3:26:35<4:57:34,  1.86s/it, loss=0.0474, lr=1e-5]Steps:  36%|███▌      | 5414/15001 [3:26:35<4:57:34,  1.86s/it, loss=0.0295, lr=1e-5]Steps:  36%|███▌      | 5415/15001 [3:26:37<4:59:36,  1.88s/it, loss=0.0295, lr=1e-5]Steps:  36%|███▌      | 5415/15001 [3:26:37<4:59:36,  1.88s/it, loss=0.146, lr=1e-5] Steps:  36%|███▌      | 5416/15001 [3:26:39<5:04:31,  1.91s/it, loss=0.146, lr=1e-5]Steps:  36%|███▌      | 5416/15001 [3:26:39<5:04:31,  1.91s/it, loss=0.147, lr=1e-5]Steps:  36%|███▌      | 5417/15001 [3:26:41<5:08:39,  1.93s/it, loss=0.147, lr=1e-5]Steps:  36%|███▌      | 5417/15001 [3:26:41<5:08:39,  1.93s/it, loss=0.152, lr=1e-5]Steps:  36%|███▌      | 5418/15001 [3:26:43<5:07:43,  1.93s/it, loss=0.152, lr=1e-5]Steps:  36%|███▌      | 5418/15001 [3:26:43<5:07:43,  1.93s/it, loss=0.133, lr=1e-5]Steps:  36%|███▌      | 5419/15001 [3:26:45<5:08:12,  1.93s/it, loss=0.133, lr=1e-5]Steps:  36%|███▌      | 5419/15001 [3:26:45<5:08:12,  1.93s/it, loss=0.357, lr=1e-5]Steps:  36%|███▌      | 5420/15001 [3:26:47<5:11:22,  1.95s/it, loss=0.357, lr=1e-5]Steps:  36%|███▌      | 5420/15001 [3:26:47<5:11:22,  1.95s/it, loss=0.2, lr=1e-5]  Steps:  36%|███▌      | 5421/15001 [3:26:49<5:04:57,  1.91s/it, loss=0.2, lr=1e-5]Steps:  36%|███▌      | 5421/15001 [3:26:49<5:04:57,  1.91s/it, loss=0.179, lr=1e-5]Steps:  36%|███▌      | 5422/15001 [3:26:51<5:07:42,  1.93s/it, loss=0.179, lr=1e-5]Steps:  36%|███▌      | 5422/15001 [3:26:51<5:07:42,  1.93s/it, loss=0.323, lr=1e-5]Steps:  36%|███▌      | 5423/15001 [3:26:53<5:09:31,  1.94s/it, loss=0.323, lr=1e-5]Steps:  36%|███▌      | 5423/15001 [3:26:53<5:09:31,  1.94s/it, loss=0.246, lr=1e-5]Steps:  36%|███▌      | 5424/15001 [3:26:54<4:53:07,  1.84s/it, loss=0.246, lr=1e-5]Steps:  36%|███▌      | 5424/15001 [3:26:55<4:53:07,  1.84s/it, loss=0.121, lr=1e-5]Steps:  36%|███▌      | 5425/15001 [3:26:57<5:07:20,  1.93s/it, loss=0.121, lr=1e-5]Steps:  36%|███▌      | 5425/15001 [3:26:57<5:07:20,  1.93s/it, loss=0.241, lr=1e-5]Steps:  36%|███▌      | 5426/15001 [3:26:58<4:53:29,  1.84s/it, loss=0.241, lr=1e-5]Steps:  36%|███▌      | 5426/15001 [3:26:58<4:53:29,  1.84s/it, loss=0.0743, lr=1e-5]Steps:  36%|███▌      | 5427/15001 [3:27:00<4:41:11,  1.76s/it, loss=0.0743, lr=1e-5]Steps:  36%|███▌      | 5427/15001 [3:27:00<4:41:11,  1.76s/it, loss=0.187, lr=1e-5] Steps:  36%|███▌      | 5428/15001 [3:27:02<4:58:32,  1.87s/it, loss=0.187, lr=1e-5]Steps:  36%|███▌      | 5428/15001 [3:27:02<4:58:32,  1.87s/it, loss=0.063, lr=1e-5]Steps:  36%|███▌      | 5429/15001 [3:27:04<4:51:26,  1.83s/it, loss=0.063, lr=1e-5]Steps:  36%|███▌      | 5429/15001 [3:27:04<4:51:26,  1.83s/it, loss=0.0994, lr=1e-5]Steps:  36%|███▌      | 5430/15001 [3:27:06<4:56:43,  1.86s/it, loss=0.0994, lr=1e-5]Steps:  36%|███▌      | 5430/15001 [3:27:06<4:56:43,  1.86s/it, loss=0.128, lr=1e-5] Steps:  36%|███▌      | 5431/15001 [3:27:07<4:38:37,  1.75s/it, loss=0.128, lr=1e-5]Steps:  36%|███▌      | 5431/15001 [3:27:07<4:38:37,  1.75s/it, loss=0.197, lr=1e-5]Steps:  36%|███▌      | 5432/15001 [3:27:09<4:48:30,  1.81s/it, loss=0.197, lr=1e-5]Steps:  36%|███▌      | 5432/15001 [3:27:09<4:48:30,  1.81s/it, loss=0.0575, lr=1e-5]Steps:  36%|███▌      | 5433/15001 [3:27:11<4:49:30,  1.82s/it, loss=0.0575, lr=1e-5]Steps:  36%|███▌      | 5433/15001 [3:27:11<4:49:30,  1.82s/it, loss=0.262, lr=1e-5] Steps:  36%|███▌      | 5434/15001 [3:27:13<4:49:55,  1.82s/it, loss=0.262, lr=1e-5]Steps:  36%|███▌      | 5434/15001 [3:27:13<4:49:55,  1.82s/it, loss=0.385, lr=1e-5]Steps:  36%|███▌      | 5435/15001 [3:27:14<4:47:39,  1.80s/it, loss=0.385, lr=1e-5]Steps:  36%|███▌      | 5435/15001 [3:27:14<4:47:39,  1.80s/it, loss=0.154, lr=1e-5]Steps:  36%|███▌      | 5436/15001 [3:27:16<4:40:04,  1.76s/it, loss=0.154, lr=1e-5]Steps:  36%|███▌      | 5436/15001 [3:27:16<4:40:04,  1.76s/it, loss=0.325, lr=1e-5]Steps:  36%|███▌      | 5437/15001 [3:27:18<4:41:01,  1.76s/it, loss=0.325, lr=1e-5]Steps:  36%|███▌      | 5437/15001 [3:27:18<4:41:01,  1.76s/it, loss=0.113, lr=1e-5]Steps:  36%|███▋      | 5438/15001 [3:27:20<4:47:27,  1.80s/it, loss=0.113, lr=1e-5]Steps:  36%|███▋      | 5438/15001 [3:27:20<4:47:27,  1.80s/it, loss=0.0361, lr=1e-5]Steps:  36%|███▋      | 5439/15001 [3:27:22<4:56:38,  1.86s/it, loss=0.0361, lr=1e-5]Steps:  36%|███▋      | 5439/15001 [3:27:22<4:56:38,  1.86s/it, loss=0.153, lr=1e-5] Steps:  36%|███▋      | 5440/15001 [3:27:23<4:50:09,  1.82s/it, loss=0.153, lr=1e-5]Steps:  36%|███▋      | 5440/15001 [3:27:24<4:50:09,  1.82s/it, loss=0.174, lr=1e-5]Steps:  36%|███▋      | 5441/15001 [3:27:26<5:04:21,  1.91s/it, loss=0.174, lr=1e-5]Steps:  36%|███▋      | 5441/15001 [3:27:26<5:04:21,  1.91s/it, loss=0.128, lr=1e-5]Steps:  36%|███▋      | 5442/15001 [3:27:27<4:57:41,  1.87s/it, loss=0.128, lr=1e-5]Steps:  36%|███▋      | 5442/15001 [3:27:28<4:57:41,  1.87s/it, loss=0.171, lr=1e-5]Steps:  36%|███▋      | 5443/15001 [3:27:30<5:20:36,  2.01s/it, loss=0.171, lr=1e-5]Steps:  36%|███▋      | 5443/15001 [3:27:30<5:20:36,  2.01s/it, loss=0.0501, lr=1e-5]Steps:  36%|███▋      | 5444/15001 [3:27:32<5:25:35,  2.04s/it, loss=0.0501, lr=1e-5]Steps:  36%|███▋      | 5444/15001 [3:27:32<5:25:35,  2.04s/it, loss=0.327, lr=1e-5] Steps:  36%|███▋      | 5445/15001 [3:27:34<5:18:03,  2.00s/it, loss=0.327, lr=1e-5]Steps:  36%|███▋      | 5445/15001 [3:27:34<5:18:03,  2.00s/it, loss=0.177, lr=1e-5]Steps:  36%|███▋      | 5446/15001 [3:27:35<5:07:37,  1.93s/it, loss=0.177, lr=1e-5]Steps:  36%|███▋      | 5446/15001 [3:27:36<5:07:37,  1.93s/it, loss=0.117, lr=1e-5]Steps:  36%|███▋      | 5447/15001 [3:27:37<5:05:58,  1.92s/it, loss=0.117, lr=1e-5]Steps:  36%|███▋      | 5447/15001 [3:27:37<5:05:58,  1.92s/it, loss=0.00444, lr=1e-5]Steps:  36%|███▋      | 5448/15001 [3:27:39<4:58:23,  1.87s/it, loss=0.00444, lr=1e-5]Steps:  36%|███▋      | 5448/15001 [3:27:39<4:58:23,  1.87s/it, loss=0.128, lr=1e-5]  Steps:  36%|███▋      | 5449/15001 [3:27:41<4:56:36,  1.86s/it, loss=0.128, lr=1e-5]Steps:  36%|███▋      | 5449/15001 [3:27:41<4:56:36,  1.86s/it, loss=0.165, lr=1e-5]Steps:  36%|███▋      | 5450/15001 [3:27:43<4:56:34,  1.86s/it, loss=0.165, lr=1e-5]Steps:  36%|███▋      | 5450/15001 [3:27:43<4:56:34,  1.86s/it, loss=0.237, lr=1e-5]Steps:  36%|███▋      | 5451/15001 [3:27:45<5:06:02,  1.92s/it, loss=0.237, lr=1e-5]Steps:  36%|███▋      | 5451/15001 [3:27:45<5:06:02,  1.92s/it, loss=0.0852, lr=1e-5]Steps:  36%|███▋      | 5452/15001 [3:27:47<5:02:31,  1.90s/it, loss=0.0852, lr=1e-5]Steps:  36%|███▋      | 5452/15001 [3:27:47<5:02:31,  1.90s/it, loss=0.283, lr=1e-5] Steps:  36%|███▋      | 5453/15001 [3:27:48<4:52:23,  1.84s/it, loss=0.283, lr=1e-5]Steps:  36%|███▋      | 5453/15001 [3:27:49<4:52:23,  1.84s/it, loss=0.204, lr=1e-5]Steps:  36%|███▋      | 5454/15001 [3:27:50<4:57:07,  1.87s/it, loss=0.204, lr=1e-5]Steps:  36%|███▋      | 5454/15001 [3:27:51<4:57:07,  1.87s/it, loss=0.253, lr=1e-5]Steps:  36%|███▋      | 5455/15001 [3:27:52<4:56:59,  1.87s/it, loss=0.253, lr=1e-5]Steps:  36%|███▋      | 5455/15001 [3:27:52<4:56:59,  1.87s/it, loss=0.142, lr=1e-5]Steps:  36%|███▋      | 5456/15001 [3:27:54<5:03:09,  1.91s/it, loss=0.142, lr=1e-5]Steps:  36%|███▋      | 5456/15001 [3:27:54<5:03:09,  1.91s/it, loss=0.2, lr=1e-5]  Steps:  36%|███▋      | 5457/15001 [3:27:56<4:51:29,  1.83s/it, loss=0.2, lr=1e-5]Steps:  36%|███▋      | 5457/15001 [3:27:56<4:51:29,  1.83s/it, loss=0.082, lr=1e-5]Steps:  36%|███▋      | 5458/15001 [3:27:58<4:47:00,  1.80s/it, loss=0.082, lr=1e-5]Steps:  36%|███▋      | 5458/15001 [3:27:58<4:47:00,  1.80s/it, loss=0.229, lr=1e-5]Steps:  36%|███▋      | 5459/15001 [3:28:00<4:55:32,  1.86s/it, loss=0.229, lr=1e-5]Steps:  36%|███▋      | 5459/15001 [3:28:00<4:55:32,  1.86s/it, loss=0.182, lr=1e-5]Steps:  36%|███▋      | 5460/15001 [3:28:01<4:50:44,  1.83s/it, loss=0.182, lr=1e-5]Steps:  36%|███▋      | 5460/15001 [3:28:02<4:50:44,  1.83s/it, loss=0.064, lr=1e-5]Steps:  36%|███▋      | 5461/15001 [3:28:03<5:04:48,  1.92s/it, loss=0.064, lr=1e-5]Steps:  36%|███▋      | 5461/15001 [3:28:04<5:04:48,  1.92s/it, loss=0.042, lr=1e-5]Steps:  36%|███▋      | 5462/15001 [3:28:06<5:09:26,  1.95s/it, loss=0.042, lr=1e-5]Steps:  36%|███▋      | 5462/15001 [3:28:06<5:09:26,  1.95s/it, loss=0.101, lr=1e-5]Steps:  36%|███▋      | 5463/15001 [3:28:07<5:02:44,  1.90s/it, loss=0.101, lr=1e-5]Steps:  36%|███▋      | 5463/15001 [3:28:08<5:02:44,  1.90s/it, loss=0.0762, lr=1e-5]Steps:  36%|███▋      | 5464/15001 [3:28:09<5:05:54,  1.92s/it, loss=0.0762, lr=1e-5]Steps:  36%|███▋      | 5464/15001 [3:28:10<5:05:54,  1.92s/it, loss=0.18, lr=1e-5]  Steps:  36%|███▋      | 5465/15001 [3:28:11<5:12:30,  1.97s/it, loss=0.18, lr=1e-5]Steps:  36%|███▋      | 5465/15001 [3:28:12<5:12:30,  1.97s/it, loss=0.34, lr=1e-5]Steps:  36%|███▋      | 5466/15001 [3:28:13<5:14:51,  1.98s/it, loss=0.34, lr=1e-5]Steps:  36%|███▋      | 5466/15001 [3:28:14<5:14:51,  1.98s/it, loss=0.176, lr=1e-5]Steps:  36%|███▋      | 5467/15001 [3:28:16<5:26:09,  2.05s/it, loss=0.176, lr=1e-5]Steps:  36%|███▋      | 5467/15001 [3:28:16<5:26:09,  2.05s/it, loss=0.111, lr=1e-5]Steps:  36%|███▋      | 5468/15001 [3:28:17<4:54:03,  1.85s/it, loss=0.111, lr=1e-5]Steps:  36%|███▋      | 5468/15001 [3:28:17<4:54:03,  1.85s/it, loss=0.253, lr=1e-5]Steps:  36%|███▋      | 5469/15001 [3:28:19<5:12:41,  1.97s/it, loss=0.253, lr=1e-5]Steps:  36%|███▋      | 5469/15001 [3:28:19<5:12:41,  1.97s/it, loss=0.298, lr=1e-5]Steps:  36%|███▋      | 5470/15001 [3:28:21<5:01:34,  1.90s/it, loss=0.298, lr=1e-5]Steps:  36%|███▋      | 5470/15001 [3:28:21<5:01:34,  1.90s/it, loss=0.145, lr=1e-5]Steps:  36%|███▋      | 5471/15001 [3:28:23<4:59:31,  1.89s/it, loss=0.145, lr=1e-5]Steps:  36%|███▋      | 5471/15001 [3:28:23<4:59:31,  1.89s/it, loss=0.341, lr=1e-5]Steps:  36%|███▋      | 5472/15001 [3:28:24<4:49:37,  1.82s/it, loss=0.341, lr=1e-5]Steps:  36%|███▋      | 5472/15001 [3:28:25<4:49:37,  1.82s/it, loss=0.209, lr=1e-5]Steps:  36%|███▋      | 5473/15001 [3:28:26<4:50:51,  1.83s/it, loss=0.209, lr=1e-5]Steps:  36%|███▋      | 5473/15001 [3:28:27<4:50:51,  1.83s/it, loss=0.127, lr=1e-5]Steps:  36%|███▋      | 5474/15001 [3:28:28<4:53:22,  1.85s/it, loss=0.127, lr=1e-5]Steps:  36%|███▋      | 5474/15001 [3:28:28<4:53:22,  1.85s/it, loss=0.056, lr=1e-5]Steps:  36%|███▋      | 5475/15001 [3:28:30<4:56:41,  1.87s/it, loss=0.056, lr=1e-5]Steps:  36%|███▋      | 5475/15001 [3:28:30<4:56:41,  1.87s/it, loss=0.0867, lr=1e-5]Steps:  37%|███▋      | 5476/15001 [3:28:32<4:56:06,  1.87s/it, loss=0.0867, lr=1e-5]Steps:  37%|███▋      | 5476/15001 [3:28:32<4:56:06,  1.87s/it, loss=0.115, lr=1e-5] Steps:  37%|███▋      | 5477/15001 [3:28:34<4:55:17,  1.86s/it, loss=0.115, lr=1e-5]Steps:  37%|███▋      | 5477/15001 [3:28:34<4:55:17,  1.86s/it, loss=0.367, lr=1e-5]Steps:  37%|███▋      | 5478/15001 [3:28:36<4:47:29,  1.81s/it, loss=0.367, lr=1e-5]Steps:  37%|███▋      | 5478/15001 [3:28:36<4:47:29,  1.81s/it, loss=0.168, lr=1e-5]Steps:  37%|███▋      | 5479/15001 [3:28:38<4:59:04,  1.88s/it, loss=0.168, lr=1e-5]Steps:  37%|███▋      | 5479/15001 [3:28:38<4:59:04,  1.88s/it, loss=0.127, lr=1e-5]Steps:  37%|███▋      | 5480/15001 [3:28:39<4:52:30,  1.84s/it, loss=0.127, lr=1e-5]Steps:  37%|███▋      | 5480/15001 [3:28:39<4:52:30,  1.84s/it, loss=0.141, lr=1e-5]Steps:  37%|███▋      | 5481/15001 [3:28:41<4:47:32,  1.81s/it, loss=0.141, lr=1e-5]Steps:  37%|███▋      | 5481/15001 [3:28:41<4:47:32,  1.81s/it, loss=0.129, lr=1e-5]Steps:  37%|███▋      | 5482/15001 [3:28:43<4:51:47,  1.84s/it, loss=0.129, lr=1e-5]Steps:  37%|███▋      | 5482/15001 [3:28:43<4:51:47,  1.84s/it, loss=0.101, lr=1e-5]Steps:  37%|███▋      | 5483/15001 [3:28:45<4:53:50,  1.85s/it, loss=0.101, lr=1e-5]Steps:  37%|███▋      | 5483/15001 [3:28:45<4:53:50,  1.85s/it, loss=0.248, lr=1e-5]Steps:  37%|███▋      | 5484/15001 [3:28:47<4:51:52,  1.84s/it, loss=0.248, lr=1e-5]Steps:  37%|███▋      | 5484/15001 [3:28:47<4:51:52,  1.84s/it, loss=0.151, lr=1e-5]Steps:  37%|███▋      | 5485/15001 [3:28:49<5:01:24,  1.90s/it, loss=0.151, lr=1e-5]Steps:  37%|███▋      | 5485/15001 [3:28:49<5:01:24,  1.90s/it, loss=0.168, lr=1e-5]Steps:  37%|███▋      | 5486/15001 [3:28:51<5:00:57,  1.90s/it, loss=0.168, lr=1e-5]Steps:  37%|███▋      | 5486/15001 [3:28:51<5:00:57,  1.90s/it, loss=0.271, lr=1e-5]Steps:  37%|███▋      | 5487/15001 [3:28:53<5:15:54,  1.99s/it, loss=0.271, lr=1e-5]Steps:  37%|███▋      | 5487/15001 [3:28:53<5:15:54,  1.99s/it, loss=0.468, lr=1e-5]Steps:  37%|███▋      | 5488/15001 [3:28:55<5:16:29,  2.00s/it, loss=0.468, lr=1e-5]Steps:  37%|███▋      | 5488/15001 [3:28:55<5:16:29,  2.00s/it, loss=0.228, lr=1e-5]Steps:  37%|███▋      | 5489/15001 [3:28:57<5:05:35,  1.93s/it, loss=0.228, lr=1e-5]Steps:  37%|███▋      | 5489/15001 [3:28:57<5:05:35,  1.93s/it, loss=0.0701, lr=1e-5]Steps:  37%|███▋      | 5490/15001 [3:28:59<5:04:50,  1.92s/it, loss=0.0701, lr=1e-5]Steps:  37%|███▋      | 5490/15001 [3:28:59<5:04:50,  1.92s/it, loss=0.108, lr=1e-5] Steps:  37%|███▋      | 5491/15001 [3:29:00<4:55:06,  1.86s/it, loss=0.108, lr=1e-5]Steps:  37%|███▋      | 5491/15001 [3:29:00<4:55:06,  1.86s/it, loss=0.26, lr=1e-5] Steps:  37%|███▋      | 5492/15001 [3:29:02<4:57:40,  1.88s/it, loss=0.26, lr=1e-5]Steps:  37%|███▋      | 5492/15001 [3:29:02<4:57:40,  1.88s/it, loss=0.0865, lr=1e-5]Steps:  37%|███▋      | 5493/15001 [3:29:04<4:46:57,  1.81s/it, loss=0.0865, lr=1e-5]Steps:  37%|███▋      | 5493/15001 [3:29:04<4:46:57,  1.81s/it, loss=0.265, lr=1e-5] Steps:  37%|███▋      | 5494/15001 [3:29:06<4:59:34,  1.89s/it, loss=0.265, lr=1e-5]Steps:  37%|███▋      | 5494/15001 [3:29:06<4:59:34,  1.89s/it, loss=0.236, lr=1e-5]Steps:  37%|███▋      | 5495/15001 [3:29:08<5:02:57,  1.91s/it, loss=0.236, lr=1e-5]Steps:  37%|███▋      | 5495/15001 [3:29:08<5:02:57,  1.91s/it, loss=0.129, lr=1e-5]Steps:  37%|███▋      | 5496/15001 [3:29:10<4:51:45,  1.84s/it, loss=0.129, lr=1e-5]Steps:  37%|███▋      | 5496/15001 [3:29:10<4:51:45,  1.84s/it, loss=0.091, lr=1e-5]Steps:  37%|███▋      | 5497/15001 [3:29:11<4:44:01,  1.79s/it, loss=0.091, lr=1e-5]Steps:  37%|███▋      | 5497/15001 [3:29:11<4:44:01,  1.79s/it, loss=0.285, lr=1e-5]Steps:  37%|███▋      | 5498/15001 [3:29:13<4:47:08,  1.81s/it, loss=0.285, lr=1e-5]Steps:  37%|███▋      | 5498/15001 [3:29:13<4:47:08,  1.81s/it, loss=0.126, lr=1e-5]Steps:  37%|███▋      | 5499/15001 [3:29:15<4:50:05,  1.83s/it, loss=0.126, lr=1e-5]Steps:  37%|███▋      | 5499/15001 [3:29:15<4:50:05,  1.83s/it, loss=0.118, lr=1e-5]Steps:  37%|███▋      | 5500/15001 [3:29:17<4:58:10,  1.88s/it, loss=0.118, lr=1e-5]02/04/2024 16:31:36 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1551.05it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  37%|███▋      | 5500/15001 [3:32:57<4:58:10,  1.88s/it, loss=0.331, lr=1e-5]Steps:  37%|███▋      | 5501/15001 [3:32:58<178:42:13, 67.72s/it, loss=0.331, lr=1e-5]Steps:  37%|███▋      | 5501/15001 [3:32:58<178:42:13, 67.72s/it, loss=0.123, lr=1e-5]Steps:  37%|███▋      | 5502/15001 [3:33:00<126:23:29, 47.90s/it, loss=0.123, lr=1e-5]Steps:  37%|███▋      | 5502/15001 [3:33:00<126:23:29, 47.90s/it, loss=0.229, lr=1e-5]Steps:  37%|███▋      | 5503/15001 [3:33:02<89:48:50, 34.04s/it, loss=0.229, lr=1e-5] Steps:  37%|███▋      | 5503/15001 [3:33:02<89:48:50, 34.04s/it, loss=0.254, lr=1e-5]Steps:  37%|███▋      | 5504/15001 [3:33:03<64:19:25, 24.38s/it, loss=0.254, lr=1e-5]Steps:  37%|███▋      | 5504/15001 [3:33:04<64:19:25, 24.38s/it, loss=0.358, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  37%|███▋      | 5505/15001 [3:33:05<46:35:42, 17.66s/it, loss=0.358, lr=1e-5]Steps:  37%|███▋      | 5505/15001 [3:33:06<46:35:42, 17.66s/it, loss=0.145, lr=1e-5]Steps:  37%|███▋      | 5506/15001 [3:33:07<34:07:12, 12.94s/it, loss=0.145, lr=1e-5]Steps:  37%|███▋      | 5506/15001 [3:33:07<34:07:12, 12.94s/it, loss=0.0406, lr=1e-5]Steps:  37%|███▋      | 5507/15001 [3:33:09<25:07:30,  9.53s/it, loss=0.0406, lr=1e-5]Steps:  37%|███▋      | 5507/15001 [3:33:09<25:07:30,  9.53s/it, loss=0.159, lr=1e-5] Steps:  37%|███▋      | 5508/15001 [3:33:11<19:14:59,  7.30s/it, loss=0.159, lr=1e-5]Steps:  37%|███▋      | 5508/15001 [3:33:11<19:14:59,  7.30s/it, loss=0.139, lr=1e-5]Steps:  37%|███▋      | 5509/15001 [3:33:13<14:56:51,  5.67s/it, loss=0.139, lr=1e-5]Steps:  37%|███▋      | 5509/15001 [3:33:13<14:56:51,  5.67s/it, loss=0.176, lr=1e-5]Steps:  37%|███▋      | 5510/15001 [3:33:14<11:42:55,  4.44s/it, loss=0.176, lr=1e-5]Steps:  37%|███▋      | 5510/15001 [3:33:15<11:42:55,  4.44s/it, loss=0.213, lr=1e-5]Steps:  37%|███▋      | 5511/15001 [3:33:16<9:42:37,  3.68s/it, loss=0.213, lr=1e-5] Steps:  37%|███▋      | 5511/15001 [3:33:17<9:42:37,  3.68s/it, loss=0.0677, lr=1e-5]Steps:  37%|███▋      | 5512/15001 [3:33:18<8:21:38,  3.17s/it, loss=0.0677, lr=1e-5]Steps:  37%|███▋      | 5512/15001 [3:33:19<8:21:38,  3.17s/it, loss=0.221, lr=1e-5] Steps:  37%|███▋      | 5513/15001 [3:33:20<7:15:47,  2.76s/it, loss=0.221, lr=1e-5]Steps:  37%|███▋      | 5513/15001 [3:33:20<7:15:47,  2.76s/it, loss=0.15, lr=1e-5] Steps:  37%|███▋      | 5514/15001 [3:33:22<6:40:43,  2.53s/it, loss=0.15, lr=1e-5]Steps:  37%|███▋      | 5514/15001 [3:33:22<6:40:43,  2.53s/it, loss=0.127, lr=1e-5]Steps:  37%|███▋      | 5515/15001 [3:33:24<6:14:13,  2.37s/it, loss=0.127, lr=1e-5]Steps:  37%|███▋      | 5515/15001 [3:33:24<6:14:13,  2.37s/it, loss=0.0684, lr=1e-5]Steps:  37%|███▋      | 5516/15001 [3:33:26<5:55:47,  2.25s/it, loss=0.0684, lr=1e-5]Steps:  37%|███▋      | 5516/15001 [3:33:26<5:55:47,  2.25s/it, loss=0.225, lr=1e-5] Steps:  37%|███▋      | 5517/15001 [3:33:28<6:00:13,  2.28s/it, loss=0.225, lr=1e-5]Steps:  37%|███▋      | 5517/15001 [3:33:29<6:00:13,  2.28s/it, loss=0.247, lr=1e-5]Steps:  37%|███▋      | 5518/15001 [3:33:31<5:50:43,  2.22s/it, loss=0.247, lr=1e-5]Steps:  37%|███▋      | 5518/15001 [3:33:31<5:50:43,  2.22s/it, loss=0.254, lr=1e-5]Steps:  37%|███▋      | 5519/15001 [3:33:32<5:32:59,  2.11s/it, loss=0.254, lr=1e-5]Steps:  37%|███▋      | 5519/15001 [3:33:33<5:32:59,  2.11s/it, loss=0.121, lr=1e-5]Steps:  37%|███▋      | 5520/15001 [3:33:35<5:37:16,  2.13s/it, loss=0.121, lr=1e-5]Steps:  37%|███▋      | 5520/15001 [3:33:35<5:37:16,  2.13s/it, loss=0.123, lr=1e-5]Steps:  37%|███▋      | 5521/15001 [3:33:36<5:17:17,  2.01s/it, loss=0.123, lr=1e-5]Steps:  37%|███▋      | 5521/15001 [3:33:36<5:17:17,  2.01s/it, loss=0.155, lr=1e-5]Steps:  37%|███▋      | 5522/15001 [3:33:38<5:05:09,  1.93s/it, loss=0.155, lr=1e-5]Steps:  37%|███▋      | 5522/15001 [3:33:38<5:05:09,  1.93s/it, loss=0.502, lr=1e-5]Steps:  37%|███▋      | 5523/15001 [3:33:40<5:00:28,  1.90s/it, loss=0.502, lr=1e-5]Steps:  37%|███▋      | 5523/15001 [3:33:40<5:00:28,  1.90s/it, loss=0.175, lr=1e-5]Steps:  37%|███▋      | 5524/15001 [3:33:42<4:47:10,  1.82s/it, loss=0.175, lr=1e-5]Steps:  37%|███▋      | 5524/15001 [3:33:42<4:47:10,  1.82s/it, loss=0.142, lr=1e-5]Steps:  37%|███▋      | 5525/15001 [3:33:44<5:02:23,  1.91s/it, loss=0.142, lr=1e-5]Steps:  37%|███▋      | 5525/15001 [3:33:44<5:02:23,  1.91s/it, loss=0.255, lr=1e-5]Steps:  37%|███▋      | 5526/15001 [3:33:45<4:56:07,  1.88s/it, loss=0.255, lr=1e-5]Steps:  37%|███▋      | 5526/15001 [3:33:46<4:56:07,  1.88s/it, loss=0.144, lr=1e-5]Steps:  37%|███▋      | 5527/15001 [3:33:47<4:43:55,  1.80s/it, loss=0.144, lr=1e-5]Steps:  37%|███▋      | 5527/15001 [3:33:47<4:43:55,  1.80s/it, loss=0.129, lr=1e-5]Steps:  37%|███▋      | 5528/15001 [3:33:49<4:50:51,  1.84s/it, loss=0.129, lr=1e-5]Steps:  37%|███▋      | 5528/15001 [3:33:49<4:50:51,  1.84s/it, loss=0.0641, lr=1e-5]Steps:  37%|███▋      | 5529/15001 [3:33:51<4:51:13,  1.84s/it, loss=0.0641, lr=1e-5]Steps:  37%|███▋      | 5529/15001 [3:33:51<4:51:13,  1.84s/it, loss=0.224, lr=1e-5] Steps:  37%|███▋      | 5530/15001 [3:33:53<4:44:08,  1.80s/it, loss=0.224, lr=1e-5]Steps:  37%|███▋      | 5530/15001 [3:33:53<4:44:08,  1.80s/it, loss=0.26, lr=1e-5] Steps:  37%|███▋      | 5531/15001 [3:33:55<4:52:39,  1.85s/it, loss=0.26, lr=1e-5]Steps:  37%|███▋      | 5531/15001 [3:33:55<4:52:39,  1.85s/it, loss=0.199, lr=1e-5]Steps:  37%|███▋      | 5532/15001 [3:33:56<4:49:10,  1.83s/it, loss=0.199, lr=1e-5]Steps:  37%|███▋      | 5532/15001 [3:33:57<4:49:10,  1.83s/it, loss=0.0102, lr=1e-5]Steps:  37%|███▋      | 5533/15001 [3:33:58<4:49:45,  1.84s/it, loss=0.0102, lr=1e-5]Steps:  37%|███▋      | 5533/15001 [3:33:58<4:49:45,  1.84s/it, loss=0.236, lr=1e-5] Steps:  37%|███▋      | 5534/15001 [3:34:00<4:56:04,  1.88s/it, loss=0.236, lr=1e-5]Steps:  37%|███▋      | 5534/15001 [3:34:00<4:56:04,  1.88s/it, loss=0.216, lr=1e-5]Steps:  37%|███▋      | 5535/15001 [3:34:02<4:53:06,  1.86s/it, loss=0.216, lr=1e-5]Steps:  37%|███▋      | 5535/15001 [3:34:02<4:53:06,  1.86s/it, loss=0.0766, lr=1e-5]Steps:  37%|███▋      | 5536/15001 [3:34:03<4:35:22,  1.75s/it, loss=0.0766, lr=1e-5]Steps:  37%|███▋      | 5536/15001 [3:34:04<4:35:22,  1.75s/it, loss=0.245, lr=1e-5] Steps:  37%|███▋      | 5537/15001 [3:34:05<4:49:15,  1.83s/it, loss=0.245, lr=1e-5]Steps:  37%|███▋      | 5537/15001 [3:34:06<4:49:15,  1.83s/it, loss=0.18, lr=1e-5] Steps:  37%|███▋      | 5538/15001 [3:34:07<4:54:58,  1.87s/it, loss=0.18, lr=1e-5]Steps:  37%|███▋      | 5538/15001 [3:34:08<4:54:58,  1.87s/it, loss=0.134, lr=1e-5]Steps:  37%|███▋      | 5539/15001 [3:34:10<5:12:43,  1.98s/it, loss=0.134, lr=1e-5]Steps:  37%|███▋      | 5539/15001 [3:34:10<5:12:43,  1.98s/it, loss=0.062, lr=1e-5]Steps:  37%|███▋      | 5540/15001 [3:34:11<5:04:45,  1.93s/it, loss=0.062, lr=1e-5]Steps:  37%|███▋      | 5540/15001 [3:34:12<5:04:45,  1.93s/it, loss=0.164, lr=1e-5]Steps:  37%|███▋      | 5541/15001 [3:34:14<5:11:58,  1.98s/it, loss=0.164, lr=1e-5]Steps:  37%|███▋      | 5541/15001 [3:34:14<5:11:58,  1.98s/it, loss=0.232, lr=1e-5]Steps:  37%|███▋      | 5542/15001 [3:34:16<5:15:08,  2.00s/it, loss=0.232, lr=1e-5]Steps:  37%|███▋      | 5542/15001 [3:34:16<5:15:08,  2.00s/it, loss=0.165, lr=1e-5]Steps:  37%|███▋      | 5543/15001 [3:34:18<5:15:28,  2.00s/it, loss=0.165, lr=1e-5]Steps:  37%|███▋      | 5543/15001 [3:34:18<5:15:28,  2.00s/it, loss=0.177, lr=1e-5]Steps:  37%|███▋      | 5544/15001 [3:34:20<5:15:37,  2.00s/it, loss=0.177, lr=1e-5]Steps:  37%|███▋      | 5544/15001 [3:34:20<5:15:37,  2.00s/it, loss=0.365, lr=1e-5]Steps:  37%|███▋      | 5545/15001 [3:34:21<4:54:47,  1.87s/it, loss=0.365, lr=1e-5]Steps:  37%|███▋      | 5545/15001 [3:34:21<4:54:47,  1.87s/it, loss=0.147, lr=1e-5]Steps:  37%|███▋      | 5546/15001 [3:34:23<4:52:20,  1.86s/it, loss=0.147, lr=1e-5]Steps:  37%|███▋      | 5546/15001 [3:34:23<4:52:20,  1.86s/it, loss=0.211, lr=1e-5]Steps:  37%|███▋      | 5547/15001 [3:34:25<4:52:50,  1.86s/it, loss=0.211, lr=1e-5]Steps:  37%|███▋      | 5547/15001 [3:34:25<4:52:50,  1.86s/it, loss=0.211, lr=1e-5]Steps:  37%|███▋      | 5548/15001 [3:34:27<4:55:55,  1.88s/it, loss=0.211, lr=1e-5]Steps:  37%|███▋      | 5548/15001 [3:34:27<4:55:55,  1.88s/it, loss=0.246, lr=1e-5]Steps:  37%|███▋      | 5549/15001 [3:34:29<4:47:10,  1.82s/it, loss=0.246, lr=1e-5]Steps:  37%|███▋      | 5549/15001 [3:34:29<4:47:10,  1.82s/it, loss=0.11, lr=1e-5] Steps:  37%|███▋      | 5550/15001 [3:34:30<4:53:03,  1.86s/it, loss=0.11, lr=1e-5]Steps:  37%|███▋      | 5550/15001 [3:34:31<4:53:03,  1.86s/it, loss=0.0266, lr=1e-5]Steps:  37%|███▋      | 5551/15001 [3:34:32<4:49:35,  1.84s/it, loss=0.0266, lr=1e-5]Steps:  37%|███▋      | 5551/15001 [3:34:32<4:49:35,  1.84s/it, loss=0.0872, lr=1e-5]Steps:  37%|███▋      | 5552/15001 [3:34:34<4:43:36,  1.80s/it, loss=0.0872, lr=1e-5]Steps:  37%|███▋      | 5552/15001 [3:34:34<4:43:36,  1.80s/it, loss=0.0897, lr=1e-5]Steps:  37%|███▋      | 5553/15001 [3:34:36<4:49:53,  1.84s/it, loss=0.0897, lr=1e-5]Steps:  37%|███▋      | 5553/15001 [3:34:36<4:49:53,  1.84s/it, loss=0.193, lr=1e-5] Steps:  37%|███▋      | 5554/15001 [3:34:38<4:53:28,  1.86s/it, loss=0.193, lr=1e-5]Steps:  37%|███▋      | 5554/15001 [3:34:38<4:53:28,  1.86s/it, loss=0.172, lr=1e-5]Steps:  37%|███▋      | 5555/15001 [3:34:39<4:39:48,  1.78s/it, loss=0.172, lr=1e-5]Steps:  37%|███▋      | 5555/15001 [3:34:40<4:39:48,  1.78s/it, loss=0.0559, lr=1e-5]Steps:  37%|███▋      | 5556/15001 [3:34:41<4:43:12,  1.80s/it, loss=0.0559, lr=1e-5]Steps:  37%|███▋      | 5556/15001 [3:34:42<4:43:12,  1.80s/it, loss=0.243, lr=1e-5] Steps:  37%|███▋      | 5557/15001 [3:34:43<4:51:22,  1.85s/it, loss=0.243, lr=1e-5]Steps:  37%|███▋      | 5557/15001 [3:34:43<4:51:22,  1.85s/it, loss=0.321, lr=1e-5]Steps:  37%|███▋      | 5558/15001 [3:34:45<4:39:59,  1.78s/it, loss=0.321, lr=1e-5]Steps:  37%|███▋      | 5558/15001 [3:34:45<4:39:59,  1.78s/it, loss=0.173, lr=1e-5]Steps:  37%|███▋      | 5559/15001 [3:34:47<4:54:16,  1.87s/it, loss=0.173, lr=1e-5]Steps:  37%|███▋      | 5559/15001 [3:34:47<4:54:16,  1.87s/it, loss=0.0537, lr=1e-5]Steps:  37%|███▋      | 5560/15001 [3:34:49<4:56:50,  1.89s/it, loss=0.0537, lr=1e-5]Steps:  37%|███▋      | 5560/15001 [3:34:49<4:56:50,  1.89s/it, loss=0.13, lr=1e-5]  Steps:  37%|███▋      | 5561/15001 [3:34:51<4:56:15,  1.88s/it, loss=0.13, lr=1e-5]Steps:  37%|███��      | 5561/15001 [3:34:51<4:56:15,  1.88s/it, loss=0.12, lr=1e-5]Steps:  37%|███▋      | 5562/15001 [3:34:53<5:12:33,  1.99s/it, loss=0.12, lr=1e-5]Steps:  37%|███▋      | 5562/15001 [3:34:53<5:12:33,  1.99s/it, loss=0.117, lr=1e-5]Steps:  37%|███▋      | 5563/15001 [3:34:55<5:23:05,  2.05s/it, loss=0.117, lr=1e-5]Steps:  37%|███▋      | 5563/15001 [3:34:55<5:23:05,  2.05s/it, loss=0.302, lr=1e-5]Steps:  37%|███▋      | 5564/15001 [3:34:57<5:15:57,  2.01s/it, loss=0.302, lr=1e-5]Steps:  37%|███▋      | 5564/15001 [3:34:57<5:15:57,  2.01s/it, loss=0.107, lr=1e-5]Steps:  37%|███▋      | 5565/15001 [3:34:59<5:07:50,  1.96s/it, loss=0.107, lr=1e-5]Steps:  37%|███▋      | 5565/15001 [3:34:59<5:07:50,  1.96s/it, loss=0.0784, lr=1e-5]Steps:  37%|███▋      | 5566/15001 [3:35:01<5:16:48,  2.01s/it, loss=0.0784, lr=1e-5]Steps:  37%|███▋      | 5566/15001 [3:35:01<5:16:48,  2.01s/it, loss=0.165, lr=1e-5] Steps:  37%|███▋      | 5567/15001 [3:35:03<5:11:05,  1.98s/it, loss=0.165, lr=1e-5]Steps:  37%|███▋      | 5567/15001 [3:35:03<5:11:05,  1.98s/it, loss=0.19, lr=1e-5] Steps:  37%|███▋      | 5568/15001 [3:35:05<4:54:00,  1.87s/it, loss=0.19, lr=1e-5]Steps:  37%|███▋      | 5568/15001 [3:35:05<4:54:00,  1.87s/it, loss=0.213, lr=1e-5]Steps:  37%|███▋      | 5569/15001 [3:35:06<4:52:00,  1.86s/it, loss=0.213, lr=1e-5]Steps:  37%|███▋      | 5569/15001 [3:35:07<4:52:00,  1.86s/it, loss=0.228, lr=1e-5]Steps:  37%|███▋      | 5570/15001 [3:35:08<4:52:48,  1.86s/it, loss=0.228, lr=1e-5]Steps:  37%|███▋      | 5570/15001 [3:35:09<4:52:48,  1.86s/it, loss=0.212, lr=1e-5]Steps:  37%|███▋      | 5571/15001 [3:35:10<4:54:34,  1.87s/it, loss=0.212, lr=1e-5]Steps:  37%|███▋      | 5571/15001 [3:35:10<4:54:34,  1.87s/it, loss=0.339, lr=1e-5]Steps:  37%|███▋      | 5572/15001 [3:35:12<4:49:52,  1.84s/it, loss=0.339, lr=1e-5]Steps:  37%|███▋      | 5572/15001 [3:35:12<4:49:52,  1.84s/it, loss=0.067, lr=1e-5]Steps:  37%|███▋      | 5573/15001 [3:35:14<4:41:24,  1.79s/it, loss=0.067, lr=1e-5]Steps:  37%|███▋      | 5573/15001 [3:35:14<4:41:24,  1.79s/it, loss=0.172, lr=1e-5]Steps:  37%|███▋      | 5574/15001 [3:35:16<4:58:04,  1.90s/it, loss=0.172, lr=1e-5]Steps:  37%|███▋      | 5574/15001 [3:35:16<4:58:04,  1.90s/it, loss=0.0228, lr=1e-5]Steps:  37%|███▋      | 5575/15001 [3:35:18<5:10:17,  1.98s/it, loss=0.0228, lr=1e-5]Steps:  37%|███▋      | 5575/15001 [3:35:18<5:10:17,  1.98s/it, loss=0.0548, lr=1e-5]Steps:  37%|███▋      | 5576/15001 [3:35:20<4:58:57,  1.90s/it, loss=0.0548, lr=1e-5]Steps:  37%|███▋      | 5576/15001 [3:35:20<4:58:57,  1.90s/it, loss=0.347, lr=1e-5] Steps:  37%|███▋      | 5577/15001 [3:35:21<4:52:40,  1.86s/it, loss=0.347, lr=1e-5]Steps:  37%|███▋      | 5577/15001 [3:35:22<4:52:40,  1.86s/it, loss=0.337, lr=1e-5]Steps:  37%|███▋      | 5578/15001 [3:35:23<4:58:22,  1.90s/it, loss=0.337, lr=1e-5]Steps:  37%|███▋      | 5578/15001 [3:35:24<4:58:22,  1.90s/it, loss=0.227, lr=1e-5]Steps:  37%|███▋      | 5579/15001 [3:35:25<4:57:14,  1.89s/it, loss=0.227, lr=1e-5]Steps:  37%|███▋      | 5579/15001 [3:35:25<4:57:14,  1.89s/it, loss=0.127, lr=1e-5]Steps:  37%|███▋      | 5580/15001 [3:35:27<4:49:43,  1.85s/it, loss=0.127, lr=1e-5]Steps:  37%|███▋      | 5580/15001 [3:35:27<4:49:43,  1.85s/it, loss=0.0323, lr=1e-5]Steps:  37%|███▋      | 5581/15001 [3:35:29<4:44:25,  1.81s/it, loss=0.0323, lr=1e-5]Steps:  37%|███▋      | 5581/15001 [3:35:29<4:44:25,  1.81s/it, loss=0.11, lr=1e-5]  Steps:  37%|███▋      | 5582/15001 [3:35:31<4:50:52,  1.85s/it, loss=0.11, lr=1e-5]Steps:  37%|███▋      | 5582/15001 [3:35:31<4:50:52,  1.85s/it, loss=0.342, lr=1e-5]Steps:  37%|███▋      | 5583/15001 [3:35:32<4:48:09,  1.84s/it, loss=0.342, lr=1e-5]Steps:  37%|███▋      | 5583/15001 [3:35:33<4:48:09,  1.84s/it, loss=0.26, lr=1e-5] Steps:  37%|███▋      | 5584/15001 [3:35:35<4:59:20,  1.91s/it, loss=0.26, lr=1e-5]Steps:  37%|███▋      | 5584/15001 [3:35:35<4:59:20,  1.91s/it, loss=0.158, lr=1e-5]Steps:  37%|███▋      | 5585/15001 [3:35:36<5:00:03,  1.91s/it, loss=0.158, lr=1e-5]Steps:  37%|███▋      | 5585/15001 [3:35:37<5:00:03,  1.91s/it, loss=0.268, lr=1e-5]Steps:  37%|███▋      | 5586/15001 [3:35:38<5:05:57,  1.95s/it, loss=0.268, lr=1e-5]Steps:  37%|███▋      | 5586/15001 [3:35:39<5:05:57,  1.95s/it, loss=0.201, lr=1e-5]Steps:  37%|███▋      | 5587/15001 [3:35:41<5:14:07,  2.00s/it, loss=0.201, lr=1e-5]Steps:  37%|███▋      | 5587/15001 [3:35:41<5:14:07,  2.00s/it, loss=0.0311, lr=1e-5]Steps:  37%|███▋      | 5588/15001 [3:35:43<5:18:03,  2.03s/it, loss=0.0311, lr=1e-5]Steps:  37%|███▋      | 5588/15001 [3:35:43<5:18:03,  2.03s/it, loss=0.268, lr=1e-5] Steps:  37%|██���▋      | 5589/15001 [3:35:44<5:06:35,  1.95s/it, loss=0.268, lr=1e-5]Steps:  37%|███▋      | 5589/15001 [3:35:45<5:06:35,  1.95s/it, loss=0.289, lr=1e-5]Steps:  37%|███▋      | 5590/15001 [3:35:46<5:07:50,  1.96s/it, loss=0.289, lr=1e-5]Steps:  37%|███▋      | 5590/15001 [3:35:47<5:07:50,  1.96s/it, loss=0.0619, lr=1e-5]Steps:  37%|███▋      | 5591/15001 [3:35:48<5:05:45,  1.95s/it, loss=0.0619, lr=1e-5]Steps:  37%|███▋      | 5591/15001 [3:35:49<5:05:45,  1.95s/it, loss=0.262, lr=1e-5] Steps:  37%|███▋      | 5592/15001 [3:35:50<4:55:18,  1.88s/it, loss=0.262, lr=1e-5]Steps:  37%|███▋      | 5592/15001 [3:35:50<4:55:18,  1.88s/it, loss=0.128, lr=1e-5]Steps:  37%|███▋      | 5593/15001 [3:35:52<4:48:13,  1.84s/it, loss=0.128, lr=1e-5]Steps:  37%|███▋      | 5593/15001 [3:35:52<4:48:13,  1.84s/it, loss=0.142, lr=1e-5]Steps:  37%|███▋      | 5594/15001 [3:35:54<5:02:40,  1.93s/it, loss=0.142, lr=1e-5]Steps:  37%|███▋      | 5594/15001 [3:35:54<5:02:40,  1.93s/it, loss=0.255, lr=1e-5]Steps:  37%|███▋      | 5595/15001 [3:35:56<4:44:35,  1.82s/it, loss=0.255, lr=1e-5]Steps:  37%|███▋      | 5595/15001 [3:35:56<4:44:35,  1.82s/it, loss=0.167, lr=1e-5]Steps:  37%|███▋      | 5596/15001 [3:35:58<4:53:40,  1.87s/it, loss=0.167, lr=1e-5]Steps:  37%|███▋      | 5596/15001 [3:35:58<4:53:40,  1.87s/it, loss=0.146, lr=1e-5]Steps:  37%|███▋      | 5597/15001 [3:35:59<4:56:07,  1.89s/it, loss=0.146, lr=1e-5]Steps:  37%|███▋      | 5597/15001 [3:36:00<4:56:07,  1.89s/it, loss=0.075, lr=1e-5]Steps:  37%|███▋      | 5598/15001 [3:36:01<4:51:46,  1.86s/it, loss=0.075, lr=1e-5]Steps:  37%|███▋      | 5598/15001 [3:36:01<4:51:46,  1.86s/it, loss=0.0855, lr=1e-5]Steps:  37%|███▋      | 5599/15001 [3:36:03<4:42:34,  1.80s/it, loss=0.0855, lr=1e-5]Steps:  37%|███▋      | 5599/15001 [3:36:03<4:42:34,  1.80s/it, loss=0.206, lr=1e-5] Steps:  37%|███▋      | 5600/15001 [3:36:05<4:45:37,  1.82s/it, loss=0.206, lr=1e-5]Steps:  37%|███▋      | 5600/15001 [3:36:05<4:45:37,  1.82s/it, loss=0.228, lr=1e-5]Steps:  37%|███▋      | 5601/15001 [3:36:07<4:41:58,  1.80s/it, loss=0.228, lr=1e-5]Steps:  37%|███▋      | 5601/15001 [3:36:07<4:41:58,  1.80s/it, loss=0.152, lr=1e-5]Steps:  37%|███▋      | 5602/15001 [3:36:09<4:53:37,  1.87s/it, loss=0.152, lr=1e-5]Steps:  37%|███▋      | 5602/15001 [3:36:09<4:53:37,  1.87s/it, loss=0.241, lr=1e-5]Steps:  37%|███▋      | 5603/15001 [3:36:10<4:44:10,  1.81s/it, loss=0.241, lr=1e-5]Steps:  37%|███▋      | 5603/15001 [3:36:11<4:44:10,  1.81s/it, loss=0.133, lr=1e-5]Steps:  37%|███▋      | 5604/15001 [3:36:12<4:49:09,  1.85s/it, loss=0.133, lr=1e-5]Steps:  37%|███▋      | 5604/15001 [3:36:12<4:49:09,  1.85s/it, loss=0.132, lr=1e-5]Steps:  37%|███▋      | 5605/15001 [3:36:14<4:53:16,  1.87s/it, loss=0.132, lr=1e-5]Steps:  37%|███▋      | 5605/15001 [3:36:14<4:53:16,  1.87s/it, loss=0.151, lr=1e-5]Steps:  37%|███▋      | 5606/15001 [3:36:16<4:59:52,  1.92s/it, loss=0.151, lr=1e-5]Steps:  37%|███▋      | 5606/15001 [3:36:16<4:59:52,  1.92s/it, loss=0.331, lr=1e-5]Steps:  37%|███▋      | 5607/15001 [3:36:18<4:54:53,  1.88s/it, loss=0.331, lr=1e-5]Steps:  37%|███▋      | 5607/15001 [3:36:18<4:54:53,  1.88s/it, loss=0.191, lr=1e-5]Steps:  37%|███▋      | 5608/15001 [3:36:20<5:01:12,  1.92s/it, loss=0.191, lr=1e-5]Steps:  37%|███▋      | 5608/15001 [3:36:20<5:01:12,  1.92s/it, loss=0.245, lr=1e-5]Steps:  37%|███▋      | 5609/15001 [3:36:22<5:23:14,  2.06s/it, loss=0.245, lr=1e-5]Steps:  37%|███▋      | 5609/15001 [3:36:22<5:23:14,  2.06s/it, loss=0.135, lr=1e-5]Steps:  37%|███▋      | 5610/15001 [3:36:24<5:12:59,  2.00s/it, loss=0.135, lr=1e-5]Steps:  37%|███▋      | 5610/15001 [3:36:24<5:12:59,  2.00s/it, loss=0.0769, lr=1e-5]Steps:  37%|███▋      | 5611/15001 [3:36:26<5:01:52,  1.93s/it, loss=0.0769, lr=1e-5]Steps:  37%|███▋      | 5611/15001 [3:36:27<5:01:52,  1.93s/it, loss=0.11, lr=1e-5]  Steps:  37%|███▋      | 5612/15001 [3:36:28<5:20:27,  2.05s/it, loss=0.11, lr=1e-5]Steps:  37%|███▋      | 5612/15001 [3:36:28<5:20:27,  2.05s/it, loss=0.0902, lr=1e-5]Steps:  37%|███▋      | 5613/15001 [3:36:30<5:05:01,  1.95s/it, loss=0.0902, lr=1e-5]Steps:  37%|███▋      | 5613/15001 [3:36:30<5:05:01,  1.95s/it, loss=0.198, lr=1e-5] Steps:  37%|███▋      | 5614/15001 [3:36:32<4:57:32,  1.90s/it, loss=0.198, lr=1e-5]Steps:  37%|███▋      | 5614/15001 [3:36:32<4:57:32,  1.90s/it, loss=0.268, lr=1e-5]Steps:  37%|███▋      | 5615/15001 [3:36:34<4:57:10,  1.90s/it, loss=0.268, lr=1e-5]Steps:  37%|███▋      | 5615/15001 [3:36:34<4:57:10,  1.90s/it, loss=0.173, lr=1e-5]Steps:  37%|███▋      | 5616/15001 [3:36:35<4:44:39,  1.82s/it, loss=0.173, lr=1e-5]Steps:  37%|���██▋      | 5616/15001 [3:36:36<4:44:39,  1.82s/it, loss=0.258, lr=1e-5]Steps:  37%|███▋      | 5617/15001 [3:36:37<4:55:26,  1.89s/it, loss=0.258, lr=1e-5]Steps:  37%|███▋      | 5617/15001 [3:36:37<4:55:26,  1.89s/it, loss=0.1, lr=1e-5]  Steps:  37%|███▋      | 5618/15001 [3:36:39<4:39:00,  1.78s/it, loss=0.1, lr=1e-5]Steps:  37%|███▋      | 5618/15001 [3:36:39<4:39:00,  1.78s/it, loss=0.0875, lr=1e-5]Steps:  37%|███▋      | 5619/15001 [3:36:41<4:45:32,  1.83s/it, loss=0.0875, lr=1e-5]Steps:  37%|███▋      | 5619/15001 [3:36:41<4:45:32,  1.83s/it, loss=0.226, lr=1e-5] Steps:  37%|███▋      | 5620/15001 [3:36:43<4:48:00,  1.84s/it, loss=0.226, lr=1e-5]Steps:  37%|███▋      | 5620/15001 [3:36:43<4:48:00,  1.84s/it, loss=0.147, lr=1e-5]Steps:  37%|███▋      | 5621/15001 [3:36:45<4:48:45,  1.85s/it, loss=0.147, lr=1e-5]Steps:  37%|███▋      | 5621/15001 [3:36:45<4:48:45,  1.85s/it, loss=0.158, lr=1e-5]Steps:  37%|███▋      | 5622/15001 [3:36:46<4:48:52,  1.85s/it, loss=0.158, lr=1e-5]Steps:  37%|███▋      | 5622/15001 [3:36:47<4:48:52,  1.85s/it, loss=0.136, lr=1e-5]Steps:  37%|███▋      | 5623/15001 [3:36:48<4:41:30,  1.80s/it, loss=0.136, lr=1e-5]Steps:  37%|███▋      | 5623/15001 [3:36:48<4:41:30,  1.80s/it, loss=0.171, lr=1e-5]Steps:  37%|███▋      | 5624/15001 [3:36:50<4:30:06,  1.73s/it, loss=0.171, lr=1e-5]Steps:  37%|███▋      | 5624/15001 [3:36:50<4:30:06,  1.73s/it, loss=0.131, lr=1e-5]Steps:  37%|███▋      | 5625/15001 [3:36:52<4:47:46,  1.84s/it, loss=0.131, lr=1e-5]Steps:  37%|███▋      | 5625/15001 [3:36:52<4:47:46,  1.84s/it, loss=0.292, lr=1e-5]Steps:  38%|███▊      | 5626/15001 [3:36:53<4:40:33,  1.80s/it, loss=0.292, lr=1e-5]Steps:  38%|███▊      | 5626/15001 [3:36:54<4:40:33,  1.80s/it, loss=0.24, lr=1e-5] Steps:  38%|███▊      | 5627/15001 [3:36:55<4:47:34,  1.84s/it, loss=0.24, lr=1e-5]Steps:  38%|███▊      | 5627/15001 [3:36:56<4:47:34,  1.84s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5628/15001 [3:36:57<4:48:52,  1.85s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5628/15001 [3:36:57<4:48:52,  1.85s/it, loss=0.113, lr=1e-5]Steps:  38%|███▊      | 5629/15001 [3:36:59<4:54:39,  1.89s/it, loss=0.113, lr=1e-5]Steps:  38%|███▊      | 5629/15001 [3:36:59<4:54:39,  1.89s/it, loss=0.216, lr=1e-5]Steps:  38%|███▊      | 5630/15001 [3:37:01<4:46:49,  1.84s/it, loss=0.216, lr=1e-5]Steps:  38%|███▊      | 5630/15001 [3:37:01<4:46:49,  1.84s/it, loss=0.344, lr=1e-5]Steps:  38%|███▊      | 5631/15001 [3:37:03<5:03:58,  1.95s/it, loss=0.344, lr=1e-5]Steps:  38%|███▊      | 5631/15001 [3:37:03<5:03:58,  1.95s/it, loss=0.186, lr=1e-5]Steps:  38%|███▊      | 5632/15001 [3:37:05<5:07:48,  1.97s/it, loss=0.186, lr=1e-5]Steps:  38%|███▊      | 5632/15001 [3:37:05<5:07:48,  1.97s/it, loss=0.217, lr=1e-5]Steps:  38%|███▊      | 5633/15001 [3:37:07<5:04:42,  1.95s/it, loss=0.217, lr=1e-5]Steps:  38%|███▊      | 5633/15001 [3:37:07<5:04:42,  1.95s/it, loss=0.175, lr=1e-5]Steps:  38%|███▊      | 5634/15001 [3:37:09<5:02:03,  1.93s/it, loss=0.175, lr=1e-5]Steps:  38%|███▊      | 5634/15001 [3:37:09<5:02:03,  1.93s/it, loss=0.4, lr=1e-5]  Steps:  38%|███▊      | 5635/15001 [3:37:11<5:06:55,  1.97s/it, loss=0.4, lr=1e-5]Steps:  38%|███▊      | 5635/15001 [3:37:11<5:06:55,  1.97s/it, loss=0.0794, lr=1e-5]Steps:  38%|███▊      | 5636/15001 [3:37:13<5:02:27,  1.94s/it, loss=0.0794, lr=1e-5]Steps:  38%|███▊      | 5636/15001 [3:37:13<5:02:27,  1.94s/it, loss=0.136, lr=1e-5] Steps:  38%|███▊      | 5637/15001 [3:37:15<5:10:08,  1.99s/it, loss=0.136, lr=1e-5]Steps:  38%|███▊      | 5637/15001 [3:37:15<5:10:08,  1.99s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5638/15001 [3:37:17<5:09:50,  1.99s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5638/15001 [3:37:17<5:09:50,  1.99s/it, loss=0.113, lr=1e-5]Steps:  38%|███▊      | 5639/15001 [3:37:18<4:40:18,  1.80s/it, loss=0.113, lr=1e-5]Steps:  38%|███▊      | 5639/15001 [3:37:19<4:40:18,  1.80s/it, loss=0.183, lr=1e-5]Steps:  38%|███▊      | 5640/15001 [3:37:21<4:59:17,  1.92s/it, loss=0.183, lr=1e-5]Steps:  38%|███▊      | 5640/15001 [3:37:21<4:59:17,  1.92s/it, loss=0.0682, lr=1e-5]Steps:  38%|███▊      | 5641/15001 [3:37:22<4:49:08,  1.85s/it, loss=0.0682, lr=1e-5]Steps:  38%|███▊      | 5641/15001 [3:37:23<4:49:08,  1.85s/it, loss=0.127, lr=1e-5] Steps:  38%|███▊      | 5642/15001 [3:37:24<4:57:06,  1.90s/it, loss=0.127, lr=1e-5]Steps:  38%|███▊      | 5642/15001 [3:37:25<4:57:06,  1.90s/it, loss=0.309, lr=1e-5]Steps:  38%|███▊      | 5643/15001 [3:37:26<4:52:23,  1.87s/it, loss=0.309, lr=1e-5]Steps:  38%|███▊      | 5643/15001 [3:37:27<4:52:23,  1.87s/it, loss=0.218, lr=1e-5]Steps:  38%|��██▊      | 5644/15001 [3:37:28<5:01:23,  1.93s/it, loss=0.218, lr=1e-5]Steps:  38%|███▊      | 5644/15001 [3:37:28<5:01:23,  1.93s/it, loss=0.2, lr=1e-5]  Steps:  38%|███▊      | 5645/15001 [3:37:30<4:45:16,  1.83s/it, loss=0.2, lr=1e-5]Steps:  38%|███▊      | 5645/15001 [3:37:30<4:45:16,  1.83s/it, loss=0.0505, lr=1e-5]Steps:  38%|███▊      | 5646/15001 [3:37:32<4:44:02,  1.82s/it, loss=0.0505, lr=1e-5]Steps:  38%|███▊      | 5646/15001 [3:37:32<4:44:02,  1.82s/it, loss=0.144, lr=1e-5] Steps:  38%|███▊      | 5647/15001 [3:37:33<4:44:28,  1.82s/it, loss=0.144, lr=1e-5]Steps:  38%|███▊      | 5647/15001 [3:37:34<4:44:28,  1.82s/it, loss=0.0997, lr=1e-5]Steps:  38%|███▊      | 5648/15001 [3:37:35<4:53:40,  1.88s/it, loss=0.0997, lr=1e-5]Steps:  38%|███▊      | 5648/15001 [3:37:36<4:53:40,  1.88s/it, loss=0.25, lr=1e-5]  Steps:  38%|███▊      | 5649/15001 [3:37:37<4:44:10,  1.82s/it, loss=0.25, lr=1e-5]Steps:  38%|███▊      | 5649/15001 [3:37:37<4:44:10,  1.82s/it, loss=0.0981, lr=1e-5]Steps:  38%|███▊      | 5650/15001 [3:37:39<4:54:58,  1.89s/it, loss=0.0981, lr=1e-5]Steps:  38%|███▊      | 5650/15001 [3:37:39<4:54:58,  1.89s/it, loss=0.065, lr=1e-5] Steps:  38%|███▊      | 5651/15001 [3:37:41<4:53:23,  1.88s/it, loss=0.065, lr=1e-5]Steps:  38%|███▊      | 5651/15001 [3:37:41<4:53:23,  1.88s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5652/15001 [3:37:43<4:50:46,  1.87s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5652/15001 [3:37:44<4:50:46,  1.87s/it, loss=0.038, lr=1e-5]Steps:  38%|███▊      | 5653/15001 [3:37:46<6:00:08,  2.31s/it, loss=0.038, lr=1e-5]Steps:  38%|███▊      | 5653/15001 [3:37:46<6:00:08,  2.31s/it, loss=0.246, lr=1e-5]Steps:  38%|███▊      | 5654/15001 [3:37:48<5:34:38,  2.15s/it, loss=0.246, lr=1e-5]Steps:  38%|███▊      | 5654/15001 [3:37:48<5:34:38,  2.15s/it, loss=0.193, lr=1e-5]Steps:  38%|███▊      | 5655/15001 [3:37:50<5:29:28,  2.12s/it, loss=0.193, lr=1e-5]Steps:  38%|███▊      | 5655/15001 [3:37:50<5:29:28,  2.12s/it, loss=0.0976, lr=1e-5]Steps:  38%|███▊      | 5656/15001 [3:37:52<5:26:29,  2.10s/it, loss=0.0976, lr=1e-5]Steps:  38%|███▊      | 5656/15001 [3:37:52<5:26:29,  2.10s/it, loss=0.171, lr=1e-5] Steps:  38%|███▊      | 5657/15001 [3:37:54<5:09:54,  1.99s/it, loss=0.171, lr=1e-5]Steps:  38%|███▊      | 5657/15001 [3:37:54<5:09:54,  1.99s/it, loss=0.315, lr=1e-5]Steps:  38%|███▊      | 5658/15001 [3:37:56<5:12:59,  2.01s/it, loss=0.315, lr=1e-5]Steps:  38%|███▊      | 5658/15001 [3:37:56<5:12:59,  2.01s/it, loss=0.093, lr=1e-5]Steps:  38%|███▊      | 5659/15001 [3:37:58<4:57:40,  1.91s/it, loss=0.093, lr=1e-5]Steps:  38%|███▊      | 5659/15001 [3:37:58<4:57:40,  1.91s/it, loss=0.0797, lr=1e-5]Steps:  38%|███▊      | 5660/15001 [3:38:00<5:00:17,  1.93s/it, loss=0.0797, lr=1e-5]Steps:  38%|███▊      | 5660/15001 [3:38:00<5:00:17,  1.93s/it, loss=0.126, lr=1e-5] Steps:  38%|███▊      | 5661/15001 [3:38:01<4:58:27,  1.92s/it, loss=0.126, lr=1e-5]Steps:  38%|███▊      | 5661/15001 [3:38:01<4:58:27,  1.92s/it, loss=0.354, lr=1e-5]Steps:  38%|███▊      | 5662/15001 [3:38:03<4:54:02,  1.89s/it, loss=0.354, lr=1e-5]Steps:  38%|███▊      | 5662/15001 [3:38:03<4:54:02,  1.89s/it, loss=0.155, lr=1e-5]Steps:  38%|███▊      | 5663/15001 [3:38:05<4:44:44,  1.83s/it, loss=0.155, lr=1e-5]Steps:  38%|███▊      | 5663/15001 [3:38:05<4:44:44,  1.83s/it, loss=0.231, lr=1e-5]Steps:  38%|███▊      | 5664/15001 [3:38:07<4:47:52,  1.85s/it, loss=0.231, lr=1e-5]Steps:  38%|███▊      | 5664/15001 [3:38:07<4:47:52,  1.85s/it, loss=0.118, lr=1e-5]Steps:  38%|███▊      | 5665/15001 [3:38:09<4:40:34,  1.80s/it, loss=0.118, lr=1e-5]Steps:  38%|███▊      | 5665/15001 [3:38:09<4:40:34,  1.80s/it, loss=0.114, lr=1e-5]Steps:  38%|███▊      | 5666/15001 [3:38:10<4:46:59,  1.84s/it, loss=0.114, lr=1e-5]Steps:  38%|███▊      | 5666/15001 [3:38:11<4:46:59,  1.84s/it, loss=0.112, lr=1e-5]Steps:  38%|███▊      | 5667/15001 [3:38:12<4:38:04,  1.79s/it, loss=0.112, lr=1e-5]Steps:  38%|███▊      | 5667/15001 [3:38:12<4:38:04,  1.79s/it, loss=0.0483, lr=1e-5]Steps:  38%|███▊      | 5668/15001 [3:38:14<4:49:34,  1.86s/it, loss=0.0483, lr=1e-5]Steps:  38%|███▊      | 5668/15001 [3:38:14<4:49:34,  1.86s/it, loss=0.0978, lr=1e-5]Steps:  38%|███▊      | 5669/15001 [3:38:16<4:48:05,  1.85s/it, loss=0.0978, lr=1e-5]Steps:  38%|███▊      | 5669/15001 [3:38:16<4:48:05,  1.85s/it, loss=0.227, lr=1e-5] Steps:  38%|███▊      | 5670/15001 [3:38:18<4:55:12,  1.90s/it, loss=0.227, lr=1e-5]Steps:  38%|███▊      | 5670/15001 [3:38:18<4:55:12,  1.90s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5671/15001 [3:38:20<4:47:42,  1.85s/it, loss=0.107, lr=1e-5]Steps:  38%|███▊      | 5671/15001 [3:38:20<4:47:42,  1.85s/it, loss=0.343, lr=1e-5]Steps:  38%|███▊      | 5672/15001 [3:38:21<4:40:45,  1.81s/it, loss=0.343, lr=1e-5]Steps:  38%|███▊      | 5672/15001 [3:38:22<4:40:45,  1.81s/it, loss=0.0692, lr=1e-5]Steps:  38%|███▊      | 5673/15001 [3:38:23<4:53:03,  1.89s/it, loss=0.0692, lr=1e-5]Steps:  38%|███▊      | 5673/15001 [3:38:24<4:53:03,  1.89s/it, loss=0.0977, lr=1e-5]Steps:  38%|███▊      | 5674/15001 [3:38:26<5:08:57,  1.99s/it, loss=0.0977, lr=1e-5]Steps:  38%|███▊      | 5674/15001 [3:38:26<5:08:57,  1.99s/it, loss=0.188, lr=1e-5] Steps:  38%|███▊      | 5675/15001 [3:38:28<5:14:00,  2.02s/it, loss=0.188, lr=1e-5]Steps:  38%|███▊      | 5675/15001 [3:38:28<5:14:00,  2.02s/it, loss=0.0898, lr=1e-5]Steps:  38%|███▊      | 5676/15001 [3:38:30<5:07:56,  1.98s/it, loss=0.0898, lr=1e-5]Steps:  38%|███▊      | 5676/15001 [3:38:30<5:07:56,  1.98s/it, loss=0.11, lr=1e-5]  Steps:  38%|███▊      | 5677/15001 [3:38:32<5:15:31,  2.03s/it, loss=0.11, lr=1e-5]Steps:  38%|███▊      | 5677/15001 [3:38:32<5:15:31,  2.03s/it, loss=0.0792, lr=1e-5]Steps:  38%|███▊      | 5678/15001 [3:38:34<5:12:40,  2.01s/it, loss=0.0792, lr=1e-5]Steps:  38%|███▊      | 5678/15001 [3:38:34<5:12:40,  2.01s/it, loss=0.227, lr=1e-5] Steps:  38%|███▊      | 5679/15001 [3:38:36<5:04:01,  1.96s/it, loss=0.227, lr=1e-5]Steps:  38%|███▊      | 5679/15001 [3:38:36<5:04:01,  1.96s/it, loss=0.327, lr=1e-5]Steps:  38%|███▊      | 5680/15001 [3:38:38<5:03:57,  1.96s/it, loss=0.327, lr=1e-5]Steps:  38%|███▊      | 5680/15001 [3:38:38<5:03:57,  1.96s/it, loss=0.289, lr=1e-5]Steps:  38%|███▊      | 5681/15001 [3:38:39<4:56:25,  1.91s/it, loss=0.289, lr=1e-5]Steps:  38%|███▊      | 5681/15001 [3:38:39<4:56:25,  1.91s/it, loss=0.373, lr=1e-5]Steps:  38%|███▊      | 5682/15001 [3:38:41<4:37:26,  1.79s/it, loss=0.373, lr=1e-5]Steps:  38%|███▊      | 5682/15001 [3:38:41<4:37:26,  1.79s/it, loss=0.149, lr=1e-5]Steps:  38%|███▊      | 5683/15001 [3:38:43<4:46:43,  1.85s/it, loss=0.149, lr=1e-5]Steps:  38%|███▊      | 5683/15001 [3:38:43<4:46:43,  1.85s/it, loss=0.0662, lr=1e-5]Steps:  38%|███▊      | 5684/15001 [3:38:45<4:49:53,  1.87s/it, loss=0.0662, lr=1e-5]Steps:  38%|███▊      | 5684/15001 [3:38:45<4:49:53,  1.87s/it, loss=0.239, lr=1e-5] Steps:  38%|███▊      | 5685/15001 [3:38:46<4:39:52,  1.80s/it, loss=0.239, lr=1e-5]Steps:  38%|███▊      | 5685/15001 [3:38:47<4:39:52,  1.80s/it, loss=0.0412, lr=1e-5]Steps:  38%|███▊      | 5686/15001 [3:38:48<4:40:07,  1.80s/it, loss=0.0412, lr=1e-5]Steps:  38%|███▊      | 5686/15001 [3:38:48<4:40:07,  1.80s/it, loss=0.0878, lr=1e-5]Steps:  38%|███▊      | 5687/15001 [3:38:50<4:42:03,  1.82s/it, loss=0.0878, lr=1e-5]Steps:  38%|███▊      | 5687/15001 [3:38:50<4:42:03,  1.82s/it, loss=0.242, lr=1e-5] Steps:  38%|███▊      | 5688/15001 [3:38:52<4:31:14,  1.75s/it, loss=0.242, lr=1e-5]Steps:  38%|███▊      | 5688/15001 [3:38:52<4:31:14,  1.75s/it, loss=0.278, lr=1e-5]Steps:  38%|███▊      | 5689/15001 [3:38:54<4:39:25,  1.80s/it, loss=0.278, lr=1e-5]Steps:  38%|███▊      | 5689/15001 [3:38:54<4:39:25,  1.80s/it, loss=0.101, lr=1e-5]Steps:  38%|███▊      | 5690/15001 [3:38:55<4:39:09,  1.80s/it, loss=0.101, lr=1e-5]Steps:  38%|███▊      | 5690/15001 [3:38:56<4:39:09,  1.80s/it, loss=0.056, lr=1e-5]Steps:  38%|███▊      | 5691/15001 [3:38:57<4:44:14,  1.83s/it, loss=0.056, lr=1e-5]Steps:  38%|███▊      | 5691/15001 [3:38:58<4:44:14,  1.83s/it, loss=0.171, lr=1e-5]Steps:  38%|███▊      | 5692/15001 [3:38:59<4:57:16,  1.92s/it, loss=0.171, lr=1e-5]Steps:  38%|███▊      | 5692/15001 [3:38:59<4:57:16,  1.92s/it, loss=0.128, lr=1e-5]Steps:  38%|███▊      | 5693/15001 [3:39:01<4:50:50,  1.87s/it, loss=0.128, lr=1e-5]Steps:  38%|███▊      | 5693/15001 [3:39:01<4:50:50,  1.87s/it, loss=0.145, lr=1e-5]Steps:  38%|███▊      | 5694/15001 [3:39:03<4:47:52,  1.86s/it, loss=0.145, lr=1e-5]Steps:  38%|███▊      | 5694/15001 [3:39:03<4:47:52,  1.86s/it, loss=0.0991, lr=1e-5]Steps:  38%|███▊      | 5695/15001 [3:39:05<4:47:51,  1.86s/it, loss=0.0991, lr=1e-5]Steps:  38%|███▊      | 5695/15001 [3:39:05<4:47:51,  1.86s/it, loss=0.206, lr=1e-5] Steps:  38%|███▊      | 5696/15001 [3:39:07<4:51:27,  1.88s/it, loss=0.206, lr=1e-5]Steps:  38%|███▊      | 5696/15001 [3:39:07<4:51:27,  1.88s/it, loss=0.186, lr=1e-5]Steps:  38%|███▊      | 5697/15001 [3:39:09<4:51:23,  1.88s/it, loss=0.186, lr=1e-5]Steps:  38%|███▊      | 5697/15001 [3:39:09<4:51:23,  1.88s/it, loss=0.0609, lr=1e-5]Steps:  38%|███▊      | 5698/15001 [3:39:11<5:09:35,  2.00s/it, loss=0.0609, lr=1e-5]Steps:  38%|███▊      | 5698/15001 [3:39:11<5:09:35,  2.00s/it, loss=0.0616, lr=1e-5]Steps:  38%|███▊      | 5699/15001 [3:39:13<5:15:10,  2.03s/it, loss=0.0616, lr=1e-5]Steps:  38%|███▊      | 5699/15001 [3:39:13<5:15:10,  2.03s/it, loss=0.18, lr=1e-5]  Steps:  38%|███▊      | 5700/15001 [3:39:15<5:11:58,  2.01s/it, loss=0.18, lr=1e-5]Steps:  38%|███▊      | 5700/15001 [3:39:15<5:11:58,  2.01s/it, loss=0.152, lr=1e-5]Steps:  38%|███▊      | 5701/15001 [3:39:17<5:02:19,  1.95s/it, loss=0.152, lr=1e-5]Steps:  38%|███▊      | 5701/15001 [3:39:17<5:02:19,  1.95s/it, loss=0.12, lr=1e-5] Steps:  38%|███▊      | 5702/15001 [3:39:19<5:06:50,  1.98s/it, loss=0.12, lr=1e-5]Steps:  38%|███▊      | 5702/15001 [3:39:19<5:06:50,  1.98s/it, loss=0.344, lr=1e-5]Steps:  38%|███▊      | 5703/15001 [3:39:21<5:06:02,  1.97s/it, loss=0.344, lr=1e-5]Steps:  38%|███▊      | 5703/15001 [3:39:21<5:06:02,  1.97s/it, loss=0.0964, lr=1e-5]Steps:  38%|███▊      | 5704/15001 [3:39:23<5:00:51,  1.94s/it, loss=0.0964, lr=1e-5]Steps:  38%|███▊      | 5704/15001 [3:39:23<5:00:51,  1.94s/it, loss=0.276, lr=1e-5] Steps:  38%|███▊      | 5705/15001 [3:39:24<4:52:44,  1.89s/it, loss=0.276, lr=1e-5]Steps:  38%|███▊      | 5705/15001 [3:39:25<4:52:44,  1.89s/it, loss=0.23, lr=1e-5] Steps:  38%|███▊      | 5706/15001 [3:39:26<4:45:50,  1.85s/it, loss=0.23, lr=1e-5]Steps:  38%|███▊      | 5706/15001 [3:39:26<4:45:50,  1.85s/it, loss=0.298, lr=1e-5]Steps:  38%|███▊      | 5707/15001 [3:39:28<4:46:08,  1.85s/it, loss=0.298, lr=1e-5]Steps:  38%|███▊      | 5707/15001 [3:39:28<4:46:08,  1.85s/it, loss=0.245, lr=1e-5]Steps:  38%|███▊      | 5708/15001 [3:39:30<4:48:58,  1.87s/it, loss=0.245, lr=1e-5]Steps:  38%|███▊      | 5708/15001 [3:39:30<4:48:58,  1.87s/it, loss=0.151, lr=1e-5]Steps:  38%|███▊      | 5709/15001 [3:39:32<4:42:28,  1.82s/it, loss=0.151, lr=1e-5]Steps:  38%|███▊      | 5709/15001 [3:39:32<4:42:28,  1.82s/it, loss=0.311, lr=1e-5]Steps:  38%|███▊      | 5710/15001 [3:39:34<4:40:44,  1.81s/it, loss=0.311, lr=1e-5]Steps:  38%|███▊      | 5710/15001 [3:39:34<4:40:44,  1.81s/it, loss=0.139, lr=1e-5]Steps:  38%|███▊      | 5711/15001 [3:39:35<4:26:13,  1.72s/it, loss=0.139, lr=1e-5]Steps:  38%|███▊      | 5711/15001 [3:39:36<4:26:13,  1.72s/it, loss=0.261, lr=1e-5]Steps:  38%|███▊      | 5712/15001 [3:39:37<4:44:11,  1.84s/it, loss=0.261, lr=1e-5]Steps:  38%|███▊      | 5712/15001 [3:39:37<4:44:11,  1.84s/it, loss=0.28, lr=1e-5] Steps:  38%|███▊      | 5713/15001 [3:39:39<4:40:43,  1.81s/it, loss=0.28, lr=1e-5]Steps:  38%|███▊      | 5713/15001 [3:39:39<4:40:43,  1.81s/it, loss=0.0776, lr=1e-5]Steps:  38%|███▊      | 5714/15001 [3:39:41<4:50:34,  1.88s/it, loss=0.0776, lr=1e-5]Steps:  38%|███▊      | 5714/15001 [3:39:41<4:50:34,  1.88s/it, loss=0.128, lr=1e-5] Steps:  38%|███▊      | 5715/15001 [3:39:43<4:49:33,  1.87s/it, loss=0.128, lr=1e-5]Steps:  38%|███▊      | 5715/15001 [3:39:43<4:49:33,  1.87s/it, loss=0.291, lr=1e-5]Steps:  38%|███▊      | 5716/15001 [3:39:44<4:36:28,  1.79s/it, loss=0.291, lr=1e-5]Steps:  38%|███▊      | 5716/15001 [3:39:45<4:36:28,  1.79s/it, loss=0.131, lr=1e-5]Steps:  38%|███▊      | 5717/15001 [3:39:46<4:35:04,  1.78s/it, loss=0.131, lr=1e-5]Steps:  38%|███▊      | 5717/15001 [3:39:46<4:35:04,  1.78s/it, loss=0.0741, lr=1e-5]Steps:  38%|███▊      | 5718/15001 [3:39:48<4:43:25,  1.83s/it, loss=0.0741, lr=1e-5]Steps:  38%|███▊      | 5718/15001 [3:39:48<4:43:25,  1.83s/it, loss=0.139, lr=1e-5] Steps:  38%|███▊      | 5719/15001 [3:39:50<4:46:02,  1.85s/it, loss=0.139, lr=1e-5]Steps:  38%|███▊      | 5719/15001 [3:39:50<4:46:02,  1.85s/it, loss=0.102, lr=1e-5]Steps:  38%|███▊      | 5720/15001 [3:39:52<4:55:33,  1.91s/it, loss=0.102, lr=1e-5]Steps:  38%|███▊      | 5720/15001 [3:39:52<4:55:33,  1.91s/it, loss=0.299, lr=1e-5]Steps:  38%|███▊      | 5721/15001 [3:39:54<5:13:21,  2.03s/it, loss=0.299, lr=1e-5]Steps:  38%|███▊      | 5721/15001 [3:39:54<5:13:21,  2.03s/it, loss=0.215, lr=1e-5]Steps:  38%|███▊      | 5722/15001 [3:39:56<5:03:07,  1.96s/it, loss=0.215, lr=1e-5]Steps:  38%|███▊      | 5722/15001 [3:39:56<5:03:07,  1.96s/it, loss=0.129, lr=1e-5]Steps:  38%|███▊      | 5723/15001 [3:39:58<5:10:48,  2.01s/it, loss=0.129, lr=1e-5]Steps:  38%|███▊      | 5723/15001 [3:39:58<5:10:48,  2.01s/it, loss=0.219, lr=1e-5]Steps:  38%|███▊      | 5724/15001 [3:40:00<5:06:08,  1.98s/it, loss=0.219, lr=1e-5]Steps:  38%|███▊      | 5724/15001 [3:40:00<5:06:08,  1.98s/it, loss=0.0977, lr=1e-5]Steps:  38%|███▊      | 5725/15001 [3:40:02<4:48:07,  1.86s/it, loss=0.0977, lr=1e-5]Steps:  38%|███▊      | 5725/15001 [3:40:02<4:48:07,  1.86s/it, loss=0.0363, lr=1e-5]Steps:  38%|███▊      | 5726/15001 [3:40:04<4:48:35,  1.87s/it, loss=0.0363, lr=1e-5]Steps:  38%|███▊      | 5726/15001 [3:40:04<4:48:35,  1.87s/it, loss=0.144, lr=1e-5] Steps:  38%|███▊      | 5727/15001 [3:40:05<4:46:14,  1.85s/it, loss=0.144, lr=1e-5]Steps:  38%|███▊      | 5727/15001 [3:40:06<4:46:14,  1.85s/it, loss=0.043, lr=1e-5]Steps:  38%|███▊      | 5728/15001 [3:40:07<4:48:19,  1.87s/it, loss=0.043, lr=1e-5]Steps:  38%|███▊      | 5728/15001 [3:40:07<4:48:19,  1.87s/it, loss=0.187, lr=1e-5]Steps:  38%|███▊      | 5729/15001 [3:40:09<4:46:56,  1.86s/it, loss=0.187, lr=1e-5]Steps:  38%|███▊      | 5729/15001 [3:40:09<4:46:56,  1.86s/it, loss=0.209, lr=1e-5]Steps:  38%|███▊      | 5730/15001 [3:40:11<4:50:16,  1.88s/it, loss=0.209, lr=1e-5]Steps:  38%|███▊      | 5730/15001 [3:40:11<4:50:16,  1.88s/it, loss=0.182, lr=1e-5]Steps:  38%|███▊      | 5731/15001 [3:40:13<4:41:23,  1.82s/it, loss=0.182, lr=1e-5]Steps:  38%|███▊      | 5731/15001 [3:40:13<4:41:23,  1.82s/it, loss=0.255, lr=1e-5]Steps:  38%|███▊      | 5732/15001 [3:40:15<4:45:57,  1.85s/it, loss=0.255, lr=1e-5]Steps:  38%|███▊      | 5732/15001 [3:40:15<4:45:57,  1.85s/it, loss=0.256, lr=1e-5]Steps:  38%|███▊      | 5733/15001 [3:40:16<4:31:58,  1.76s/it, loss=0.256, lr=1e-5]Steps:  38%|███▊      | 5733/15001 [3:40:17<4:31:58,  1.76s/it, loss=0.0913, lr=1e-5]Steps:  38%|███▊      | 5734/15001 [3:40:18<4:38:12,  1.80s/it, loss=0.0913, lr=1e-5]Steps:  38%|███▊      | 5734/15001 [3:40:19<4:38:12,  1.80s/it, loss=0.158, lr=1e-5] Steps:  38%|███▊      | 5735/15001 [3:40:20<4:48:15,  1.87s/it, loss=0.158, lr=1e-5]Steps:  38%|███▊      | 5735/15001 [3:40:20<4:48:15,  1.87s/it, loss=0.3, lr=1e-5]  Steps:  38%|███▊      | 5736/15001 [3:40:22<4:47:40,  1.86s/it, loss=0.3, lr=1e-5]Steps:  38%|███▊      | 5736/15001 [3:40:22<4:47:40,  1.86s/it, loss=0.0826, lr=1e-5]Steps:  38%|███▊      | 5737/15001 [3:40:24<4:51:54,  1.89s/it, loss=0.0826, lr=1e-5]Steps:  38%|███▊      | 5737/15001 [3:40:24<4:51:54,  1.89s/it, loss=0.0321, lr=1e-5]Steps:  38%|███▊      | 5738/15001 [3:40:26<4:48:44,  1.87s/it, loss=0.0321, lr=1e-5]Steps:  38%|███▊      | 5738/15001 [3:40:26<4:48:44,  1.87s/it, loss=0.228, lr=1e-5] Steps:  38%|███▊      | 5739/15001 [3:40:28<4:41:44,  1.83s/it, loss=0.228, lr=1e-5]Steps:  38%|███▊      | 5739/15001 [3:40:28<4:41:44,  1.83s/it, loss=0.21, lr=1e-5] Steps:  38%|███▊      | 5740/15001 [3:40:29<4:39:25,  1.81s/it, loss=0.21, lr=1e-5]Steps:  38%|███▊      | 5740/15001 [3:40:29<4:39:25,  1.81s/it, loss=0.102, lr=1e-5]Steps:  38%|███▊      | 5741/15001 [3:40:31<4:47:40,  1.86s/it, loss=0.102, lr=1e-5]Steps:  38%|███▊      | 5741/15001 [3:40:31<4:47:40,  1.86s/it, loss=0.296, lr=1e-5]Steps:  38%|███▊      | 5742/15001 [3:40:33<4:51:28,  1.89s/it, loss=0.296, lr=1e-5]Steps:  38%|███▊      | 5742/15001 [3:40:34<4:51:28,  1.89s/it, loss=0.196, lr=1e-5]Steps:  38%|███▊      | 5743/15001 [3:40:35<5:01:20,  1.95s/it, loss=0.196, lr=1e-5]Steps:  38%|███▊      | 5743/15001 [3:40:35<5:01:20,  1.95s/it, loss=0.195, lr=1e-5]Steps:  38%|███▊      | 5744/15001 [3:40:37<4:56:03,  1.92s/it, loss=0.195, lr=1e-5]Steps:  38%|███▊      | 5744/15001 [3:40:37<4:56:03,  1.92s/it, loss=0.151, lr=1e-5]Steps:  38%|███▊      | 5745/15001 [3:40:39<5:04:57,  1.98s/it, loss=0.151, lr=1e-5]Steps:  38%|███▊      | 5745/15001 [3:40:39<5:04:57,  1.98s/it, loss=0.147, lr=1e-5]Steps:  38%|███▊      | 5746/15001 [3:40:41<5:05:02,  1.98s/it, loss=0.147, lr=1e-5]Steps:  38%|███▊      | 5746/15001 [3:40:41<5:05:02,  1.98s/it, loss=0.154, lr=1e-5]Steps:  38%|███▊      | 5747/15001 [3:40:43<5:02:36,  1.96s/it, loss=0.154, lr=1e-5]Steps:  38%|███▊      | 5747/15001 [3:40:43<5:02:36,  1.96s/it, loss=0.258, lr=1e-5]Steps:  38%|███▊      | 5748/15001 [3:40:45<4:57:11,  1.93s/it, loss=0.258, lr=1e-5]Steps:  38%|███▊      | 5748/15001 [3:40:45<4:57:11,  1.93s/it, loss=0.376, lr=1e-5]Steps:  38%|███▊      | 5749/15001 [3:40:47<4:49:50,  1.88s/it, loss=0.376, lr=1e-5]Steps:  38%|███▊      | 5749/15001 [3:40:47<4:49:50,  1.88s/it, loss=0.166, lr=1e-5]Steps:  38%|███▊      | 5750/15001 [3:40:49<4:46:32,  1.86s/it, loss=0.166, lr=1e-5]Steps:  38%|███▊      | 5750/15001 [3:40:49<4:46:32,  1.86s/it, loss=0.164, lr=1e-5]Steps:  38%|███▊      | 5751/15001 [3:40:50<4:37:27,  1.80s/it, loss=0.164, lr=1e-5]Steps:  38%|███▊      | 5751/15001 [3:40:50<4:37:27,  1.80s/it, loss=0.247, lr=1e-5]Steps:  38%|███▊      | 5752/15001 [3:40:52<4:31:59,  1.76s/it, loss=0.247, lr=1e-5]Steps:  38%|███▊      | 5752/15001 [3:40:52<4:31:59,  1.76s/it, loss=0.17, lr=1e-5] Steps:  38%|███▊      | 5753/15001 [3:40:54<4:46:35,  1.86s/it, loss=0.17, lr=1e-5]Steps:  38%|███▊      | 5753/15001 [3:40:54<4:46:35,  1.86s/it, loss=0.223, lr=1e-5]Steps:  38%|███▊      | 5754/15001 [3:40:56<4:31:17,  1.76s/it, loss=0.223, lr=1e-5]Steps:  38%|███▊      | 5754/15001 [3:40:56<4:31:17,  1.76s/it, loss=0.167, lr=1e-5]Steps:  38%|███▊      | 5755/15001 [3:40:58<4:46:41,  1.86s/it, loss=0.167, lr=1e-5]Steps:  38%|███▊      | 5755/15001 [3:40:58<4:46:41,  1.86s/it, loss=0.0871, lr=1e-5]Steps:  38%|███▊      | 5756/15001 [3:40:59<4:38:40,  1.81s/it, loss=0.0871, lr=1e-5]Steps:  38%|███▊      | 5756/15001 [3:41:00<4:38:40,  1.81s/it, loss=0.281, lr=1e-5] Steps:  38%|███▊      | 5757/15001 [3:41:02<4:56:25,  1.92s/it, loss=0.281, lr=1e-5]Steps:  38%|███▊      | 5757/15001 [3:41:02<4:56:25,  1.92s/it, loss=0.0724, lr=1e-5]Steps:  38%|███▊      | 5758/15001 [3:41:03<4:41:02,  1.82s/it, loss=0.0724, lr=1e-5]Steps:  38%|███▊      | 5758/15001 [3:41:03<4:41:02,  1.82s/it, loss=0.213, lr=1e-5] Steps:  38%|███▊      | 5759/15001 [3:41:05<4:40:05,  1.82s/it, loss=0.213, lr=1e-5]Steps:  38%|███▊      | 5759/15001 [3:41:05<4:40:05,  1.82s/it, loss=0.254, lr=1e-5]Steps:  38%|███▊      | 5760/15001 [3:41:07<4:37:16,  1.80s/it, loss=0.254, lr=1e-5]Steps:  38%|███▊      | 5760/15001 [3:41:07<4:37:16,  1.80s/it, loss=0.154, lr=1e-5]Steps:  38%|███▊      | 5761/15001 [3:41:09<4:45:46,  1.86s/it, loss=0.154, lr=1e-5]Steps:  38%|███▊      | 5761/15001 [3:41:09<4:45:46,  1.86s/it, loss=0.33, lr=1e-5] Steps:  38%|███▊      | 5762/15001 [3:41:10<4:43:14,  1.84s/it, loss=0.33, lr=1e-5]Steps:  38%|███▊      | 5762/15001 [3:41:11<4:43:14,  1.84s/it, loss=0.141, lr=1e-5]Steps:  38%|███▊      | 5763/15001 [3:41:13<4:57:39,  1.93s/it, loss=0.141, lr=1e-5]Steps:  38%|███▊      | 5763/15001 [3:41:13<4:57:39,  1.93s/it, loss=0.132, lr=1e-5]Steps:  38%|███▊      | 5764/15001 [3:41:15<4:56:41,  1.93s/it, loss=0.132, lr=1e-5]Steps:  38%|███▊      | 5764/15001 [3:41:15<4:56:41,  1.93s/it, loss=0.0897, lr=1e-5]Steps:  38%|███▊      | 5765/15001 [3:41:16<4:56:29,  1.93s/it, loss=0.0897, lr=1e-5]Steps:  38%|███▊      | 5765/15001 [3:41:17<4:56:29,  1.93s/it, loss=0.135, lr=1e-5] Steps:  38%|███▊      | 5766/15001 [3:41:19<5:05:38,  1.99s/it, loss=0.135, lr=1e-5]Steps:  38%|███▊      | 5766/15001 [3:41:19<5:05:38,  1.99s/it, loss=0.0535, lr=1e-5]Steps:  38%|███▊      | 5767/15001 [3:41:21<5:11:05,  2.02s/it, loss=0.0535, lr=1e-5]Steps:  38%|███▊      | 5767/15001 [3:41:21<5:11:05,  2.02s/it, loss=0.23, lr=1e-5]  Steps:  38%|███▊      | 5768/15001 [3:41:22<5:00:14,  1.95s/it, loss=0.23, lr=1e-5]Steps:  38%|███▊      | 5768/15001 [3:41:23<5:00:14,  1.95s/it, loss=0.0388, lr=1e-5]Steps:  38%|███▊      | 5769/15001 [3:41:24<5:01:59,  1.96s/it, loss=0.0388, lr=1e-5]Steps:  38%|███▊      | 5769/15001 [3:41:25<5:01:59,  1.96s/it, loss=0.096, lr=1e-5] Steps:  38%|███▊      | 5770/15001 [3:41:26<4:54:02,  1.91s/it, loss=0.096, lr=1e-5]Steps:  38%|███▊      | 5770/15001 [3:41:27<4:54:02,  1.91s/it, loss=0.185, lr=1e-5]Steps:  38%|███▊      | 5771/15001 [3:41:28<4:54:07,  1.91s/it, loss=0.185, lr=1e-5]Steps:  38%|███▊      | 5771/15001 [3:41:28<4:54:07,  1.91s/it, loss=0.149, lr=1e-5]Steps:  38%|███▊      | 5772/15001 [3:41:30<5:02:25,  1.97s/it, loss=0.149, lr=1e-5]Steps:  38%|███▊      | 5772/15001 [3:41:30<5:02:25,  1.97s/it, loss=0.203, lr=1e-5]Steps:  38%|███▊      | 5773/15001 [3:41:32<4:49:23,  1.88s/it, loss=0.203, lr=1e-5]Steps:  38%|███▊      | 5773/15001 [3:41:32<4:49:23,  1.88s/it, loss=0.256, lr=1e-5]Steps:  38%|███▊      | 5774/15001 [3:41:34<4:38:18,  1.81s/it, loss=0.256, lr=1e-5]Steps:  38%|███▊      | 5774/15001 [3:41:34<4:38:18,  1.81s/it, loss=0.15, lr=1e-5] Steps:  38%|███▊      | 5775/15001 [3:41:35<4:41:54,  1.83s/it, loss=0.15, lr=1e-5]Steps:  38%|███▊      | 5775/15001 [3:41:36<4:41:54,  1.83s/it, loss=0.0969, lr=1e-5]Steps:  39%|███▊      | 5776/15001 [3:41:37<4:43:40,  1.85s/it, loss=0.0969, lr=1e-5]Steps:  39%|███▊      | 5776/15001 [3:41:38<4:43:40,  1.85s/it, loss=0.185, lr=1e-5] Steps:  39%|███▊      | 5777/15001 [3:41:39<4:41:21,  1.83s/it, loss=0.185, lr=1e-5]Steps:  39%|███▊      | 5777/15001 [3:41:39<4:41:21,  1.83s/it, loss=0.326, lr=1e-5]Steps:  39%|███▊      | 5778/15001 [3:41:41<4:32:35,  1.77s/it, loss=0.326, lr=1e-5]Steps:  39%|███▊      | 5778/15001 [3:41:41<4:32:35,  1.77s/it, loss=0.257, lr=1e-5]Steps:  39%|███▊      | 5779/15001 [3:41:43<4:41:06,  1.83s/it, loss=0.257, lr=1e-5]Steps:  39%|███▊      | 5779/15001 [3:41:43<4:41:06,  1.83s/it, loss=0.243, lr=1e-5]Steps:  39%|███▊      | 5780/15001 [3:41:44<4:33:16,  1.78s/it, loss=0.243, lr=1e-5]Steps:  39%|███▊      | 5780/15001 [3:41:45<4:33:16,  1.78s/it, loss=0.175, lr=1e-5]Steps:  39%|███▊      | 5781/15001 [3:41:46<4:41:25,  1.83s/it, loss=0.175, lr=1e-5]Steps:  39%|███▊      | 5781/15001 [3:41:46<4:41:25,  1.83s/it, loss=0.435, lr=1e-5]Steps:  39%|███▊      | 5782/15001 [3:41:48<4:41:25,  1.83s/it, loss=0.435, lr=1e-5]Steps:  39%|███▊      | 5782/15001 [3:41:48<4:41:25,  1.83s/it, loss=0.189, lr=1e-5]Steps:  39%|███▊      | 5783/15001 [3:41:50<4:34:00,  1.78s/it, loss=0.189, lr=1e-5]Steps:  39%|███▊      | 5783/15001 [3:41:50<4:34:00,  1.78s/it, loss=0.103, lr=1e-5]Steps:  39%|███▊      | 5784/15001 [3:41:52<4:34:38,  1.79s/it, loss=0.103, lr=1e-5]Steps:  39%|███▊      | 5784/15001 [3:41:52<4:34:38,  1.79s/it, loss=0.137, lr=1e-5]Steps:  39%|███▊      | 5785/15001 [3:41:54<4:38:07,  1.81s/it, loss=0.137, lr=1e-5]Steps:  39%|███▊      | 5785/15001 [3:41:54<4:38:07,  1.81s/it, loss=0.059, lr=1e-5]Steps:  39%|███▊      | 5786/15001 [3:41:55<4:35:47,  1.80s/it, loss=0.059, lr=1e-5]Steps:  39%|███▊      | 5786/15001 [3:41:56<4:35:47,  1.80s/it, loss=0.172, lr=1e-5]Steps:  39%|███▊      | 5787/15001 [3:41:57<4:48:20,  1.88s/it, loss=0.172, lr=1e-5]Steps:  39%|███▊      | 5787/15001 [3:41:58<4:48:20,  1.88s/it, loss=0.193, lr=1e-5]Steps:  39%|███▊      | 5788/15001 [3:41:59<4:57:32,  1.94s/it, loss=0.193, lr=1e-5]Steps:  39%|███▊      | 5788/15001 [3:41:59<4:57:32,  1.94s/it, loss=0.0379, lr=1e-5]Steps:  39%|███▊      | 5789/15001 [3:42:01<5:00:49,  1.96s/it, loss=0.0379, lr=1e-5]Steps:  39%|███▊      | 5789/15001 [3:42:02<5:00:49,  1.96s/it, loss=0.141, lr=1e-5] Steps:  39%|███▊      | 5790/15001 [3:42:03<4:55:08,  1.92s/it, loss=0.141, lr=1e-5]Steps:  39%|███▊      | 5790/15001 [3:42:03<4:55:08,  1.92s/it, loss=0.281, lr=1e-5]Steps:  39%|███▊      | 5791/15001 [3:42:05<4:55:23,  1.92s/it, loss=0.281, lr=1e-5]Steps:  39%|███▊      | 5791/15001 [3:42:05<4:55:23,  1.92s/it, loss=0.316, lr=1e-5]Steps:  39%|███▊      | 5792/15001 [3:42:07<5:00:04,  1.96s/it, loss=0.316, lr=1e-5]Steps:  39%|███▊      | 5792/15001 [3:42:07<5:00:04,  1.96s/it, loss=0.147, lr=1e-5]Steps:  39%|███▊      | 5793/15001 [3:42:09<4:58:39,  1.95s/it, loss=0.147, lr=1e-5]Steps:  39%|███▊      | 5793/15001 [3:42:09<4:58:39,  1.95s/it, loss=0.123, lr=1e-5]Steps:  39%|███▊      | 5794/15001 [3:42:11<4:57:49,  1.94s/it, loss=0.123, lr=1e-5]Steps:  39%|███▊      | 5794/15001 [3:42:11<4:57:49,  1.94s/it, loss=0.206, lr=1e-5]Steps:  39%|███▊      | 5795/15001 [3:42:13<5:01:32,  1.97s/it, loss=0.206, lr=1e-5]Steps:  39%|███▊      | 5795/15001 [3:42:13<5:01:32,  1.97s/it, loss=0.0603, lr=1e-5]Steps:  39%|███▊      | 5796/15001 [3:42:15<4:56:44,  1.93s/it, loss=0.0603, lr=1e-5]Steps:  39%|███▊      | 5796/15001 [3:42:15<4:56:44,  1.93s/it, loss=0.238, lr=1e-5] Steps:  39%|███▊      | 5797/15001 [3:42:17<4:45:23,  1.86s/it, loss=0.238, lr=1e-5]Steps:  39%|███▊      | 5797/15001 [3:42:17<4:45:23,  1.86s/it, loss=0.163, lr=1e-5]Steps:  39%|███▊      | 5798/15001 [3:42:19<4:47:19,  1.87s/it, loss=0.163, lr=1e-5]Steps:  39%|███▊      | 5798/15001 [3:42:19<4:47:19,  1.87s/it, loss=0.105, lr=1e-5]Steps:  39%|███▊      | 5799/15001 [3:42:20<4:36:54,  1.81s/it, loss=0.105, lr=1e-5]Steps:  39%|███▊      | 5799/15001 [3:42:21<4:36:54,  1.81s/it, loss=0.162, lr=1e-5]Steps:  39%|███▊      | 5800/15001 [3:42:22<4:45:20,  1.86s/it, loss=0.162, lr=1e-5]Steps:  39%|███▊      | 5800/15001 [3:42:22<4:45:20,  1.86s/it, loss=0.139, lr=1e-5]Steps:  39%|███▊      | 5801/15001 [3:42:24<4:37:30,  1.81s/it, loss=0.139, lr=1e-5]Steps:  39%|███▊      | 5801/15001 [3:42:24<4:37:30,  1.81s/it, loss=0.369, lr=1e-5]Steps:  39%|███▊      | 5802/15001 [3:42:26<4:35:21,  1.80s/it, loss=0.369, lr=1e-5]Steps:  39%|███▊      | 5802/15001 [3:42:26<4:35:21,  1.80s/it, loss=0.255, lr=1e-5]Steps:  39%|███▊      | 5803/15001 [3:42:28<4:46:29,  1.87s/it, loss=0.255, lr=1e-5]Steps:  39%|███▊      | 5803/15001 [3:42:28<4:46:29,  1.87s/it, loss=0.169, lr=1e-5]Steps:  39%|███▊      | 5804/15001 [3:42:29<4:41:03,  1.83s/it, loss=0.169, lr=1e-5]Steps:  39%|███▊      | 5804/15001 [3:42:30<4:41:03,  1.83s/it, loss=0.0827, lr=1e-5]Steps:  39%|███▊      | 5805/15001 [3:42:32<4:54:24,  1.92s/it, loss=0.0827, lr=1e-5]Steps:  39%|███▊      | 5805/15001 [3:42:32<4:54:24,  1.92s/it, loss=0.133, lr=1e-5] Steps:  39%|███▊      | 5806/15001 [3:42:34<4:55:25,  1.93s/it, loss=0.133, lr=1e-5]Steps:  39%|███▊      | 5806/15001 [3:42:34<4:55:25,  1.93s/it, loss=0.236, lr=1e-5]Steps:  39%|███▊      | 5807/15001 [3:42:35<4:48:27,  1.88s/it, loss=0.236, lr=1e-5]Steps:  39%|███▊      | 5807/15001 [3:42:35<4:48:27,  1.88s/it, loss=0.17, lr=1e-5] Steps:  39%|███▊      | 5808/15001 [3:42:37<4:31:50,  1.77s/it, loss=0.17, lr=1e-5]Steps:  39%|███▊      | 5808/15001 [3:42:37<4:31:50,  1.77s/it, loss=0.104, lr=1e-5]Steps:  39%|███▊      | 5809/15001 [3:42:39<4:38:34,  1.82s/it, loss=0.104, lr=1e-5]Steps:  39%|███▊      | 5809/15001 [3:42:39<4:38:34,  1.82s/it, loss=0.235, lr=1e-5]Steps:  39%|███▊      | 5810/15001 [3:42:41<4:49:08,  1.89s/it, loss=0.235, lr=1e-5]Steps:  39%|███▊      | 5810/15001 [3:42:41<4:49:08,  1.89s/it, loss=0.0481, lr=1e-5]Steps:  39%|███▊      | 5811/15001 [3:42:43<4:54:08,  1.92s/it, loss=0.0481, lr=1e-5]Steps:  39%|███▊      | 5811/15001 [3:42:43<4:54:08,  1.92s/it, loss=0.11, lr=1e-5]  Steps:  39%|███▊      | 5812/15001 [3:42:44<4:43:43,  1.85s/it, loss=0.11, lr=1e-5]Steps:  39%|███▊      | 5812/15001 [3:42:45<4:43:43,  1.85s/it, loss=0.0429, lr=1e-5]Steps:  39%|███▉      | 5813/15001 [3:42:47<4:56:33,  1.94s/it, loss=0.0429, lr=1e-5]Steps:  39%|███▉      | 5813/15001 [3:42:47<4:56:33,  1.94s/it, loss=0.0203, lr=1e-5]Steps:  39%|███▉      | 5814/15001 [3:42:49<5:08:49,  2.02s/it, loss=0.0203, lr=1e-5]Steps:  39%|███▉      | 5814/15001 [3:42:49<5:08:49,  2.02s/it, loss=0.0642, lr=1e-5]Steps:  39%|███▉      | 5815/15001 [3:42:51<5:05:38,  2.00s/it, loss=0.0642, lr=1e-5]Steps:  39%|███▉      | 5815/15001 [3:42:51<5:05:38,  2.00s/it, loss=0.157, lr=1e-5] Steps:  39%|███▉      | 5816/15001 [3:42:53<5:03:37,  1.98s/it, loss=0.157, lr=1e-5]Steps:  39%|███▉      | 5816/15001 [3:42:53<5:03:37,  1.98s/it, loss=0.305, lr=1e-5]Steps:  39%|███▉      | 5817/15001 [3:42:55<4:55:44,  1.93s/it, loss=0.305, lr=1e-5]Steps:  39%|███▉      | 5817/15001 [3:42:55<4:55:44,  1.93s/it, loss=0.225, lr=1e-5]Steps:  39%|███▉      | 5818/15001 [3:42:56<4:53:35,  1.92s/it, loss=0.225, lr=1e-5]Steps:  39%|███▉      | 5818/15001 [3:42:57<4:53:35,  1.92s/it, loss=0.257, lr=1e-5]Steps:  39%|███▉      | 5819/15001 [3:42:58<4:53:46,  1.92s/it, loss=0.257, lr=1e-5]Steps:  39%|███▉      | 5819/15001 [3:42:58<4:53:46,  1.92s/it, loss=0.363, lr=1e-5]Steps:  39%|███▉      | 5820/15001 [3:43:00<4:48:58,  1.89s/it, loss=0.363, lr=1e-5]Steps:  39%|███▉      | 5820/15001 [3:43:00<4:48:58,  1.89s/it, loss=0.239, lr=1e-5]Steps:  39%|███▉      | 5821/15001 [3:43:02<4:46:47,  1.87s/it, loss=0.239, lr=1e-5]Steps:  39%|███▉      | 5821/15001 [3:43:02<4:46:47,  1.87s/it, loss=0.288, lr=1e-5]Steps:  39%|███▉      | 5822/15001 [3:43:04<4:47:15,  1.88s/it, loss=0.288, lr=1e-5]Steps:  39%|███▉      | 5822/15001 [3:43:04<4:47:15,  1.88s/it, loss=0.188, lr=1e-5]Steps:  39%|███▉      | 5823/15001 [3:43:06<4:43:06,  1.85s/it, loss=0.188, lr=1e-5]Steps:  39%|███▉      | 5823/15001 [3:43:06<4:43:06,  1.85s/it, loss=0.109, lr=1e-5]Steps:  39%|███▉      | 5824/15001 [3:43:07<4:29:21,  1.76s/it, loss=0.109, lr=1e-5]Steps:  39%|███▉      | 5824/15001 [3:43:08<4:29:21,  1.76s/it, loss=0.217, lr=1e-5]Steps:  39%|███▉      | 5825/15001 [3:43:09<4:48:00,  1.88s/it, loss=0.217, lr=1e-5]Steps:  39%|███▉      | 5825/15001 [3:43:09<4:48:00,  1.88s/it, loss=0.264, lr=1e-5]Steps:  39%|███▉      | 5826/15001 [3:43:11<4:38:43,  1.82s/it, loss=0.264, lr=1e-5]Steps:  39%|███▉      | 5826/15001 [3:43:11<4:38:43,  1.82s/it, loss=0.212, lr=1e-5]Steps:  39%|███▉      | 5827/15001 [3:43:13<4:36:15,  1.81s/it, loss=0.212, lr=1e-5]Steps:  39%|███▉      | 5827/15001 [3:43:13<4:36:15,  1.81s/it, loss=0.171, lr=1e-5]Steps:  39%|███▉      | 5828/15001 [3:43:14<4:21:47,  1.71s/it, loss=0.171, lr=1e-5]Steps:  39%|███▉      | 5828/15001 [3:43:15<4:21:47,  1.71s/it, loss=0.171, lr=1e-5]Steps:  39%|███▉      | 5829/15001 [3:43:16<4:36:02,  1.81s/it, loss=0.171, lr=1e-5]Steps:  39%|███▉      | 5829/15001 [3:43:17<4:36:02,  1.81s/it, loss=0.325, lr=1e-5]Steps:  39%|███▉      | 5830/15001 [3:43:18<4:38:40,  1.82s/it, loss=0.325, lr=1e-5]Steps:  39%|███▉      | 5830/15001 [3:43:18<4:38:40,  1.82s/it, loss=0.245, lr=1e-5]Steps:  39%|███▉      | 5831/15001 [3:43:20<4:39:43,  1.83s/it, loss=0.245, lr=1e-5]Steps:  39%|███▉      | 5831/15001 [3:43:20<4:39:43,  1.83s/it, loss=0.224, lr=1e-5]Steps:  39%|███▉      | 5832/15001 [3:43:22<4:44:18,  1.86s/it, loss=0.224, lr=1e-5]Steps:  39%|███▉      | 5832/15001 [3:43:22<4:44:18,  1.86s/it, loss=0.262, lr=1e-5]Steps:  39%|███▉      | 5833/15001 [3:43:24<4:39:05,  1.83s/it, loss=0.262, lr=1e-5]Steps:  39%|███▉      | 5833/15001 [3:43:24<4:39:05,  1.83s/it, loss=0.2, lr=1e-5]  Steps:  39%|███▉      | 5834/15001 [3:43:26<4:50:51,  1.90s/it, loss=0.2, lr=1e-5]Steps:  39%|███▉      | 5834/15001 [3:43:26<4:50:51,  1.90s/it, loss=0.219, lr=1e-5]Steps:  39%|███▉      | 5835/15001 [3:43:28<4:55:32,  1.93s/it, loss=0.219, lr=1e-5]Steps:  39%|███▉      | 5835/15001 [3:43:28<4:55:32,  1.93s/it, loss=0.0763, lr=1e-5]Steps:  39%|███▉      | 5836/15001 [3:43:30<4:59:00,  1.96s/it, loss=0.0763, lr=1e-5]Steps:  39%|███▉      | 5836/15001 [3:43:30<4:59:00,  1.96s/it, loss=0.0626, lr=1e-5]Steps:  39%|███▉      | 5837/15001 [3:43:32<5:06:10,  2.00s/it, loss=0.0626, lr=1e-5]Steps:  39%|███▉      | 5837/15001 [3:43:32<5:06:10,  2.00s/it, loss=0.242, lr=1e-5] Steps:  39%|███▉      | 5838/15001 [3:43:34<4:51:00,  1.91s/it, loss=0.242, lr=1e-5]Steps:  39%|███▉      | 5838/15001 [3:43:34<4:51:00,  1.91s/it, loss=0.269, lr=1e-5]Steps:  39%|███▉      | 5839/15001 [3:43:36<5:07:52,  2.02s/it, loss=0.269, lr=1e-5]Steps:  39%|███▉      | 5839/15001 [3:43:36<5:07:52,  2.02s/it, loss=0.0928, lr=1e-5]Steps:  39%|███▉      | 5840/15001 [3:43:38<4:59:04,  1.96s/it, loss=0.0928, lr=1e-5]Steps:  39%|███▉      | 5840/15001 [3:43:38<4:59:04,  1.96s/it, loss=0.177, lr=1e-5] Steps:  39%|███▉      | 5841/15001 [3:43:40<4:56:18,  1.94s/it, loss=0.177, lr=1e-5]Steps:  39%|███▉      | 5841/15001 [3:43:40<4:56:18,  1.94s/it, loss=0.268, lr=1e-5]Steps:  39%|███▉      | 5842/15001 [3:43:42<4:53:05,  1.92s/it, loss=0.268, lr=1e-5]Steps:  39%|███▉      | 5842/15001 [3:43:42<4:53:05,  1.92s/it, loss=0.272, lr=1e-5]Steps:  39%|███▉      | 5843/15001 [3:43:43<4:34:36,  1.80s/it, loss=0.272, lr=1e-5]Steps:  39%|███▉      | 5843/15001 [3:43:43<4:34:36,  1.80s/it, loss=0.0933, lr=1e-5]Steps:  39%|███▉      | 5844/15001 [3:43:45<4:48:25,  1.89s/it, loss=0.0933, lr=1e-5]Steps:  39%|███▉      | 5844/15001 [3:43:45<4:48:25,  1.89s/it, loss=0.182, lr=1e-5] Steps:  39%|███▉      | 5845/15001 [3:43:47<4:46:22,  1.88s/it, loss=0.182, lr=1e-5]Steps:  39%|███▉      | 5845/15001 [3:43:47<4:46:22,  1.88s/it, loss=0.239, lr=1e-5]Steps:  39%|███▉      | 5846/15001 [3:43:49<4:44:30,  1.86s/it, loss=0.239, lr=1e-5]Steps:  39%|███▉      | 5846/15001 [3:43:49<4:44:30,  1.86s/it, loss=0.181, lr=1e-5]Steps:  39%|███▉      | 5847/15001 [3:43:50<4:32:59,  1.79s/it, loss=0.181, lr=1e-5]Steps:  39%|███▉      | 5847/15001 [3:43:51<4:32:59,  1.79s/it, loss=0.274, lr=1e-5]Steps:  39%|███▉      | 5848/15001 [3:43:52<4:41:14,  1.84s/it, loss=0.274, lr=1e-5]Steps:  39%|███▉      | 5848/15001 [3:43:53<4:41:14,  1.84s/it, loss=0.0312, lr=1e-5]Steps:  39%|███▉      | 5849/15001 [3:43:54<4:46:57,  1.88s/it, loss=0.0312, lr=1e-5]Steps:  39%|███▉      | 5849/15001 [3:43:54<4:46:57,  1.88s/it, loss=0.13, lr=1e-5]  Steps:  39%|███▉      | 5850/15001 [3:43:56<4:38:26,  1.83s/it, loss=0.13, lr=1e-5]Steps:  39%|███▉      | 5850/15001 [3:43:56<4:38:26,  1.83s/it, loss=0.195, lr=1e-5]Steps:  39%|███▉      | 5851/15001 [3:43:58<4:37:26,  1.82s/it, loss=0.195, lr=1e-5]Steps:  39%|███▉      | 5851/15001 [3:43:58<4:37:26,  1.82s/it, loss=0.116, lr=1e-5]Steps:  39%|███▉      | 5852/15001 [3:44:00<4:44:38,  1.87s/it, loss=0.116, lr=1e-5]Steps:  39%|███▉      | 5852/15001 [3:44:00<4:44:38,  1.87s/it, loss=0.44, lr=1e-5] Steps:  39%|███▉      | 5853/15001 [3:44:02<4:37:09,  1.82s/it, loss=0.44, lr=1e-5]Steps:  39%|███▉      | 5853/15001 [3:44:02<4:37:09,  1.82s/it, loss=0.0372, lr=1e-5]Steps:  39%|███▉      | 5854/15001 [3:44:03<4:36:52,  1.82s/it, loss=0.0372, lr=1e-5]Steps:  39%|███▉      | 5854/15001 [3:44:04<4:36:52,  1.82s/it, loss=0.267, lr=1e-5] Steps:  39%|███▉      | 5855/15001 [3:44:05<4:40:43,  1.84s/it, loss=0.267, lr=1e-5]Steps:  39%|███▉      | 5855/15001 [3:44:05<4:40:43,  1.84s/it, loss=0.0221, lr=1e-5]Steps:  39%|███▉      | 5856/15001 [3:44:07<4:55:13,  1.94s/it, loss=0.0221, lr=1e-5]Steps:  39%|███▉      | 5856/15001 [3:44:07<4:55:13,  1.94s/it, loss=0.171, lr=1e-5] Steps:  39%|███▉      | 5857/15001 [3:44:09<4:54:26,  1.93s/it, loss=0.171, lr=1e-5]Steps:  39%|███▉      | 5857/15001 [3:44:09<4:54:26,  1.93s/it, loss=0.15, lr=1e-5] Steps:  39%|███▉      | 5858/15001 [3:44:11<4:42:33,  1.85s/it, loss=0.15, lr=1e-5]Steps:  39%|███▉      | 5858/15001 [3:44:11<4:42:33,  1.85s/it, loss=0.0874, lr=1e-5]Steps:  39%|███▉      | 5859/15001 [3:44:13<4:57:25,  1.95s/it, loss=0.0874, lr=1e-5]Steps:  39%|███▉      | 5859/15001 [3:44:13<4:57:25,  1.95s/it, loss=0.112, lr=1e-5] Steps:  39%|███▉      | 5860/15001 [3:44:15<5:00:13,  1.97s/it, loss=0.112, lr=1e-5]Steps:  39%|███▉      | 5860/15001 [3:44:15<5:00:13,  1.97s/it, loss=0.0447, lr=1e-5]Steps:  39%|███▉      | 5861/15001 [3:44:17<4:57:37,  1.95s/it, loss=0.0447, lr=1e-5]Steps:  39%|███▉      | 5861/15001 [3:44:17<4:57:37,  1.95s/it, loss=0.151, lr=1e-5] Steps:  39%|███▉      | 5862/15001 [3:44:19<4:52:37,  1.92s/it, loss=0.151, lr=1e-5]Steps:  39%|███▉      | 5862/15001 [3:44:19<4:52:37,  1.92s/it, loss=0.141, lr=1e-5]Steps:  39%|███▉      | 5863/15001 [3:44:21<4:47:52,  1.89s/it, loss=0.141, lr=1e-5]Steps:  39%|███▉      | 5863/15001 [3:44:21<4:47:52,  1.89s/it, loss=0.07, lr=1e-5] Steps:  39%|███▉      | 5864/15001 [3:44:23<4:42:30,  1.86s/it, loss=0.07, lr=1e-5]Steps:  39%|███▉      | 5864/15001 [3:44:23<4:42:30,  1.86s/it, loss=0.193, lr=1e-5]Steps:  39%|███▉      | 5865/15001 [3:44:24<4:34:28,  1.80s/it, loss=0.193, lr=1e-5]Steps:  39%|███▉      | 5865/15001 [3:44:24<4:34:28,  1.80s/it, loss=0.206, lr=1e-5]Steps:  39%|███▉      | 5866/15001 [3:44:26<4:39:40,  1.84s/it, loss=0.206, lr=1e-5]Steps:  39%|███▉      | 5866/15001 [3:44:26<4:39:40,  1.84s/it, loss=0.0557, lr=1e-5]Steps:  39%|███▉      | 5867/15001 [3:44:28<4:35:22,  1.81s/it, loss=0.0557, lr=1e-5]Steps:  39%|███▉      | 5867/15001 [3:44:28<4:35:22,  1.81s/it, loss=0.131, lr=1e-5] Steps:  39%|███▉      | 5868/15001 [3:44:30<4:34:42,  1.80s/it, loss=0.131, lr=1e-5]Steps:  39%|███▉      | 5868/15001 [3:44:30<4:34:42,  1.80s/it, loss=0.229, lr=1e-5]Steps:  39%|███▉      | 5869/15001 [3:44:31<4:29:00,  1.77s/it, loss=0.229, lr=1e-5]Steps:  39%|███▉      | 5869/15001 [3:44:32<4:29:00,  1.77s/it, loss=0.0594, lr=1e-5]Steps:  39%|███▉      | 5870/15001 [3:44:34<4:52:45,  1.92s/it, loss=0.0594, lr=1e-5]Steps:  39%|███▉      | 5870/15001 [3:44:34<4:52:45,  1.92s/it, loss=0.338, lr=1e-5] Steps:  39%|███▉      | 5871/15001 [3:44:36<4:48:52,  1.90s/it, loss=0.338, lr=1e-5]Steps:  39%|███▉      | 5871/15001 [3:44:36<4:48:52,  1.90s/it, loss=0.217, lr=1e-5]Steps:  39%|███▉      | 5872/15001 [3:44:37<4:40:19,  1.84s/it, loss=0.217, lr=1e-5]Steps:  39%|███▉      | 5872/15001 [3:44:37<4:40:19,  1.84s/it, loss=0.141, lr=1e-5]Steps:  39%|███▉      | 5873/15001 [3:44:39<4:37:19,  1.82s/it, loss=0.141, lr=1e-5]Steps:  39%|███▉      | 5873/15001 [3:44:39<4:37:19,  1.82s/it, loss=0.125, lr=1e-5]Steps:  39%|███▉      | 5874/15001 [3:44:41<4:38:49,  1.83s/it, loss=0.125, lr=1e-5]Steps:  39%|███▉      | 5874/15001 [3:44:41<4:38:49,  1.83s/it, loss=0.278, lr=1e-5]Steps:  39%|███▉      | 5875/15001 [3:44:43<4:31:14,  1.78s/it, loss=0.278, lr=1e-5]Steps:  39%|███▉      | 5875/15001 [3:44:43<4:31:14,  1.78s/it, loss=0.302, lr=1e-5]Steps:  39%|███▉      | 5876/15001 [3:44:44<4:34:00,  1.80s/it, loss=0.302, lr=1e-5]Steps:  39%|███▉      | 5876/15001 [3:44:45<4:34:00,  1.80s/it, loss=0.122, lr=1e-5]Steps:  39%|███▉      | 5877/15001 [3:44:46<4:45:44,  1.88s/it, loss=0.122, lr=1e-5]Steps:  39%|███▉      | 5877/15001 [3:44:47<4:45:44,  1.88s/it, loss=0.0606, lr=1e-5]Steps:  39%|███▉      | 5878/15001 [3:44:48<4:34:05,  1.80s/it, loss=0.0606, lr=1e-5]Steps:  39%|███▉      | 5878/15001 [3:44:48<4:34:05,  1.80s/it, loss=0.144, lr=1e-5] Steps:  39%|███▉      | 5879/15001 [3:44:50<4:43:56,  1.87s/it, loss=0.144, lr=1e-5]Steps:  39%|███▉      | 5879/15001 [3:44:50<4:43:56,  1.87s/it, loss=0.152, lr=1e-5]Steps:  39%|███▉      | 5880/15001 [3:44:52<4:50:03,  1.91s/it, loss=0.152, lr=1e-5]Steps:  39%|███▉      | 5880/15001 [3:44:52<4:50:03,  1.91s/it, loss=0.118, lr=1e-5]Steps:  39%|███▉      | 5881/15001 [3:44:54<5:01:01,  1.98s/it, loss=0.118, lr=1e-5]Steps:  39%|███▉      | 5881/15001 [3:44:54<5:01:01,  1.98s/it, loss=0.175, lr=1e-5]Steps:  39%|███▉      | 5882/15001 [3:44:56<5:00:50,  1.98s/it, loss=0.175, lr=1e-5]Steps:  39%|███▉      | 5882/15001 [3:44:56<5:00:50,  1.98s/it, loss=0.0474, lr=1e-5]Steps:  39%|███▉      | 5883/15001 [3:44:58<4:53:24,  1.93s/it, loss=0.0474, lr=1e-5]Steps:  39%|███▉      | 5883/15001 [3:44:58<4:53:24,  1.93s/it, loss=0.217, lr=1e-5] Steps:  39%|███▉      | 5884/15001 [3:45:00<5:00:10,  1.98s/it, loss=0.217, lr=1e-5]Steps:  39%|███▉      | 5884/15001 [3:45:00<5:00:10,  1.98s/it, loss=0.0856, lr=1e-5]Steps:  39%|███▉      | 5885/15001 [3:45:02<4:59:51,  1.97s/it, loss=0.0856, lr=1e-5]Steps:  39%|███▉      | 5885/15001 [3:45:02<4:59:51,  1.97s/it, loss=0.0428, lr=1e-5]Steps:  39%|███▉      | 5886/15001 [3:45:04<4:44:00,  1.87s/it, loss=0.0428, lr=1e-5]Steps:  39%|███▉      | 5886/15001 [3:45:04<4:44:00,  1.87s/it, loss=0.0796, lr=1e-5]Steps:  39%|███▉      | 5887/15001 [3:45:06<4:41:51,  1.86s/it, loss=0.0796, lr=1e-5]Steps:  39%|███▉      | 5887/15001 [3:45:06<4:41:51,  1.86s/it, loss=0.364, lr=1e-5] Steps:  39%|███▉      | 5888/15001 [3:45:07<4:35:58,  1.82s/it, loss=0.364, lr=1e-5]Steps:  39%|███▉      | 5888/15001 [3:45:08<4:35:58,  1.82s/it, loss=0.252, lr=1e-5]Steps:  39%|███▉      | 5889/15001 [3:45:09<4:48:11,  1.90s/it, loss=0.252, lr=1e-5]Steps:  39%|███▉      | 5889/15001 [3:45:09<4:48:11,  1.90s/it, loss=0.132, lr=1e-5]Steps:  39%|███▉      | 5890/15001 [3:45:11<4:38:43,  1.84s/it, loss=0.132, lr=1e-5]Steps:  39%|███▉      | 5890/15001 [3:45:11<4:38:43,  1.84s/it, loss=0.148, lr=1e-5]Steps:  39%|███▉      | 5891/15001 [3:45:13<4:40:05,  1.84s/it, loss=0.148, lr=1e-5]Steps:  39%|███▉      | 5891/15001 [3:45:13<4:40:05,  1.84s/it, loss=0.0619, lr=1e-5]Steps:  39%|███▉      | 5892/15001 [3:45:15<4:35:07,  1.81s/it, loss=0.0619, lr=1e-5]Steps:  39%|███▉      | 5892/15001 [3:45:15<4:35:07,  1.81s/it, loss=0.276, lr=1e-5] Steps:  39%|███▉      | 5893/15001 [3:45:16<4:31:35,  1.79s/it, loss=0.276, lr=1e-5]Steps:  39%|███▉      | 5893/15001 [3:45:17<4:31:35,  1.79s/it, loss=0.159, lr=1e-5]Steps:  39%|███▉      | 5894/15001 [3:45:18<4:33:56,  1.80s/it, loss=0.159, lr=1e-5]Steps:  39%|███▉      | 5894/15001 [3:45:18<4:33:56,  1.80s/it, loss=0.144, lr=1e-5]Steps:  39%|███▉      | 5895/15001 [3:45:20<4:40:26,  1.85s/it, loss=0.144, lr=1e-5]Steps:  39%|███▉      | 5895/15001 [3:45:20<4:40:26,  1.85s/it, loss=0.0671, lr=1e-5]Steps:  39%|███▉      | 5896/15001 [3:45:22<4:39:12,  1.84s/it, loss=0.0671, lr=1e-5]Steps:  39%|███▉      | 5896/15001 [3:45:22<4:39:12,  1.84s/it, loss=0.192, lr=1e-5] Steps:  39%|███▉      | 5897/15001 [3:45:24<4:33:46,  1.80s/it, loss=0.192, lr=1e-5]Steps:  39%|███▉      | 5897/15001 [3:45:24<4:33:46,  1.80s/it, loss=0.189, lr=1e-5]Steps:  39%|███▉      | 5898/15001 [3:45:26<4:37:51,  1.83s/it, loss=0.189, lr=1e-5]Steps:  39%|███▉      | 5898/15001 [3:45:26<4:37:51,  1.83s/it, loss=0.205, lr=1e-5]Steps:  39%|███▉      | 5899/15001 [3:45:27<4:38:31,  1.84s/it, loss=0.205, lr=1e-5]Steps:  39%|███▉      | 5899/15001 [3:45:28<4:38:31,  1.84s/it, loss=0.0922, lr=1e-5]Steps:  39%|███▉      | 5900/15001 [3:45:29<4:31:38,  1.79s/it, loss=0.0922, lr=1e-5]Steps:  39%|███▉      | 5900/15001 [3:45:29<4:31:38,  1.79s/it, loss=0.313, lr=1e-5] Steps:  39%|███▉      | 5901/15001 [3:45:31<4:37:53,  1.83s/it, loss=0.313, lr=1e-5]Steps:  39%|███▉      | 5901/15001 [3:45:31<4:37:53,  1.83s/it, loss=0.268, lr=1e-5]Steps:  39%|███▉      | 5902/15001 [3:45:33<4:39:57,  1.85s/it, loss=0.268, lr=1e-5]Steps:  39%|███▉      | 5902/15001 [3:45:33<4:39:57,  1.85s/it, loss=0.169, lr=1e-5]Steps:  39%|███▉      | 5903/15001 [3:45:35<4:42:52,  1.87s/it, loss=0.169, lr=1e-5]Steps:  39%|███▉      | 5903/15001 [3:45:35<4:42:52,  1.87s/it, loss=0.21, lr=1e-5] Steps:  39%|███▉      | 5904/15001 [3:45:37<4:48:35,  1.90s/it, loss=0.21, lr=1e-5]Steps:  39%|███▉      | 5904/15001 [3:45:37<4:48:35,  1.90s/it, loss=0.0999, lr=1e-5]Steps:  39%|███▉      | 5905/15001 [3:45:39<4:53:37,  1.94s/it, loss=0.0999, lr=1e-5]Steps:  39%|███▉      | 5905/15001 [3:45:39<4:53:37,  1.94s/it, loss=0.298, lr=1e-5] Steps:  39%|███▉      | 5906/15001 [3:45:41<5:12:13,  2.06s/it, loss=0.298, lr=1e-5]Steps:  39%|███▉      | 5906/15001 [3:45:41<5:12:13,  2.06s/it, loss=0.254, lr=1e-5]Steps:  39%|███▉      | 5907/15001 [3:45:43<5:05:05,  2.01s/it, loss=0.254, lr=1e-5]Steps:  39%|███▉      | 5907/15001 [3:45:43<5:05:05,  2.01s/it, loss=0.213, lr=1e-5]Steps:  39%|███▉      | 5908/15001 [3:45:45<4:51:20,  1.92s/it, loss=0.213, lr=1e-5]Steps:  39%|███▉      | 5908/15001 [3:45:45<4:51:20,  1.92s/it, loss=0.0301, lr=1e-5]Steps:  39%|███▉      | 5909/15001 [3:45:47<4:54:23,  1.94s/it, loss=0.0301, lr=1e-5]Steps:  39%|███▉      | 5909/15001 [3:45:47<4:54:23,  1.94s/it, loss=0.0896, lr=1e-5]Steps:  39%|███▉      | 5910/15001 [3:45:48<4:42:05,  1.86s/it, loss=0.0896, lr=1e-5]Steps:  39%|███▉      | 5910/15001 [3:45:49<4:42:05,  1.86s/it, loss=0.212, lr=1e-5] Steps:  39%|███▉      | 5911/15001 [3:45:50<4:49:40,  1.91s/it, loss=0.212, lr=1e-5]Steps:  39%|███▉      | 5911/15001 [3:45:51<4:49:40,  1.91s/it, loss=0.0552, lr=1e-5]Steps:  39%|███▉      | 5912/15001 [3:45:52<4:31:36,  1.79s/it, loss=0.0552, lr=1e-5]Steps:  39%|███▉      | 5912/15001 [3:45:52<4:31:36,  1.79s/it, loss=0.187, lr=1e-5] Steps:  39%|███▉      | 5913/15001 [3:45:54<4:50:35,  1.92s/it, loss=0.187, lr=1e-5]Steps:  39%|███▉      | 5913/15001 [3:45:54<4:50:35,  1.92s/it, loss=0.344, lr=1e-5]Steps:  39%|███▉      | 5914/15001 [3:45:56<4:47:16,  1.90s/it, loss=0.344, lr=1e-5]Steps:  39%|███▉      | 5914/15001 [3:45:56<4:47:16,  1.90s/it, loss=0.153, lr=1e-5]Steps:  39%|███▉      | 5915/15001 [3:45:58<4:35:49,  1.82s/it, loss=0.153, lr=1e-5]Steps:  39%|███▉      | 5915/15001 [3:45:58<4:35:49,  1.82s/it, loss=0.0586, lr=1e-5]Steps:  39%|███▉      | 5916/15001 [3:46:00<4:36:47,  1.83s/it, loss=0.0586, lr=1e-5]Steps:  39%|███▉      | 5916/15001 [3:46:00<4:36:47,  1.83s/it, loss=0.157, lr=1e-5] Steps:  39%|███▉      | 5917/15001 [3:46:02<4:44:45,  1.88s/it, loss=0.157, lr=1e-5]Steps:  39%|███▉      | 5917/15001 [3:46:02<4:44:45,  1.88s/it, loss=0.0961, lr=1e-5]Steps:  39%|███▉      | 5918/15001 [3:46:03<4:31:23,  1.79s/it, loss=0.0961, lr=1e-5]Steps:  39%|███▉      | 5918/15001 [3:46:04<4:31:23,  1.79s/it, loss=0.175, lr=1e-5] Steps:  39%|███▉      | 5919/15001 [3:46:05<4:34:54,  1.82s/it, loss=0.175, lr=1e-5]Steps:  39%|███▉      | 5919/15001 [3:46:05<4:34:54,  1.82s/it, loss=0.251, lr=1e-5]Steps:  39%|███▉      | 5920/15001 [3:46:07<4:31:22,  1.79s/it, loss=0.251, lr=1e-5]Steps:  39%|███▉      | 5920/15001 [3:46:07<4:31:22,  1.79s/it, loss=0.161, lr=1e-5]Steps:  39%|███▉      | 5921/15001 [3:46:09<4:45:23,  1.89s/it, loss=0.161, lr=1e-5]Steps:  39%|███▉      | 5921/15001 [3:46:09<4:45:23,  1.89s/it, loss=0.297, lr=1e-5]Steps:  39%|███▉      | 5922/15001 [3:46:10<4:27:05,  1.77s/it, loss=0.297, lr=1e-5]Steps:  39%|███▉      | 5922/15001 [3:46:11<4:27:05,  1.77s/it, loss=0.31, lr=1e-5] Steps:  39%|███▉      | 5923/15001 [3:46:12<4:38:24,  1.84s/it, loss=0.31, lr=1e-5]Steps:  39%|███▉      | 5923/15001 [3:46:12<4:38:24,  1.84s/it, loss=0.19, lr=1e-5]Steps:  39%|███▉      | 5924/15001 [3:46:14<4:34:48,  1.82s/it, loss=0.19, lr=1e-5]Steps:  39%|███▉      | 5924/15001 [3:46:14<4:34:48,  1.82s/it, loss=0.234, lr=1e-5]Steps:  39%|███▉      | 5925/15001 [3:46:16<4:40:37,  1.86s/it, loss=0.234, lr=1e-5]Steps:  39%|███▉      | 5925/15001 [3:46:16<4:40:37,  1.86s/it, loss=0.189, lr=1e-5]Steps:  40%|███▉      | 5926/15001 [3:46:18<4:55:17,  1.95s/it, loss=0.189, lr=1e-5]Steps:  40%|███▉      | 5926/15001 [3:46:18<4:55:17,  1.95s/it, loss=0.324, lr=1e-5]Steps:  40%|███▉      | 5927/15001 [3:46:20<4:47:47,  1.90s/it, loss=0.324, lr=1e-5]Steps:  40%|███▉      | 5927/15001 [3:46:20<4:47:47,  1.90s/it, loss=0.375, lr=1e-5]Steps:  40%|███▉      | 5928/15001 [3:46:22<5:00:25,  1.99s/it, loss=0.375, lr=1e-5]Steps:  40%|███▉      | 5928/15001 [3:46:22<5:00:25,  1.99s/it, loss=0.0936, lr=1e-5]Steps:  40%|███▉      | 5929/15001 [3:46:24<5:03:03,  2.00s/it, loss=0.0936, lr=1e-5]Steps:  40%|███▉      | 5929/15001 [3:46:24<5:03:03,  2.00s/it, loss=0.0669, lr=1e-5]Steps:  40%|███▉      | 5930/15001 [3:46:26<5:04:13,  2.01s/it, loss=0.0669, lr=1e-5]Steps:  40%|███▉      | 5930/15001 [3:46:27<5:04:13,  2.01s/it, loss=0.436, lr=1e-5] Steps:  40%|███▉      | 5931/15001 [3:46:28<4:56:36,  1.96s/it, loss=0.436, lr=1e-5]Steps:  40%|███▉      | 5931/15001 [3:46:28<4:56:36,  1.96s/it, loss=0.25, lr=1e-5] Steps:  40%|███▉      | 5932/15001 [3:46:30<4:38:44,  1.84s/it, loss=0.25, lr=1e-5]Steps:  40%|███▉      | 5932/15001 [3:46:30<4:38:44,  1.84s/it, loss=0.202, lr=1e-5]Steps:  40%|███▉      | 5933/15001 [3:46:32<4:43:23,  1.88s/it, loss=0.202, lr=1e-5]Steps:  40%|███▉      | 5933/15001 [3:46:32<4:43:23,  1.88s/it, loss=0.106, lr=1e-5]Steps:  40%|███▉      | 5934/15001 [3:46:34<4:52:43,  1.94s/it, loss=0.106, lr=1e-5]Steps:  40%|███▉      | 5934/15001 [3:46:34<4:52:43,  1.94s/it, loss=0.17, lr=1e-5] Steps:  40%|███▉      | 5935/15001 [3:46:35<4:42:13,  1.87s/it, loss=0.17, lr=1e-5]Steps:  40%|███▉      | 5935/15001 [3:46:36<4:42:13,  1.87s/it, loss=0.152, lr=1e-5]Steps:  40%|███▉      | 5936/15001 [3:46:37<4:41:28,  1.86s/it, loss=0.152, lr=1e-5]Steps:  40%|███▉      | 5936/15001 [3:46:37<4:41:28,  1.86s/it, loss=0.128, lr=1e-5]Steps:  40%|███▉      | 5937/15001 [3:46:39<4:32:57,  1.81s/it, loss=0.128, lr=1e-5]Steps:  40%|███▉      | 5937/15001 [3:46:39<4:32:57,  1.81s/it, loss=0.183, lr=1e-5]Steps:  40%|███▉      | 5938/15001 [3:46:41<4:39:04,  1.85s/it, loss=0.183, lr=1e-5]Steps:  40%|███▉      | 5938/15001 [3:46:41<4:39:04,  1.85s/it, loss=0.287, lr=1e-5]Steps:  40%|███▉      | 5939/15001 [3:46:43<4:42:50,  1.87s/it, loss=0.287, lr=1e-5]Steps:  40%|███▉      | 5939/15001 [3:46:43<4:42:50,  1.87s/it, loss=0.131, lr=1e-5]Steps:  40%|███▉      | 5940/15001 [3:46:45<4:41:08,  1.86s/it, loss=0.131, lr=1e-5]Steps:  40%|███▉      | 5940/15001 [3:46:45<4:41:08,  1.86s/it, loss=0.36, lr=1e-5] Steps:  40%|███▉      | 5941/15001 [3:46:46<4:33:02,  1.81s/it, loss=0.36, lr=1e-5]Steps:  40%|███▉      | 5941/15001 [3:46:47<4:33:02,  1.81s/it, loss=0.263, lr=1e-5]Steps:  40%|███▉      | 5942/15001 [3:46:48<4:33:51,  1.81s/it, loss=0.263, lr=1e-5]Steps:  40%|███▉      | 5942/15001 [3:46:48<4:33:51,  1.81s/it, loss=0.181, lr=1e-5]Steps:  40%|███▉      | 5943/15001 [3:46:50<4:37:01,  1.83s/it, loss=0.181, lr=1e-5]Steps:  40%|███▉      | 5943/15001 [3:46:50<4:37:01,  1.83s/it, loss=0.0629, lr=1e-5]Steps:  40%|███▉      | 5944/15001 [3:46:52<4:42:10,  1.87s/it, loss=0.0629, lr=1e-5]Steps:  40%|███▉      | 5944/15001 [3:46:52<4:42:10,  1.87s/it, loss=0.141, lr=1e-5] Steps:  40%|███▉      | 5945/15001 [3:46:54<4:36:54,  1.83s/it, loss=0.141, lr=1e-5]Steps:  40%|███▉      | 5945/15001 [3:46:54<4:36:54,  1.83s/it, loss=0.191, lr=1e-5]Steps:  40%|███▉      | 5946/15001 [3:46:56<4:50:58,  1.93s/it, loss=0.191, lr=1e-5]Steps:  40%|███▉      | 5946/15001 [3:46:56<4:50:58,  1.93s/it, loss=0.3, lr=1e-5]  Steps:  40%|███▉      | 5947/15001 [3:46:58<4:43:15,  1.88s/it, loss=0.3, lr=1e-5]Steps:  40%|███▉      | 5947/15001 [3:46:58<4:43:15,  1.88s/it, loss=0.106, lr=1e-5]Steps:  40%|███▉      | 5948/15001 [3:46:59<4:39:02,  1.85s/it, loss=0.106, lr=1e-5]Steps:  40%|███▉      | 5948/15001 [3:47:00<4:39:02,  1.85s/it, loss=0.202, lr=1e-5]Steps:  40%|███▉      | 5949/15001 [3:47:02<4:57:57,  1.98s/it, loss=0.202, lr=1e-5]Steps:  40%|███▉      | 5949/15001 [3:47:02<4:57:57,  1.98s/it, loss=0.0404, lr=1e-5]Steps:  40%|███▉      | 5950/15001 [3:47:04<5:00:25,  1.99s/it, loss=0.0404, lr=1e-5]Steps:  40%|███▉      | 5950/15001 [3:47:04<5:00:25,  1.99s/it, loss=0.103, lr=1e-5] Steps:  40%|███▉      | 5951/15001 [3:47:06<4:55:59,  1.96s/it, loss=0.103, lr=1e-5]Steps:  40%|███▉      | 5951/15001 [3:47:06<4:55:59,  1.96s/it, loss=0.257, lr=1e-5]Steps:  40%|███▉      | 5952/15001 [3:47:08<4:57:00,  1.97s/it, loss=0.257, lr=1e-5]Steps:  40%|███▉      | 5952/15001 [3:47:08<4:57:00,  1.97s/it, loss=0.251, lr=1e-5]Steps:  40%|███▉      | 5953/15001 [3:47:10<4:59:16,  1.98s/it, loss=0.251, lr=1e-5]Steps:  40%|███▉      | 5953/15001 [3:47:10<4:59:16,  1.98s/it, loss=0.115, lr=1e-5]Steps:  40%|███▉      | 5954/15001 [3:47:11<4:51:16,  1.93s/it, loss=0.115, lr=1e-5]Steps:  40%|███▉      | 5954/15001 [3:47:12<4:51:16,  1.93s/it, loss=0.0841, lr=1e-5]Steps:  40%|███▉      | 5955/15001 [3:47:13<4:47:28,  1.91s/it, loss=0.0841, lr=1e-5]Steps:  40%|███▉      | 5955/15001 [3:47:13<4:47:28,  1.91s/it, loss=0.14, lr=1e-5]  Steps:  40%|███▉      | 5956/15001 [3:47:15<4:40:50,  1.86s/it, loss=0.14, lr=1e-5]Steps:  40%|███▉      | 5956/15001 [3:47:15<4:40:50,  1.86s/it, loss=0.0429, lr=1e-5]Steps:  40%|███▉      | 5957/15001 [3:47:17<4:21:49,  1.74s/it, loss=0.0429, lr=1e-5]Steps:  40%|███▉      | 5957/15001 [3:47:17<4:21:49,  1.74s/it, loss=0.0924, lr=1e-5]Steps:  40%|███▉      | 5958/15001 [3:47:19<4:35:50,  1.83s/it, loss=0.0924, lr=1e-5]Steps:  40%|███▉      | 5958/15001 [3:47:19<4:35:50,  1.83s/it, loss=0.145, lr=1e-5] Steps:  40%|███▉      | 5959/15001 [3:47:20<4:32:13,  1.81s/it, loss=0.145, lr=1e-5]Steps:  40%|███▉      | 5959/15001 [3:47:21<4:32:13,  1.81s/it, loss=0.199, lr=1e-5]Steps:  40%|███▉      | 5960/15001 [3:47:22<4:38:12,  1.85s/it, loss=0.199, lr=1e-5]Steps:  40%|███▉      | 5960/15001 [3:47:22<4:38:12,  1.85s/it, loss=0.0123, lr=1e-5]Steps:  40%|███▉      | 5961/15001 [3:47:24<4:35:08,  1.83s/it, loss=0.0123, lr=1e-5]Steps:  40%|███▉      | 5961/15001 [3:47:24<4:35:08,  1.83s/it, loss=0.348, lr=1e-5] Steps:  40%|███▉      | 5962/15001 [3:47:26<4:27:13,  1.77s/it, loss=0.348, lr=1e-5]Steps:  40%|███▉      | 5962/15001 [3:47:26<4:27:13,  1.77s/it, loss=0.338, lr=1e-5]Steps:  40%|███▉      | 5963/15001 [3:47:27<4:28:22,  1.78s/it, loss=0.338, lr=1e-5]Steps:  40%|███▉      | 5963/15001 [3:47:28<4:28:22,  1.78s/it, loss=0.0628, lr=1e-5]Steps:  40%|███▉      | 5964/15001 [3:47:29<4:27:23,  1.78s/it, loss=0.0628, lr=1e-5]Steps:  40%|███▉      | 5964/15001 [3:47:29<4:27:23,  1.78s/it, loss=0.475, lr=1e-5] Steps:  40%|███▉      | 5965/15001 [3:47:31<4:37:25,  1.84s/it, loss=0.475, lr=1e-5]Steps:  40%|███▉      | 5965/15001 [3:47:31<4:37:25,  1.84s/it, loss=0.141, lr=1e-5]Steps:  40%|███▉      | 5966/15001 [3:47:33<4:25:07,  1.76s/it, loss=0.141, lr=1e-5]Steps:  40%|███▉      | 5966/15001 [3:47:33<4:25:07,  1.76s/it, loss=0.136, lr=1e-5]Steps:  40%|███▉      | 5967/15001 [3:47:35<4:24:54,  1.76s/it, loss=0.136, lr=1e-5]Steps:  40%|███▉      | 5967/15001 [3:47:35<4:24:54,  1.76s/it, loss=0.152, lr=1e-5]Steps:  40%|███▉      | 5968/15001 [3:47:37<4:36:09,  1.83s/it, loss=0.152, lr=1e-5]Steps:  40%|███▉      | 5968/15001 [3:47:37<4:36:09,  1.83s/it, loss=0.135, lr=1e-5]Steps:  40%|███▉      | 5969/15001 [3:47:38<4:35:04,  1.83s/it, loss=0.135, lr=1e-5]Steps:  40%|███▉      | 5969/15001 [3:47:39<4:35:04,  1.83s/it, loss=0.0635, lr=1e-5]Steps:  40%|███▉      | 5970/15001 [3:47:40<4:35:03,  1.83s/it, loss=0.0635, lr=1e-5]Steps:  40%|███▉      | 5970/15001 [3:47:40<4:35:03,  1.83s/it, loss=0.2, lr=1e-5]   Steps:  40%|███▉      | 5971/15001 [3:47:42<4:47:27,  1.91s/it, loss=0.2, lr=1e-5]Steps:  40%|███▉      | 5971/15001 [3:47:42<4:47:27,  1.91s/it, loss=0.197, lr=1e-5]Steps:  40%|███▉      | 5972/15001 [3:47:44<4:46:27,  1.90s/it, loss=0.197, lr=1e-5]Steps:  40%|███▉      | 5972/15001 [3:47:44<4:46:27,  1.90s/it, loss=0.322, lr=1e-5]Steps:  40%|███▉      | 5973/15001 [3:47:46<4:53:20,  1.95s/it, loss=0.322, lr=1e-5]Steps:  40%|███▉      | 5973/15001 [3:47:46<4:53:20,  1.95s/it, loss=0.21, lr=1e-5] Steps:  40%|███▉      | 5974/15001 [3:47:48<4:52:35,  1.94s/it, loss=0.21, lr=1e-5]Steps:  40%|███▉      | 5974/15001 [3:47:48<4:52:35,  1.94s/it, loss=0.198, lr=1e-5]Steps:  40%|███▉      | 5975/15001 [3:47:50<4:48:38,  1.92s/it, loss=0.198, lr=1e-5]Steps:  40%|███▉      | 5975/15001 [3:47:50<4:48:38,  1.92s/it, loss=0.092, lr=1e-5]Steps:  40%|███▉      | 5976/15001 [3:47:52<4:52:17,  1.94s/it, loss=0.092, lr=1e-5]Steps:  40%|███▉      | 5976/15001 [3:47:52<4:52:17,  1.94s/it, loss=0.257, lr=1e-5]Steps:  40%|███▉      | 5977/15001 [3:47:54<4:48:10,  1.92s/it, loss=0.257, lr=1e-5]Steps:  40%|███▉      | 5977/15001 [3:47:54<4:48:10,  1.92s/it, loss=0.0703, lr=1e-5]Steps:  40%|███▉      | 5978/15001 [3:47:56<4:37:14,  1.84s/it, loss=0.0703, lr=1e-5]Steps:  40%|███▉      | 5978/15001 [3:47:56<4:37:14,  1.84s/it, loss=0.266, lr=1e-5] Steps:  40%|███▉      | 5979/15001 [3:47:57<4:38:07,  1.85s/it, loss=0.266, lr=1e-5]Steps:  40%|███▉      | 5979/15001 [3:47:58<4:38:07,  1.85s/it, loss=0.241, lr=1e-5]Steps:  40%|███▉      | 5980/15001 [3:47:59<4:37:18,  1.84s/it, loss=0.241, lr=1e-5]Steps:  40%|███▉      | 5980/15001 [3:48:00<4:37:18,  1.84s/it, loss=0.17, lr=1e-5] Steps:  40%|███▉      | 5981/15001 [3:48:01<4:43:16,  1.88s/it, loss=0.17, lr=1e-5]Steps:  40%|███▉      | 5981/15001 [3:48:01<4:43:16,  1.88s/it, loss=0.144, lr=1e-5]Steps:  40%|███▉      | 5982/15001 [3:48:03<4:34:47,  1.83s/it, loss=0.144, lr=1e-5]Steps:  40%|███▉      | 5982/15001 [3:48:03<4:34:47,  1.83s/it, loss=0.134, lr=1e-5]Steps:  40%|███▉      | 5983/15001 [3:48:05<4:39:44,  1.86s/it, loss=0.134, lr=1e-5]Steps:  40%|███▉      | 5983/15001 [3:48:05<4:39:44,  1.86s/it, loss=0.0467, lr=1e-5]Steps:  40%|███▉      | 5984/15001 [3:48:06<4:23:01,  1.75s/it, loss=0.0467, lr=1e-5]Steps:  40%|███▉      | 5984/15001 [3:48:07<4:23:01,  1.75s/it, loss=0.0522, lr=1e-5]Steps:  40%|███▉      | 5985/15001 [3:48:08<4:36:21,  1.84s/it, loss=0.0522, lr=1e-5]Steps:  40%|███▉      | 5985/15001 [3:48:09<4:36:21,  1.84s/it, loss=0.188, lr=1e-5] Steps:  40%|███▉      | 5986/15001 [3:48:10<4:35:27,  1.83s/it, loss=0.188, lr=1e-5]Steps:  40%|███▉      | 5986/15001 [3:48:10<4:35:27,  1.83s/it, loss=0.0657, lr=1e-5]Steps:  40%|███▉      | 5987/15001 [3:48:12<4:30:16,  1.80s/it, loss=0.0657, lr=1e-5]Steps:  40%|███▉      | 5987/15001 [3:48:12<4:30:16,  1.80s/it, loss=0.414, lr=1e-5] Steps:  40%|███▉      | 5988/15001 [3:48:14<4:37:31,  1.85s/it, loss=0.414, lr=1e-5]Steps:  40%|███▉      | 5988/15001 [3:48:14<4:37:31,  1.85s/it, loss=0.0119, lr=1e-5]Steps:  40%|███▉      | 5989/15001 [3:48:16<4:29:18,  1.79s/it, loss=0.0119, lr=1e-5]Steps:  40%|███▉      | 5989/15001 [3:48:16<4:29:18,  1.79s/it, loss=0.266, lr=1e-5] Steps:  40%|███▉      | 5990/15001 [3:48:17<4:29:39,  1.80s/it, loss=0.266, lr=1e-5]Steps:  40%|███▉      | 5990/15001 [3:48:18<4:29:39,  1.80s/it, loss=0.268, lr=1e-5]Steps:  40%|███▉      | 5991/15001 [3:48:19<4:40:23,  1.87s/it, loss=0.268, lr=1e-5]Steps:  40%|███▉      | 5991/15001 [3:48:20<4:40:23,  1.87s/it, loss=0.105, lr=1e-5]Steps:  40%|███▉      | 5992/15001 [3:48:21<4:39:16,  1.86s/it, loss=0.105, lr=1e-5]Steps:  40%|███▉      | 5992/15001 [3:48:21<4:39:16,  1.86s/it, loss=0.465, lr=1e-5]Steps:  40%|███▉      | 5993/15001 [3:48:23<4:45:28,  1.90s/it, loss=0.465, lr=1e-5]Steps:  40%|███▉      | 5993/15001 [3:48:23<4:45:28,  1.90s/it, loss=0.147, lr=1e-5]Steps:  40%|███▉      | 5994/15001 [3:48:25<4:34:35,  1.83s/it, loss=0.147, lr=1e-5]Steps:  40%|███▉      | 5994/15001 [3:48:25<4:34:35,  1.83s/it, loss=0.174, lr=1e-5]Steps:  40%|███▉      | 5995/15001 [3:48:27<4:50:47,  1.94s/it, loss=0.174, lr=1e-5]Steps:  40%|███▉      | 5995/15001 [3:48:27<4:50:47,  1.94s/it, loss=0.126, lr=1e-5]Steps:  40%|███▉      | 5996/15001 [3:48:29<4:55:19,  1.97s/it, loss=0.126, lr=1e-5]Steps:  40%|███▉      | 5996/15001 [3:48:29<4:55:19,  1.97s/it, loss=0.0863, lr=1e-5]Steps:  40%|███▉      | 5997/15001 [3:48:31<4:57:09,  1.98s/it, loss=0.0863, lr=1e-5]Steps:  40%|███▉      | 5997/15001 [3:48:31<4:57:09,  1.98s/it, loss=0.127, lr=1e-5] Steps:  40%|███▉      | 5998/15001 [3:48:33<4:58:04,  1.99s/it, loss=0.127, lr=1e-5]Steps:  40%|███▉      | 5998/15001 [3:48:33<4:58:04,  1.99s/it, loss=0.246, lr=1e-5]Steps:  40%|███▉      | 5999/15001 [3:48:35<4:47:48,  1.92s/it, loss=0.246, lr=1e-5]Steps:  40%|███▉      | 5999/15001 [3:48:35<4:47:48,  1.92s/it, loss=0.193, lr=1e-5]Steps:  40%|███▉      | 6000/15001 [3:48:37<4:52:18,  1.95s/it, loss=0.193, lr=1e-5]02/04/2024 16:50:56 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1645.36it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  40%|███▉      | 6000/15001 [3:52:15<4:52:18,  1.95s/it, loss=0.307, lr=1e-5]Steps:  40%|████      | 6001/15001 [3:52:17<168:20:06, 67.33s/it, loss=0.307, lr=1e-5]Steps:  40%|████      | 6001/15001 [3:52:17<168:20:06, 67.33s/it, loss=0.0731, lr=1e-5]Steps:  40%|████      | 6002/15001 [3:52:19<119:10:03, 47.67s/it, loss=0.0731, lr=1e-5]Steps:  40%|████      | 6002/15001 [3:52:19<119:10:03, 47.67s/it, loss=0.147, lr=1e-5] Steps:  40%|████      | 6003/15001 [3:52:20<84:47:38, 33.93s/it, loss=0.147, lr=1e-5] Steps:  40%|████      | 6003/15001 [3:52:21<84:47:38, 33.93s/it, loss=0.0973, lr=1e-5]Steps:  40%|████      | 6004/15001 [3:52:23<61:00:44, 24.41s/it, loss=0.0973, lr=1e-5]Steps:  40%|████      | 6004/15001 [3:52:23<61:00:44, 24.41s/it, loss=0.107, lr=1e-5] Steps:  40%|████      | 6005/15001 [3:52:25<44:10:27, 17.68s/it, loss=0.107, lr=1e-5]Steps:  40%|████      | 6005/15001 [3:52:25<44:10:27, 17.68s/it, loss=0.142, lr=1e-5]Steps:  40%|████      | 6006/15001 [3:52:27<32:23:08, 12.96s/it, loss=0.142, lr=1e-5]Steps:  40%|████      | 6006/15001 [3:52:27<32:23:08, 12.96s/it, loss=0.0456, lr=1e-5]Steps:  40%|████      | 6007/15001 [3:52:29<24:20:27,  9.74s/it, loss=0.0456, lr=1e-5]Steps:  40%|████      | 6007/15001 [3:52:29<24:20:27,  9.74s/it, loss=0.182, lr=1e-5] Steps:  40%|████      | 6008/15001 [3:52:31<18:28:19,  7.39s/it, loss=0.182, lr=1e-5]Steps:  40%|████      | 6008/15001 [3:52:31<18:28:19,  7.39s/it, loss=0.0732, lr=1e-5]Steps:  40%|████      | 6009/15001 [3:52:33<14:22:12,  5.75s/it, loss=0.0732, lr=1e-5]Steps:  40%|████      | 6009/15001 [3:52:33<14:22:12,  5.75s/it, loss=0.0974, lr=1e-5]Steps:  40%|████      | 6010/15001 [3:52:34<11:14:48,  4.50s/it, loss=0.0974, lr=1e-5]Steps:  40%|████      | 6010/15001 [3:52:34<11:14:48,  4.50s/it, loss=0.168, lr=1e-5] Steps:  40%|████      | 6011/15001 [3:52:36<9:12:24,  3.69s/it, loss=0.168, lr=1e-5] Steps:  40%|████      | 6011/15001 [3:52:36<9:12:24,  3.69s/it, loss=0.247, lr=1e-5]Steps:  40%|████      | 6012/15001 [3:52:38<7:56:07,  3.18s/it, loss=0.247, lr=1e-5]Steps:  40%|████      | 6012/15001 [3:52:38<7:56:07,  3.18s/it, loss=0.194, lr=1e-5]Steps:  40%|████      | 6013/15001 [3:52:40<7:02:41,  2.82s/it, loss=0.194, lr=1e-5]Steps:  40%|████      | 6013/15001 [3:52:40<7:02:41,  2.82s/it, loss=0.308, lr=1e-5]Steps:  40%|████      | 6014/15001 [3:52:42<6:17:00,  2.52s/it, loss=0.308, lr=1e-5]Steps:  40%|████      | 6014/15001 [3:52:42<6:17:00,  2.52s/it, loss=0.112, lr=1e-5]Steps:  40%|████      | 6015/15001 [3:52:44<5:39:08,  2.26s/it, loss=0.112, lr=1e-5]Steps:  40%|████      | 6015/15001 [3:52:44<5:39:08,  2.26s/it, loss=0.336, lr=1e-5]Steps:  40%|████      | 6016/15001 [3:52:45<5:23:15,  2.16s/it, loss=0.336, lr=1e-5]Steps:  40%|████      | 6016/15001 [3:52:46<5:23:15,  2.16s/it, loss=0.256, lr=1e-5]Steps:  40%|████      | 6017/15001 [3:52:47<5:06:03,  2.04s/it, loss=0.256, lr=1e-5]Steps:  40%|████      | 6017/15001 [3:52:48<5:06:03,  2.04s/it, loss=0.14, lr=1e-5] Steps:  40%|████      | 6018/15001 [3:52:49<4:59:31,  2.00s/it, loss=0.14, lr=1e-5]Steps:  40%|████      | 6018/15001 [3:52:49<4:59:31,  2.00s/it, loss=0.166, lr=1e-5]Steps:  40%|████      | 6019/15001 [3:52:51<4:50:56,  1.94s/it, loss=0.166, lr=1e-5]Steps:  40%|████      | 6019/15001 [3:52:51<4:50:56,  1.94s/it, loss=0.0812, lr=1e-5]Steps:  40%|████      | 6020/15001 [3:52:53<4:45:52,  1.91s/it, loss=0.0812, lr=1e-5]Steps:  40%|████      | 6020/15001 [3:52:53<4:45:52,  1.91s/it, loss=0.131, lr=1e-5] Steps:  40%|████      | 6021/15001 [3:52:54<4:33:39,  1.83s/it, loss=0.131, lr=1e-5]Steps:  40%|████      | 6021/15001 [3:52:55<4:33:39,  1.83s/it, loss=0.254, lr=1e-5]Steps:  40%|████      | 6022/15001 [3:52:57<4:53:48,  1.96s/it, loss=0.254, lr=1e-5]Steps:  40%|███���      | 6022/15001 [3:52:57<4:53:48,  1.96s/it, loss=0.0702, lr=1e-5]Steps:  40%|████      | 6023/15001 [3:52:59<4:48:52,  1.93s/it, loss=0.0702, lr=1e-5]Steps:  40%|████      | 6023/15001 [3:52:59<4:48:52,  1.93s/it, loss=0.147, lr=1e-5] Steps:  40%|████      | 6024/15001 [3:53:00<4:37:42,  1.86s/it, loss=0.147, lr=1e-5]Steps:  40%|████      | 6024/15001 [3:53:00<4:37:42,  1.86s/it, loss=0.229, lr=1e-5]Steps:  40%|████      | 6025/15001 [3:53:02<4:49:33,  1.94s/it, loss=0.229, lr=1e-5]Steps:  40%|████      | 6025/15001 [3:53:03<4:49:33,  1.94s/it, loss=0.295, lr=1e-5]Steps:  40%|████      | 6026/15001 [3:53:04<4:54:07,  1.97s/it, loss=0.295, lr=1e-5]Steps:  40%|████      | 6026/15001 [3:53:04<4:54:07,  1.97s/it, loss=0.0891, lr=1e-5]Steps:  40%|████      | 6027/15001 [3:53:06<4:47:07,  1.92s/it, loss=0.0891, lr=1e-5]Steps:  40%|████      | 6027/15001 [3:53:07<4:47:07,  1.92s/it, loss=0.138, lr=1e-5] Steps:  40%|████      | 6028/15001 [3:53:08<4:56:54,  1.99s/it, loss=0.138, lr=1e-5]Steps:  40%|████      | 6028/15001 [3:53:08<4:56:54,  1.99s/it, loss=0.215, lr=1e-5]Steps:  40%|████      | 6029/15001 [3:53:10<4:50:10,  1.94s/it, loss=0.215, lr=1e-5]Steps:  40%|████      | 6029/15001 [3:53:10<4:50:10,  1.94s/it, loss=0.0524, lr=1e-5]Steps:  40%|████      | 6030/15001 [3:53:12<4:47:27,  1.92s/it, loss=0.0524, lr=1e-5]Steps:  40%|████      | 6030/15001 [3:53:13<4:47:27,  1.92s/it, loss=0.343, lr=1e-5] Steps:  40%|████      | 6031/15001 [3:53:14<5:02:23,  2.02s/it, loss=0.343, lr=1e-5]Steps:  40%|████      | 6031/15001 [3:53:15<5:02:23,  2.02s/it, loss=0.277, lr=1e-5]Steps:  40%|████      | 6032/15001 [3:53:16<4:48:49,  1.93s/it, loss=0.277, lr=1e-5]Steps:  40%|████      | 6032/15001 [3:53:16<4:48:49,  1.93s/it, loss=0.134, lr=1e-5]Steps:  40%|████      | 6033/15001 [3:53:18<4:51:41,  1.95s/it, loss=0.134, lr=1e-5]Steps:  40%|████      | 6033/15001 [3:53:18<4:51:41,  1.95s/it, loss=0.213, lr=1e-5]Steps:  40%|████      | 6034/15001 [3:53:20<4:42:41,  1.89s/it, loss=0.213, lr=1e-5]Steps:  40%|████      | 6034/15001 [3:53:20<4:42:41,  1.89s/it, loss=0.142, lr=1e-5]Steps:  40%|████      | 6035/15001 [3:53:21<4:30:41,  1.81s/it, loss=0.142, lr=1e-5]Steps:  40%|████      | 6035/15001 [3:53:22<4:30:41,  1.81s/it, loss=0.111, lr=1e-5]Steps:  40%|████      | 6036/15001 [3:53:24<4:45:41,  1.91s/it, loss=0.111, lr=1e-5]Steps:  40%|████      | 6036/15001 [3:53:24<4:45:41,  1.91s/it, loss=0.088, lr=1e-5]Steps:  40%|████      | 6037/15001 [3:53:25<4:37:55,  1.86s/it, loss=0.088, lr=1e-5]Steps:  40%|████      | 6037/15001 [3:53:25<4:37:55,  1.86s/it, loss=0.167, lr=1e-5]Steps:  40%|████      | 6038/15001 [3:53:27<4:27:51,  1.79s/it, loss=0.167, lr=1e-5]Steps:  40%|████      | 6038/15001 [3:53:27<4:27:51,  1.79s/it, loss=0.0492, lr=1e-5]Steps:  40%|████      | 6039/15001 [3:53:29<4:46:42,  1.92s/it, loss=0.0492, lr=1e-5]Steps:  40%|████      | 6039/15001 [3:53:29<4:46:42,  1.92s/it, loss=0.347, lr=1e-5] Steps:  40%|████      | 6040/15001 [3:53:31<4:37:40,  1.86s/it, loss=0.347, lr=1e-5]Steps:  40%|████      | 6040/15001 [3:53:31<4:37:40,  1.86s/it, loss=0.0659, lr=1e-5]Steps:  40%|████      | 6041/15001 [3:53:33<4:37:04,  1.86s/it, loss=0.0659, lr=1e-5]Steps:  40%|████      | 6041/15001 [3:53:33<4:37:04,  1.86s/it, loss=0.165, lr=1e-5] Steps:  40%|████      | 6042/15001 [3:53:35<4:38:58,  1.87s/it, loss=0.165, lr=1e-5]Steps:  40%|████      | 6042/15001 [3:53:35<4:38:58,  1.87s/it, loss=0.129, lr=1e-5]Steps:  40%|████      | 6043/15001 [3:53:36<4:38:31,  1.87s/it, loss=0.129, lr=1e-5]Steps:  40%|████      | 6043/15001 [3:53:37<4:38:31,  1.87s/it, loss=0.0872, lr=1e-5]Steps:  40%|████      | 6044/15001 [3:53:38<4:37:20,  1.86s/it, loss=0.0872, lr=1e-5]Steps:  40%|████      | 6044/15001 [3:53:38<4:37:20,  1.86s/it, loss=0.126, lr=1e-5] Steps:  40%|████      | 6045/15001 [3:53:40<4:24:09,  1.77s/it, loss=0.126, lr=1e-5]Steps:  40%|████      | 6045/15001 [3:53:40<4:24:09,  1.77s/it, loss=0.0986, lr=1e-5]Steps:  40%|████      | 6046/15001 [3:53:42<4:37:14,  1.86s/it, loss=0.0986, lr=1e-5]Steps:  40%|████      | 6046/15001 [3:53:42<4:37:14,  1.86s/it, loss=0.205, lr=1e-5] Steps:  40%|████      | 6047/15001 [3:53:44<4:30:19,  1.81s/it, loss=0.205, lr=1e-5]Steps:  40%|████      | 6047/15001 [3:53:44<4:30:19,  1.81s/it, loss=0.246, lr=1e-5]Steps:  40%|████      | 6048/15001 [3:53:45<4:20:43,  1.75s/it, loss=0.246, lr=1e-5]Steps:  40%|████      | 6048/15001 [3:53:46<4:20:43,  1.75s/it, loss=0.16, lr=1e-5] Steps:  40%|████      | 6049/15001 [3:53:48<4:44:35,  1.91s/it, loss=0.16, lr=1e-5]Steps:  40%|████      | 6049/15001 [3:53:48<4:44:35,  1.91s/it, loss=0.154, lr=1e-5]Steps:  40%|████      | 6050/15001 [3:53:50<4:55:58,  1.98s/it, loss=0.154, lr=1e-5]Steps:  40%|████      | 6050/15001 [3:53:50<4:55:58,  1.98s/it, loss=0.291, lr=1e-5]Steps:  40%|████      | 6051/15001 [3:53:51<4:48:22,  1.93s/it, loss=0.291, lr=1e-5]Steps:  40%|████      | 6051/15001 [3:53:52<4:48:22,  1.93s/it, loss=0.251, lr=1e-5]Steps:  40%|████      | 6052/15001 [3:53:53<4:50:36,  1.95s/it, loss=0.251, lr=1e-5]Steps:  40%|████      | 6052/15001 [3:53:54<4:50:36,  1.95s/it, loss=0.169, lr=1e-5]Steps:  40%|████      | 6053/15001 [3:53:55<4:37:30,  1.86s/it, loss=0.169, lr=1e-5]Steps:  40%|████      | 6053/15001 [3:53:56<4:37:30,  1.86s/it, loss=0.0916, lr=1e-5]Steps:  40%|████      | 6054/15001 [3:53:57<4:51:22,  1.95s/it, loss=0.0916, lr=1e-5]Steps:  40%|████      | 6054/15001 [3:53:58<4:51:22,  1.95s/it, loss=0.296, lr=1e-5] Steps:  40%|████      | 6055/15001 [3:53:59<4:54:14,  1.97s/it, loss=0.296, lr=1e-5]Steps:  40%|████      | 6055/15001 [3:53:59<4:54:14,  1.97s/it, loss=0.114, lr=1e-5]Steps:  40%|████      | 6056/15001 [3:54:01<4:45:39,  1.92s/it, loss=0.114, lr=1e-5]Steps:  40%|████      | 6056/15001 [3:54:01<4:45:39,  1.92s/it, loss=0.313, lr=1e-5]Steps:  40%|████      | 6057/15001 [3:54:03<4:42:56,  1.90s/it, loss=0.313, lr=1e-5]Steps:  40%|████      | 6057/15001 [3:54:03<4:42:56,  1.90s/it, loss=0.109, lr=1e-5]Steps:  40%|████      | 6058/15001 [3:54:05<4:28:52,  1.80s/it, loss=0.109, lr=1e-5]Steps:  40%|████      | 6058/15001 [3:54:05<4:28:52,  1.80s/it, loss=0.327, lr=1e-5]Steps:  40%|████      | 6059/15001 [3:54:07<4:40:37,  1.88s/it, loss=0.327, lr=1e-5]Steps:  40%|████      | 6059/15001 [3:54:07<4:40:37,  1.88s/it, loss=0.157, lr=1e-5]Steps:  40%|████      | 6060/15001 [3:54:08<4:35:38,  1.85s/it, loss=0.157, lr=1e-5]Steps:  40%|████      | 6060/15001 [3:54:08<4:35:38,  1.85s/it, loss=0.0247, lr=1e-5]Steps:  40%|████      | 6061/15001 [3:54:10<4:18:55,  1.74s/it, loss=0.0247, lr=1e-5]Steps:  40%|████      | 6061/15001 [3:54:10<4:18:55,  1.74s/it, loss=0.106, lr=1e-5] Steps:  40%|████      | 6062/15001 [3:54:12<4:34:57,  1.85s/it, loss=0.106, lr=1e-5]Steps:  40%|████      | 6062/15001 [3:54:12<4:34:57,  1.85s/it, loss=0.352, lr=1e-5]Steps:  40%|████      | 6063/15001 [3:54:14<4:38:08,  1.87s/it, loss=0.352, lr=1e-5]Steps:  40%|████      | 6063/15001 [3:54:14<4:38:08,  1.87s/it, loss=0.177, lr=1e-5]Steps:  40%|████      | 6064/15001 [3:54:16<4:30:54,  1.82s/it, loss=0.177, lr=1e-5]Steps:  40%|████      | 6064/15001 [3:54:16<4:30:54,  1.82s/it, loss=0.179, lr=1e-5]Steps:  40%|████      | 6065/15001 [3:54:18<4:35:47,  1.85s/it, loss=0.179, lr=1e-5]Steps:  40%|████      | 6065/15001 [3:54:18<4:35:47,  1.85s/it, loss=0.0367, lr=1e-5]Steps:  40%|████      | 6066/15001 [3:54:19<4:39:27,  1.88s/it, loss=0.0367, lr=1e-5]Steps:  40%|████      | 6066/15001 [3:54:20<4:39:27,  1.88s/it, loss=0.165, lr=1e-5] Steps:  40%|████      | 6067/15001 [3:54:21<4:32:58,  1.83s/it, loss=0.165, lr=1e-5]Steps:  40%|████      | 6067/15001 [3:54:21<4:32:58,  1.83s/it, loss=0.159, lr=1e-5]Steps:  40%|████      | 6068/15001 [3:54:23<4:32:46,  1.83s/it, loss=0.159, lr=1e-5]Steps:  40%|████      | 6068/15001 [3:54:23<4:32:46,  1.83s/it, loss=0.0492, lr=1e-5]Steps:  40%|████      | 6069/15001 [3:54:25<4:37:55,  1.87s/it, loss=0.0492, lr=1e-5]Steps:  40%|████      | 6069/15001 [3:54:25<4:37:55,  1.87s/it, loss=0.051, lr=1e-5] Steps:  40%|████      | 6070/15001 [3:54:27<4:34:58,  1.85s/it, loss=0.051, lr=1e-5]Steps:  40%|████      | 6070/15001 [3:54:27<4:34:58,  1.85s/it, loss=0.215, lr=1e-5]Steps:  40%|████      | 6071/15001 [3:54:28<4:24:55,  1.78s/it, loss=0.215, lr=1e-5]Steps:  40%|████      | 6071/15001 [3:54:29<4:24:55,  1.78s/it, loss=0.168, lr=1e-5]Steps:  40%|████      | 6072/15001 [3:54:31<4:46:12,  1.92s/it, loss=0.168, lr=1e-5]Steps:  40%|████      | 6072/15001 [3:54:31<4:46:12,  1.92s/it, loss=0.0924, lr=1e-5]Steps:  40%|████      | 6073/15001 [3:54:33<4:47:28,  1.93s/it, loss=0.0924, lr=1e-5]Steps:  40%|████      | 6073/15001 [3:54:33<4:47:28,  1.93s/it, loss=0.176, lr=1e-5] Steps:  40%|████      | 6074/15001 [3:54:35<4:53:10,  1.97s/it, loss=0.176, lr=1e-5]Steps:  40%|████      | 6074/15001 [3:54:35<4:53:10,  1.97s/it, loss=0.274, lr=1e-5]Steps:  40%|████      | 6075/15001 [3:54:37<4:59:04,  2.01s/it, loss=0.274, lr=1e-5]Steps:  40%|████      | 6075/15001 [3:54:37<4:59:04,  2.01s/it, loss=0.142, lr=1e-5]Steps:  41%|████      | 6076/15001 [3:54:39<5:03:12,  2.04s/it, loss=0.142, lr=1e-5]Steps:  41%|████      | 6076/15001 [3:54:39<5:03:12,  2.04s/it, loss=0.137, lr=1e-5]Steps:  41%|████      | 6077/15001 [3:54:41<4:57:57,  2.00s/it, loss=0.137, lr=1e-5]Steps:  41%|████      | 6077/15001 [3:54:41<4:57:57,  2.00s/it, loss=0.134, lr=1e-5]Steps:  41%|████      | 6078/15001 [3:54:43<4:49:49,  1.95s/it, loss=0.134, lr=1e-5]Steps:  41%|████      | 6078/15001 [3:54:43<4:49:49,  1.95s/it, loss=0.283, lr=1e-5]Steps:  41%|████      | 6079/15001 [3:54:44<4:40:02,  1.88s/it, loss=0.283, lr=1e-5]Steps:  41%|████      | 6079/15001 [3:54:45<4:40:02,  1.88s/it, loss=0.157, lr=1e-5]Steps:  41%|████      | 6080/15001 [3:54:46<4:43:20,  1.91s/it, loss=0.157, lr=1e-5]Steps:  41%|████      | 6080/15001 [3:54:46<4:43:20,  1.91s/it, loss=0.137, lr=1e-5]Steps:  41%|████      | 6081/15001 [3:54:48<4:38:59,  1.88s/it, loss=0.137, lr=1e-5]Steps:  41%|████      | 6081/15001 [3:54:48<4:38:59,  1.88s/it, loss=0.0622, lr=1e-5]Steps:  41%|████      | 6082/15001 [3:54:50<4:43:26,  1.91s/it, loss=0.0622, lr=1e-5]Steps:  41%|████      | 6082/15001 [3:54:50<4:43:26,  1.91s/it, loss=0.201, lr=1e-5] Steps:  41%|████      | 6083/15001 [3:54:52<4:31:14,  1.82s/it, loss=0.201, lr=1e-5]Steps:  41%|████      | 6083/15001 [3:54:52<4:31:14,  1.82s/it, loss=0.0797, lr=1e-5]Steps:  41%|████      | 6084/15001 [3:54:53<4:29:40,  1.81s/it, loss=0.0797, lr=1e-5]Steps:  41%|████      | 6084/15001 [3:54:54<4:29:40,  1.81s/it, loss=0.107, lr=1e-5] Steps:  41%|████      | 6085/15001 [3:54:55<4:27:57,  1.80s/it, loss=0.107, lr=1e-5]Steps:  41%|████      | 6085/15001 [3:54:56<4:27:57,  1.80s/it, loss=0.319, lr=1e-5]Steps:  41%|████      | 6086/15001 [3:54:57<4:41:16,  1.89s/it, loss=0.319, lr=1e-5]Steps:  41%|████      | 6086/15001 [3:54:57<4:41:16,  1.89s/it, loss=0.186, lr=1e-5]Steps:  41%|████      | 6087/15001 [3:54:59<4:31:47,  1.83s/it, loss=0.186, lr=1e-5]Steps:  41%|████      | 6087/15001 [3:54:59<4:31:47,  1.83s/it, loss=0.285, lr=1e-5]Steps:  41%|████      | 6088/15001 [3:55:01<4:37:40,  1.87s/it, loss=0.285, lr=1e-5]Steps:  41%|████      | 6088/15001 [3:55:01<4:37:40,  1.87s/it, loss=0.294, lr=1e-5]Steps:  41%|████      | 6089/15001 [3:55:03<4:34:06,  1.85s/it, loss=0.294, lr=1e-5]Steps:  41%|████      | 6089/15001 [3:55:03<4:34:06,  1.85s/it, loss=0.211, lr=1e-5]Steps:  41%|████      | 6090/15001 [3:55:05<4:33:20,  1.84s/it, loss=0.211, lr=1e-5]Steps:  41%|████      | 6090/15001 [3:55:05<4:33:20,  1.84s/it, loss=0.207, lr=1e-5]Steps:  41%|████      | 6091/15001 [3:55:06<4:27:10,  1.80s/it, loss=0.207, lr=1e-5]Steps:  41%|████      | 6091/15001 [3:55:07<4:27:10,  1.80s/it, loss=0.0429, lr=1e-5]Steps:  41%|████      | 6092/15001 [3:55:08<4:23:31,  1.77s/it, loss=0.0429, lr=1e-5]Steps:  41%|████      | 6092/15001 [3:55:08<4:23:31,  1.77s/it, loss=0.195, lr=1e-5] Steps:  41%|████      | 6093/15001 [3:55:10<4:26:15,  1.79s/it, loss=0.195, lr=1e-5]Steps:  41%|████      | 6093/15001 [3:55:10<4:26:15,  1.79s/it, loss=0.0521, lr=1e-5]Steps:  41%|████      | 6094/15001 [3:55:12<4:46:32,  1.93s/it, loss=0.0521, lr=1e-5]Steps:  41%|████      | 6094/15001 [3:55:12<4:46:32,  1.93s/it, loss=0.162, lr=1e-5] Steps:  41%|████      | 6095/15001 [3:55:14<4:46:31,  1.93s/it, loss=0.162, lr=1e-5]Steps:  41%|████      | 6095/15001 [3:55:14<4:46:31,  1.93s/it, loss=0.135, lr=1e-5]Steps:  41%|████      | 6096/15001 [3:55:16<4:52:13,  1.97s/it, loss=0.135, lr=1e-5]Steps:  41%|████      | 6096/15001 [3:55:16<4:52:13,  1.97s/it, loss=0.0794, lr=1e-5]Steps:  41%|████      | 6097/15001 [3:55:18<4:55:40,  1.99s/it, loss=0.0794, lr=1e-5]Steps:  41%|████      | 6097/15001 [3:55:18<4:55:40,  1.99s/it, loss=0.09, lr=1e-5]  Steps:  41%|████      | 6098/15001 [3:55:20<4:55:41,  1.99s/it, loss=0.09, lr=1e-5]Steps:  41%|████      | 6098/15001 [3:55:20<4:55:41,  1.99s/it, loss=0.0248, lr=1e-5]Steps:  41%|████      | 6099/15001 [3:55:22<4:49:47,  1.95s/it, loss=0.0248, lr=1e-5]Steps:  41%|████      | 6099/15001 [3:55:22<4:49:47,  1.95s/it, loss=0.121, lr=1e-5] Steps:  41%|████      | 6100/15001 [3:55:24<4:53:43,  1.98s/it, loss=0.121, lr=1e-5]Steps:  41%|████      | 6100/15001 [3:55:24<4:53:43,  1.98s/it, loss=0.146, lr=1e-5]Steps:  41%|████      | 6101/15001 [3:55:26<4:51:16,  1.96s/it, loss=0.146, lr=1e-5]Steps:  41%|████      | 6101/15001 [3:55:26<4:51:16,  1.96s/it, loss=0.00796, lr=1e-5]Steps:  41%|████      | 6102/15001 [3:55:28<4:41:50,  1.90s/it, loss=0.00796, lr=1e-5]Steps:  41%|████      | 6102/15001 [3:55:28<4:41:50,  1.90s/it, loss=0.0759, lr=1e-5] Steps:  41%|████      | 6103/15001 [3:55:30<4:46:03,  1.93s/it, loss=0.0759, lr=1e-5]Steps:  41%|████      | 6103/15001 [3:55:30<4:46:03,  1.93s/it, loss=0.13, lr=1e-5]  Steps:  41%|████      | 6104/15001 [3:55:31<4:30:03,  1.82s/it, loss=0.13, lr=1e-5]Steps:  41%|████      | 6104/15001 [3:55:32<4:30:03,  1.82s/it, loss=0.111, lr=1e-5]Steps:  41%|████      | 6105/15001 [3:55:33<4:33:53,  1.85s/it, loss=0.111, lr=1e-5]Steps:  41%|████      | 6105/15001 [3:55:34<4:33:53,  1.85s/it, loss=0.194, lr=1e-5]Steps:  41%|████      | 6106/15001 [3:55:35<4:35:11,  1.86s/it, loss=0.194, lr=1e-5]Steps:  41%|████      | 6106/15001 [3:55:35<4:35:11,  1.86s/it, loss=0.165, lr=1e-5]Steps:  41%|████      | 6107/15001 [3:55:37<4:36:26,  1.86s/it, loss=0.165, lr=1e-5]Steps:  41%|████      | 6107/15001 [3:55:37<4:36:26,  1.86s/it, loss=0.218, lr=1e-5]Steps:  41%|████      | 6108/15001 [3:55:39<4:32:01,  1.84s/it, loss=0.218, lr=1e-5]Steps:  41%|████      | 6108/15001 [3:55:39<4:32:01,  1.84s/it, loss=0.0245, lr=1e-5]Steps:  41%|████      | 6109/15001 [3:55:41<4:29:14,  1.82s/it, loss=0.0245, lr=1e-5]Steps:  41%|████      | 6109/15001 [3:55:41<4:29:14,  1.82s/it, loss=0.306, lr=1e-5] Steps:  41%|████      | 6110/15001 [3:55:43<4:39:43,  1.89s/it, loss=0.306, lr=1e-5]Steps:  41%|████      | 6110/15001 [3:55:43<4:39:43,  1.89s/it, loss=0.291, lr=1e-5]Steps:  41%|████      | 6111/15001 [3:55:44<4:32:50,  1.84s/it, loss=0.291, lr=1e-5]Steps:  41%|████      | 6111/15001 [3:55:45<4:32:50,  1.84s/it, loss=0.0613, lr=1e-5]Steps:  41%|████      | 6112/15001 [3:55:46<4:48:10,  1.95s/it, loss=0.0613, lr=1e-5]Steps:  41%|████      | 6112/15001 [3:55:47<4:48:10,  1.95s/it, loss=0.218, lr=1e-5] Steps:  41%|████      | 6113/15001 [3:55:48<4:42:20,  1.91s/it, loss=0.218, lr=1e-5]Steps:  41%|████      | 6113/15001 [3:55:48<4:42:20,  1.91s/it, loss=0.165, lr=1e-5]Steps:  41%|████      | 6114/15001 [3:55:50<4:34:05,  1.85s/it, loss=0.165, lr=1e-5]Steps:  41%|████      | 6114/15001 [3:55:50<4:34:05,  1.85s/it, loss=0.229, lr=1e-5]Steps:  41%|████      | 6115/15001 [3:55:52<4:37:13,  1.87s/it, loss=0.229, lr=1e-5]Steps:  41%|████      | 6115/15001 [3:55:52<4:37:13,  1.87s/it, loss=0.0915, lr=1e-5]Steps:  41%|████      | 6116/15001 [3:55:54<4:40:58,  1.90s/it, loss=0.0915, lr=1e-5]Steps:  41%|████      | 6116/15001 [3:55:54<4:40:58,  1.90s/it, loss=0.0443, lr=1e-5]Steps:  41%|████      | 6117/15001 [3:55:56<4:42:14,  1.91s/it, loss=0.0443, lr=1e-5]Steps:  41%|████      | 6117/15001 [3:55:56<4:42:14,  1.91s/it, loss=0.0645, lr=1e-5]Steps:  41%|████      | 6118/15001 [3:55:58<4:45:02,  1.93s/it, loss=0.0645, lr=1e-5]Steps:  41%|████      | 6118/15001 [3:55:58<4:45:02,  1.93s/it, loss=0.142, lr=1e-5] Steps:  41%|████      | 6119/15001 [3:56:00<4:43:57,  1.92s/it, loss=0.142, lr=1e-5]Steps:  41%|████      | 6119/15001 [3:56:00<4:43:57,  1.92s/it, loss=0.0212, lr=1e-5]Steps:  41%|████      | 6120/15001 [3:56:02<4:38:37,  1.88s/it, loss=0.0212, lr=1e-5]Steps:  41%|████      | 6120/15001 [3:56:02<4:38:37,  1.88s/it, loss=0.194, lr=1e-5] Steps:  41%|████      | 6121/15001 [3:56:03<4:42:37,  1.91s/it, loss=0.194, lr=1e-5]Steps:  41%|████      | 6121/15001 [3:56:04<4:42:37,  1.91s/it, loss=0.135, lr=1e-5]Steps:  41%|████      | 6122/15001 [3:56:05<4:46:46,  1.94s/it, loss=0.135, lr=1e-5]Steps:  41%|████      | 6122/15001 [3:56:06<4:46:46,  1.94s/it, loss=0.151, lr=1e-5]Steps:  41%|████      | 6123/15001 [3:56:08<4:58:05,  2.01s/it, loss=0.151, lr=1e-5]Steps:  41%|████      | 6123/15001 [3:56:08<4:58:05,  2.01s/it, loss=0.148, lr=1e-5]Steps:  41%|████      | 6124/15001 [3:56:09<4:46:29,  1.94s/it, loss=0.148, lr=1e-5]Steps:  41%|████      | 6124/15001 [3:56:10<4:46:29,  1.94s/it, loss=0.067, lr=1e-5]Steps:  41%|████      | 6125/15001 [3:56:11<4:37:40,  1.88s/it, loss=0.067, lr=1e-5]Steps:  41%|████      | 6125/15001 [3:56:11<4:37:40,  1.88s/it, loss=0.207, lr=1e-5]Steps:  41%|████      | 6126/15001 [3:56:13<4:38:53,  1.89s/it, loss=0.207, lr=1e-5]Steps:  41%|████      | 6126/15001 [3:56:13<4:38:53,  1.89s/it, loss=0.155, lr=1e-5]Steps:  41%|████      | 6127/15001 [3:56:15<4:39:27,  1.89s/it, loss=0.155, lr=1e-5]Steps:  41%|████      | 6127/15001 [3:56:15<4:39:27,  1.89s/it, loss=0.238, lr=1e-5]Steps:  41%|████      | 6128/15001 [3:56:17<4:31:17,  1.83s/it, loss=0.238, lr=1e-5]Steps:  41%|████      | 6128/15001 [3:56:17<4:31:17,  1.83s/it, loss=0.471, lr=1e-5]Steps:  41%|████      | 6129/15001 [3:56:19<4:37:53,  1.88s/it, loss=0.471, lr=1e-5]Steps:  41%|████      | 6129/15001 [3:56:19<4:37:53,  1.88s/it, loss=0.116, lr=1e-5]Steps:  41%|████      | 6130/15001 [3:56:20<4:28:29,  1.82s/it, loss=0.116, lr=1e-5]Steps:  41%|████      | 6130/15001 [3:56:21<4:28:29,  1.82s/it, loss=0.188, lr=1e-5]Steps:  41%|████      | 6131/15001 [3:56:22<4:32:43,  1.84s/it, loss=0.188, lr=1e-5]Steps:  41%|████      | 6131/15001 [3:56:22<4:32:43,  1.84s/it, loss=0.413, lr=1e-5]Steps:  41%|████      | 6132/15001 [3:56:24<4:25:38,  1.80s/it, loss=0.413, lr=1e-5]Steps:  41%|████      | 6132/15001 [3:56:24<4:25:38,  1.80s/it, loss=0.179, lr=1e-5]Steps:  41%|████      | 6133/15001 [3:56:26<4:30:12,  1.83s/it, loss=0.179, lr=1e-5]Steps:  41%|████      | 6133/15001 [3:56:26<4:30:12,  1.83s/it, loss=0.112, lr=1e-5]Steps:  41%|████      | 6134/15001 [3:56:28<4:29:42,  1.83s/it, loss=0.112, lr=1e-5]Steps:  41%|████      | 6134/15001 [3:56:28<4:29:42,  1.83s/it, loss=0.11, lr=1e-5] Steps:  41%|████      | 6135/15001 [3:56:30<4:36:00,  1.87s/it, loss=0.11, lr=1e-5]Steps:  41%|████      | 6135/15001 [3:56:30<4:36:00,  1.87s/it, loss=0.188, lr=1e-5]Steps:  41%|████      | 6136/15001 [3:56:31<4:35:47,  1.87s/it, loss=0.188, lr=1e-5]Steps:  41%|████      | 6136/15001 [3:56:32<4:35:47,  1.87s/it, loss=0.215, lr=1e-5]Steps:  41%|████      | 6137/15001 [3:56:33<4:28:13,  1.82s/it, loss=0.215, lr=1e-5]Steps:  41%|████      | 6137/15001 [3:56:33<4:28:13,  1.82s/it, loss=0.289, lr=1e-5]Steps:  41%|████      | 6138/15001 [3:56:35<4:40:13,  1.90s/it, loss=0.289, lr=1e-5]Steps:  41%|████      | 6138/15001 [3:56:35<4:40:13,  1.90s/it, loss=0.177, lr=1e-5]Steps:  41%|████      | 6139/15001 [3:56:37<4:34:59,  1.86s/it, loss=0.177, lr=1e-5]Steps:  41%|████      | 6139/15001 [3:56:37<4:34:59,  1.86s/it, loss=0.176, lr=1e-5]Steps:  41%|████      | 6140/15001 [3:56:39<4:46:43,  1.94s/it, loss=0.176, lr=1e-5]Steps:  41%|████      | 6140/15001 [3:56:39<4:46:43,  1.94s/it, loss=0.11, lr=1e-5] Steps:  41%|████      | 6141/15001 [3:56:41<4:53:32,  1.99s/it, loss=0.11, lr=1e-5]Steps:  41%|████      | 6141/15001 [3:56:41<4:53:32,  1.99s/it, loss=0.227, lr=1e-5]Steps:  41%|████      | 6142/15001 [3:56:43<4:52:49,  1.98s/it, loss=0.227, lr=1e-5]Steps:  41%|████      | 6142/15001 [3:56:43<4:52:49,  1.98s/it, loss=0.243, lr=1e-5]Steps:  41%|████      | 6143/15001 [3:56:45<4:55:30,  2.00s/it, loss=0.243, lr=1e-5]Steps:  41%|████      | 6143/15001 [3:56:45<4:55:30,  2.00s/it, loss=0.0893, lr=1e-5]Steps:  41%|████      | 6144/15001 [3:56:47<4:50:24,  1.97s/it, loss=0.0893, lr=1e-5]Steps:  41%|████      | 6144/15001 [3:56:47<4:50:24,  1.97s/it, loss=0.13, lr=1e-5]  Steps:  41%|████      | 6145/15001 [3:56:49<4:50:06,  1.97s/it, loss=0.13, lr=1e-5]Steps:  41%|████      | 6145/15001 [3:56:49<4:50:06,  1.97s/it, loss=0.282, lr=1e-5]Steps:  41%|████      | 6146/15001 [3:56:51<4:38:05,  1.88s/it, loss=0.282, lr=1e-5]Steps:  41%|████      | 6146/15001 [3:56:51<4:38:05,  1.88s/it, loss=0.275, lr=1e-5]Steps:  41%|████      | 6147/15001 [3:56:53<4:51:24,  1.97s/it, loss=0.275, lr=1e-5]Steps:  41%|████      | 6147/15001 [3:56:53<4:51:24,  1.97s/it, loss=0.416, lr=1e-5]Steps:  41%|████      | 6148/15001 [3:56:55<4:45:26,  1.93s/it, loss=0.416, lr=1e-5]Steps:  41%|████      | 6148/15001 [3:56:55<4:45:26,  1.93s/it, loss=0.307, lr=1e-5]Steps:  41%|████      | 6149/15001 [3:56:57<4:40:06,  1.90s/it, loss=0.307, lr=1e-5]Steps:  41%|████      | 6149/15001 [3:56:57<4:40:06,  1.90s/it, loss=0.149, lr=1e-5]Steps:  41%|████      | 6150/15001 [3:56:58<4:31:17,  1.84s/it, loss=0.149, lr=1e-5]Steps:  41%|████      | 6150/15001 [3:56:59<4:31:17,  1.84s/it, loss=0.0984, lr=1e-5]Steps:  41%|████      | 6151/15001 [3:57:00<4:35:12,  1.87s/it, loss=0.0984, lr=1e-5]Steps:  41%|████      | 6151/15001 [3:57:00<4:35:12,  1.87s/it, loss=0.375, lr=1e-5] Steps:  41%|████      | 6152/15001 [3:57:02<4:27:20,  1.81s/it, loss=0.375, lr=1e-5]Steps:  41%|████      | 6152/15001 [3:57:02<4:27:20,  1.81s/it, loss=0.191, lr=1e-5]Steps:  41%|████      | 6153/15001 [3:57:04<4:27:02,  1.81s/it, loss=0.191, lr=1e-5]Steps:  41%|████      | 6153/15001 [3:57:04<4:27:02,  1.81s/it, loss=0.311, lr=1e-5]Steps:  41%|████      | 6154/15001 [3:57:06<4:31:59,  1.84s/it, loss=0.311, lr=1e-5]Steps:  41%|████      | 6154/15001 [3:57:06<4:31:59,  1.84s/it, loss=0.0617, lr=1e-5]Steps:  41%|████      | 6155/15001 [3:57:07<4:28:54,  1.82s/it, loss=0.0617, lr=1e-5]Steps:  41%|████      | 6155/15001 [3:57:08<4:28:54,  1.82s/it, loss=0.277, lr=1e-5] Steps:  41%|████      | 6156/15001 [3:57:09<4:31:12,  1.84s/it, loss=0.277, lr=1e-5]Steps:  41%|████      | 6156/15001 [3:57:09<4:31:12,  1.84s/it, loss=0.202, lr=1e-5]Steps:  41%|████      | 6157/15001 [3:57:11<4:28:00,  1.82s/it, loss=0.202, lr=1e-5]Steps:  41%|████      | 6157/15001 [3:57:11<4:28:00,  1.82s/it, loss=0.215, lr=1e-5]Steps:  41%|████      | 6158/15001 [3:57:13<4:32:24,  1.85s/it, loss=0.215, lr=1e-5]Steps:  41%|████      | 6158/15001 [3:57:13<4:32:24,  1.85s/it, loss=0.129, lr=1e-5]Steps:  41%|████      | 6159/15001 [3:57:15<4:34:53,  1.87s/it, loss=0.129, lr=1e-5]Steps:  41%|████      | 6159/15001 [3:57:15<4:34:53,  1.87s/it, loss=0.0791, lr=1e-5]Steps:  41%|████      | 6160/15001 [3:57:17<4:34:05,  1.86s/it, loss=0.0791, lr=1e-5]Steps:  41%|████      | 6160/15001 [3:57:17<4:34:05,  1.86s/it, loss=0.387, lr=1e-5] Steps:  41%|████      | 6161/15001 [3:57:19<4:32:26,  1.85s/it, loss=0.387, lr=1e-5]Steps:  41%|████      | 6161/15001 [3:57:19<4:32:26,  1.85s/it, loss=0.244, lr=1e-5]Steps:  41%|████      | 6162/15001 [3:57:20<4:26:25,  1.81s/it, loss=0.244, lr=1e-5]Steps:  41%|████      | 6162/15001 [3:57:21<4:26:25,  1.81s/it, loss=0.336, lr=1e-5]Steps:  41%|████      | 6163/15001 [3:57:23<4:45:51,  1.94s/it, loss=0.336, lr=1e-5]Steps:  41%|████      | 6163/15001 [3:57:23<4:45:51,  1.94s/it, loss=0.197, lr=1e-5]Steps:  41%|████      | 6164/15001 [3:57:25<4:46:05,  1.94s/it, loss=0.197, lr=1e-5]Steps:  41%|████      | 6164/15001 [3:57:25<4:46:05,  1.94s/it, loss=0.318, lr=1e-5]Steps:  41%|████      | 6165/15001 [3:57:26<4:36:14,  1.88s/it, loss=0.318, lr=1e-5]Steps:  41%|████      | 6165/15001 [3:57:27<4:36:14,  1.88s/it, loss=0.437, lr=1e-5]Steps:  41%|████      | 6166/15001 [3:57:28<4:40:46,  1.91s/it, loss=0.437, lr=1e-5]Steps:  41%|████      | 6166/15001 [3:57:29<4:40:46,  1.91s/it, loss=0.0867, lr=1e-5]Steps:  41%|████      | 6167/15001 [3:57:31<4:57:39,  2.02s/it, loss=0.0867, lr=1e-5]Steps:  41%|████      | 6167/15001 [3:57:31<4:57:39,  2.02s/it, loss=0.226, lr=1e-5] Steps:  41%|████      | 6168/15001 [3:57:32<4:48:08,  1.96s/it, loss=0.226, lr=1e-5]Steps:  41%|████      | 6168/15001 [3:57:33<4:48:08,  1.96s/it, loss=0.208, lr=1e-5]Steps:  41%|████      | 6169/15001 [3:57:34<4:43:48,  1.93s/it, loss=0.208, lr=1e-5]Steps:  41%|████      | 6169/15001 [3:57:35<4:43:48,  1.93s/it, loss=0.137, lr=1e-5]Steps:  41%|████      | 6170/15001 [3:57:36<4:44:06,  1.93s/it, loss=0.137, lr=1e-5]Steps:  41%|████      | 6170/15001 [3:57:36<4:44:06,  1.93s/it, loss=0.0988, lr=1e-5]Steps:  41%|████      | 6171/15001 [3:57:38<4:35:29,  1.87s/it, loss=0.0988, lr=1e-5]Steps:  41%|████      | 6171/15001 [3:57:38<4:35:29,  1.87s/it, loss=0.153, lr=1e-5] Steps:  41%|████      | 6172/15001 [3:57:40<4:46:01,  1.94s/it, loss=0.153, lr=1e-5]Steps:  41%|████      | 6172/15001 [3:57:40<4:46:01,  1.94s/it, loss=0.0945, lr=1e-5]Steps:  41%|████      | 6173/15001 [3:57:42<4:34:43,  1.87s/it, loss=0.0945, lr=1e-5]Steps:  41%|████      | 6173/15001 [3:57:42<4:34:43,  1.87s/it, loss=0.224, lr=1e-5] Steps:  41%|████      | 6174/15001 [3:57:44<4:37:20,  1.89s/it, loss=0.224, lr=1e-5]Steps:  41%|████      | 6174/15001 [3:57:44<4:37:20,  1.89s/it, loss=0.16, lr=1e-5] Steps:  41%|████      | 6175/15001 [3:57:45<4:31:09,  1.84s/it, loss=0.16, lr=1e-5]Steps:  41%|████      | 6175/15001 [3:57:46<4:31:09,  1.84s/it, loss=0.228, lr=1e-5]Steps:  41%|████      | 6176/15001 [3:57:47<4:30:35,  1.84s/it, loss=0.228, lr=1e-5]Steps:  41%|████      | 6176/15001 [3:57:47<4:30:35,  1.84s/it, loss=0.168, lr=1e-5]Steps:  41%|████      | 6177/15001 [3:57:49<4:33:01,  1.86s/it, loss=0.168, lr=1e-5]Steps:  41%|████      | 6177/15001 [3:57:49<4:33:01,  1.86s/it, loss=0.0454, lr=1e-5]Steps:  41%|████      | 6178/15001 [3:57:51<4:36:03,  1.88s/it, loss=0.0454, lr=1e-5]Steps:  41%|████      | 6178/15001 [3:57:51<4:36:03,  1.88s/it, loss=0.0584, lr=1e-5]Steps:  41%|████      | 6179/15001 [3:57:53<4:29:26,  1.83s/it, loss=0.0584, lr=1e-5]Steps:  41%|████      | 6179/15001 [3:57:53<4:29:26,  1.83s/it, loss=0.148, lr=1e-5] Steps:  41%|████      | 6180/15001 [3:57:55<4:35:44,  1.88s/it, loss=0.148, lr=1e-5]Steps:  41%|████      | 6180/15001 [3:57:55<4:35:44,  1.88s/it, loss=0.161, lr=1e-5]Steps:  41%|████      | 6181/15001 [3:57:56<4:22:03,  1.78s/it, loss=0.161, lr=1e-5]Steps:  41%|████      | 6181/15001 [3:57:57<4:22:03,  1.78s/it, loss=0.352, lr=1e-5]Steps:  41%|████      | 6182/15001 [3:57:58<4:27:28,  1.82s/it, loss=0.352, lr=1e-5]Steps:  41%|████      | 6182/15001 [3:57:59<4:27:28,  1.82s/it, loss=0.28, lr=1e-5] Steps:  41%|████      | 6183/15001 [3:58:00<4:44:02,  1.93s/it, loss=0.28, lr=1e-5]Steps:  41%|████      | 6183/15001 [3:58:00<4:44:02,  1.93s/it, loss=0.139, lr=1e-5]Steps:  41%|████      | 6184/15001 [3:58:02<4:28:53,  1.83s/it, loss=0.139, lr=1e-5]Steps:  41%|████      | 6184/15001 [3:58:02<4:28:53,  1.83s/it, loss=0.258, lr=1e-5]Steps:  41%|████      | 6185/15001 [3:58:04<4:43:06,  1.93s/it, loss=0.258, lr=1e-5]Steps:  41%|████      | 6185/15001 [3:58:04<4:43:06,  1.93s/it, loss=0.0686, lr=1e-5]Steps:  41%|████      | 6186/15001 [3:58:06<4:46:06,  1.95s/it, loss=0.0686, lr=1e-5]Steps:  41%|████      | 6186/15001 [3:58:06<4:46:06,  1.95s/it, loss=0.073, lr=1e-5] Steps:  41%|████      | 6187/15001 [3:58:08<4:45:54,  1.95s/it, loss=0.073, lr=1e-5]Steps:  41%|████      | 6187/15001 [3:58:08<4:45:54,  1.95s/it, loss=0.0645, lr=1e-5]Steps:  41%|████▏     | 6188/15001 [3:58:10<4:55:29,  2.01s/it, loss=0.0645, lr=1e-5]Steps:  41%|████▏     | 6188/15001 [3:58:10<4:55:29,  2.01s/it, loss=0.193, lr=1e-5] Steps:  41%|████▏     | 6189/15001 [3:58:12<4:50:21,  1.98s/it, loss=0.193, lr=1e-5]Steps:  41%|████▏     | 6189/15001 [3:58:12<4:50:21,  1.98s/it, loss=0.293, lr=1e-5]Steps:  41%|████▏     | 6190/15001 [3:58:14<4:55:43,  2.01s/it, loss=0.293, lr=1e-5]Steps:  41%|████▏     | 6190/15001 [3:58:14<4:55:43,  2.01s/it, loss=0.169, lr=1e-5]Steps:  41%|████▏     | 6191/15001 [3:58:16<4:47:24,  1.96s/it, loss=0.169, lr=1e-5]Steps:  41%|████▏     | 6191/15001 [3:58:16<4:47:24,  1.96s/it, loss=0.0909, lr=1e-5]Steps:  41%|████▏     | 6192/15001 [3:58:18<4:43:36,  1.93s/it, loss=0.0909, lr=1e-5]Steps:  41%|████▏     | 6192/15001 [3:58:18<4:43:36,  1.93s/it, loss=0.134, lr=1e-5] Steps:  41%|████▏     | 6193/15001 [3:58:20<4:38:35,  1.90s/it, loss=0.134, lr=1e-5]Steps:  41%|████▏     | 6193/15001 [3:58:20<4:38:35,  1.90s/it, loss=0.114, lr=1e-5]Steps:  41%|████▏     | 6194/15001 [3:58:21<4:31:15,  1.85s/it, loss=0.114, lr=1e-5]Steps:  41%|████▏     | 6194/15001 [3:58:22<4:31:15,  1.85s/it, loss=0.0576, lr=1e-5]Steps:  41%|████▏     | 6195/15001 [3:58:23<4:30:40,  1.84s/it, loss=0.0576, lr=1e-5]Steps:  41%|████▏     | 6195/15001 [3:58:23<4:30:40,  1.84s/it, loss=0.139, lr=1e-5] Steps:  41%|████▏     | 6196/15001 [3:58:25<4:31:54,  1.85s/it, loss=0.139, lr=1e-5]Steps:  41%|████▏     | 6196/15001 [3:58:25<4:31:54,  1.85s/it, loss=0.198, lr=1e-5]Steps:  41%|████▏     | 6197/15001 [3:58:27<4:23:38,  1.80s/it, loss=0.198, lr=1e-5]Steps:  41%|████▏     | 6197/15001 [3:58:27<4:23:38,  1.80s/it, loss=0.295, lr=1e-5]Steps:  41%|████▏     | 6198/15001 [3:58:29<4:29:36,  1.84s/it, loss=0.295, lr=1e-5]Steps:  41%|████▏     | 6198/15001 [3:58:29<4:29:36,  1.84s/it, loss=0.228, lr=1e-5]Steps:  41%|████▏     | 6199/15001 [3:58:30<4:23:08,  1.79s/it, loss=0.228, lr=1e-5]Steps:  41%|████▏     | 6199/15001 [3:58:31<4:23:08,  1.79s/it, loss=0.123, lr=1e-5]Steps:  41%|████▏     | 6200/15001 [3:58:32<4:29:10,  1.84s/it, loss=0.123, lr=1e-5]Steps:  41%|████▏     | 6200/15001 [3:58:33<4:29:10,  1.84s/it, loss=0.0557, lr=1e-5]Steps:  41%|████▏     | 6201/15001 [3:58:34<4:28:26,  1.83s/it, loss=0.0557, lr=1e-5]Steps:  41%|████▏     | 6201/15001 [3:58:35<4:28:26,  1.83s/it, loss=0.431, lr=1e-5] Steps:  41%|████▏     | 6202/15001 [3:58:36<4:36:47,  1.89s/it, loss=0.431, lr=1e-5]Steps:  41%|████▏     | 6202/15001 [3:58:36<4:36:47,  1.89s/it, loss=0.191, lr=1e-5]Steps:  41%|████▏     | 6203/15001 [3:58:38<4:41:52,  1.92s/it, loss=0.191, lr=1e-5]Steps:  41%|████▏     | 6203/15001 [3:58:38<4:41:52,  1.92s/it, loss=0.268, lr=1e-5]Steps:  41%|████▏     | 6204/15001 [3:58:40<4:32:04,  1.86s/it, loss=0.268, lr=1e-5]Steps:  41%|████▏     | 6204/15001 [3:58:40<4:32:04,  1.86s/it, loss=0.0579, lr=1e-5]Steps:  41%|████▏     | 6205/15001 [3:58:41<4:18:53,  1.77s/it, loss=0.0579, lr=1e-5]Steps:  41%|████▏     | 6205/15001 [3:58:42<4:18:53,  1.77s/it, loss=0.309, lr=1e-5] Steps:  41%|████▏     | 6206/15001 [3:58:43<4:18:37,  1.76s/it, loss=0.309, lr=1e-5]Steps:  41%|████▏     | 6206/15001 [3:58:44<4:18:37,  1.76s/it, loss=0.0682, lr=1e-5]Steps:  41%|████▏     | 6207/15001 [3:58:45<4:34:55,  1.88s/it, loss=0.0682, lr=1e-5]Steps:  41%|████▏     | 6207/15001 [3:58:46<4:34:55,  1.88s/it, loss=0.134, lr=1e-5] Steps:  41%|████▏     | 6208/15001 [3:58:47<4:37:00,  1.89s/it, loss=0.134, lr=1e-5]Steps:  41%|████▏     | 6208/15001 [3:58:48<4:37:00,  1.89s/it, loss=0.153, lr=1e-5]Steps:  41%|████▏     | 6209/15001 [3:58:49<4:34:44,  1.87s/it, loss=0.153, lr=1e-5]Steps:  41%|████▏     | 6209/15001 [3:58:50<4:34:44,  1.87s/it, loss=0.124, lr=1e-5]Steps:  41%|████▏     | 6210/15001 [3:58:51<4:47:43,  1.96s/it, loss=0.124, lr=1e-5]Steps:  41%|████▏     | 6210/15001 [3:58:52<4:47:43,  1.96s/it, loss=0.318, lr=1e-5]Steps:  41%|████▏     | 6211/15001 [3:58:54<4:57:47,  2.03s/it, loss=0.318, lr=1e-5]Steps:  41%|████▏     | 6211/15001 [3:58:54<4:57:47,  2.03s/it, loss=0.127, lr=1e-5]Steps:  41%|████▏     | 6212/15001 [3:58:55<4:42:34,  1.93s/it, loss=0.127, lr=1e-5]Steps:  41%|████▏     | 6212/15001 [3:58:56<4:42:34,  1.93s/it, loss=0.153, lr=1e-5]Steps:  41%|████▏     | 6213/15001 [3:58:58<5:02:32,  2.07s/it, loss=0.153, lr=1e-5]Steps:  41%|████▏     | 6213/15001 [3:58:58<5:02:32,  2.07s/it, loss=0.185, lr=1e-5]Steps:  41%|███���▏     | 6214/15001 [3:58:59<4:47:51,  1.97s/it, loss=0.185, lr=1e-5]Steps:  41%|████▏     | 6214/15001 [3:59:00<4:47:51,  1.97s/it, loss=0.202, lr=1e-5]Steps:  41%|████▏     | 6215/15001 [3:59:01<4:53:12,  2.00s/it, loss=0.202, lr=1e-5]Steps:  41%|████▏     | 6215/15001 [3:59:02<4:53:12,  2.00s/it, loss=0.213, lr=1e-5]Steps:  41%|████▏     | 6216/15001 [3:59:03<4:44:16,  1.94s/it, loss=0.213, lr=1e-5]Steps:  41%|████▏     | 6216/15001 [3:59:03<4:44:16,  1.94s/it, loss=0.127, lr=1e-5]Steps:  41%|████▏     | 6217/15001 [3:59:05<4:40:44,  1.92s/it, loss=0.127, lr=1e-5]Steps:  41%|████▏     | 6217/15001 [3:59:05<4:40:44,  1.92s/it, loss=0.164, lr=1e-5]Steps:  41%|████▏     | 6218/15001 [3:59:07<4:36:16,  1.89s/it, loss=0.164, lr=1e-5]Steps:  41%|████▏     | 6218/15001 [3:59:07<4:36:16,  1.89s/it, loss=0.272, lr=1e-5]Steps:  41%|████▏     | 6219/15001 [3:59:09<4:40:11,  1.91s/it, loss=0.272, lr=1e-5]Steps:  41%|████▏     | 6219/15001 [3:59:09<4:40:11,  1.91s/it, loss=0.092, lr=1e-5]Steps:  41%|████▏     | 6220/15001 [3:59:11<4:31:31,  1.86s/it, loss=0.092, lr=1e-5]Steps:  41%|████▏     | 6220/15001 [3:59:11<4:31:31,  1.86s/it, loss=0.227, lr=1e-5]Steps:  41%|████▏     | 6221/15001 [3:59:12<4:26:39,  1.82s/it, loss=0.227, lr=1e-5]Steps:  41%|████▏     | 6221/15001 [3:59:13<4:26:39,  1.82s/it, loss=0.16, lr=1e-5] Steps:  41%|████▏     | 6222/15001 [3:59:14<4:29:06,  1.84s/it, loss=0.16, lr=1e-5]Steps:  41%|████▏     | 6222/15001 [3:59:14<4:29:06,  1.84s/it, loss=0.073, lr=1e-5]Steps:  41%|████▏     | 6223/15001 [3:59:16<4:34:43,  1.88s/it, loss=0.073, lr=1e-5]Steps:  41%|████▏     | 6223/15001 [3:59:16<4:34:43,  1.88s/it, loss=0.0147, lr=1e-5]Steps:  41%|████▏     | 6224/15001 [3:59:18<4:21:32,  1.79s/it, loss=0.0147, lr=1e-5]Steps:  41%|████▏     | 6224/15001 [3:59:18<4:21:32,  1.79s/it, loss=0.101, lr=1e-5] Steps:  41%|████▏     | 6225/15001 [3:59:20<4:25:48,  1.82s/it, loss=0.101, lr=1e-5]Steps:  41%|████▏     | 6225/15001 [3:59:20<4:25:48,  1.82s/it, loss=0.151, lr=1e-5]Steps:  42%|████▏     | 6226/15001 [3:59:21<4:24:56,  1.81s/it, loss=0.151, lr=1e-5]Steps:  42%|████▏     | 6226/15001 [3:59:22<4:24:56,  1.81s/it, loss=0.336, lr=1e-5]Steps:  42%|████▏     | 6227/15001 [3:59:23<4:16:36,  1.75s/it, loss=0.336, lr=1e-5]Steps:  42%|████▏     | 6227/15001 [3:59:24<4:16:36,  1.75s/it, loss=0.343, lr=1e-5]Steps:  42%|████▏     | 6228/15001 [3:59:25<4:33:39,  1.87s/it, loss=0.343, lr=1e-5]Steps:  42%|████▏     | 6228/15001 [3:59:25<4:33:39,  1.87s/it, loss=0.187, lr=1e-5]Steps:  42%|████▏     | 6229/15001 [3:59:27<4:26:23,  1.82s/it, loss=0.187, lr=1e-5]Steps:  42%|████▏     | 6229/15001 [3:59:27<4:26:23,  1.82s/it, loss=0.106, lr=1e-5]Steps:  42%|████▏     | 6230/15001 [3:59:29<4:33:40,  1.87s/it, loss=0.106, lr=1e-5]Steps:  42%|████▏     | 6230/15001 [3:59:29<4:33:40,  1.87s/it, loss=0.0657, lr=1e-5]Steps:  42%|████▏     | 6231/15001 [3:59:31<4:42:05,  1.93s/it, loss=0.0657, lr=1e-5]Steps:  42%|████▏     | 6231/15001 [3:59:31<4:42:05,  1.93s/it, loss=0.211, lr=1e-5] Steps:  42%|████▏     | 6232/15001 [3:59:33<4:48:41,  1.98s/it, loss=0.211, lr=1e-5]Steps:  42%|████▏     | 6232/15001 [3:59:33<4:48:41,  1.98s/it, loss=0.0813, lr=1e-5]Steps:  42%|████▏     | 6233/15001 [3:59:35<4:52:42,  2.00s/it, loss=0.0813, lr=1e-5]Steps:  42%|████▏     | 6233/15001 [3:59:35<4:52:42,  2.00s/it, loss=0.214, lr=1e-5] Steps:  42%|████▏     | 6234/15001 [3:59:37<4:52:18,  2.00s/it, loss=0.214, lr=1e-5]Steps:  42%|████▏     | 6234/15001 [3:59:37<4:52:18,  2.00s/it, loss=0.281, lr=1e-5]Steps:  42%|████▏     | 6235/15001 [3:59:39<4:53:49,  2.01s/it, loss=0.281, lr=1e-5]Steps:  42%|████▏     | 6235/15001 [3:59:39<4:53:49,  2.01s/it, loss=0.131, lr=1e-5]Steps:  42%|████▏     | 6236/15001 [3:59:41<4:46:55,  1.96s/it, loss=0.131, lr=1e-5]Steps:  42%|████▏     | 6236/15001 [3:59:41<4:46:55,  1.96s/it, loss=0.124, lr=1e-5]Steps:  42%|████▏     | 6237/15001 [3:59:43<4:39:37,  1.91s/it, loss=0.124, lr=1e-5]Steps:  42%|████▏     | 6237/15001 [3:59:43<4:39:37,  1.91s/it, loss=0.244, lr=1e-5]Steps:  42%|████▏     | 6238/15001 [3:59:45<4:33:42,  1.87s/it, loss=0.244, lr=1e-5]Steps:  42%|████▏     | 6238/15001 [3:59:45<4:33:42,  1.87s/it, loss=0.216, lr=1e-5]Steps:  42%|████▏     | 6239/15001 [3:59:46<4:34:07,  1.88s/it, loss=0.216, lr=1e-5]Steps:  42%|████▏     | 6239/15001 [3:59:47<4:34:07,  1.88s/it, loss=0.196, lr=1e-5]Steps:  42%|████▏     | 6240/15001 [3:59:48<4:30:53,  1.86s/it, loss=0.196, lr=1e-5]Steps:  42%|████▏     | 6240/15001 [3:59:48<4:30:53,  1.86s/it, loss=0.236, lr=1e-5]Steps:  42%|████▏     | 6241/15001 [3:59:50<4:21:14,  1.79s/it, loss=0.236, lr=1e-5]Steps:  42%|████▏     | 6241/15001 [3:59:50<4:21:14,  1.79s/it, loss=0.103, lr=1e-5]Steps:  42%|████▏     | 6242/15001 [3:59:52<4:26:30,  1.83s/it, loss=0.103, lr=1e-5]Steps:  42%|████▏     | 6242/15001 [3:59:52<4:26:30,  1.83s/it, loss=0.17, lr=1e-5] Steps:  42%|████▏     | 6243/15001 [3:59:54<4:32:32,  1.87s/it, loss=0.17, lr=1e-5]Steps:  42%|████▏     | 6243/15001 [3:59:54<4:32:32,  1.87s/it, loss=0.176, lr=1e-5]Steps:  42%|████▏     | 6244/15001 [3:59:55<4:19:51,  1.78s/it, loss=0.176, lr=1e-5]Steps:  42%|████▏     | 6244/15001 [3:59:56<4:19:51,  1.78s/it, loss=0.157, lr=1e-5]Steps:  42%|████▏     | 6245/15001 [3:59:57<4:31:56,  1.86s/it, loss=0.157, lr=1e-5]Steps:  42%|████▏     | 6245/15001 [3:59:57<4:31:56,  1.86s/it, loss=0.0586, lr=1e-5]Steps:  42%|████▏     | 6246/15001 [3:59:59<4:29:42,  1.85s/it, loss=0.0586, lr=1e-5]Steps:  42%|████▏     | 6246/15001 [3:59:59<4:29:42,  1.85s/it, loss=0.24, lr=1e-5]  Steps:  42%|████▏     | 6247/15001 [4:00:01<4:25:51,  1.82s/it, loss=0.24, lr=1e-5]Steps:  42%|████▏     | 6247/15001 [4:00:01<4:25:51,  1.82s/it, loss=0.12, lr=1e-5]Steps:  42%|████▏     | 6248/15001 [4:00:03<4:28:14,  1.84s/it, loss=0.12, lr=1e-5]Steps:  42%|████▏     | 6248/15001 [4:00:03<4:28:14,  1.84s/it, loss=0.289, lr=1e-5]Steps:  42%|████▏     | 6249/15001 [4:00:04<4:17:37,  1.77s/it, loss=0.289, lr=1e-5]Steps:  42%|████▏     | 6249/15001 [4:00:05<4:17:37,  1.77s/it, loss=0.19, lr=1e-5] Steps:  42%|████▏     | 6250/15001 [4:00:06<4:21:14,  1.79s/it, loss=0.19, lr=1e-5]Steps:  42%|████▏     | 6250/15001 [4:00:07<4:21:14,  1.79s/it, loss=0.153, lr=1e-5]Steps:  42%|████▏     | 6251/15001 [4:00:08<4:32:11,  1.87s/it, loss=0.153, lr=1e-5]Steps:  42%|████▏     | 6251/15001 [4:00:08<4:32:11,  1.87s/it, loss=0.17, lr=1e-5] Steps:  42%|████▏     | 6252/15001 [4:00:10<4:24:18,  1.81s/it, loss=0.17, lr=1e-5]Steps:  42%|████▏     | 6252/15001 [4:00:10<4:24:18,  1.81s/it, loss=0.395, lr=1e-5]Steps:  42%|████▏     | 6253/15001 [4:00:12<4:27:12,  1.83s/it, loss=0.395, lr=1e-5]Steps:  42%|████▏     | 6253/15001 [4:00:12<4:27:12,  1.83s/it, loss=0.178, lr=1e-5]Steps:  42%|████▏     | 6254/15001 [4:00:14<4:33:27,  1.88s/it, loss=0.178, lr=1e-5]Steps:  42%|████▏     | 6254/15001 [4:00:14<4:33:27,  1.88s/it, loss=0.199, lr=1e-5]Steps:  42%|████▏     | 6255/15001 [4:00:16<4:46:10,  1.96s/it, loss=0.199, lr=1e-5]Steps:  42%|████▏     | 6255/15001 [4:00:16<4:46:10,  1.96s/it, loss=0.111, lr=1e-5]Steps:  42%|████▏     | 6256/15001 [4:00:18<4:53:11,  2.01s/it, loss=0.111, lr=1e-5]Steps:  42%|████▏     | 6256/15001 [4:00:18<4:53:11,  2.01s/it, loss=0.239, lr=1e-5]Steps:  42%|████▏     | 6257/15001 [4:00:20<4:48:38,  1.98s/it, loss=0.239, lr=1e-5]Steps:  42%|████▏     | 6257/15001 [4:00:20<4:48:38,  1.98s/it, loss=0.159, lr=1e-5]Steps:  42%|████▏     | 6258/15001 [4:00:22<4:59:46,  2.06s/it, loss=0.159, lr=1e-5]Steps:  42%|████▏     | 6258/15001 [4:00:22<4:59:46,  2.06s/it, loss=0.279, lr=1e-5]Steps:  42%|████▏     | 6259/15001 [4:00:24<4:34:54,  1.89s/it, loss=0.279, lr=1e-5]Steps:  42%|████▏     | 6259/15001 [4:00:24<4:34:54,  1.89s/it, loss=0.146, lr=1e-5]Steps:  42%|████▏     | 6260/15001 [4:00:26<4:46:22,  1.97s/it, loss=0.146, lr=1e-5]Steps:  42%|████▏     | 6260/15001 [4:00:26<4:46:22,  1.97s/it, loss=0.37, lr=1e-5] Steps:  42%|████▏     | 6261/15001 [4:00:28<4:42:25,  1.94s/it, loss=0.37, lr=1e-5]Steps:  42%|████▏     | 6261/15001 [4:00:28<4:42:25,  1.94s/it, loss=0.221, lr=1e-5]Steps:  42%|████▏     | 6262/15001 [4:00:29<4:29:47,  1.85s/it, loss=0.221, lr=1e-5]Steps:  42%|████▏     | 6262/15001 [4:00:30<4:29:47,  1.85s/it, loss=0.0691, lr=1e-5]Steps:  42%|████▏     | 6263/15001 [4:00:32<4:44:53,  1.96s/it, loss=0.0691, lr=1e-5]Steps:  42%|████▏     | 6263/15001 [4:00:32<4:44:53,  1.96s/it, loss=0.127, lr=1e-5] Steps:  42%|████▏     | 6264/15001 [4:00:33<4:37:04,  1.90s/it, loss=0.127, lr=1e-5]Steps:  42%|████▏     | 6264/15001 [4:00:34<4:37:04,  1.90s/it, loss=0.0889, lr=1e-5]Steps:  42%|████▏     | 6265/15001 [4:00:35<4:42:24,  1.94s/it, loss=0.0889, lr=1e-5]Steps:  42%|████▏     | 6265/15001 [4:00:36<4:42:24,  1.94s/it, loss=0.145, lr=1e-5] Steps:  42%|████▏     | 6266/15001 [4:00:37<4:36:04,  1.90s/it, loss=0.145, lr=1e-5]Steps:  42%|████▏     | 6266/15001 [4:00:37<4:36:04,  1.90s/it, loss=0.0609, lr=1e-5]Steps:  42%|████▏     | 6267/15001 [4:00:39<4:31:01,  1.86s/it, loss=0.0609, lr=1e-5]Steps:  42%|████▏     | 6267/15001 [4:00:39<4:31:01,  1.86s/it, loss=0.203, lr=1e-5] Steps:  42%|████▏     | 6268/15001 [4:00:41<4:22:52,  1.81s/it, loss=0.203, lr=1e-5]Steps:  42%|████▏     | 6268/15001 [4:00:41<4:22:52,  1.81s/it, loss=0.218, lr=1e-5]Steps:  42%|████▏     | 6269/15001 [4:00:43<4:23:19,  1.81s/it, loss=0.218, lr=1e-5]Steps:  42%|████▏     | 6269/15001 [4:00:43<4:23:19,  1.81s/it, loss=0.0991, lr=1e-5]Steps:  42%|████▏     | 6270/15001 [4:00:44<4:22:32,  1.80s/it, loss=0.0991, lr=1e-5]Steps:  42%|████▏     | 6270/15001 [4:00:45<4:22:32,  1.80s/it, loss=0.194, lr=1e-5] Steps:  42%|████▏     | 6271/15001 [4:00:46<4:16:49,  1.77s/it, loss=0.194, lr=1e-5]Steps:  42%|████▏     | 6271/15001 [4:00:46<4:16:49,  1.77s/it, loss=0.0778, lr=1e-5]Steps:  42%|████▏     | 6272/15001 [4:00:48<4:31:58,  1.87s/it, loss=0.0778, lr=1e-5]Steps:  42%|████▏     | 6272/15001 [4:00:48<4:31:58,  1.87s/it, loss=0.114, lr=1e-5] Steps:  42%|████▏     | 6273/15001 [4:00:50<4:30:34,  1.86s/it, loss=0.114, lr=1e-5]Steps:  42%|████▏     | 6273/15001 [4:00:50<4:30:34,  1.86s/it, loss=0.203, lr=1e-5]Steps:  42%|████▏     | 6274/15001 [4:00:52<4:34:36,  1.89s/it, loss=0.203, lr=1e-5]Steps:  42%|████▏     | 6274/15001 [4:00:52<4:34:36,  1.89s/it, loss=0.191, lr=1e-5]Steps:  42%|████▏     | 6275/15001 [4:00:53<4:18:32,  1.78s/it, loss=0.191, lr=1e-5]Steps:  42%|████▏     | 6275/15001 [4:00:54<4:18:32,  1.78s/it, loss=0.134, lr=1e-5]Steps:  42%|████▏     | 6276/15001 [4:00:56<4:33:13,  1.88s/it, loss=0.134, lr=1e-5]Steps:  42%|████▏     | 6276/15001 [4:00:56<4:33:13,  1.88s/it, loss=0.0787, lr=1e-5]Steps:  42%|████▏     | 6277/15001 [4:00:58<4:38:20,  1.91s/it, loss=0.0787, lr=1e-5]Steps:  42%|████▏     | 6277/15001 [4:00:58<4:38:20,  1.91s/it, loss=0.0936, lr=1e-5]Steps:  42%|████▏     | 6278/15001 [4:01:01<5:35:49,  2.31s/it, loss=0.0936, lr=1e-5]Steps:  42%|████▏     | 6278/15001 [4:01:01<5:35:49,  2.31s/it, loss=0.085, lr=1e-5] Steps:  42%|████▏     | 6279/15001 [4:01:03<5:23:58,  2.23s/it, loss=0.085, lr=1e-5]Steps:  42%|████▏     | 6279/15001 [4:01:03<5:23:58,  2.23s/it, loss=0.0121, lr=1e-5]Steps:  42%|████▏     | 6280/15001 [4:01:04<4:56:21,  2.04s/it, loss=0.0121, lr=1e-5]Steps:  42%|████▏     | 6280/15001 [4:01:05<4:56:21,  2.04s/it, loss=0.0234, lr=1e-5]Steps:  42%|████▏     | 6281/15001 [4:01:07<5:06:50,  2.11s/it, loss=0.0234, lr=1e-5]Steps:  42%|████▏     | 6281/15001 [4:01:07<5:06:50,  2.11s/it, loss=0.158, lr=1e-5] Steps:  42%|████▏     | 6282/15001 [4:01:09<5:07:37,  2.12s/it, loss=0.158, lr=1e-5]Steps:  42%|████▏     | 6282/15001 [4:01:09<5:07:37,  2.12s/it, loss=0.374, lr=1e-5]Steps:  42%|████▏     | 6283/15001 [4:01:11<4:52:12,  2.01s/it, loss=0.374, lr=1e-5]Steps:  42%|████▏     | 6283/15001 [4:01:11<4:52:12,  2.01s/it, loss=0.131, lr=1e-5]Steps:  42%|████▏     | 6284/15001 [4:01:12<4:39:32,  1.92s/it, loss=0.131, lr=1e-5]Steps:  42%|████▏     | 6284/15001 [4:01:12<4:39:32,  1.92s/it, loss=0.0364, lr=1e-5]Steps:  42%|████▏     | 6285/15001 [4:01:14<4:27:40,  1.84s/it, loss=0.0364, lr=1e-5]Steps:  42%|████▏     | 6285/15001 [4:01:14<4:27:40,  1.84s/it, loss=0.0438, lr=1e-5]Steps:  42%|████▏     | 6286/15001 [4:01:16<4:30:45,  1.86s/it, loss=0.0438, lr=1e-5]Steps:  42%|████▏     | 6286/15001 [4:01:16<4:30:45,  1.86s/it, loss=0.247, lr=1e-5] Steps:  42%|████▏     | 6287/15001 [4:01:18<4:21:44,  1.80s/it, loss=0.247, lr=1e-5]Steps:  42%|████▏     | 6287/15001 [4:01:18<4:21:44,  1.80s/it, loss=0.0428, lr=1e-5]Steps:  42%|████▏     | 6288/15001 [4:01:20<4:40:01,  1.93s/it, loss=0.0428, lr=1e-5]Steps:  42%|████▏     | 6288/15001 [4:01:20<4:40:01,  1.93s/it, loss=0.15, lr=1e-5]  Steps:  42%|████▏     | 6289/15001 [4:01:22<4:31:20,  1.87s/it, loss=0.15, lr=1e-5]Steps:  42%|████▏     | 6289/15001 [4:01:22<4:31:20,  1.87s/it, loss=0.183, lr=1e-5]Steps:  42%|████▏     | 6290/15001 [4:01:23<4:24:03,  1.82s/it, loss=0.183, lr=1e-5]Steps:  42%|████▏     | 6290/15001 [4:01:23<4:24:03,  1.82s/it, loss=0.416, lr=1e-5]Steps:  42%|████▏     | 6291/15001 [4:01:25<4:23:30,  1.82s/it, loss=0.416, lr=1e-5]Steps:  42%|████▏     | 6291/15001 [4:01:25<4:23:30,  1.82s/it, loss=0.291, lr=1e-5]Steps:  42%|████▏     | 6292/15001 [4:01:27<4:21:40,  1.80s/it, loss=0.291, lr=1e-5]Steps:  42%|████▏     | 6292/15001 [4:01:27<4:21:40,  1.80s/it, loss=0.0628, lr=1e-5]Steps:  42%|████▏     | 6293/15001 [4:01:29<4:29:43,  1.86s/it, loss=0.0628, lr=1e-5]Steps:  42%|████▏     | 6293/15001 [4:01:29<4:29:43,  1.86s/it, loss=0.041, lr=1e-5] Steps:  42%|████▏     | 6294/15001 [4:01:30<4:15:23,  1.76s/it, loss=0.041, lr=1e-5]Steps:  42%|████▏     | 6294/15001 [4:01:31<4:15:23,  1.76s/it, loss=0.163, lr=1e-5]Steps:  42%|████▏     | 6295/15001 [4:01:32<4:29:40,  1.86s/it, loss=0.163, lr=1e-5]Steps:  42%|████▏     | 6295/15001 [4:01:32<4:29:40,  1.86s/it, loss=0.233, lr=1e-5]Steps:  42%|████▏     | 6296/15001 [4:01:34<4:25:09,  1.83s/it, loss=0.233, lr=1e-5]Steps:  42%|████▏     | 6296/15001 [4:01:34<4:25:09,  1.83s/it, loss=0.128, lr=1e-5]Steps:  42%|████▏     | 6297/15001 [4:01:36<4:23:52,  1.82s/it, loss=0.128, lr=1e-5]Steps:  42%|████▏     | 6297/15001 [4:01:36<4:23:52,  1.82s/it, loss=0.0622, lr=1e-5]Steps:  42%|████▏     | 6298/15001 [4:01:38<4:32:38,  1.88s/it, loss=0.0622, lr=1e-5]Steps:  42%|████▏     | 6298/15001 [4:01:38<4:32:38,  1.88s/it, loss=0.107, lr=1e-5] Steps:  42%|████▏     | 6299/15001 [4:01:40<4:33:32,  1.89s/it, loss=0.107, lr=1e-5]Steps:  42%|████▏     | 6299/15001 [4:01:40<4:33:32,  1.89s/it, loss=0.141, lr=1e-5]Steps:  42%|████▏     | 6300/15001 [4:01:42<4:46:36,  1.98s/it, loss=0.141, lr=1e-5]Steps:  42%|████▏     | 6300/15001 [4:01:42<4:46:36,  1.98s/it, loss=0.078, lr=1e-5]Steps:  42%|████▏     | 6301/15001 [4:01:44<4:45:17,  1.97s/it, loss=0.078, lr=1e-5]Steps:  42%|████▏     | 6301/15001 [4:01:44<4:45:17,  1.97s/it, loss=0.36, lr=1e-5] Steps:  42%|████▏     | 6302/15001 [4:01:46<4:43:03,  1.95s/it, loss=0.36, lr=1e-5]Steps:  42%|████▏     | 6302/15001 [4:01:46<4:43:03,  1.95s/it, loss=0.0874, lr=1e-5]Steps:  42%|████▏     | 6303/15001 [4:01:48<4:53:49,  2.03s/it, loss=0.0874, lr=1e-5]Steps:  42%|████▏     | 6303/15001 [4:01:48<4:53:49,  2.03s/it, loss=0.256, lr=1e-5] Steps:  42%|████▏     | 6304/15001 [4:01:50<4:46:02,  1.97s/it, loss=0.256, lr=1e-5]Steps:  42%|████▏     | 6304/15001 [4:01:50<4:46:02,  1.97s/it, loss=0.107, lr=1e-5]Steps:  42%|████▏     | 6305/15001 [4:01:52<4:47:52,  1.99s/it, loss=0.107, lr=1e-5]Steps:  42%|████▏     | 6305/15001 [4:01:52<4:47:52,  1.99s/it, loss=0.0601, lr=1e-5]Steps:  42%|████▏     | 6306/15001 [4:01:54<4:35:33,  1.90s/it, loss=0.0601, lr=1e-5]Steps:  42%|████▏     | 6306/15001 [4:01:54<4:35:33,  1.90s/it, loss=0.0711, lr=1e-5]Steps:  42%|████▏     | 6307/15001 [4:01:56<4:34:43,  1.90s/it, loss=0.0711, lr=1e-5]Steps:  42%|████▏     | 6307/15001 [4:01:56<4:34:43,  1.90s/it, loss=0.215, lr=1e-5] Steps:  42%|████▏     | 6308/15001 [4:01:57<4:23:42,  1.82s/it, loss=0.215, lr=1e-5]Steps:  42%|████▏     | 6308/15001 [4:01:58<4:23:42,  1.82s/it, loss=0.165, lr=1e-5]Steps:  42%|████▏     | 6309/15001 [4:01:59<4:35:54,  1.90s/it, loss=0.165, lr=1e-5]Steps:  42%|████▏     | 6309/15001 [4:01:59<4:35:54,  1.90s/it, loss=0.0193, lr=1e-5]Steps:  42%|████▏     | 6310/15001 [4:02:01<4:35:44,  1.90s/it, loss=0.0193, lr=1e-5]Steps:  42%|████▏     | 6310/15001 [4:02:01<4:35:44,  1.90s/it, loss=0.229, lr=1e-5] Steps:  42%|████▏     | 6311/15001 [4:02:03<4:22:22,  1.81s/it, loss=0.229, lr=1e-5]Steps:  42%|████▏     | 6311/15001 [4:02:03<4:22:22,  1.81s/it, loss=0.122, lr=1e-5]Steps:  42%|████▏     | 6312/15001 [4:02:05<4:21:31,  1.81s/it, loss=0.122, lr=1e-5]Steps:  42%|████▏     | 6312/15001 [4:02:05<4:21:31,  1.81s/it, loss=0.336, lr=1e-5]Steps:  42%|████▏     | 6313/15001 [4:02:06<4:20:08,  1.80s/it, loss=0.336, lr=1e-5]Steps:  42%|████▏     | 6313/15001 [4:02:07<4:20:08,  1.80s/it, loss=0.206, lr=1e-5]Steps:  42%|████▏     | 6314/15001 [4:02:08<4:33:46,  1.89s/it, loss=0.206, lr=1e-5]Steps:  42%|████▏     | 6314/15001 [4:02:09<4:33:46,  1.89s/it, loss=0.124, lr=1e-5]Steps:  42%|████▏     | 6315/15001 [4:02:10<4:26:00,  1.84s/it, loss=0.124, lr=1e-5]Steps:  42%|████▏     | 6315/15001 [4:02:10<4:26:00,  1.84s/it, loss=0.0397, lr=1e-5]Steps:  42%|████▏     | 6316/15001 [4:02:12<4:21:40,  1.81s/it, loss=0.0397, lr=1e-5]Steps:  42%|████▏     | 6316/15001 [4:02:12<4:21:40,  1.81s/it, loss=0.0865, lr=1e-5]Steps:  42%|████▏     | 6317/15001 [4:02:14<4:16:49,  1.77s/it, loss=0.0865, lr=1e-5]Steps:  42%|████▏     | 6317/15001 [4:02:14<4:16:49,  1.77s/it, loss=0.0524, lr=1e-5]Steps:  42%|████▏     | 6318/15001 [4:02:16<4:22:48,  1.82s/it, loss=0.0524, lr=1e-5]Steps:  42%|████▏     | 6318/15001 [4:02:16<4:22:48,  1.82s/it, loss=0.0578, lr=1e-5]Steps:  42%|████▏     | 6319/15001 [4:02:17<4:21:50,  1.81s/it, loss=0.0578, lr=1e-5]Steps:  42%|████▏     | 6319/15001 [4:02:18<4:21:50,  1.81s/it, loss=0.13, lr=1e-5]  Steps:  42%|████▏     | 6320/15001 [4:02:19<4:24:12,  1.83s/it, loss=0.13, lr=1e-5]Steps:  42%|████▏     | 6320/15001 [4:02:19<4:24:12,  1.83s/it, loss=0.266, lr=1e-5]Steps:  42%|████▏     | 6321/15001 [4:02:21<4:38:27,  1.92s/it, loss=0.266, lr=1e-5]Steps:  42%|█��██▏     | 6321/15001 [4:02:22<4:38:27,  1.92s/it, loss=0.228, lr=1e-5]Steps:  42%|████▏     | 6322/15001 [4:02:23<4:46:03,  1.98s/it, loss=0.228, lr=1e-5]Steps:  42%|████▏     | 6322/15001 [4:02:24<4:46:03,  1.98s/it, loss=0.322, lr=1e-5]Steps:  42%|████▏     | 6323/15001 [4:02:25<4:47:14,  1.99s/it, loss=0.322, lr=1e-5]Steps:  42%|████▏     | 6323/15001 [4:02:26<4:47:14,  1.99s/it, loss=0.0229, lr=1e-5]Steps:  42%|████▏     | 6324/15001 [4:02:28<4:49:19,  2.00s/it, loss=0.0229, lr=1e-5]Steps:  42%|████▏     | 6324/15001 [4:02:28<4:49:19,  2.00s/it, loss=0.166, lr=1e-5] Steps:  42%|████▏     | 6325/15001 [4:02:29<4:39:09,  1.93s/it, loss=0.166, lr=1e-5]Steps:  42%|████▏     | 6325/15001 [4:02:30<4:39:09,  1.93s/it, loss=0.184, lr=1e-5]Steps:  42%|████▏     | 6326/15001 [4:02:32<4:54:41,  2.04s/it, loss=0.184, lr=1e-5]Steps:  42%|████▏     | 6326/15001 [4:02:32<4:54:41,  2.04s/it, loss=0.0766, lr=1e-5]Steps:  42%|████▏     | 6327/15001 [4:02:34<4:54:05,  2.03s/it, loss=0.0766, lr=1e-5]Steps:  42%|████▏     | 6327/15001 [4:02:34<4:54:05,  2.03s/it, loss=0.129, lr=1e-5] Steps:  42%|████▏     | 6328/15001 [4:02:35<4:43:59,  1.96s/it, loss=0.129, lr=1e-5]Steps:  42%|████▏     | 6328/15001 [4:02:35<4:43:59,  1.96s/it, loss=0.308, lr=1e-5]Steps:  42%|████▏     | 6329/15001 [4:02:37<4:30:42,  1.87s/it, loss=0.308, lr=1e-5]Steps:  42%|████▏     | 6329/15001 [4:02:37<4:30:42,  1.87s/it, loss=0.155, lr=1e-5]Steps:  42%|████▏     | 6330/15001 [4:02:39<4:26:52,  1.85s/it, loss=0.155, lr=1e-5]Steps:  42%|████▏     | 6330/15001 [4:02:39<4:26:52,  1.85s/it, loss=0.257, lr=1e-5]Steps:  42%|████▏     | 6331/15001 [4:02:41<4:30:40,  1.87s/it, loss=0.257, lr=1e-5]Steps:  42%|████▏     | 6331/15001 [4:02:41<4:30:40,  1.87s/it, loss=0.0653, lr=1e-5]Steps:  42%|████▏     | 6332/15001 [4:02:43<4:29:33,  1.87s/it, loss=0.0653, lr=1e-5]Steps:  42%|████▏     | 6332/15001 [4:02:43<4:29:33,  1.87s/it, loss=0.202, lr=1e-5] Steps:  42%|████▏     | 6333/15001 [4:02:44<4:25:41,  1.84s/it, loss=0.202, lr=1e-5]Steps:  42%|████▏     | 6333/15001 [4:02:44<4:25:41,  1.84s/it, loss=0.0599, lr=1e-5]Steps:  42%|████▏     | 6334/15001 [4:02:46<4:16:36,  1.78s/it, loss=0.0599, lr=1e-5]Steps:  42%|████▏     | 6334/15001 [4:02:46<4:16:36,  1.78s/it, loss=0.255, lr=1e-5] Steps:  42%|████▏     | 6335/15001 [4:02:48<4:19:15,  1.80s/it, loss=0.255, lr=1e-5]Steps:  42%|████▏     | 6335/15001 [4:02:48<4:19:15,  1.80s/it, loss=0.228, lr=1e-5]Steps:  42%|████▏     | 6336/15001 [4:02:50<4:25:34,  1.84s/it, loss=0.228, lr=1e-5]Steps:  42%|████▏     | 6336/15001 [4:02:50<4:25:34,  1.84s/it, loss=0.61, lr=1e-5] Steps:  42%|████▏     | 6337/15001 [4:02:51<4:17:02,  1.78s/it, loss=0.61, lr=1e-5]Steps:  42%|████▏     | 6337/15001 [4:02:52<4:17:02,  1.78s/it, loss=0.232, lr=1e-5]Steps:  42%|████▏     | 6338/15001 [4:02:53<4:20:33,  1.80s/it, loss=0.232, lr=1e-5]Steps:  42%|████▏     | 6338/15001 [4:02:54<4:20:33,  1.80s/it, loss=0.319, lr=1e-5]Steps:  42%|████▏     | 6339/15001 [4:02:55<4:21:24,  1.81s/it, loss=0.319, lr=1e-5]Steps:  42%|████▏     | 6339/15001 [4:02:55<4:21:24,  1.81s/it, loss=0.141, lr=1e-5]Steps:  42%|████▏     | 6340/15001 [4:02:57<4:25:46,  1.84s/it, loss=0.141, lr=1e-5]Steps:  42%|████▏     | 6340/15001 [4:02:57<4:25:46,  1.84s/it, loss=0.215, lr=1e-5]Steps:  42%|████▏     | 6341/15001 [4:02:59<4:28:18,  1.86s/it, loss=0.215, lr=1e-5]Steps:  42%|████▏     | 6341/15001 [4:02:59<4:28:18,  1.86s/it, loss=0.188, lr=1e-5]Steps:  42%|████▏     | 6342/15001 [4:03:01<4:36:07,  1.91s/it, loss=0.188, lr=1e-5]Steps:  42%|████▏     | 6342/15001 [4:03:01<4:36:07,  1.91s/it, loss=0.219, lr=1e-5]Steps:  42%|████▏     | 6343/15001 [4:03:03<4:31:20,  1.88s/it, loss=0.219, lr=1e-5]Steps:  42%|████▏     | 6343/15001 [4:03:03<4:31:20,  1.88s/it, loss=0.155, lr=1e-5]Steps:  42%|████▏     | 6344/15001 [4:03:05<4:26:32,  1.85s/it, loss=0.155, lr=1e-5]Steps:  42%|████▏     | 6344/15001 [4:03:05<4:26:32,  1.85s/it, loss=0.202, lr=1e-5]Steps:  42%|████▏     | 6345/15001 [4:03:07<4:35:32,  1.91s/it, loss=0.202, lr=1e-5]Steps:  42%|████▏     | 6345/15001 [4:03:07<4:35:32,  1.91s/it, loss=0.12, lr=1e-5] Steps:  42%|████▏     | 6346/15001 [4:03:08<4:27:48,  1.86s/it, loss=0.12, lr=1e-5]Steps:  42%|████▏     | 6346/15001 [4:03:09<4:27:48,  1.86s/it, loss=0.124, lr=1e-5]Steps:  42%|████▏     | 6347/15001 [4:03:10<4:40:11,  1.94s/it, loss=0.124, lr=1e-5]Steps:  42%|████▏     | 6347/15001 [4:03:11<4:40:11,  1.94s/it, loss=0.0838, lr=1e-5]Steps:  42%|████▏     | 6348/15001 [4:03:13<4:53:14,  2.03s/it, loss=0.0838, lr=1e-5]Steps:  42%|████▏     | 6348/15001 [4:03:13<4:53:14,  2.03s/it, loss=0.138, lr=1e-5] Steps:  42%|████▏     | 6349/15001 [4:03:15<4:48:10,  2.00s/it, loss=0.138, lr=1e-5]Steps:  42%|████▏     | 6349/15001 [4:03:15<4:48:10,  2.00s/it, loss=0.158, lr=1e-5]Steps:  42%|████▏     | 6350/15001 [4:03:17<4:45:55,  1.98s/it, loss=0.158, lr=1e-5]Steps:  42%|████▏     | 6350/15001 [4:03:17<4:45:55,  1.98s/it, loss=0.0511, lr=1e-5]Steps:  42%|████▏     | 6351/15001 [4:03:18<4:36:50,  1.92s/it, loss=0.0511, lr=1e-5]Steps:  42%|████▏     | 6351/15001 [4:03:19<4:36:50,  1.92s/it, loss=0.191, lr=1e-5] Steps:  42%|████▏     | 6352/15001 [4:03:20<4:37:45,  1.93s/it, loss=0.191, lr=1e-5]Steps:  42%|████▏     | 6352/15001 [4:03:20<4:37:45,  1.93s/it, loss=0.219, lr=1e-5]Steps:  42%|████▏     | 6353/15001 [4:03:22<4:32:46,  1.89s/it, loss=0.219, lr=1e-5]Steps:  42%|████▏     | 6353/15001 [4:03:22<4:32:46,  1.89s/it, loss=0.283, lr=1e-5]Steps:  42%|████▏     | 6354/15001 [4:03:24<4:22:37,  1.82s/it, loss=0.283, lr=1e-5]Steps:  42%|████▏     | 6354/15001 [4:03:24<4:22:37,  1.82s/it, loss=0.0166, lr=1e-5]Steps:  42%|████▏     | 6355/15001 [4:03:26<4:34:47,  1.91s/it, loss=0.0166, lr=1e-5]Steps:  42%|████▏     | 6355/15001 [4:03:26<4:34:47,  1.91s/it, loss=0.284, lr=1e-5] Steps:  42%|████▏     | 6356/15001 [4:03:28<4:28:48,  1.87s/it, loss=0.284, lr=1e-5]Steps:  42%|████▏     | 6356/15001 [4:03:28<4:28:48,  1.87s/it, loss=0.187, lr=1e-5]Steps:  42%|████▏     | 6357/15001 [4:03:29<4:25:24,  1.84s/it, loss=0.187, lr=1e-5]Steps:  42%|████▏     | 6357/15001 [4:03:30<4:25:24,  1.84s/it, loss=0.183, lr=1e-5]Steps:  42%|████▏     | 6358/15001 [4:03:31<4:18:51,  1.80s/it, loss=0.183, lr=1e-5]Steps:  42%|████▏     | 6358/15001 [4:03:31<4:18:51,  1.80s/it, loss=0.232, lr=1e-5]Steps:  42%|████▏     | 6359/15001 [4:03:33<4:14:35,  1.77s/it, loss=0.232, lr=1e-5]Steps:  42%|████▏     | 6359/15001 [4:03:33<4:14:35,  1.77s/it, loss=0.132, lr=1e-5]Steps:  42%|████▏     | 6360/15001 [4:03:35<4:21:54,  1.82s/it, loss=0.132, lr=1e-5]Steps:  42%|████▏     | 6360/15001 [4:03:35<4:21:54,  1.82s/it, loss=0.249, lr=1e-5]Steps:  42%|████▏     | 6361/15001 [4:03:37<4:24:34,  1.84s/it, loss=0.249, lr=1e-5]Steps:  42%|████▏     | 6361/15001 [4:03:37<4:24:34,  1.84s/it, loss=0.0369, lr=1e-5]Steps:  42%|████▏     | 6362/15001 [4:03:38<4:21:53,  1.82s/it, loss=0.0369, lr=1e-5]Steps:  42%|████▏     | 6362/15001 [4:03:39<4:21:53,  1.82s/it, loss=0.239, lr=1e-5] Steps:  42%|████▏     | 6363/15001 [4:03:40<4:19:31,  1.80s/it, loss=0.239, lr=1e-5]Steps:  42%|████▏     | 6363/15001 [4:03:40<4:19:31,  1.80s/it, loss=0.098, lr=1e-5]Steps:  42%|████▏     | 6364/15001 [4:03:42<4:15:11,  1.77s/it, loss=0.098, lr=1e-5]Steps:  42%|████▏     | 6364/15001 [4:03:42<4:15:11,  1.77s/it, loss=0.116, lr=1e-5]Steps:  42%|████▏     | 6365/15001 [4:03:44<4:12:09,  1.75s/it, loss=0.116, lr=1e-5]Steps:  42%|████▏     | 6365/15001 [4:03:44<4:12:09,  1.75s/it, loss=0.192, lr=1e-5]Steps:  42%|████▏     | 6366/15001 [4:03:46<4:27:44,  1.86s/it, loss=0.192, lr=1e-5]Steps:  42%|████▏     | 6366/15001 [4:03:46<4:27:44,  1.86s/it, loss=0.184, lr=1e-5]Steps:  42%|████▏     | 6367/15001 [4:03:48<4:32:59,  1.90s/it, loss=0.184, lr=1e-5]Steps:  42%|████▏     | 6367/15001 [4:03:48<4:32:59,  1.90s/it, loss=0.187, lr=1e-5]Steps:  42%|████▏     | 6368/15001 [4:03:49<4:27:12,  1.86s/it, loss=0.187, lr=1e-5]Steps:  42%|████▏     | 6368/15001 [4:03:50<4:27:12,  1.86s/it, loss=0.0645, lr=1e-5]Steps:  42%|████▏     | 6369/15001 [4:03:52<4:59:04,  2.08s/it, loss=0.0645, lr=1e-5]Steps:  42%|████▏     | 6369/15001 [4:03:52<4:59:04,  2.08s/it, loss=0.222, lr=1e-5] Steps:  42%|████▏     | 6370/15001 [4:03:54<4:51:50,  2.03s/it, loss=0.222, lr=1e-5]Steps:  42%|████▏     | 6370/15001 [4:03:54<4:51:50,  2.03s/it, loss=0.301, lr=1e-5]Steps:  42%|████▏     | 6371/15001 [4:03:56<4:50:50,  2.02s/it, loss=0.301, lr=1e-5]Steps:  42%|████▏     | 6371/15001 [4:03:56<4:50:50,  2.02s/it, loss=0.111, lr=1e-5]Steps:  42%|████▏     | 6372/15001 [4:03:58<4:48:40,  2.01s/it, loss=0.111, lr=1e-5]Steps:  42%|████▏     | 6372/15001 [4:03:58<4:48:40,  2.01s/it, loss=0.151, lr=1e-5]Steps:  42%|████▏     | 6373/15001 [4:04:00<4:33:21,  1.90s/it, loss=0.151, lr=1e-5]Steps:  42%|████▏     | 6373/15001 [4:04:00<4:33:21,  1.90s/it, loss=0.2, lr=1e-5]  Steps:  42%|████▏     | 6374/15001 [4:04:02<4:41:03,  1.95s/it, loss=0.2, lr=1e-5]Steps:  42%|████▏     | 6374/15001 [4:04:02<4:41:03,  1.95s/it, loss=0.309, lr=1e-5]Steps:  42%|████▏     | 6375/15001 [4:04:04<4:34:50,  1.91s/it, loss=0.309, lr=1e-5]Steps:  42%|████▏     | 6375/15001 [4:04:04<4:34:50,  1.91s/it, loss=0.0626, lr=1e-5]Steps:  43%|████▎     | 6376/15001 [4:04:05<4:25:42,  1.85s/it, loss=0.0626, lr=1e-5]Steps:  43%|████▎     | 6376/15001 [4:04:05<4:25:42,  1.85s/it, loss=0.0996, lr=1e-5]Steps:  43%|████▎     | 6377/15001 [4:04:07<4:32:24,  1.90s/it, loss=0.0996, lr=1e-5]Steps:  43%|████▎     | 6377/15001 [4:04:07<4:32:24,  1.90s/it, loss=0.0899, lr=1e-5]Steps:  43%|████▎     | 6378/15001 [4:04:09<4:26:18,  1.85s/it, loss=0.0899, lr=1e-5]Steps:  43%|████▎     | 6378/15001 [4:04:09<4:26:18,  1.85s/it, loss=0.0774, lr=1e-5]Steps:  43%|████▎     | 6379/15001 [4:04:11<4:19:35,  1.81s/it, loss=0.0774, lr=1e-5]Steps:  43%|████▎     | 6379/15001 [4:04:11<4:19:35,  1.81s/it, loss=0.106, lr=1e-5] Steps:  43%|████▎     | 6380/15001 [4:04:13<4:26:13,  1.85s/it, loss=0.106, lr=1e-5]Steps:  43%|████▎     | 6380/15001 [4:04:13<4:26:13,  1.85s/it, loss=0.141, lr=1e-5]Steps:  43%|████▎     | 6381/15001 [4:04:14<4:19:57,  1.81s/it, loss=0.141, lr=1e-5]Steps:  43%|████▎     | 6381/15001 [4:04:14<4:19:57,  1.81s/it, loss=0.0678, lr=1e-5]Steps:  43%|████▎     | 6382/15001 [4:04:16<4:21:21,  1.82s/it, loss=0.0678, lr=1e-5]Steps:  43%|████▎     | 6382/15001 [4:04:16<4:21:21,  1.82s/it, loss=0.215, lr=1e-5] Steps:  43%|████▎     | 6383/15001 [4:04:18<4:18:10,  1.80s/it, loss=0.215, lr=1e-5]Steps:  43%|████▎     | 6383/15001 [4:04:18<4:18:10,  1.80s/it, loss=0.13, lr=1e-5] Steps:  43%|████▎     | 6384/15001 [4:04:20<4:16:53,  1.79s/it, loss=0.13, lr=1e-5]Steps:  43%|████▎     | 6384/15001 [4:04:20<4:16:53,  1.79s/it, loss=0.0686, lr=1e-5]Steps:  43%|████▎     | 6385/15001 [4:04:21<4:15:48,  1.78s/it, loss=0.0686, lr=1e-5]Steps:  43%|████▎     | 6385/15001 [4:04:22<4:15:48,  1.78s/it, loss=0.139, lr=1e-5] Steps:  43%|████▎     | 6386/15001 [4:04:23<4:12:50,  1.76s/it, loss=0.139, lr=1e-5]Steps:  43%|████▎     | 6386/15001 [4:04:23<4:12:50,  1.76s/it, loss=0.19, lr=1e-5] Steps:  43%|████▎     | 6387/15001 [4:04:25<4:23:06,  1.83s/it, loss=0.19, lr=1e-5]Steps:  43%|████▎     | 6387/15001 [4:04:25<4:23:06,  1.83s/it, loss=0.268, lr=1e-5]Steps:  43%|████▎     | 6388/15001 [4:04:27<4:15:23,  1.78s/it, loss=0.268, lr=1e-5]Steps:  43%|████▎     | 6388/15001 [4:04:27<4:15:23,  1.78s/it, loss=0.161, lr=1e-5]Steps:  43%|████▎     | 6389/15001 [4:04:29<4:29:54,  1.88s/it, loss=0.161, lr=1e-5]Steps:  43%|████▎     | 6389/15001 [4:04:29<4:29:54,  1.88s/it, loss=0.203, lr=1e-5]Steps:  43%|████▎     | 6390/15001 [4:04:31<4:36:23,  1.93s/it, loss=0.203, lr=1e-5]Steps:  43%|████▎     | 6390/15001 [4:04:31<4:36:23,  1.93s/it, loss=0.196, lr=1e-5]Steps:  43%|████▎     | 6391/15001 [4:04:33<4:31:39,  1.89s/it, loss=0.196, lr=1e-5]Steps:  43%|████▎     | 6391/15001 [4:04:33<4:31:39,  1.89s/it, loss=0.259, lr=1e-5]Steps:  43%|████▎     | 6392/15001 [4:04:35<4:34:20,  1.91s/it, loss=0.259, lr=1e-5]Steps:  43%|████▎     | 6392/15001 [4:04:35<4:34:20,  1.91s/it, loss=0.204, lr=1e-5]Steps:  43%|████▎     | 6393/15001 [4:04:37<4:41:40,  1.96s/it, loss=0.204, lr=1e-5]Steps:  43%|████▎     | 6393/15001 [4:04:37<4:41:40,  1.96s/it, loss=0.103, lr=1e-5]Steps:  43%|████▎     | 6394/15001 [4:04:39<4:37:44,  1.94s/it, loss=0.103, lr=1e-5]Steps:  43%|████▎     | 6394/15001 [4:04:39<4:37:44,  1.94s/it, loss=0.316, lr=1e-5]Steps:  43%|████▎     | 6395/15001 [4:04:41<4:37:37,  1.94s/it, loss=0.316, lr=1e-5]Steps:  43%|████▎     | 6395/15001 [4:04:41<4:37:37,  1.94s/it, loss=0.271, lr=1e-5]Steps:  43%|████▎     | 6396/15001 [4:04:42<4:25:12,  1.85s/it, loss=0.271, lr=1e-5]Steps:  43%|████▎     | 6396/15001 [4:04:43<4:25:12,  1.85s/it, loss=0.0372, lr=1e-5]Steps:  43%|████▎     | 6397/15001 [4:04:44<4:32:51,  1.90s/it, loss=0.0372, lr=1e-5]Steps:  43%|████▎     | 6397/15001 [4:04:45<4:32:51,  1.90s/it, loss=0.073, lr=1e-5] Steps:  43%|████▎     | 6398/15001 [4:04:46<4:38:07,  1.94s/it, loss=0.073, lr=1e-5]Steps:  43%|████▎     | 6398/15001 [4:04:47<4:38:07,  1.94s/it, loss=0.426, lr=1e-5]Steps:  43%|████▎     | 6399/15001 [4:04:48<4:41:31,  1.96s/it, loss=0.426, lr=1e-5]Steps:  43%|████▎     | 6399/15001 [4:04:48<4:41:31,  1.96s/it, loss=0.132, lr=1e-5]Steps:  43%|████▎     | 6400/15001 [4:04:50<4:35:25,  1.92s/it, loss=0.132, lr=1e-5]Steps:  43%|████▎     | 6400/15001 [4:04:50<4:35:25,  1.92s/it, loss=0.113, lr=1e-5]Steps:  43%|████▎     | 6401/15001 [4:04:52<4:26:59,  1.86s/it, loss=0.113, lr=1e-5]Steps:  43%|████▎     | 6401/15001 [4:04:52<4:26:59,  1.86s/it, loss=0.16, lr=1e-5] Steps:  43%|████▎     | 6402/15001 [4:04:54<4:19:22,  1.81s/it, loss=0.16, lr=1e-5]Steps:  43%|████▎     | 6402/15001 [4:04:54<4:19:22,  1.81s/it, loss=0.292, lr=1e-5]Steps:  43%|████▎     | 6403/15001 [4:04:55<4:19:53,  1.81s/it, loss=0.292, lr=1e-5]Steps:  43%|████▎     | 6403/15001 [4:04:56<4:19:53,  1.81s/it, loss=0.0288, lr=1e-5]Steps:  43%|████▎     | 6404/15001 [4:04:57<4:20:03,  1.82s/it, loss=0.0288, lr=1e-5]Steps:  43%|████▎     | 6404/15001 [4:04:58<4:20:03,  1.82s/it, loss=0.24, lr=1e-5]  Steps:  43%|████▎     | 6405/15001 [4:04:59<4:25:24,  1.85s/it, loss=0.24, lr=1e-5]Steps:  43%|████▎     | 6405/15001 [4:04:59<4:25:24,  1.85s/it, loss=0.182, lr=1e-5]Steps:  43%|████▎     | 6406/15001 [4:05:01<4:25:47,  1.86s/it, loss=0.182, lr=1e-5]Steps:  43%|████▎     | 6406/15001 [4:05:01<4:25:47,  1.86s/it, loss=0.147, lr=1e-5]Steps:  43%|████▎     | 6407/15001 [4:05:03<4:18:02,  1.80s/it, loss=0.147, lr=1e-5]Steps:  43%|████▎     | 6407/15001 [4:05:03<4:18:02,  1.80s/it, loss=0.0362, lr=1e-5]Steps:  43%|████▎     | 6408/15001 [4:05:05<4:21:34,  1.83s/it, loss=0.0362, lr=1e-5]Steps:  43%|████▎     | 6408/15001 [4:05:05<4:21:34,  1.83s/it, loss=0.0747, lr=1e-5]Steps:  43%|████▎     | 6409/15001 [4:05:07<4:25:32,  1.85s/it, loss=0.0747, lr=1e-5]Steps:  43%|████▎     | 6409/15001 [4:05:07<4:25:32,  1.85s/it, loss=0.314, lr=1e-5] Steps:  43%|████▎     | 6410/15001 [4:05:08<4:29:49,  1.88s/it, loss=0.314, lr=1e-5]Steps:  43%|████▎     | 6410/15001 [4:05:09<4:29:49,  1.88s/it, loss=0.16, lr=1e-5] Steps:  43%|████▎     | 6411/15001 [4:05:11<4:36:18,  1.93s/it, loss=0.16, lr=1e-5]Steps:  43%|████▎     | 6411/15001 [4:05:11<4:36:18,  1.93s/it, loss=0.0587, lr=1e-5]Steps:  43%|████▎     | 6412/15001 [4:05:12<4:27:32,  1.87s/it, loss=0.0587, lr=1e-5]Steps:  43%|████▎     | 6412/15001 [4:05:13<4:27:32,  1.87s/it, loss=0.0836, lr=1e-5]Steps:  43%|████▎     | 6413/15001 [4:05:14<4:42:04,  1.97s/it, loss=0.0836, lr=1e-5]Steps:  43%|████▎     | 6413/15001 [4:05:15<4:42:04,  1.97s/it, loss=0.417, lr=1e-5] Steps:  43%|████▎     | 6414/15001 [4:05:16<4:42:33,  1.97s/it, loss=0.417, lr=1e-5]Steps:  43%|████▎     | 6414/15001 [4:05:17<4:42:33,  1.97s/it, loss=0.0335, lr=1e-5]Steps:  43%|████▎     | 6415/15001 [4:05:18<4:34:32,  1.92s/it, loss=0.0335, lr=1e-5]Steps:  43%|████▎     | 6415/15001 [4:05:19<4:34:32,  1.92s/it, loss=0.14, lr=1e-5]  Steps:  43%|████▎     | 6416/15001 [4:05:20<4:35:12,  1.92s/it, loss=0.14, lr=1e-5]Steps:  43%|████▎     | 6416/15001 [4:05:20<4:35:12,  1.92s/it, loss=0.179, lr=1e-5]Steps:  43%|████▎     | 6417/15001 [4:05:22<4:38:50,  1.95s/it, loss=0.179, lr=1e-5]Steps:  43%|████▎     | 6417/15001 [4:05:22<4:38:50,  1.95s/it, loss=0.0711, lr=1e-5]Steps:  43%|████▎     | 6418/15001 [4:05:24<4:41:49,  1.97s/it, loss=0.0711, lr=1e-5]Steps:  43%|████▎     | 6418/15001 [4:05:24<4:41:49,  1.97s/it, loss=0.0238, lr=1e-5]Steps:  43%|████▎     | 6419/15001 [4:05:26<4:37:36,  1.94s/it, loss=0.0238, lr=1e-5]Steps:  43%|████▎     | 6419/15001 [4:05:26<4:37:36,  1.94s/it, loss=0.293, lr=1e-5] Steps:  43%|████▎     | 6420/15001 [4:05:28<4:32:18,  1.90s/it, loss=0.293, lr=1e-5]Steps:  43%|████▎     | 6420/15001 [4:05:28<4:32:18,  1.90s/it, loss=0.137, lr=1e-5]Steps:  43%|████▎     | 6421/15001 [4:05:30<4:30:06,  1.89s/it, loss=0.137, lr=1e-5]Steps:  43%|████▎     | 6421/15001 [4:05:30<4:30:06,  1.89s/it, loss=0.246, lr=1e-5]Steps:  43%|████▎     | 6422/15001 [4:05:32<4:30:25,  1.89s/it, loss=0.246, lr=1e-5]Steps:  43%|████▎     | 6422/15001 [4:05:32<4:30:25,  1.89s/it, loss=0.0856, lr=1e-5]Steps:  43%|████▎     | 6423/15001 [4:05:33<4:16:58,  1.80s/it, loss=0.0856, lr=1e-5]Steps:  43%|████▎     | 6423/15001 [4:05:33<4:16:58,  1.80s/it, loss=0.24, lr=1e-5]  Steps:  43%|████▎     | 6424/15001 [4:05:35<4:17:32,  1.80s/it, loss=0.24, lr=1e-5]Steps:  43%|████▎     | 6424/15001 [4:05:35<4:17:32,  1.80s/it, loss=0.031, lr=1e-5]Steps:  43%|████▎     | 6425/15001 [4:05:37<4:20:42,  1.82s/it, loss=0.031, lr=1e-5]Steps:  43%|████▎     | 6425/15001 [4:05:37<4:20:42,  1.82s/it, loss=0.0362, lr=1e-5]Steps:  43%|████▎     | 6426/15001 [4:05:39<4:20:45,  1.82s/it, loss=0.0362, lr=1e-5]Steps:  43%|████▎     | 6426/15001 [4:05:39<4:20:45,  1.82s/it, loss=0.0545, lr=1e-5]Steps:  43%|████▎     | 6427/15001 [4:05:40<4:13:57,  1.78s/it, loss=0.0545, lr=1e-5]Steps:  43%|████▎     | 6427/15001 [4:05:41<4:13:57,  1.78s/it, loss=0.141, lr=1e-5] Steps:  43%|████▎     | 6428/15001 [4:05:42<4:16:58,  1.80s/it, loss=0.141, lr=1e-5]Steps:  43%|████▎     | 6428/15001 [4:05:42<4:16:58,  1.80s/it, loss=0.279, lr=1e-5]Steps:  43%|████▎     | 6429/15001 [4:05:44<4:15:40,  1.79s/it, loss=0.279, lr=1e-5]Steps:  43%|████▎     | 6429/15001 [4:05:44<4:15:40,  1.79s/it, loss=0.161, lr=1e-5]Steps:  43%|████▎     | 6430/15001 [4:05:46<4:11:33,  1.76s/it, loss=0.161, lr=1e-5]Steps:  43%|████▎     | 6430/15001 [4:05:46<4:11:33,  1.76s/it, loss=0.167, lr=1e-5]Steps:  43%|████▎     | 6431/15001 [4:05:48<4:21:14,  1.83s/it, loss=0.167, lr=1e-5]Steps:  43%|████▎     | 6431/15001 [4:05:48<4:21:14,  1.83s/it, loss=0.361, lr=1e-5]Steps:  43%|████▎     | 6432/15001 [4:05:49<4:20:14,  1.82s/it, loss=0.361, lr=1e-5]Steps:  43%|████▎     | 6432/15001 [4:05:50<4:20:14,  1.82s/it, loss=0.0929, lr=1e-5]Steps:  43%|████▎     | 6433/15001 [4:05:51<4:20:37,  1.83s/it, loss=0.0929, lr=1e-5]Steps:  43%|████▎     | 6433/15001 [4:05:52<4:20:37,  1.83s/it, loss=0.412, lr=1e-5] Steps:  43%|████▎     | 6434/15001 [4:05:53<4:22:51,  1.84s/it, loss=0.412, lr=1e-5]Steps:  43%|████▎     | 6434/15001 [4:05:53<4:22:51,  1.84s/it, loss=0.0897, lr=1e-5]Steps:  43%|████▎     | 6435/15001 [4:05:55<4:25:11,  1.86s/it, loss=0.0897, lr=1e-5]Steps:  43%|████▎     | 6435/15001 [4:05:55<4:25:11,  1.86s/it, loss=0.127, lr=1e-5] Steps:  43%|████▎     | 6436/15001 [4:05:57<4:30:50,  1.90s/it, loss=0.127, lr=1e-5]Steps:  43%|████▎     | 6436/15001 [4:05:57<4:30:50,  1.90s/it, loss=0.159, lr=1e-5]Steps:  43%|████▎     | 6437/15001 [4:05:59<4:37:29,  1.94s/it, loss=0.159, lr=1e-5]Steps:  43%|████▎     | 6437/15001 [4:05:59<4:37:29,  1.94s/it, loss=0.444, lr=1e-5]Steps:  43%|████▎     | 6438/15001 [4:06:01<4:41:47,  1.97s/it, loss=0.444, lr=1e-5]Steps:  43%|████▎     | 6438/15001 [4:06:01<4:41:47,  1.97s/it, loss=0.109, lr=1e-5]Steps:  43%|████▎     | 6439/15001 [4:06:03<4:43:06,  1.98s/it, loss=0.109, lr=1e-5]Steps:  43%|████▎     | 6439/15001 [4:06:03<4:43:06,  1.98s/it, loss=0.0588, lr=1e-5]Steps:  43%|████▎     | 6440/15001 [4:06:05<4:41:23,  1.97s/it, loss=0.0588, lr=1e-5]Steps:  43%|████▎     | 6440/15001 [4:06:05<4:41:23,  1.97s/it, loss=0.275, lr=1e-5] Steps:  43%|████▎     | 6441/15001 [4:06:07<4:46:44,  2.01s/it, loss=0.275, lr=1e-5]Steps:  43%|████▎     | 6441/15001 [4:06:07<4:46:44,  2.01s/it, loss=0.21, lr=1e-5] Steps:  43%|████▎     | 6442/15001 [4:06:09<4:33:01,  1.91s/it, loss=0.21, lr=1e-5]Steps:  43%|████▎     | 6442/15001 [4:06:09<4:33:01,  1.91s/it, loss=0.188, lr=1e-5]Steps:  43%|████▎     | 6443/15001 [4:06:11<4:38:31,  1.95s/it, loss=0.188, lr=1e-5]Steps:  43%|████▎     | 6443/15001 [4:06:11<4:38:31,  1.95s/it, loss=0.0754, lr=1e-5]Steps:  43%|████▎     | 6444/15001 [4:06:13<4:35:59,  1.94s/it, loss=0.0754, lr=1e-5]Steps:  43%|████▎     | 6444/15001 [4:06:13<4:35:59,  1.94s/it, loss=0.169, lr=1e-5] Steps:  43%|████▎     | 6445/15001 [4:06:15<4:27:17,  1.87s/it, loss=0.169, lr=1e-5]Steps:  43%|████▎     | 6445/15001 [4:06:15<4:27:17,  1.87s/it, loss=0.18, lr=1e-5] Steps:  43%|████▎     | 6446/15001 [4:06:16<4:24:35,  1.86s/it, loss=0.18, lr=1e-5]Steps:  43%|████▎     | 6446/15001 [4:06:17<4:24:35,  1.86s/it, loss=0.4, lr=1e-5] Steps:  43%|████▎     | 6447/15001 [4:06:18<4:34:14,  1.92s/it, loss=0.4, lr=1e-5]Steps:  43%|████▎     | 6447/15001 [4:06:19<4:34:14,  1.92s/it, loss=0.241, lr=1e-5]Steps:  43%|████▎     | 6448/15001 [4:06:20<4:27:48,  1.88s/it, loss=0.241, lr=1e-5]Steps:  43%|████▎     | 6448/15001 [4:06:20<4:27:48,  1.88s/it, loss=0.0779, lr=1e-5]Steps:  43%|████▎     | 6449/15001 [4:06:22<4:14:55,  1.79s/it, loss=0.0779, lr=1e-5]Steps:  43%|████▎     | 6449/15001 [4:06:22<4:14:55,  1.79s/it, loss=0.287, lr=1e-5] Steps:  43%|████▎     | 6450/15001 [4:06:24<4:18:07,  1.81s/it, loss=0.287, lr=1e-5]Steps:  43%|████▎     | 6450/15001 [4:06:24<4:18:07,  1.81s/it, loss=0.349, lr=1e-5]Steps:  43%|████▎     | 6451/15001 [4:06:26<4:25:29,  1.86s/it, loss=0.349, lr=1e-5]Steps:  43%|████▎     | 6451/15001 [4:06:26<4:25:29,  1.86s/it, loss=0.109, lr=1e-5]Steps:  43%|████▎     | 6452/15001 [4:06:27<4:14:28,  1.79s/it, loss=0.109, lr=1e-5]Steps:  43%|████▎     | 6452/15001 [4:06:28<4:14:28,  1.79s/it, loss=0.418, lr=1e-5]Steps:  43%|████▎     | 6453/15001 [4:06:29<4:26:01,  1.87s/it, loss=0.418, lr=1e-5]Steps:  43%|████▎     | 6453/15001 [4:06:30<4:26:01,  1.87s/it, loss=0.286, lr=1e-5]Steps:  43%|████▎     | 6454/15001 [4:06:31<4:27:13,  1.88s/it, loss=0.286, lr=1e-5]Steps:  43%|████▎     | 6454/15001 [4:06:31<4:27:13,  1.88s/it, loss=0.0887, lr=1e-5]Steps:  43%|████▎     | 6455/15001 [4:06:33<4:24:53,  1.86s/it, loss=0.0887, lr=1e-5]Steps:  43%|████▎     | 6455/15001 [4:06:33<4:24:53,  1.86s/it, loss=0.122, lr=1e-5] Steps:  43%|████▎     | 6456/15001 [4:06:35<4:13:41,  1.78s/it, loss=0.122, lr=1e-5]Steps:  43%|████▎     | 6456/15001 [4:06:35<4:13:41,  1.78s/it, loss=0.0666, lr=1e-5]Steps:  43%|████▎     | 6457/15001 [4:06:37<4:24:15,  1.86s/it, loss=0.0666, lr=1e-5]Steps:  43%|████▎     | 6457/15001 [4:06:37<4:24:15,  1.86s/it, loss=0.147, lr=1e-5] Steps:  43%|████▎     | 6458/15001 [4:06:38<4:21:08,  1.83s/it, loss=0.147, lr=1e-5]Steps:  43%|████▎     | 6458/15001 [4:06:39<4:21:08,  1.83s/it, loss=0.0613, lr=1e-5]Steps:  43%|████▎     | 6459/15001 [4:06:41<4:32:12,  1.91s/it, loss=0.0613, lr=1e-5]Steps:  43%|████▎     | 6459/15001 [4:06:41<4:32:12,  1.91s/it, loss=0.29, lr=1e-5]  Steps:  43%|████▎     | 6460/15001 [4:06:42<4:26:58,  1.88s/it, loss=0.29, lr=1e-5]Steps:  43%|████▎     | 6460/15001 [4:06:43<4:26:58,  1.88s/it, loss=0.128, lr=1e-5]Steps:  43%|████▎     | 6461/15001 [4:06:44<4:25:36,  1.87s/it, loss=0.128, lr=1e-5]Steps:  43%|████▎     | 6461/15001 [4:06:45<4:25:36,  1.87s/it, loss=0.123, lr=1e-5]Steps:  43%|████▎     | 6462/15001 [4:06:46<4:34:26,  1.93s/it, loss=0.123, lr=1e-5]Steps:  43%|████▎     | 6462/15001 [4:06:47<4:34:26,  1.93s/it, loss=0.101, lr=1e-5]Steps:  43%|████▎     | 6463/15001 [4:06:48<4:39:03,  1.96s/it, loss=0.101, lr=1e-5]Steps:  43%|████▎     | 6463/15001 [4:06:49<4:39:03,  1.96s/it, loss=0.0732, lr=1e-5]Steps:  43%|████▎     | 6464/15001 [4:06:50<4:47:29,  2.02s/it, loss=0.0732, lr=1e-5]Steps:  43%|████▎     | 6464/15001 [4:06:51<4:47:29,  2.02s/it, loss=0.198, lr=1e-5] Steps:  43%|████▎     | 6465/15001 [4:06:52<4:37:13,  1.95s/it, loss=0.198, lr=1e-5]Steps:  43%|████▎     | 6465/15001 [4:06:52<4:37:13,  1.95s/it, loss=0.135, lr=1e-5]Steps:  43%|████▎     | 6466/15001 [4:06:54<4:33:41,  1.92s/it, loss=0.135, lr=1e-5]Steps:  43%|████▎     | 6466/15001 [4:06:54<4:33:41,  1.92s/it, loss=0.199, lr=1e-5]Steps:  43%|████▎     | 6467/15001 [4:06:56<4:25:18,  1.87s/it, loss=0.199, lr=1e-5]Steps:  43%|████▎     | 6467/15001 [4:06:56<4:25:18,  1.87s/it, loss=0.119, lr=1e-5]Steps:  43%|████▎     | 6468/15001 [4:06:58<4:33:47,  1.93s/it, loss=0.119, lr=1e-5]Steps:  43%|████▎     | 6468/15001 [4:06:58<4:33:47,  1.93s/it, loss=0.177, lr=1e-5]Steps:  43%|████▎     | 6469/15001 [4:07:00<4:30:44,  1.90s/it, loss=0.177, lr=1e-5]Steps:  43%|████▎     | 6469/15001 [4:07:00<4:30:44,  1.90s/it, loss=0.227, lr=1e-5]Steps:  43%|████▎     | 6470/15001 [4:07:02<4:26:28,  1.87s/it, loss=0.227, lr=1e-5]Steps:  43%|████▎     | 6470/15001 [4:07:02<4:26:28,  1.87s/it, loss=0.0693, lr=1e-5]Steps:  43%|████▎     | 6471/15001 [4:07:04<4:29:38,  1.90s/it, loss=0.0693, lr=1e-5]Steps:  43%|████▎     | 6471/15001 [4:07:04<4:29:38,  1.90s/it, loss=0.328, lr=1e-5] Steps:  43%|████▎     | 6472/15001 [4:07:05<4:30:37,  1.90s/it, loss=0.328, lr=1e-5]Steps:  43%|████▎     | 6472/15001 [4:07:06<4:30:37,  1.90s/it, loss=0.092, lr=1e-5]Steps:  43%|████▎     | 6473/15001 [4:07:07<4:23:07,  1.85s/it, loss=0.092, lr=1e-5]Steps:  43%|████▎     | 6473/15001 [4:07:07<4:23:07,  1.85s/it, loss=0.244, lr=1e-5]Steps:  43%|████▎     | 6474/15001 [4:07:09<4:21:16,  1.84s/it, loss=0.244, lr=1e-5]Steps:  43%|████▎     | 6474/15001 [4:07:09<4:21:16,  1.84s/it, loss=0.129, lr=1e-5]Steps:  43%|████▎     | 6475/15001 [4:07:11<4:20:45,  1.84s/it, loss=0.129, lr=1e-5]Steps:  43%|████▎     | 6475/15001 [4:07:11<4:20:45,  1.84s/it, loss=0.239, lr=1e-5]Steps:  43%|████▎     | 6476/15001 [4:07:12<4:12:37,  1.78s/it, loss=0.239, lr=1e-5]Steps:  43%|████▎     | 6476/15001 [4:07:13<4:12:37,  1.78s/it, loss=0.107, lr=1e-5]Steps:  43%|████▎     | 6477/15001 [4:07:14<4:14:27,  1.79s/it, loss=0.107, lr=1e-5]Steps:  43%|████▎     | 6477/15001 [4:07:15<4:14:27,  1.79s/it, loss=0.162, lr=1e-5]Steps:  43%|████▎     | 6478/15001 [4:07:16<4:15:05,  1.80s/it, loss=0.162, lr=1e-5]Steps:  43%|████▎     | 6478/15001 [4:07:16<4:15:05,  1.80s/it, loss=0.0827, lr=1e-5]Steps:  43%|████▎     | 6479/15001 [4:07:18<4:30:27,  1.90s/it, loss=0.0827, lr=1e-5]Steps:  43%|████▎     | 6479/15001 [4:07:18<4:30:27,  1.90s/it, loss=0.186, lr=1e-5] Steps:  43%|████▎     | 6480/15001 [4:07:20<4:22:38,  1.85s/it, loss=0.186, lr=1e-5]Steps:  43%|████▎     | 6480/15001 [4:07:20<4:22:38,  1.85s/it, loss=0.0296, lr=1e-5]Steps:  43%|████▎     | 6481/15001 [4:07:22<4:11:24,  1.77s/it, loss=0.0296, lr=1e-5]Steps:  43%|████▎     | 6481/15001 [4:07:22<4:11:24,  1.77s/it, loss=0.476, lr=1e-5] Steps:  43%|████▎     | 6482/15001 [4:07:24<4:23:40,  1.86s/it, loss=0.476, lr=1e-5]Steps:  43%|████▎     | 6482/15001 [4:07:24<4:23:40,  1.86s/it, loss=0.21, lr=1e-5] Steps:  43%|████▎     | 6483/15001 [4:07:26<4:32:37,  1.92s/it, loss=0.21, lr=1e-5]Steps:  43%|████▎     | 6483/15001 [4:07:26<4:32:37,  1.92s/it, loss=0.107, lr=1e-5]Steps:  43%|████▎     | 6484/15001 [4:07:28<4:40:13,  1.97s/it, loss=0.107, lr=1e-5]Steps:  43%|████▎     | 6484/15001 [4:07:28<4:40:13,  1.97s/it, loss=0.114, lr=1e-5]Steps:  43%|████▎     | 6485/15001 [4:07:30<4:49:03,  2.04s/it, loss=0.114, lr=1e-5]Steps:  43%|████▎     | 6485/15001 [4:07:30<4:49:03,  2.04s/it, loss=0.088, lr=1e-5]Steps:  43%|████▎     | 6486/15001 [4:07:32<4:40:18,  1.98s/it, loss=0.088, lr=1e-5]Steps:  43%|████▎     | 6486/15001 [4:07:32<4:40:18,  1.98s/it, loss=0.175, lr=1e-5]Steps:  43%|████▎     | 6487/15001 [4:07:34<4:38:10,  1.96s/it, loss=0.175, lr=1e-5]Steps:  43%|████▎     | 6487/15001 [4:07:34<4:38:10,  1.96s/it, loss=0.16, lr=1e-5] Steps:  43%|████▎     | 6488/15001 [4:07:35<4:24:16,  1.86s/it, loss=0.16, lr=1e-5]Steps:  43%|████▎     | 6488/15001 [4:07:36<4:24:16,  1.86s/it, loss=0.151, lr=1e-5]Steps:  43%|████▎     | 6489/15001 [4:07:37<4:31:38,  1.91s/it, loss=0.151, lr=1e-5]Steps:  43%|████▎     | 6489/15001 [4:07:37<4:31:38,  1.91s/it, loss=0.0907, lr=1e-5]Steps:  43%|████▎     | 6490/15001 [4:07:39<4:25:49,  1.87s/it, loss=0.0907, lr=1e-5]Steps:  43%|████▎     | 6490/15001 [4:07:39<4:25:49,  1.87s/it, loss=0.317, lr=1e-5] Steps:  43%|████▎     | 6491/15001 [4:07:41<4:23:52,  1.86s/it, loss=0.317, lr=1e-5]Steps:  43%|████▎     | 6491/15001 [4:07:41<4:23:52,  1.86s/it, loss=0.079, lr=1e-5]Steps:  43%|████▎     | 6492/15001 [4:07:43<4:13:50,  1.79s/it, loss=0.079, lr=1e-5]Steps:  43%|████▎     | 6492/15001 [4:07:43<4:13:50,  1.79s/it, loss=0.274, lr=1e-5]Steps:  43%|████▎     | 6493/15001 [4:07:44<4:14:13,  1.79s/it, loss=0.274, lr=1e-5]Steps:  43%|████▎     | 6493/15001 [4:07:45<4:14:13,  1.79s/it, loss=0.301, lr=1e-5]Steps:  43%|████▎     | 6494/15001 [4:07:46<4:15:51,  1.80s/it, loss=0.301, lr=1e-5]Steps:  43%|████▎     | 6494/15001 [4:07:47<4:15:51,  1.80s/it, loss=0.0848, lr=1e-5]Steps:  43%|████▎     | 6495/15001 [4:07:48<4:26:51,  1.88s/it, loss=0.0848, lr=1e-5]Steps:  43%|████▎     | 6495/15001 [4:07:48<4:26:51,  1.88s/it, loss=0.0613, lr=1e-5]Steps:  43%|████▎     | 6496/15001 [4:07:50<4:16:06,  1.81s/it, loss=0.0613, lr=1e-5]Steps:  43%|████▎     | 6496/15001 [4:07:50<4:16:06,  1.81s/it, loss=0.204, lr=1e-5] Steps:  43%|████▎     | 6497/15001 [4:07:52<4:18:58,  1.83s/it, loss=0.204, lr=1e-5]Steps:  43%|████▎     | 6497/15001 [4:07:52<4:18:58,  1.83s/it, loss=0.153, lr=1e-5]Steps:  43%|████▎     | 6498/15001 [4:07:54<4:14:51,  1.80s/it, loss=0.153, lr=1e-5]Steps:  43%|████▎     | 6498/15001 [4:07:54<4:14:51,  1.80s/it, loss=0.251, lr=1e-5]Steps:  43%|████▎     | 6499/15001 [4:07:55<4:19:32,  1.83s/it, loss=0.251, lr=1e-5]Steps:  43%|████▎     | 6499/15001 [4:07:56<4:19:32,  1.83s/it, loss=0.11, lr=1e-5] Steps:  43%|████▎     | 6500/15001 [4:07:57<4:16:49,  1.81s/it, loss=0.11, lr=1e-5]02/04/2024 17:10:16 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 420.65it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  43%|████▎     | 6500/15001 [4:11:37<4:16:49,  1.81s/it, loss=0.0754, lr=1e-5]Steps:  43%|████▎     | 6501/15001 [4:11:38<159:33:01, 67.57s/it, loss=0.0754, lr=1e-5]Steps:  43%|████▎     | 6501/15001 [4:11:38<159:33:01, 67.57s/it, loss=0.251, lr=1e-5] Steps:  43%|████▎     | 6502/15001 [4:11:40<112:45:44, 47.76s/it, loss=0.251, lr=1e-5]Steps:  43%|████▎     | 6502/15001 [4:11:40<112:45:44, 47.76s/it, loss=0.121, lr=1e-5]Steps:  43%|████▎     | 6503/15001 [4:11:42<80:12:58, 33.98s/it, loss=0.121, lr=1e-5] Steps:  43%|████▎     | 6503/15001 [4:11:42<80:12:58, 33.98s/it, loss=0.332, lr=1e-5]Steps:  43%|████▎     | 6504/15001 [4:11:44<57:33:28, 24.39s/it, loss=0.332, lr=1e-5]Steps:  43%|████▎     | 6504/15001 [4:11:44<57:33:28, 24.39s/it, loss=0.35, lr=1e-5] Steps:  43%|████▎     | 6505/15001 [4:11:45<41:32:51, 17.60s/it, loss=0.35, lr=1e-5]Steps:  43%|████▎     | 6505/15001 [4:11:46<41:32:51, 17.60s/it, loss=0.134, lr=1e-5]Steps:  43%|████▎     | 6506/15001 [4:11:47<30:29:00, 12.92s/it, loss=0.134, lr=1e-5]Steps:  43%|████▎     | 6506/15001 [4:11:47<30:29:00, 12.92s/it, loss=0.229, lr=1e-5]Steps:  43%|████▎     | 6507/15001 [4:11:49<22:39:26,  9.60s/it, loss=0.229, lr=1e-5]Steps:  43%|████▎     | 6507/15001 [4:11:49<22:39:26,  9.60s/it, loss=0.0507, lr=1e-5]Steps:  43%|████▎     | 6508/15001 [4:11:51<17:03:10,  7.23s/it, loss=0.0507, lr=1e-5]Steps:  43%|████▎     | 6508/15001 [4:11:51<17:03:10,  7.23s/it, loss=0.0396, lr=1e-5]Steps:  43%|████▎     | 6509/15001 [4:11:53<13:12:52,  5.60s/it, loss=0.0396, lr=1e-5]Steps:  43%|████▎     | 6509/15001 [4:11:53<13:12:52,  5.60s/it, loss=0.139, lr=1e-5] Steps:  43%|████▎     | 6510/15001 [4:11:54<10:25:39,  4.42s/it, loss=0.139, lr=1e-5]Steps:  43%|████▎     | 6510/15001 [4:11:55<10:25:39,  4.42s/it, loss=0.0581, lr=1e-5]Steps:  43%|████▎     | 6511/15001 [4:11:56<8:42:15,  3.69s/it, loss=0.0581, lr=1e-5] Steps:  43%|████▎     | 6511/15001 [4:11:57<8:42:15,  3.69s/it, loss=0.129, lr=1e-5] Steps:  43%|████▎     | 6512/15001 [4:11:58<7:21:45,  3.12s/it, loss=0.129, lr=1e-5]Steps:  43%|████▎     | 6512/15001 [4:11:58<7:21:45,  3.12s/it, loss=0.0268, lr=1e-5]Steps:  43%|████▎     | 6513/15001 [4:12:00<6:37:53,  2.81s/it, loss=0.0268, lr=1e-5]Steps:  43%|████▎     | 6513/15001 [4:12:01<6:37:53,  2.81s/it, loss=0.0467, lr=1e-5]Steps:  43%|████▎     | 6514/15001 [4:12:02<6:08:37,  2.61s/it, loss=0.0467, lr=1e-5]Steps:  43%|████▎     | 6514/15001 [4:12:03<6:08:37,  2.61s/it, loss=0.2, lr=1e-5]   Steps:  43%|████▎     | 6515/15001 [4:12:04<5:43:50,  2.43s/it, loss=0.2, lr=1e-5]Steps:  43%|████▎     | 6515/15001 [4:12:05<5:43:50,  2.43s/it, loss=0.271, lr=1e-5]Steps:  43%|████▎     | 6516/15001 [4:12:07<5:33:34,  2.36s/it, loss=0.271, lr=1e-5]Steps:  43%|████▎     | 6516/15001 [4:12:07<5:33:34,  2.36s/it, loss=0.311, lr=1e-5]Steps:  43%|████▎     | 6517/15001 [4:12:09<5:17:32,  2.25s/it, loss=0.311, lr=1e-5]Steps:  43%|████▎     | 6517/15001 [4:12:09<5:17:32,  2.25s/it, loss=0.106, lr=1e-5]Steps:  43%|████▎     | 6518/15001 [4:12:10<4:57:31,  2.10s/it, loss=0.106, lr=1e-5]Steps:  43%|████▎     | 6518/15001 [4:12:10<4:57:31,  2.10s/it, loss=0.0607, lr=1e-5]Steps:  43%|████▎     | 6519/15001 [4:12:12<4:38:10,  1.97s/it, loss=0.0607, lr=1e-5]Steps:  43%|████▎     | 6519/15001 [4:12:12<4:38:10,  1.97s/it, loss=0.287, lr=1e-5] Steps:  43%|████▎     | 6520/15001 [4:12:14<4:35:31,  1.95s/it, loss=0.287, lr=1e-5]Steps:  43%|████▎     | 6520/15001 [4:12:14<4:35:31,  1.95s/it, loss=0.155, lr=1e-5]Steps:  43%|████▎     | 6521/15001 [4:12:16<4:25:55,  1.88s/it, loss=0.155, lr=1e-5]Steps:  43%|████▎     | 6521/15001 [4:12:16<4:25:55,  1.88s/it, loss=0.18, lr=1e-5] Steps:  43%|████▎     | 6522/15001 [4:12:17<4:23:06,  1.86s/it, loss=0.18, lr=1e-5]Steps:  43%|████▎     | 6522/15001 [4:12:18<4:23:06,  1.86s/it, loss=0.255, lr=1e-5]Steps:  43%|████▎     | 6523/15001 [4:12:19<4:27:46,  1.90s/it, loss=0.255, lr=1e-5]Steps:  43%|████▎     | 6523/15001 [4:12:20<4:27:46,  1.90s/it, loss=0.224, lr=1e-5]Steps:  43%|████▎     | 6524/15001 [4:12:21<4:24:48,  1.87s/it, loss=0.224, lr=1e-5]Steps:  43%|████▎     | 6524/15001 [4:12:21<4:24:48,  1.87s/it, loss=0.0173, lr=1e-5]Steps:  43%|████▎     | 6525/15001 [4:12:23<4:16:14,  1.81s/it, loss=0.0173, lr=1e-5]Steps:  43%|████▎     | 6525/15001 [4:12:23<4:16:14,  1.81s/it, loss=0.136, lr=1e-5] Steps:  44%|████▎     | 6526/15001 [4:12:25<4:14:57,  1.80s/it, loss=0.136, lr=1e-5]Steps:  44%|████▎     | 6526/15001 [4:12:25<4:14:57,  1.80s/it, loss=0.184, lr=1e-5]Steps:  44%|████▎     | 6527/15001 [4:12:26<4:07:23,  1.75s/it, loss=0.184, lr=1e-5]Steps:  44%|████▎     | 6527/15001 [4:12:27<4:07:23,  1.75s/it, loss=0.225, lr=1e-5]Steps:  44%|████▎     | 6528/15001 [4:12:28<4:12:17,  1.79s/it, loss=0.225, lr=1e-5]Steps:  44%|████▎     | 6528/15001 [4:12:28<4:12:17,  1.79s/it, loss=0.0287, lr=1e-5]Steps:  44%|████▎     | 6529/15001 [4:12:30<4:06:42,  1.75s/it, loss=0.0287, lr=1e-5]Steps:  44%|████▎     | 6529/15001 [4:12:30<4:06:42,  1.75s/it, loss=0.0924, lr=1e-5]Steps:  44%|████▎     | 6530/15001 [4:12:32<4:09:29,  1.77s/it, loss=0.0924, lr=1e-5]Steps:  44%|████▎     | 6530/15001 [4:12:32<4:09:29,  1.77s/it, loss=0.225, lr=1e-5] Steps:  44%|████▎     | 6531/15001 [4:12:34<4:14:31,  1.80s/it, loss=0.225, lr=1e-5]Steps:  44%|████▎     | 6531/15001 [4:12:34<4:14:31,  1.80s/it, loss=0.146, lr=1e-5]Steps:  44%|████▎     | 6532/15001 [4:12:35<4:11:49,  1.78s/it, loss=0.146, lr=1e-5]Steps:  44%|████▎     | 6532/15001 [4:12:36<4:11:49,  1.78s/it, loss=0.168, lr=1e-5]Steps:  44%|████▎     | 6533/15001 [4:12:37<4:13:00,  1.79s/it, loss=0.168, lr=1e-5]Steps:  44%|████▎     | 6533/15001 [4:12:37<4:13:00,  1.79s/it, loss=0.128, lr=1e-5]Steps:  44%|████▎     | 6534/15001 [4:12:39<4:13:47,  1.80s/it, loss=0.128, lr=1e-5]Steps:  44%|████▎     | 6534/15001 [4:12:39<4:13:47,  1.80s/it, loss=0.214, lr=1e-5]Steps:  44%|████▎     | 6535/15001 [4:12:41<4:17:57,  1.83s/it, loss=0.214, lr=1e-5]Steps:  44%|████▎     | 6535/15001 [4:12:41<4:17:57,  1.83s/it, loss=0.0788, lr=1e-5]Steps:  44%|████▎     | 6536/15001 [4:12:43<4:16:54,  1.82s/it, loss=0.0788, lr=1e-5]Steps:  44%|████▎     | 6536/15001 [4:12:43<4:16:54,  1.82s/it, loss=0.088, lr=1e-5] Steps:  44%|████▎     | 6537/15001 [4:12:45<4:46:25,  2.03s/it, loss=0.088, lr=1e-5]Steps:  44%|████▎     | 6537/15001 [4:12:45<4:46:25,  2.03s/it, loss=0.113, lr=1e-5]Steps:  44%|████▎     | 6538/15001 [4:12:47<4:43:35,  2.01s/it, loss=0.113, lr=1e-5]Steps:  44%|████▎     | 6538/15001 [4:12:47<4:43:35,  2.01s/it, loss=0.146, lr=1e-5]Steps:  44%|████▎     | 6539/15001 [4:12:49<4:38:52,  1.98s/it, loss=0.146, lr=1e-5]Steps:  44%|████▎     | 6539/15001 [4:12:49<4:38:52,  1.98s/it, loss=0.117, lr=1e-5]Steps:  44%|████▎     | 6540/15001 [4:12:51<4:39:09,  1.98s/it, loss=0.117, lr=1e-5]Steps:  44%|████▎     | 6540/15001 [4:12:51<4:39:09,  1.98s/it, loss=0.242, lr=1e-5]Steps:  44%|████▎     | 6541/15001 [4:12:53<4:31:08,  1.92s/it, loss=0.242, lr=1e-5]Steps:  44%|████▎     | 6541/15001 [4:12:53<4:31:08,  1.92s/it, loss=0.173, lr=1e-5]Steps:  44%|████▎     | 6542/15001 [4:12:55<4:35:45,  1.96s/it, loss=0.173, lr=1e-5]Steps:  44%|████▎     | 6542/15001 [4:12:55<4:35:45,  1.96s/it, loss=0.271, lr=1e-5]Steps:  44%|████▎     | 6543/15001 [4:12:56<4:18:30,  1.83s/it, loss=0.271, lr=1e-5]Steps:  44%|████▎     | 6543/15001 [4:12:57<4:18:30,  1.83s/it, loss=0.226, lr=1e-5]Steps:  44%|████▎     | 6544/15001 [4:12:58<4:24:00,  1.87s/it, loss=0.226, lr=1e-5]Steps:  44%|████▎     | 6544/15001 [4:12:59<4:24:00,  1.87s/it, loss=0.0733, lr=1e-5]Steps:  44%|████▎     | 6545/15001 [4:13:00<4:22:45,  1.86s/it, loss=0.0733, lr=1e-5]Steps:  44%|████▎     | 6545/15001 [4:13:00<4:22:45,  1.86s/it, loss=0.151, lr=1e-5] Steps:  44%|████▎     | 6546/15001 [4:13:02<4:18:20,  1.83s/it, loss=0.151, lr=1e-5]Steps:  44%|████▎     | 6546/15001 [4:13:02<4:18:20,  1.83s/it, loss=0.142, lr=1e-5]Steps:  44%|████▎     | 6547/15001 [4:13:04<4:27:07,  1.90s/it, loss=0.142, lr=1e-5]Steps:  44%|████▎     | 6547/15001 [4:13:04<4:27:07,  1.90s/it, loss=0.0121, lr=1e-5]Steps:  44%|████▎     | 6548/15001 [4:13:06<4:17:35,  1.83s/it, loss=0.0121, lr=1e-5]Steps:  44%|████▎     | 6548/15001 [4:13:06<4:17:35,  1.83s/it, loss=0.227, lr=1e-5] Steps:  44%|████▎     | 6549/15001 [4:13:08<4:19:23,  1.84s/it, loss=0.227, lr=1e-5]Steps:  44%|████▎     | 6549/15001 [4:13:08<4:19:23,  1.84s/it, loss=0.228, lr=1e-5]Steps:  44%|████▎     | 6550/15001 [4:13:09<4:22:57,  1.87s/it, loss=0.228, lr=1e-5]Steps:  44%|████▎     | 6550/15001 [4:13:10<4:22:57,  1.87s/it, loss=0.0404, lr=1e-5]Steps:  44%|████▎     | 6551/15001 [4:13:11<4:14:40,  1.81s/it, loss=0.0404, lr=1e-5]Steps:  44%|████▎     | 6551/15001 [4:13:11<4:14:40,  1.81s/it, loss=0.358, lr=1e-5] Steps:  44%|████▎     | 6552/15001 [4:13:13<4:15:26,  1.81s/it, loss=0.358, lr=1e-5]Steps:  44%|████▎     | 6552/15001 [4:13:13<4:15:26,  1.81s/it, loss=0.0861, lr=1e-5]Steps:  44%|████▎     | 6553/15001 [4:13:15<4:17:19,  1.83s/it, loss=0.0861, lr=1e-5]Steps:  44%|████▎     | 6553/15001 [4:13:15<4:17:19,  1.83s/it, loss=0.128, lr=1e-5] Steps:  44%|████▎     | 6554/15001 [4:13:17<4:25:13,  1.88s/it, loss=0.128, lr=1e-5]Steps:  44%|████▎     | 6554/15001 [4:13:17<4:25:13,  1.88s/it, loss=0.126, lr=1e-5]Steps:  44%|████▎     | 6555/15001 [4:13:18<4:16:04,  1.82s/it, loss=0.126, lr=1e-5]Steps:  44%|████▎     | 6555/15001 [4:13:19<4:16:04,  1.82s/it, loss=0.167, lr=1e-5]Steps:  44%|████▎     | 6556/15001 [4:13:21<4:28:31,  1.91s/it, loss=0.167, lr=1e-5]Steps:  44%|████▎     | 6556/15001 [4:13:21<4:28:31,  1.91s/it, loss=0.0303, lr=1e-5]Steps:  44%|████▎     | 6557/15001 [4:13:22<4:10:15,  1.78s/it, loss=0.0303, lr=1e-5]Steps:  44%|████▎     | 6557/15001 [4:13:23<4:10:15,  1.78s/it, loss=0.128, lr=1e-5] Steps:  44%|████▎     | 6558/15001 [4:13:24<4:25:51,  1.89s/it, loss=0.128, lr=1e-5]Steps:  44%|████▎     | 6558/15001 [4:13:24<4:25:51,  1.89s/it, loss=0.205, lr=1e-5]Steps:  44%|████▎     | 6559/15001 [4:13:26<4:22:28,  1.87s/it, loss=0.205, lr=1e-5]Steps:  44%|████▎     | 6559/15001 [4:13:26<4:22:28,  1.87s/it, loss=0.0945, lr=1e-5]Steps:  44%|████▎     | 6560/15001 [4:13:28<4:34:44,  1.95s/it, loss=0.0945, lr=1e-5]Steps:  44%|████▎     | 6560/15001 [4:13:28<4:34:44,  1.95s/it, loss=0.334, lr=1e-5] Steps:  44%|████▎     | 6561/15001 [4:13:30<4:35:12,  1.96s/it, loss=0.334, lr=1e-5]Steps:  44%|████▎     | 6561/15001 [4:13:30<4:35:12,  1.96s/it, loss=0.11, lr=1e-5] Steps:  44%|████▎     | 6562/15001 [4:13:32<4:37:17,  1.97s/it, loss=0.11, lr=1e-5]Steps:  44%|████▎     | 6562/15001 [4:13:32<4:37:17,  1.97s/it, loss=0.074, lr=1e-5]Steps:  44%|████▍     | 6563/15001 [4:13:34<4:45:27,  2.03s/it, loss=0.074, lr=1e-5]Steps:  44%|████▍     | 6563/15001 [4:13:34<4:45:27,  2.03s/it, loss=0.0553, lr=1e-5]Steps:  44%|████▍     | 6564/15001 [4:13:36<4:34:44,  1.95s/it, loss=0.0553, lr=1e-5]Steps:  44%|████▍     | 6564/15001 [4:13:36<4:34:44,  1.95s/it, loss=0.268, lr=1e-5] Steps:  44%|████▍     | 6565/15001 [4:13:38<4:18:04,  1.84s/it, loss=0.268, lr=1e-5]Steps:  44%|████▍     | 6565/15001 [4:13:38<4:18:04,  1.84s/it, loss=0.168, lr=1e-5]Steps:  44%|████▍     | 6566/15001 [4:13:40<4:28:48,  1.91s/it, loss=0.168, lr=1e-5]Steps:  44%|████▍     | 6566/15001 [4:13:40<4:28:48,  1.91s/it, loss=0.317, lr=1e-5]Steps:  44%|████▍     | 6567/15001 [4:13:42<4:30:07,  1.92s/it, loss=0.317, lr=1e-5]Steps:  44%|████▍     | 6567/15001 [4:13:42<4:30:07,  1.92s/it, loss=0.125, lr=1e-5]Steps:  44%|████▍     | 6568/15001 [4:13:44<4:35:35,  1.96s/it, loss=0.125, lr=1e-5]Steps:  44%|████▍     | 6568/15001 [4:13:44<4:35:35,  1.96s/it, loss=0.0351, lr=1e-5]Steps:  44%|████▍     | 6569/15001 [4:13:45<4:18:33,  1.84s/it, loss=0.0351, lr=1e-5]Steps:  44%|████▍     | 6569/15001 [4:13:46<4:18:33,  1.84s/it, loss=0.214, lr=1e-5] Steps:  44%|████▍     | 6570/15001 [4:13:47<4:17:58,  1.84s/it, loss=0.214, lr=1e-5]Steps:  44%|████▍     | 6570/15001 [4:13:47<4:17:58,  1.84s/it, loss=0.237, lr=1e-5]Steps:  44%|████▍     | 6571/15001 [4:13:49<4:15:18,  1.82s/it, loss=0.237, lr=1e-5]Steps:  44%|████▍     | 6571/15001 [4:13:49<4:15:18,  1.82s/it, loss=0.169, lr=1e-5]Steps:  44%|████▍     | 6572/15001 [4:13:51<4:28:25,  1.91s/it, loss=0.169, lr=1e-5]Steps:  44%|████▍     | 6572/15001 [4:13:51<4:28:25,  1.91s/it, loss=0.0236, lr=1e-5]Steps:  44%|████▍     | 6573/15001 [4:13:53<4:17:00,  1.83s/it, loss=0.0236, lr=1e-5]Steps:  44%|████▍     | 6573/15001 [4:13:53<4:17:00,  1.83s/it, loss=0.303, lr=1e-5] Steps:  44%|████▍     | 6574/15001 [4:13:55<4:20:19,  1.85s/it, loss=0.303, lr=1e-5]Steps:  44%|████▍     | 6574/15001 [4:13:55<4:20:19,  1.85s/it, loss=0.243, lr=1e-5]Steps:  44%|████▍     | 6575/15001 [4:13:57<4:24:00,  1.88s/it, loss=0.243, lr=1e-5]Steps:  44%|████▍     | 6575/15001 [4:13:57<4:24:00,  1.88s/it, loss=0.205, lr=1e-5]Steps:  44%|████▍     | 6576/15001 [4:13:58<4:19:16,  1.85s/it, loss=0.205, lr=1e-5]Steps:  44%|████▍     | 6576/15001 [4:13:58<4:19:16,  1.85s/it, loss=0.145, lr=1e-5]Steps:  44%|████▍     | 6577/15001 [4:14:00<4:23:03,  1.87s/it, loss=0.145, lr=1e-5]Steps:  44%|████▍     | 6577/15001 [4:14:00<4:23:03,  1.87s/it, loss=0.145, lr=1e-5]Steps:  44%|████▍     | 6578/15001 [4:14:02<4:18:25,  1.84s/it, loss=0.145, lr=1e-5]Steps:  44%|████▍     | 6578/15001 [4:14:02<4:18:25,  1.84s/it, loss=0.154, lr=1e-5]Steps:  44%|████▍     | 6579/15001 [4:14:04<4:08:14,  1.77s/it, loss=0.154, lr=1e-5]Steps:  44%|████▍     | 6579/15001 [4:14:04<4:08:14,  1.77s/it, loss=0.249, lr=1e-5]Steps:  44%|████▍     | 6580/15001 [4:14:05<4:13:31,  1.81s/it, loss=0.249, lr=1e-5]Steps:  44%|████▍     | 6580/15001 [4:14:06<4:13:31,  1.81s/it, loss=0.116, lr=1e-5]Steps:  44%|████▍     | 6581/15001 [4:14:07<4:12:09,  1.80s/it, loss=0.116, lr=1e-5]Steps:  44%|████▍     | 6581/15001 [4:14:07<4:12:09,  1.80s/it, loss=0.2, lr=1e-5]  Steps:  44%|████▍     | 6582/15001 [4:14:09<4:17:03,  1.83s/it, loss=0.2, lr=1e-5]Steps:  44%|████▍     | 6582/15001 [4:14:10<4:17:03,  1.83s/it, loss=0.0431, lr=1e-5]Steps:  44%|████▍     | 6583/15001 [4:14:11<4:32:55,  1.95s/it, loss=0.0431, lr=1e-5]Steps:  44%|████▍     | 6583/15001 [4:14:12<4:32:55,  1.95s/it, loss=0.216, lr=1e-5] Steps:  44%|████▍     | 6584/15001 [4:14:13<4:31:14,  1.93s/it, loss=0.216, lr=1e-5]Steps:  44%|████▍     | 6584/15001 [4:14:13<4:31:14,  1.93s/it, loss=0.0295, lr=1e-5]Steps:  44%|████▍     | 6585/15001 [4:14:15<4:42:29,  2.01s/it, loss=0.0295, lr=1e-5]Steps:  44%|████▍     | 6585/15001 [4:14:16<4:42:29,  2.01s/it, loss=0.146, lr=1e-5] Steps:  44%|████▍     | 6586/15001 [4:14:18<4:44:50,  2.03s/it, loss=0.146, lr=1e-5]Steps:  44%|████▍     | 6586/15001 [4:14:18<4:44:50,  2.03s/it, loss=0.153, lr=1e-5]Steps:  44%|████▍     | 6587/15001 [4:14:19<4:28:44,  1.92s/it, loss=0.153, lr=1e-5]Steps:  44%|████▍     | 6587/15001 [4:14:20<4:28:44,  1.92s/it, loss=0.36, lr=1e-5] Steps:  44%|████▍     | 6588/15001 [4:14:21<4:34:38,  1.96s/it, loss=0.36, lr=1e-5]Steps:  44%|████▍     | 6588/15001 [4:14:21<4:34:38,  1.96s/it, loss=0.0288, lr=1e-5]Steps:  44%|████▍     | 6589/15001 [4:14:23<4:22:36,  1.87s/it, loss=0.0288, lr=1e-5]Steps:  44%|████▍     | 6589/15001 [4:14:23<4:22:36,  1.87s/it, loss=0.221, lr=1e-5] Steps:  44%|████▍     | 6590/15001 [4:14:25<4:20:39,  1.86s/it, loss=0.221, lr=1e-5]Steps:  44%|████▍     | 6590/15001 [4:14:25<4:20:39,  1.86s/it, loss=0.282, lr=1e-5]Steps:  44%|████▍     | 6591/15001 [4:14:27<4:19:46,  1.85s/it, loss=0.282, lr=1e-5]Steps:  44%|████▍     | 6591/15001 [4:14:27<4:19:46,  1.85s/it, loss=0.0738, lr=1e-5]Steps:  44%|████▍     | 6592/15001 [4:14:28<4:19:33,  1.85s/it, loss=0.0738, lr=1e-5]Steps:  44%|████▍     | 6592/15001 [4:14:29<4:19:33,  1.85s/it, loss=0.115, lr=1e-5] Steps:  44%|████▍     | 6593/15001 [4:14:30<4:13:58,  1.81s/it, loss=0.115, lr=1e-5]Steps:  44%|████▍     | 6593/15001 [4:14:30<4:13:58,  1.81s/it, loss=0.172, lr=1e-5]Steps:  44%|████▍     | 6594/15001 [4:14:32<4:10:49,  1.79s/it, loss=0.172, lr=1e-5]Steps:  44%|████▍     | 6594/15001 [4:14:32<4:10:49,  1.79s/it, loss=0.215, lr=1e-5]Steps:  44%|████▍     | 6595/15001 [4:14:34<4:27:08,  1.91s/it, loss=0.215, lr=1e-5]Steps:  44%|████▍     | 6595/15001 [4:14:34<4:27:08,  1.91s/it, loss=0.106, lr=1e-5]Steps:  44%|████▍     | 6596/15001 [4:14:36<4:17:54,  1.84s/it, loss=0.106, lr=1e-5]Steps:  44%|████▍     | 6596/15001 [4:14:36<4:17:54,  1.84s/it, loss=0.0797, lr=1e-5]Steps:  44%|████▍     | 6597/15001 [4:14:38<4:16:18,  1.83s/it, loss=0.0797, lr=1e-5]Steps:  44%|████▍     | 6597/15001 [4:14:38<4:16:18,  1.83s/it, loss=0.16, lr=1e-5]  Steps:  44%|████▍     | 6598/15001 [4:14:40<4:23:03,  1.88s/it, loss=0.16, lr=1e-5]Steps:  44%|████▍     | 6598/15001 [4:14:40<4:23:03,  1.88s/it, loss=0.0647, lr=1e-5]Steps:  44%|████▍     | 6599/15001 [4:14:41<4:13:59,  1.81s/it, loss=0.0647, lr=1e-5]Steps:  44%|████▍     | 6599/15001 [4:14:42<4:13:59,  1.81s/it, loss=0.257, lr=1e-5] Steps:  44%|████▍     | 6600/15001 [4:14:43<4:11:32,  1.80s/it, loss=0.257, lr=1e-5]Steps:  44%|████▍     | 6600/15001 [4:14:43<4:11:32,  1.80s/it, loss=0.377, lr=1e-5]Steps:  44%|████▍     | 6601/15001 [4:14:45<4:14:03,  1.81s/it, loss=0.377, lr=1e-5]Steps:  44%|████▍     | 6601/15001 [4:14:45<4:14:03,  1.81s/it, loss=0.237, lr=1e-5]Steps:  44%|████▍     | 6602/15001 [4:14:47<4:23:01,  1.88s/it, loss=0.237, lr=1e-5]Steps:  44%|████▍     | 6602/15001 [4:14:47<4:23:01,  1.88s/it, loss=0.161, lr=1e-5]Steps:  44%|████▍     | 6603/15001 [4:14:49<4:23:50,  1.89s/it, loss=0.161, lr=1e-5]Steps:  44%|████▍     | 6603/15001 [4:14:49<4:23:50,  1.89s/it, loss=0.123, lr=1e-5]Steps:  44%|████▍     | 6604/15001 [4:14:51<4:18:50,  1.85s/it, loss=0.123, lr=1e-5]Steps:  44%|████▍     | 6604/15001 [4:14:51<4:18:50,  1.85s/it, loss=0.0963, lr=1e-5]Steps:  44%|████▍     | 6605/15001 [4:14:53<4:33:09,  1.95s/it, loss=0.0963, lr=1e-5]Steps:  44%|████▍     | 6605/15001 [4:14:53<4:33:09,  1.95s/it, loss=0.137, lr=1e-5] Steps:  44%|████▍     | 6606/15001 [4:14:55<4:34:53,  1.96s/it, loss=0.137, lr=1e-5]Steps:  44%|████▍     | 6606/15001 [4:14:55<4:34:53,  1.96s/it, loss=0.211, lr=1e-5]Steps:  44%|████▍     | 6607/15001 [4:14:57<4:30:02,  1.93s/it, loss=0.211, lr=1e-5]Steps:  44%|████▍     | 6607/15001 [4:14:57<4:30:02,  1.93s/it, loss=0.209, lr=1e-5]Steps:  44%|████▍     | 6608/15001 [4:14:59<4:42:31,  2.02s/it, loss=0.209, lr=1e-5]Steps:  44%|████▍     | 6608/15001 [4:14:59<4:42:31,  2.02s/it, loss=0.209, lr=1e-5]Steps:  44%|████▍     | 6609/15001 [4:15:01<4:38:09,  1.99s/it, loss=0.209, lr=1e-5]Steps:  44%|████▍     | 6609/15001 [4:15:01<4:38:09,  1.99s/it, loss=0.247, lr=1e-5]Steps:  44%|████▍     | 6610/15001 [4:15:03<4:29:40,  1.93s/it, loss=0.247, lr=1e-5]Steps:  44%|████▍     | 6610/15001 [4:15:03<4:29:40,  1.93s/it, loss=0.171, lr=1e-5]Steps:  44%|████▍     | 6611/15001 [4:15:04<4:12:43,  1.81s/it, loss=0.171, lr=1e-5]Steps:  44%|████▍     | 6611/15001 [4:15:04<4:12:43,  1.81s/it, loss=0.268, lr=1e-5]Steps:  44%|████▍     | 6612/15001 [4:15:06<4:24:14,  1.89s/it, loss=0.268, lr=1e-5]Steps:  44%|████▍     | 6612/15001 [4:15:06<4:24:14,  1.89s/it, loss=0.277, lr=1e-5]Steps:  44%|████▍     | 6613/15001 [4:15:08<4:29:41,  1.93s/it, loss=0.277, lr=1e-5]Steps:  44%|████▍     | 6613/15001 [4:15:08<4:29:41,  1.93s/it, loss=0.281, lr=1e-5]Steps:  44%|████▍     | 6614/15001 [4:15:10<4:17:20,  1.84s/it, loss=0.281, lr=1e-5]Steps:  44%|████▍     | 6614/15001 [4:15:10<4:17:20,  1.84s/it, loss=0.201, lr=1e-5]Steps:  44%|████▍     | 6615/15001 [4:15:12<4:16:44,  1.84s/it, loss=0.201, lr=1e-5]Steps:  44%|████▍     | 6615/15001 [4:15:12<4:16:44,  1.84s/it, loss=0.355, lr=1e-5]Steps:  44%|████▍     | 6616/15001 [4:15:14<4:23:00,  1.88s/it, loss=0.355, lr=1e-5]Steps:  44%|████▍     | 6616/15001 [4:15:14<4:23:00,  1.88s/it, loss=0.122, lr=1e-5]Steps:  44%|████▍     | 6617/15001 [4:15:15<4:12:21,  1.81s/it, loss=0.122, lr=1e-5]Steps:  44%|████▍     | 6617/15001 [4:15:16<4:12:21,  1.81s/it, loss=0.0974, lr=1e-5]Steps:  44%|████▍     | 6618/15001 [4:15:17<4:16:20,  1.83s/it, loss=0.0974, lr=1e-5]Steps:  44%|████▍     | 6618/15001 [4:15:17<4:16:20,  1.83s/it, loss=0.0461, lr=1e-5]Steps:  44%|████▍     | 6619/15001 [4:15:19<4:19:48,  1.86s/it, loss=0.0461, lr=1e-5]Steps:  44%|████▍     | 6619/15001 [4:15:19<4:19:48,  1.86s/it, loss=0.115, lr=1e-5] Steps:  44%|████▍     | 6620/15001 [4:15:21<4:24:32,  1.89s/it, loss=0.115, lr=1e-5]Steps:  44%|████▍     | 6620/15001 [4:15:21<4:24:32,  1.89s/it, loss=0.153, lr=1e-5]Steps:  44%|████▍     | 6621/15001 [4:15:23<4:13:43,  1.82s/it, loss=0.153, lr=1e-5]Steps:  44%|████▍     | 6621/15001 [4:15:23<4:13:43,  1.82s/it, loss=0.355, lr=1e-5]Steps:  44%|████▍     | 6622/15001 [4:15:25<4:16:44,  1.84s/it, loss=0.355, lr=1e-5]Steps:  44%|████▍     | 6622/15001 [4:15:25<4:16:44,  1.84s/it, loss=0.0326, lr=1e-5]Steps:  44%|████▍     | 6623/15001 [4:15:26<4:09:58,  1.79s/it, loss=0.0326, lr=1e-5]Steps:  44%|████▍     | 6623/15001 [4:15:26<4:09:58,  1.79s/it, loss=0.393, lr=1e-5] Steps:  44%|████▍     | 6624/15001 [4:15:28<4:08:42,  1.78s/it, loss=0.393, lr=1e-5]Steps:  44%|████▍     | 6624/15001 [4:15:28<4:08:42,  1.78s/it, loss=0.187, lr=1e-5]Steps:  44%|████▍     | 6625/15001 [4:15:30<4:19:44,  1.86s/it, loss=0.187, lr=1e-5]Steps:  44%|████▍     | 6625/15001 [4:15:30<4:19:44,  1.86s/it, loss=0.124, lr=1e-5]Steps:  44%|████▍     | 6626/15001 [4:15:32<4:16:38,  1.84s/it, loss=0.124, lr=1e-5]Steps:  44%|████▍     | 6626/15001 [4:15:32<4:16:38,  1.84s/it, loss=0.135, lr=1e-5]Steps:  44%|████▍     | 6627/15001 [4:15:34<4:16:54,  1.84s/it, loss=0.135, lr=1e-5]Steps:  44%|████▍     | 6627/15001 [4:15:34<4:16:54,  1.84s/it, loss=0.501, lr=1e-5]Steps:  44%|████▍     | 6628/15001 [4:15:36<4:29:32,  1.93s/it, loss=0.501, lr=1e-5]Steps:  44%|████▍     | 6628/15001 [4:15:36<4:29:32,  1.93s/it, loss=0.104, lr=1e-5]Steps:  44%|████▍     | 6629/15001 [4:15:38<4:37:28,  1.99s/it, loss=0.104, lr=1e-5]Steps:  44%|████▍     | 6629/15001 [4:15:38<4:37:28,  1.99s/it, loss=0.158, lr=1e-5]Steps:  44%|████▍     | 6630/15001 [4:15:40<4:40:08,  2.01s/it, loss=0.158, lr=1e-5]Steps:  44%|████▍     | 6630/15001 [4:15:40<4:40:08,  2.01s/it, loss=0.0685, lr=1e-5]Steps:  44%|████▍     | 6631/15001 [4:15:42<4:39:52,  2.01s/it, loss=0.0685, lr=1e-5]Steps:  44%|████▍     | 6631/15001 [4:15:42<4:39:52,  2.01s/it, loss=0.147, lr=1e-5] Steps:  44%|████▍     | 6632/15001 [4:15:44<4:32:52,  1.96s/it, loss=0.147, lr=1e-5]Steps:  44%|████▍     | 6632/15001 [4:15:44<4:32:52,  1.96s/it, loss=0.1, lr=1e-5]  Steps:  44%|████▍     | 6633/15001 [4:15:46<4:28:56,  1.93s/it, loss=0.1, lr=1e-5]Steps:  44%|████▍     | 6633/15001 [4:15:46<4:28:56,  1.93s/it, loss=0.3, lr=1e-5]Steps:  44%|████▍     | 6634/15001 [4:15:47<4:22:22,  1.88s/it, loss=0.3, lr=1e-5]Steps:  44%|████▍     | 6634/15001 [4:15:48<4:22:22,  1.88s/it, loss=0.1, lr=1e-5]Steps:  44%|████▍     | 6635/15001 [4:15:49<4:24:35,  1.90s/it, loss=0.1, lr=1e-5]Steps:  44%|████▍     | 6635/15001 [4:15:49<4:24:35,  1.90s/it, loss=0.101, lr=1e-5]Steps:  44%|████▍     | 6636/15001 [4:15:51<4:10:31,  1.80s/it, loss=0.101, lr=1e-5]Steps:  44%|████▍     | 6636/15001 [4:15:51<4:10:31,  1.80s/it, loss=0.18, lr=1e-5] Steps:  44%|████▍     | 6637/15001 [4:15:53<4:12:09,  1.81s/it, loss=0.18, lr=1e-5]Steps:  44%|████▍     | 6637/15001 [4:15:53<4:12:09,  1.81s/it, loss=0.129, lr=1e-5]Steps:  44%|████▍     | 6638/15001 [4:15:55<4:20:22,  1.87s/it, loss=0.129, lr=1e-5]Steps:  44%|████▍     | 6638/15001 [4:15:55<4:20:22,  1.87s/it, loss=0.147, lr=1e-5]Steps:  44%|████▍     | 6639/15001 [4:15:57<4:19:59,  1.87s/it, loss=0.147, lr=1e-5]Steps:  44%|████▍     | 6639/15001 [4:15:57<4:19:59,  1.87s/it, loss=0.186, lr=1e-5]Steps:  44%|████▍     | 6640/15001 [4:15:59<4:23:09,  1.89s/it, loss=0.186, lr=1e-5]Steps:  44%|████▍     | 6640/15001 [4:15:59<4:23:09,  1.89s/it, loss=0.156, lr=1e-5]Steps:  44%|████▍     | 6641/15001 [4:16:00<4:10:56,  1.80s/it, loss=0.156, lr=1e-5]Steps:  44%|████▍     | 6641/15001 [4:16:00<4:10:56,  1.80s/it, loss=0.184, lr=1e-5]Steps:  44%|████▍     | 6642/15001 [4:16:02<4:13:55,  1.82s/it, loss=0.184, lr=1e-5]Steps:  44%|████▍     | 6642/15001 [4:16:02<4:13:55,  1.82s/it, loss=0.191, lr=1e-5]Steps:  44%|████▍     | 6643/15001 [4:16:04<4:09:11,  1.79s/it, loss=0.191, lr=1e-5]Steps:  44%|████▍     | 6643/15001 [4:16:04<4:09:11,  1.79s/it, loss=0.219, lr=1e-5]Steps:  44%|████▍     | 6644/15001 [4:16:06<4:14:47,  1.83s/it, loss=0.219, lr=1e-5]Steps:  44%|████▍     | 6644/15001 [4:16:06<4:14:47,  1.83s/it, loss=0.223, lr=1e-5]Steps:  44%|████▍     | 6645/15001 [4:16:08<4:19:22,  1.86s/it, loss=0.223, lr=1e-5]Steps:  44%|████▍     | 6645/15001 [4:16:08<4:19:22,  1.86s/it, loss=0.0387, lr=1e-5]Steps:  44%|████▍     | 6646/15001 [4:16:09<4:05:32,  1.76s/it, loss=0.0387, lr=1e-5]Steps:  44%|████▍     | 6646/15001 [4:16:09<4:05:32,  1.76s/it, loss=0.138, lr=1e-5] Steps:  44%|████▍     | 6647/15001 [4:16:11<4:12:01,  1.81s/it, loss=0.138, lr=1e-5]Steps:  44%|████▍     | 6647/15001 [4:16:11<4:12:01,  1.81s/it, loss=0.108, lr=1e-5]Steps:  44%|████▍     | 6648/15001 [4:16:13<4:10:00,  1.80s/it, loss=0.108, lr=1e-5]Steps:  44%|████▍     | 6648/15001 [4:16:13<4:10:00,  1.80s/it, loss=0.333, lr=1e-5]Steps:  44%|████▍     | 6649/15001 [4:16:15<4:23:33,  1.89s/it, loss=0.333, lr=1e-5]Steps:  44%|████▍     | 6649/15001 [4:16:15<4:23:33,  1.89s/it, loss=0.0932, lr=1e-5]Steps:  44%|████▍     | 6650/15001 [4:16:17<4:19:42,  1.87s/it, loss=0.0932, lr=1e-5]Steps:  44%|████▍     | 6650/15001 [4:16:17<4:19:42,  1.87s/it, loss=0.0724, lr=1e-5]Steps:  44%|████▍     | 6651/15001 [4:16:19<4:25:13,  1.91s/it, loss=0.0724, lr=1e-5]Steps:  44%|████▍     | 6651/15001 [4:16:19<4:25:13,  1.91s/it, loss=0.0698, lr=1e-5]Steps:  44%|████▍     | 6652/15001 [4:16:21<4:28:00,  1.93s/it, loss=0.0698, lr=1e-5]Steps:  44%|████▍     | 6652/15001 [4:16:21<4:28:00,  1.93s/it, loss=0.168, lr=1e-5] Steps:  44%|████▍     | 6653/15001 [4:16:23<4:37:59,  2.00s/it, loss=0.168, lr=1e-5]Steps:  44%|████▍     | 6653/15001 [4:16:23<4:37:59,  2.00s/it, loss=0.139, lr=1e-5]Steps:  44%|████▍     | 6654/15001 [4:16:25<4:36:55,  1.99s/it, loss=0.139, lr=1e-5]Steps:  44%|████▍     | 6654/15001 [4:16:25<4:36:55,  1.99s/it, loss=0.267, lr=1e-5]Steps:  44%|████▍     | 6655/15001 [4:16:26<4:17:28,  1.85s/it, loss=0.267, lr=1e-5]Steps:  44%|████▍     | 6655/15001 [4:16:27<4:17:28,  1.85s/it, loss=0.0507, lr=1e-5]Steps:  44%|████▍     | 6656/15001 [4:16:29<4:32:31,  1.96s/it, loss=0.0507, lr=1e-5]Steps:  44%|████▍     | 6656/15001 [4:16:29<4:32:31,  1.96s/it, loss=0.124, lr=1e-5] Steps:  44%|████▍     | 6657/15001 [4:16:31<4:32:39,  1.96s/it, loss=0.124, lr=1e-5]Steps:  44%|████▍     | 6657/15001 [4:16:31<4:32:39,  1.96s/it, loss=0.314, lr=1e-5]Steps:  44%|████▍     | 6658/15001 [4:16:32<4:20:30,  1.87s/it, loss=0.314, lr=1e-5]Steps:  44%|████▍     | 6658/15001 [4:16:33<4:20:30,  1.87s/it, loss=0.0574, lr=1e-5]Steps:  44%|████▍     | 6659/15001 [4:16:34<4:16:24,  1.84s/it, loss=0.0574, lr=1e-5]Steps:  44%|████▍     | 6659/15001 [4:16:34<4:16:24,  1.84s/it, loss=0.0878, lr=1e-5]Steps:  44%|████▍     | 6660/15001 [4:16:36<4:25:58,  1.91s/it, loss=0.0878, lr=1e-5]Steps:  44%|████▍     | 6660/15001 [4:16:36<4:25:58,  1.91s/it, loss=0.507, lr=1e-5] Steps:  44%|████▍     | 6661/15001 [4:16:38<4:15:34,  1.84s/it, loss=0.507, lr=1e-5]Steps:  44%|████▍     | 6661/15001 [4:16:38<4:15:34,  1.84s/it, loss=0.312, lr=1e-5]Steps:  44%|████▍     | 6662/15001 [4:16:40<4:19:57,  1.87s/it, loss=0.312, lr=1e-5]Steps:  44%|████▍     | 6662/15001 [4:16:40<4:19:57,  1.87s/it, loss=0.237, lr=1e-5]Steps:  44%|████▍     | 6663/15001 [4:16:42<4:24:01,  1.90s/it, loss=0.237, lr=1e-5]Steps:  44%|████▍     | 6663/15001 [4:16:42<4:24:01,  1.90s/it, loss=0.402, lr=1e-5]Steps:  44%|████▍     | 6664/15001 [4:16:44<4:21:31,  1.88s/it, loss=0.402, lr=1e-5]Steps:  44%|████▍     | 6664/15001 [4:16:44<4:21:31,  1.88s/it, loss=0.257, lr=1e-5]Steps:  44%|████▍     | 6665/15001 [4:16:45<4:11:43,  1.81s/it, loss=0.257, lr=1e-5]Steps:  44%|████▍     | 6665/15001 [4:16:45<4:11:43,  1.81s/it, loss=0.152, lr=1e-5]Steps:  44%|████▍     | 6666/15001 [4:16:47<4:19:07,  1.87s/it, loss=0.152, lr=1e-5]Steps:  44%|████▍     | 6666/15001 [4:16:47<4:19:07,  1.87s/it, loss=0.0279, lr=1e-5]Steps:  44%|████▍     | 6667/15001 [4:16:49<4:16:29,  1.85s/it, loss=0.0279, lr=1e-5]Steps:  44%|████▍     | 6667/15001 [4:16:49<4:16:29,  1.85s/it, loss=0.1, lr=1e-5]   Steps:  44%|████▍     | 6668/15001 [4:16:51<4:23:48,  1.90s/it, loss=0.1, lr=1e-5]Steps:  44%|████▍     | 6668/15001 [4:16:51<4:23:48,  1.90s/it, loss=0.146, lr=1e-5]Steps:  44%|████▍     | 6669/15001 [4:16:53<4:18:07,  1.86s/it, loss=0.146, lr=1e-5]Steps:  44%|████▍     | 6669/15001 [4:16:53<4:18:07,  1.86s/it, loss=0.328, lr=1e-5]Steps:  44%|████▍     | 6670/15001 [4:16:54<4:07:56,  1.79s/it, loss=0.328, lr=1e-5]Steps:  44%|████▍     | 6670/15001 [4:16:55<4:07:56,  1.79s/it, loss=0.473, lr=1e-5]Steps:  44%|████▍     | 6671/15001 [4:16:56<4:12:48,  1.82s/it, loss=0.473, lr=1e-5]Steps:  44%|████▍     | 6671/15001 [4:16:56<4:12:48,  1.82s/it, loss=0.214, lr=1e-5]Steps:  44%|████▍     | 6672/15001 [4:16:58<4:01:51,  1.74s/it, loss=0.214, lr=1e-5]Steps:  44%|████▍     | 6672/15001 [4:16:58<4:01:51,  1.74s/it, loss=0.074, lr=1e-5]Steps:  44%|████▍     | 6673/15001 [4:17:00<4:25:59,  1.92s/it, loss=0.074, lr=1e-5]Steps:  44%|████▍     | 6673/15001 [4:17:00<4:25:59,  1.92s/it, loss=0.166, lr=1e-5]Steps:  44%|████▍     | 6674/15001 [4:17:02<4:21:56,  1.89s/it, loss=0.166, lr=1e-5]Steps:  44%|████▍     | 6674/15001 [4:17:02<4:21:56,  1.89s/it, loss=0.105, lr=1e-5]Steps:  44%|████▍     | 6675/15001 [4:17:04<4:19:35,  1.87s/it, loss=0.105, lr=1e-5]Steps:  44%|████▍     | 6675/15001 [4:17:04<4:19:35,  1.87s/it, loss=0.249, lr=1e-5]Steps:  45%|████▍     | 6676/15001 [4:17:06<4:31:41,  1.96s/it, loss=0.249, lr=1e-5]Steps:  45%|████▍     | 6676/15001 [4:17:06<4:31:41,  1.96s/it, loss=0.469, lr=1e-5]Steps:  45%|████▍     | 6677/15001 [4:17:08<4:35:53,  1.99s/it, loss=0.469, lr=1e-5]Steps:  45%|████▍     | 6677/15001 [4:17:08<4:35:53,  1.99s/it, loss=0.15, lr=1e-5] Steps:  45%|████▍     | 6678/15001 [4:17:10<4:35:05,  1.98s/it, loss=0.15, lr=1e-5]Steps:  45%|████▍     | 6678/15001 [4:17:10<4:35:05,  1.98s/it, loss=0.235, lr=1e-5]Steps:  45%|████▍     | 6679/15001 [4:17:12<4:26:22,  1.92s/it, loss=0.235, lr=1e-5]Steps:  45%|████▍     | 6679/15001 [4:17:12<4:26:22,  1.92s/it, loss=0.217, lr=1e-5]Steps:  45%|████▍     | 6680/15001 [4:17:14<4:20:57,  1.88s/it, loss=0.217, lr=1e-5]Steps:  45%|████▍     | 6680/15001 [4:17:14<4:20:57,  1.88s/it, loss=0.0888, lr=1e-5]Steps:  45%|████▍     | 6681/15001 [4:17:15<4:16:21,  1.85s/it, loss=0.0888, lr=1e-5]Steps:  45%|████▍     | 6681/15001 [4:17:15<4:16:21,  1.85s/it, loss=0.387, lr=1e-5] Steps:  45%|████▍     | 6682/15001 [4:17:17<4:16:51,  1.85s/it, loss=0.387, lr=1e-5]Steps:  45%|████▍     | 6682/15001 [4:17:17<4:16:51,  1.85s/it, loss=0.149, lr=1e-5]Steps:  45%|████▍     | 6683/15001 [4:17:19<4:14:37,  1.84s/it, loss=0.149, lr=1e-5]Steps:  45%|████▍     | 6683/15001 [4:17:19<4:14:37,  1.84s/it, loss=0.202, lr=1e-5]Steps:  45%|████▍     | 6684/15001 [4:17:21<4:09:06,  1.80s/it, loss=0.202, lr=1e-5]Steps:  45%|████▍     | 6684/15001 [4:17:21<4:09:06,  1.80s/it, loss=0.0877, lr=1e-5]Steps:  45%|████▍     | 6685/15001 [4:17:23<4:09:51,  1.80s/it, loss=0.0877, lr=1e-5]Steps:  45%|████▍     | 6685/15001 [4:17:23<4:09:51,  1.80s/it, loss=0.0456, lr=1e-5]Steps:  45%|████▍     | 6686/15001 [4:17:24<4:09:49,  1.80s/it, loss=0.0456, lr=1e-5]Steps:  45%|████▍     | 6686/15001 [4:17:24<4:09:49,  1.80s/it, loss=0.0591, lr=1e-5]Steps:  45%|████▍     | 6687/15001 [4:17:26<4:00:44,  1.74s/it, loss=0.0591, lr=1e-5]Steps:  45%|████▍     | 6687/15001 [4:17:26<4:00:44,  1.74s/it, loss=0.154, lr=1e-5] Steps:  45%|████▍     | 6688/15001 [4:17:28<4:18:19,  1.86s/it, loss=0.154, lr=1e-5]Steps:  45%|████▍     | 6688/15001 [4:17:28<4:18:19,  1.86s/it, loss=0.212, lr=1e-5]Steps:  45%|████▍     | 6689/15001 [4:17:30<4:09:24,  1.80s/it, loss=0.212, lr=1e-5]Steps:  45%|████▍     | 6689/15001 [4:17:30<4:09:24,  1.80s/it, loss=0.0844, lr=1e-5]Steps:  45%|████▍     | 6690/15001 [4:17:32<4:15:21,  1.84s/it, loss=0.0844, lr=1e-5]Steps:  45%|████▍     | 6690/15001 [4:17:32<4:15:21,  1.84s/it, loss=0.152, lr=1e-5] Steps:  45%|████▍     | 6691/15001 [4:17:33<4:11:30,  1.82s/it, loss=0.152, lr=1e-5]Steps:  45%|████▍     | 6691/15001 [4:17:34<4:11:30,  1.82s/it, loss=0.166, lr=1e-5]Steps:  45%|████▍     | 6692/15001 [4:17:35<4:14:06,  1.83s/it, loss=0.166, lr=1e-5]Steps:  45%|████▍     | 6692/15001 [4:17:36<4:14:06,  1.83s/it, loss=0.16, lr=1e-5] Steps:  45%|████▍     | 6693/15001 [4:17:37<4:18:11,  1.86s/it, loss=0.16, lr=1e-5]Steps:  45%|████▍     | 6693/15001 [4:17:37<4:18:11,  1.86s/it, loss=0.137, lr=1e-5]Steps:  45%|████▍     | 6694/15001 [4:17:39<4:25:48,  1.92s/it, loss=0.137, lr=1e-5]Steps:  45%|████▍     | 6694/15001 [4:17:39<4:25:48,  1.92s/it, loss=0.234, lr=1e-5]Steps:  45%|████▍     | 6695/15001 [4:17:41<4:21:13,  1.89s/it, loss=0.234, lr=1e-5]Steps:  45%|████▍     | 6695/15001 [4:17:41<4:21:13,  1.89s/it, loss=0.391, lr=1e-5]Steps:  45%|████▍     | 6696/15001 [4:17:43<4:17:52,  1.86s/it, loss=0.391, lr=1e-5]Steps:  45%|████▍     | 6696/15001 [4:17:43<4:17:52,  1.86s/it, loss=0.0542, lr=1e-5]Steps:  45%|████▍     | 6697/15001 [4:17:45<4:29:18,  1.95s/it, loss=0.0542, lr=1e-5]Steps:  45%|████▍     | 6697/15001 [4:17:45<4:29:18,  1.95s/it, loss=0.0452, lr=1e-5]Steps:  45%|████▍     | 6698/15001 [4:17:47<4:25:36,  1.92s/it, loss=0.0452, lr=1e-5]Steps:  45%|████▍     | 6698/15001 [4:17:47<4:25:36,  1.92s/it, loss=0.0416, lr=1e-5]Steps:  45%|████▍     | 6699/15001 [4:17:49<4:19:39,  1.88s/it, loss=0.0416, lr=1e-5]Steps:  45%|████▍     | 6699/15001 [4:17:49<4:19:39,  1.88s/it, loss=0.316, lr=1e-5] Steps:  45%|████▍     | 6700/15001 [4:17:51<4:29:35,  1.95s/it, loss=0.316, lr=1e-5]Steps:  45%|████▍     | 6700/15001 [4:17:51<4:29:35,  1.95s/it, loss=0.222, lr=1e-5]Steps:  45%|████▍     | 6701/15001 [4:17:53<4:22:44,  1.90s/it, loss=0.222, lr=1e-5]Steps:  45%|████▍     | 6701/15001 [4:17:53<4:22:44,  1.90s/it, loss=0.0363, lr=1e-5]Steps:  45%|████▍     | 6702/15001 [4:17:55<4:33:06,  1.97s/it, loss=0.0363, lr=1e-5]Steps:  45%|████▍     | 6702/15001 [4:17:55<4:33:06,  1.97s/it, loss=0.176, lr=1e-5] Steps:  45%|████▍     | 6703/15001 [4:17:56<4:16:37,  1.86s/it, loss=0.176, lr=1e-5]Steps:  45%|████▍     | 6703/15001 [4:17:57<4:16:37,  1.86s/it, loss=0.17, lr=1e-5] Steps:  45%|████▍     | 6704/15001 [4:17:58<4:25:57,  1.92s/it, loss=0.17, lr=1e-5]Steps:  45%|████▍     | 6704/15001 [4:17:58<4:25:57,  1.92s/it, loss=0.267, lr=1e-5]Steps:  45%|████▍     | 6705/15001 [4:18:00<4:15:51,  1.85s/it, loss=0.267, lr=1e-5]Steps:  45%|████▍     | 6705/15001 [4:18:00<4:15:51,  1.85s/it, loss=0.252, lr=1e-5]Steps:  45%|████▍     | 6706/15001 [4:18:02<4:16:12,  1.85s/it, loss=0.252, lr=1e-5]Steps:  45%|████▍     | 6706/15001 [4:18:02<4:16:12,  1.85s/it, loss=0.0845, lr=1e-5]Steps:  45%|████▍     | 6707/15001 [4:18:04<4:17:44,  1.86s/it, loss=0.0845, lr=1e-5]Steps:  45%|████▍     | 6707/15001 [4:18:04<4:17:44,  1.86s/it, loss=0.259, lr=1e-5] Steps:  45%|████▍     | 6708/15001 [4:18:06<4:13:25,  1.83s/it, loss=0.259, lr=1e-5]Steps:  45%|████▍     | 6708/15001 [4:18:06<4:13:25,  1.83s/it, loss=0.152, lr=1e-5]Steps:  45%|████▍     | 6709/15001 [4:18:07<4:12:35,  1.83s/it, loss=0.152, lr=1e-5]Steps:  45%|████▍     | 6709/15001 [4:18:08<4:12:35,  1.83s/it, loss=0.115, lr=1e-5]Steps:  45%|████▍     | 6710/15001 [4:18:09<4:14:46,  1.84s/it, loss=0.115, lr=1e-5]Steps:  45%|████▍     | 6710/15001 [4:18:09<4:14:46,  1.84s/it, loss=0.235, lr=1e-5]Steps:  45%|████▍     | 6711/15001 [4:18:11<4:08:29,  1.80s/it, loss=0.235, lr=1e-5]Steps:  45%|████▍     | 6711/15001 [4:18:11<4:08:29,  1.80s/it, loss=0.156, lr=1e-5]Steps:  45%|████▍     | 6712/15001 [4:18:13<4:20:25,  1.89s/it, loss=0.156, lr=1e-5]Steps:  45%|████▍     | 6712/15001 [4:18:13<4:20:25,  1.89s/it, loss=0.0953, lr=1e-5]Steps:  45%|████▍     | 6713/15001 [4:18:15<4:15:23,  1.85s/it, loss=0.0953, lr=1e-5]Steps:  45%|████▍     | 6713/15001 [4:18:15<4:15:23,  1.85s/it, loss=0.023, lr=1e-5] Steps:  45%|████▍     | 6714/15001 [4:18:17<4:12:44,  1.83s/it, loss=0.023, lr=1e-5]Steps:  45%|████▍     | 6714/15001 [4:18:17<4:12:44,  1.83s/it, loss=0.13, lr=1e-5] Steps:  45%|████▍     | 6715/15001 [4:18:18<4:00:27,  1.74s/it, loss=0.13, lr=1e-5]Steps:  45%|████▍     | 6715/15001 [4:18:19<4:00:27,  1.74s/it, loss=0.0942, lr=1e-5]Steps:  45%|████▍     | 6716/15001 [4:18:20<4:08:29,  1.80s/it, loss=0.0942, lr=1e-5]Steps:  45%|████▍     | 6716/15001 [4:18:20<4:08:29,  1.80s/it, loss=0.282, lr=1e-5] Steps:  45%|████▍     | 6717/15001 [4:18:22<4:12:43,  1.83s/it, loss=0.282, lr=1e-5]Steps:  45%|████▍     | 6717/15001 [4:18:22<4:12:43,  1.83s/it, loss=0.115, lr=1e-5]Steps:  45%|████▍     | 6718/15001 [4:18:24<4:14:41,  1.84s/it, loss=0.115, lr=1e-5]Steps:  45%|████▍     | 6718/15001 [4:18:24<4:14:41,  1.84s/it, loss=0.166, lr=1e-5]Steps:  45%|████▍     | 6719/15001 [4:18:26<4:18:59,  1.88s/it, loss=0.166, lr=1e-5]Steps:  45%|████▍     | 6719/15001 [4:18:26<4:18:59,  1.88s/it, loss=0.116, lr=1e-5]Steps:  45%|████▍     | 6720/15001 [4:18:28<4:18:37,  1.87s/it, loss=0.116, lr=1e-5]Steps:  45%|████▍     | 6720/15001 [4:18:28<4:18:37,  1.87s/it, loss=0.18, lr=1e-5] Steps:  45%|████▍     | 6721/15001 [4:18:30<4:23:40,  1.91s/it, loss=0.18, lr=1e-5]Steps:  45%|████▍     | 6721/15001 [4:18:30<4:23:40,  1.91s/it, loss=0.0872, lr=1e-5]Steps:  45%|████▍     | 6722/15001 [4:18:32<4:21:01,  1.89s/it, loss=0.0872, lr=1e-5]Steps:  45%|████▍     | 6722/15001 [4:18:32<4:21:01,  1.89s/it, loss=0.138, lr=1e-5] Steps:  45%|████▍     | 6723/15001 [4:18:34<4:32:05,  1.97s/it, loss=0.138, lr=1e-5]Steps:  45%|████▍     | 6723/15001 [4:18:34<4:32:05,  1.97s/it, loss=0.0413, lr=1e-5]Steps:  45%|████▍     | 6724/15001 [4:18:35<4:20:46,  1.89s/it, loss=0.0413, lr=1e-5]Steps:  45%|████▍     | 6724/15001 [4:18:36<4:20:46,  1.89s/it, loss=0.342, lr=1e-5] Steps:  45%|████▍     | 6725/15001 [4:18:37<4:28:28,  1.95s/it, loss=0.342, lr=1e-5]Steps:  45%|████▍     | 6725/15001 [4:18:38<4:28:28,  1.95s/it, loss=0.217, lr=1e-5]Steps:  45%|████▍     | 6726/15001 [4:18:39<4:11:32,  1.82s/it, loss=0.217, lr=1e-5]Steps:  45%|████▍     | 6726/15001 [4:18:39<4:11:32,  1.82s/it, loss=0.229, lr=1e-5]Steps:  45%|████▍     | 6727/15001 [4:18:41<4:18:04,  1.87s/it, loss=0.229, lr=1e-5]Steps:  45%|████▍     | 6727/15001 [4:18:41<4:18:04,  1.87s/it, loss=0.383, lr=1e-5]Steps:  45%|████▍     | 6728/15001 [4:18:43<4:17:59,  1.87s/it, loss=0.383, lr=1e-5]Steps:  45%|████▍     | 6728/15001 [4:18:43<4:17:59,  1.87s/it, loss=0.13, lr=1e-5] Steps:  45%|████▍     | 6729/15001 [4:18:45<4:14:12,  1.84s/it, loss=0.13, lr=1e-5]Steps:  45%|████▍     | 6729/15001 [4:18:45<4:14:12,  1.84s/it, loss=0.0892, lr=1e-5]Steps:  45%|████▍     | 6730/15001 [4:18:46<4:15:25,  1.85s/it, loss=0.0892, lr=1e-5]Steps:  45%|████▍     | 6730/15001 [4:18:47<4:15:25,  1.85s/it, loss=0.115, lr=1e-5] Steps:  45%|████▍     | 6731/15001 [4:18:49<4:25:36,  1.93s/it, loss=0.115, lr=1e-5]Steps:  45%|████▍     | 6731/15001 [4:18:49<4:25:36,  1.93s/it, loss=0.217, lr=1e-5]Steps:  45%|████▍     | 6732/15001 [4:18:50<4:14:06,  1.84s/it, loss=0.217, lr=1e-5]Steps:  45%|████▍     | 6732/15001 [4:18:51<4:14:06,  1.84s/it, loss=0.152, lr=1e-5]Steps:  45%|████▍     | 6733/15001 [4:18:52<4:11:58,  1.83s/it, loss=0.152, lr=1e-5]Steps:  45%|████▍     | 6733/15001 [4:18:52<4:11:58,  1.83s/it, loss=0.107, lr=1e-5]Steps:  45%|████▍     | 6734/15001 [4:18:54<4:13:49,  1.84s/it, loss=0.107, lr=1e-5]Steps:  45%|████▍     | 6734/15001 [4:18:54<4:13:49,  1.84s/it, loss=0.138, lr=1e-5]Steps:  45%|████▍     | 6735/15001 [4:18:56<4:26:06,  1.93s/it, loss=0.138, lr=1e-5]Steps:  45%|████▍     | 6735/15001 [4:18:56<4:26:06,  1.93s/it, loss=0.0379, lr=1e-5]Steps:  45%|████▍     | 6736/15001 [4:18:58<4:13:12,  1.84s/it, loss=0.0379, lr=1e-5]Steps:  45%|████▍     | 6736/15001 [4:18:58<4:13:12,  1.84s/it, loss=0.165, lr=1e-5] Steps:  45%|████▍     | 6737/15001 [4:19:00<4:12:47,  1.84s/it, loss=0.165, lr=1e-5]Steps:  45%|████▍     | 6737/15001 [4:19:00<4:12:47,  1.84s/it, loss=0.17, lr=1e-5] Steps:  45%|████▍     | 6738/15001 [4:19:01<4:04:49,  1.78s/it, loss=0.17, lr=1e-5]Steps:  45%|████▍     | 6738/15001 [4:19:02<4:04:49,  1.78s/it, loss=0.299, lr=1e-5]Steps:  45%|████▍     | 6739/15001 [4:19:03<4:18:16,  1.88s/it, loss=0.299, lr=1e-5]Steps:  45%|████▍     | 6739/15001 [4:19:03<4:18:16,  1.88s/it, loss=0.116, lr=1e-5]Steps:  45%|████▍     | 6740/15001 [4:19:05<4:11:38,  1.83s/it, loss=0.116, lr=1e-5]Steps:  45%|████▍     | 6740/15001 [4:19:05<4:11:38,  1.83s/it, loss=0.218, lr=1e-5]Steps:  45%|████▍     | 6741/15001 [4:19:07<4:12:25,  1.83s/it, loss=0.218, lr=1e-5]Steps:  45%|████▍     | 6741/15001 [4:19:07<4:12:25,  1.83s/it, loss=0.236, lr=1e-5]Steps:  45%|████▍     | 6742/15001 [4:19:09<4:36:41,  2.01s/it, loss=0.236, lr=1e-5]Steps:  45%|████▍     | 6742/15001 [4:19:09<4:36:41,  2.01s/it, loss=0.134, lr=1e-5]Steps:  45%|████▍     | 6743/15001 [4:19:11<4:31:34,  1.97s/it, loss=0.134, lr=1e-5]Steps:  45%|████▍     | 6743/15001 [4:19:11<4:31:34,  1.97s/it, loss=0.172, lr=1e-5]Steps:  45%|████▍     | 6744/15001 [4:19:13<4:36:20,  2.01s/it, loss=0.172, lr=1e-5]Steps:  45%|████▍     | 6744/15001 [4:19:13<4:36:20,  2.01s/it, loss=0.142, lr=1e-5]Steps:  45%|████▍     | 6745/15001 [4:19:15<4:36:59,  2.01s/it, loss=0.142, lr=1e-5]Steps:  45%|████▍     | 6745/15001 [4:19:15<4:36:59,  2.01s/it, loss=0.386, lr=1e-5]Steps:  45%|████▍     | 6746/15001 [4:19:17<4:25:04,  1.93s/it, loss=0.386, lr=1e-5]Steps:  45%|████▍     | 6746/15001 [4:19:17<4:25:04,  1.93s/it, loss=0.0943, lr=1e-5]Steps:  45%|████▍     | 6747/15001 [4:19:19<4:37:21,  2.02s/it, loss=0.0943, lr=1e-5]Steps:  45%|████▍     | 6747/15001 [4:19:19<4:37:21,  2.02s/it, loss=0.205, lr=1e-5] Steps:  45%|████▍     | 6748/15001 [4:19:21<4:30:35,  1.97s/it, loss=0.205, lr=1e-5]Steps:  45%|████▍     | 6748/15001 [4:19:21<4:30:35,  1.97s/it, loss=0.191, lr=1e-5]Steps:  45%|████▍     | 6749/15001 [4:19:23<4:13:45,  1.85s/it, loss=0.191, lr=1e-5]Steps:  45%|████▍     | 6749/15001 [4:19:23<4:13:45,  1.85s/it, loss=0.0374, lr=1e-5]Steps:  45%|████▍     | 6750/15001 [4:19:25<4:21:53,  1.90s/it, loss=0.0374, lr=1e-5]Steps:  45%|████▍     | 6750/15001 [4:19:25<4:21:53,  1.90s/it, loss=0.278, lr=1e-5] Steps:  45%|████▌     | 6751/15001 [4:19:26<4:10:30,  1.82s/it, loss=0.278, lr=1e-5]Steps:  45%|████▌     | 6751/15001 [4:19:27<4:10:30,  1.82s/it, loss=0.281, lr=1e-5]Steps:  45%|████▌     | 6752/15001 [4:19:28<4:13:00,  1.84s/it, loss=0.281, lr=1e-5]Steps:  45%|████▌     | 6752/15001 [4:19:28<4:13:00,  1.84s/it, loss=0.189, lr=1e-5]Steps:  45%|████▌     | 6753/15001 [4:19:30<4:13:09,  1.84s/it, loss=0.189, lr=1e-5]Steps:  45%|████▌     | 6753/15001 [4:19:30<4:13:09,  1.84s/it, loss=0.0707, lr=1e-5]Steps:  45%|████▌     | 6754/15001 [4:19:32<4:18:17,  1.88s/it, loss=0.0707, lr=1e-5]Steps:  45%|████▌     | 6754/15001 [4:19:32<4:18:17,  1.88s/it, loss=0.0821, lr=1e-5]Steps:  45%|████▌     | 6755/15001 [4:19:34<4:14:52,  1.85s/it, loss=0.0821, lr=1e-5]Steps:  45%|████▌     | 6755/15001 [4:19:34<4:14:52,  1.85s/it, loss=0.178, lr=1e-5] Steps:  45%|████▌     | 6756/15001 [4:19:36<4:15:58,  1.86s/it, loss=0.178, lr=1e-5]Steps:  45%|████▌     | 6756/15001 [4:19:36<4:15:58,  1.86s/it, loss=0.162, lr=1e-5]Steps:  45%|████▌     | 6757/15001 [4:19:37<4:07:21,  1.80s/it, loss=0.162, lr=1e-5]Steps:  45%|████▌     | 6757/15001 [4:19:38<4:07:21,  1.80s/it, loss=0.107, lr=1e-5]Steps:  45%|████▌     | 6758/15001 [4:19:39<4:10:52,  1.83s/it, loss=0.107, lr=1e-5]Steps:  45%|████▌     | 6758/15001 [4:19:39<4:10:52,  1.83s/it, loss=0.0737, lr=1e-5]Steps:  45%|████▌     | 6759/15001 [4:19:41<4:07:25,  1.80s/it, loss=0.0737, lr=1e-5]Steps:  45%|████▌     | 6759/15001 [4:19:41<4:07:25,  1.80s/it, loss=0.0231, lr=1e-5]Steps:  45%|████▌     | 6760/15001 [4:19:43<4:06:36,  1.80s/it, loss=0.0231, lr=1e-5]Steps:  45%|████▌     | 6760/15001 [4:19:43<4:06:36,  1.80s/it, loss=0.121, lr=1e-5] Steps:  45%|████▌     | 6761/15001 [4:19:44<4:03:04,  1.77s/it, loss=0.121, lr=1e-5]Steps:  45%|████▌     | 6761/15001 [4:19:45<4:03:04,  1.77s/it, loss=0.0451, lr=1e-5]Steps:  45%|████▌     | 6762/15001 [4:19:46<4:07:53,  1.81s/it, loss=0.0451, lr=1e-5]Steps:  45%|████▌     | 6762/15001 [4:19:47<4:07:53,  1.81s/it, loss=0.162, lr=1e-5] Steps:  45%|████▌     | 6763/15001 [4:19:48<4:16:14,  1.87s/it, loss=0.162, lr=1e-5]Steps:  45%|████▌     | 6763/15001 [4:19:49<4:16:14,  1.87s/it, loss=0.287, lr=1e-5]Steps:  45%|████▌     | 6764/15001 [4:19:50<4:26:22,  1.94s/it, loss=0.287, lr=1e-5]Steps:  45%|████▌     | 6764/15001 [4:19:51<4:26:22,  1.94s/it, loss=0.406, lr=1e-5]Steps:  45%|████▌     | 6765/15001 [4:19:52<4:25:26,  1.93s/it, loss=0.406, lr=1e-5]Steps:  45%|████▌     | 6765/15001 [4:19:52<4:25:26,  1.93s/it, loss=0.311, lr=1e-5]Steps:  45%|████▌     | 6766/15001 [4:19:54<4:23:43,  1.92s/it, loss=0.311, lr=1e-5]Steps:  45%|████▌     | 6766/15001 [4:19:54<4:23:43,  1.92s/it, loss=0.142, lr=1e-5]Steps:  45%|████▌     | 6767/15001 [4:19:56<4:13:27,  1.85s/it, loss=0.142, lr=1e-5]Steps:  45%|████▌     | 6767/15001 [4:19:56<4:13:27,  1.85s/it, loss=0.138, lr=1e-5]Steps:  45%|████▌     | 6768/15001 [4:19:58<4:34:34,  2.00s/it, loss=0.138, lr=1e-5]Steps:  45%|████▌     | 6768/15001 [4:19:58<4:34:34,  2.00s/it, loss=0.16, lr=1e-5] Steps:  45%|████▌     | 6769/15001 [4:20:00<4:33:01,  1.99s/it, loss=0.16, lr=1e-5]Steps:  45%|████▌     | 6769/15001 [4:20:00<4:33:01,  1.99s/it, loss=0.0485, lr=1e-5]Steps:  45%|████▌     | 6770/15001 [4:20:02<4:31:16,  1.98s/it, loss=0.0485, lr=1e-5]Steps:  45%|████▌     | 6770/15001 [4:20:02<4:31:16,  1.98s/it, loss=0.226, lr=1e-5] Steps:  45%|████▌     | 6771/15001 [4:20:04<4:18:21,  1.88s/it, loss=0.226, lr=1e-5]Steps:  45%|████▌     | 6771/15001 [4:20:04<4:18:21,  1.88s/it, loss=0.191, lr=1e-5]Steps:  45%|████▌     | 6772/15001 [4:20:06<4:21:24,  1.91s/it, loss=0.191, lr=1e-5]Steps:  45%|████▌     | 6772/15001 [4:20:06<4:21:24,  1.91s/it, loss=0.133, lr=1e-5]Steps:  45%|████▌     | 6773/15001 [4:20:07<4:06:46,  1.80s/it, loss=0.133, lr=1e-5]Steps:  45%|████▌     | 6773/15001 [4:20:08<4:06:46,  1.80s/it, loss=0.227, lr=1e-5]Steps:  45%|████▌     | 6774/15001 [4:20:09<4:16:16,  1.87s/it, loss=0.227, lr=1e-5]Steps:  45%|████▌     | 6774/15001 [4:20:09<4:16:16,  1.87s/it, loss=0.182, lr=1e-5]Steps:  45%|████▌     | 6775/15001 [4:20:11<4:06:30,  1.80s/it, loss=0.182, lr=1e-5]Steps:  45%|████▌     | 6775/15001 [4:20:11<4:06:30,  1.80s/it, loss=0.0733, lr=1e-5]Steps:  45%|████▌     | 6776/15001 [4:20:13<4:15:16,  1.86s/it, loss=0.0733, lr=1e-5]Steps:  45%|████▌     | 6776/15001 [4:20:13<4:15:16,  1.86s/it, loss=0.116, lr=1e-5] Steps:  45%|████▌     | 6777/15001 [4:20:15<4:14:34,  1.86s/it, loss=0.116, lr=1e-5]Steps:  45%|████▌     | 6777/15001 [4:20:15<4:14:34,  1.86s/it, loss=0.155, lr=1e-5]Steps:  45%|████▌     | 6778/15001 [4:20:16<4:01:12,  1.76s/it, loss=0.155, lr=1e-5]Steps:  45%|████▌     | 6778/15001 [4:20:17<4:01:12,  1.76s/it, loss=0.282, lr=1e-5]Steps:  45%|████▌     | 6779/15001 [4:20:18<4:13:59,  1.85s/it, loss=0.282, lr=1e-5]Steps:  45%|████▌     | 6779/15001 [4:20:19<4:13:59,  1.85s/it, loss=0.132, lr=1e-5]Steps:  45%|████▌     | 6780/15001 [4:20:20<4:12:38,  1.84s/it, loss=0.132, lr=1e-5]Steps:  45%|████▌     | 6780/15001 [4:20:20<4:12:38,  1.84s/it, loss=0.0307, lr=1e-5]Steps:  45%|████▌     | 6781/15001 [4:20:22<4:07:06,  1.80s/it, loss=0.0307, lr=1e-5]Steps:  45%|████▌     | 6781/15001 [4:20:22<4:07:06,  1.80s/it, loss=0.103, lr=1e-5] Steps:  45%|████▌     | 6782/15001 [4:20:24<4:07:46,  1.81s/it, loss=0.103, lr=1e-5]Steps:  45%|████▌     | 6782/15001 [4:20:24<4:07:46,  1.81s/it, loss=0.327, lr=1e-5]Steps:  45%|████▌     | 6783/15001 [4:20:26<4:04:30,  1.79s/it, loss=0.327, lr=1e-5]Steps:  45%|████▌     | 6783/15001 [4:20:26<4:04:30,  1.79s/it, loss=0.0122, lr=1e-5]Steps:  45%|████▌     | 6784/15001 [4:20:28<4:12:24,  1.84s/it, loss=0.0122, lr=1e-5]Steps:  45%|████▌     | 6784/15001 [4:20:28<4:12:24,  1.84s/it, loss=0.166, lr=1e-5] Steps:  45%|████▌     | 6785/15001 [4:20:29<4:11:52,  1.84s/it, loss=0.166, lr=1e-5]Steps:  45%|████▌     | 6785/15001 [4:20:30<4:11:52,  1.84s/it, loss=0.0459, lr=1e-5]Steps:  45%|████▌     | 6786/15001 [4:20:31<4:16:52,  1.88s/it, loss=0.0459, lr=1e-5]Steps:  45%|████▌     | 6786/15001 [4:20:31<4:16:52,  1.88s/it, loss=0.257, lr=1e-5] Steps:  45%|████▌     | 6787/15001 [4:20:33<4:13:54,  1.85s/it, loss=0.257, lr=1e-5]Steps:  45%|████▌     | 6787/15001 [4:20:33<4:13:54,  1.85s/it, loss=0.212, lr=1e-5]Steps:  45%|████▌     | 6788/15001 [4:20:35<4:26:53,  1.95s/it, loss=0.212, lr=1e-5]Steps:  45%|████▌     | 6788/15001 [4:20:36<4:26:53,  1.95s/it, loss=0.181, lr=1e-5]Steps:  45%|████▌     | 6789/15001 [4:20:37<4:33:46,  2.00s/it, loss=0.181, lr=1e-5]Steps:  45%|████▌     | 6789/15001 [4:20:37<4:33:46,  2.00s/it, loss=0.355, lr=1e-5]Steps:  45%|████▌     | 6790/15001 [4:20:39<4:27:39,  1.96s/it, loss=0.355, lr=1e-5]Steps:  45%|████▌     | 6790/15001 [4:20:39<4:27:39,  1.96s/it, loss=0.289, lr=1e-5]Steps:  45%|████▌     | 6791/15001 [4:20:41<4:25:51,  1.94s/it, loss=0.289, lr=1e-5]Steps:  45%|████▌     | 6791/15001 [4:20:41<4:25:51,  1.94s/it, loss=0.201, lr=1e-5]Steps:  45%|████▌     | 6792/15001 [4:20:43<4:30:04,  1.97s/it, loss=0.201, lr=1e-5]Steps:  45%|████▌     | 6792/15001 [4:20:43<4:30:04,  1.97s/it, loss=0.0894, lr=1e-5]Steps:  45%|████▌     | 6793/15001 [4:20:45<4:28:47,  1.96s/it, loss=0.0894, lr=1e-5]Steps:  45%|████▌     | 6793/15001 [4:20:45<4:28:47,  1.96s/it, loss=0.161, lr=1e-5] Steps:  45%|████▌     | 6794/15001 [4:20:47<4:31:06,  1.98s/it, loss=0.161, lr=1e-5]Steps:  45%|████▌     | 6794/15001 [4:20:47<4:31:06,  1.98s/it, loss=0.171, lr=1e-5]Steps:  45%|████▌     | 6795/15001 [4:20:49<4:27:24,  1.96s/it, loss=0.171, lr=1e-5]Steps:  45%|████▌     | 6795/15001 [4:20:49<4:27:24,  1.96s/it, loss=0.209, lr=1e-5]Steps:  45%|████▌     | 6796/15001 [4:20:51<4:19:09,  1.90s/it, loss=0.209, lr=1e-5]Steps:  45%|████▌     | 6796/15001 [4:20:51<4:19:09,  1.90s/it, loss=0.119, lr=1e-5]Steps:  45%|████▌     | 6797/15001 [4:20:53<4:14:04,  1.86s/it, loss=0.119, lr=1e-5]Steps:  45%|████▌     | 6797/15001 [4:20:53<4:14:04,  1.86s/it, loss=0.182, lr=1e-5]Steps:  45%|████▌     | 6798/15001 [4:20:55<4:14:37,  1.86s/it, loss=0.182, lr=1e-5]Steps:  45%|████▌     | 6798/15001 [4:20:55<4:14:37,  1.86s/it, loss=0.0182, lr=1e-5]Steps:  45%|████▌     | 6799/15001 [4:20:56<4:08:35,  1.82s/it, loss=0.0182, lr=1e-5]Steps:  45%|████▌     | 6799/15001 [4:20:57<4:08:35,  1.82s/it, loss=0.00545, lr=1e-5]Steps:  45%|████▌     | 6800/15001 [4:20:58<4:10:59,  1.84s/it, loss=0.00545, lr=1e-5]Steps:  45%|████▌     | 6800/15001 [4:20:58<4:10:59,  1.84s/it, loss=0.0953, lr=1e-5] Steps:  45%|████▌     | 6801/15001 [4:21:00<4:21:41,  1.91s/it, loss=0.0953, lr=1e-5]Steps:  45%|████▌     | 6801/15001 [4:21:00<4:21:41,  1.91s/it, loss=0.223, lr=1e-5] Steps:  45%|████▌     | 6802/15001 [4:21:02<4:07:46,  1.81s/it, loss=0.223, lr=1e-5]Steps:  45%|████▌     | 6802/15001 [4:21:02<4:07:46,  1.81s/it, loss=0.336, lr=1e-5]Steps:  45%|████▌     | 6803/15001 [4:21:04<4:13:12,  1.85s/it, loss=0.336, lr=1e-5]Steps:  45%|████▌     | 6803/15001 [4:21:04<4:13:12,  1.85s/it, loss=0.0702, lr=1e-5]Steps:  45%|████▌     | 6804/15001 [4:21:06<4:12:52,  1.85s/it, loss=0.0702, lr=1e-5]Steps:  45%|████▌     | 6804/15001 [4:21:06<4:12:52,  1.85s/it, loss=0.184, lr=1e-5] Steps:  45%|████▌     | 6805/15001 [4:21:08<4:16:26,  1.88s/it, loss=0.184, lr=1e-5]Steps:  45%|████▌     | 6805/15001 [4:21:08<4:16:26,  1.88s/it, loss=0.219, lr=1e-5]Steps:  45%|████▌     | 6806/15001 [4:21:09<4:15:47,  1.87s/it, loss=0.219, lr=1e-5]Steps:  45%|████▌     | 6806/15001 [4:21:09<4:15:47,  1.87s/it, loss=0.302, lr=1e-5]Steps:  45%|████▌     | 6807/15001 [4:21:11<4:09:28,  1.83s/it, loss=0.302, lr=1e-5]Steps:  45%|████▌     | 6807/15001 [4:21:11<4:09:28,  1.83s/it, loss=0.167, lr=1e-5]Steps:  45%|████▌     | 6808/15001 [4:21:13<4:06:43,  1.81s/it, loss=0.167, lr=1e-5]Steps:  45%|████▌     | 6808/15001 [4:21:13<4:06:43,  1.81s/it, loss=0.188, lr=1e-5]Steps:  45%|████▌     | 6809/15001 [4:21:14<4:00:07,  1.76s/it, loss=0.188, lr=1e-5]Steps:  45%|████▌     | 6809/15001 [4:21:15<4:00:07,  1.76s/it, loss=0.0742, lr=1e-5]Steps:  45%|████▌     | 6810/15001 [4:21:16<4:08:36,  1.82s/it, loss=0.0742, lr=1e-5]Steps:  45%|████▌     | 6810/15001 [4:21:17<4:08:36,  1.82s/it, loss=0.178, lr=1e-5] Steps:  45%|████▌     | 6811/15001 [4:21:18<4:13:53,  1.86s/it, loss=0.178, lr=1e-5]Steps:  45%|████▌     | 6811/15001 [4:21:19<4:13:53,  1.86s/it, loss=0.274, lr=1e-5]Steps:  45%|████▌     | 6812/15001 [4:21:21<4:28:10,  1.96s/it, loss=0.274, lr=1e-5]Steps:  45%|████▌     | 6812/15001 [4:21:21<4:28:10,  1.96s/it, loss=0.205, lr=1e-5]Steps:  45%|████▌     | 6813/15001 [4:21:23<4:33:32,  2.00s/it, loss=0.205, lr=1e-5]Steps:  45%|████▌     | 6813/15001 [4:21:23<4:33:32,  2.00s/it, loss=0.0556, lr=1e-5]Steps:  45%|████▌     | 6814/15001 [4:21:25<4:25:48,  1.95s/it, loss=0.0556, lr=1e-5]Steps:  45%|████▌     | 6814/15001 [4:21:25<4:25:48,  1.95s/it, loss=0.174, lr=1e-5] Steps:  45%|████▌     | 6815/15001 [4:21:26<4:24:58,  1.94s/it, loss=0.174, lr=1e-5]Steps:  45%|████▌     | 6815/15001 [4:21:27<4:24:58,  1.94s/it, loss=0.0644, lr=1e-5]Steps:  45%|████▌     | 6816/15001 [4:21:29<4:31:34,  1.99s/it, loss=0.0644, lr=1e-5]Steps:  45%|████▌     | 6816/15001 [4:21:29<4:31:34,  1.99s/it, loss=0.157, lr=1e-5] Steps:  45%|████▌     | 6817/15001 [4:21:30<4:21:36,  1.92s/it, loss=0.157, lr=1e-5]Steps:  45%|████▌     | 6817/15001 [4:21:30<4:21:36,  1.92s/it, loss=0.0663, lr=1e-5]Steps:  45%|████▌     | 6818/15001 [4:21:32<4:17:02,  1.88s/it, loss=0.0663, lr=1e-5]Steps:  45%|████▌     | 6818/15001 [4:21:32<4:17:02,  1.88s/it, loss=0.134, lr=1e-5] Steps:  45%|████▌     | 6819/15001 [4:21:34<4:17:47,  1.89s/it, loss=0.134, lr=1e-5]Steps:  45%|████▌     | 6819/15001 [4:21:34<4:17:47,  1.89s/it, loss=0.093, lr=1e-5]Steps:  45%|████▌     | 6820/15001 [4:21:36<4:08:25,  1.82s/it, loss=0.093, lr=1e-5]Steps:  45%|████▌     | 6820/15001 [4:21:36<4:08:25,  1.82s/it, loss=0.214, lr=1e-5]Steps:  45%|████▌     | 6821/15001 [4:21:37<4:07:27,  1.82s/it, loss=0.214, lr=1e-5]Steps:  45%|████▌     | 6821/15001 [4:21:38<4:07:27,  1.82s/it, loss=0.237, lr=1e-5]Steps:  45%|████▌     | 6822/15001 [4:21:40<4:16:33,  1.88s/it, loss=0.237, lr=1e-5]Steps:  45%|████▌     | 6822/15001 [4:21:40<4:16:33,  1.88s/it, loss=0.102, lr=1e-5]Steps:  45%|████▌     | 6823/15001 [4:21:41<4:14:26,  1.87s/it, loss=0.102, lr=1e-5]Steps:  45%|████▌     | 6823/15001 [4:21:41<4:14:26,  1.87s/it, loss=0.178, lr=1e-5]Steps:  45%|████▌     | 6824/15001 [4:21:43<4:10:38,  1.84s/it, loss=0.178, lr=1e-5]Steps:  45%|████▌     | 6824/15001 [4:21:43<4:10:38,  1.84s/it, loss=0.188, lr=1e-5]Steps:  45%|████▌     | 6825/15001 [4:21:45<3:55:09,  1.73s/it, loss=0.188, lr=1e-5]Steps:  45%|████▌     | 6825/15001 [4:21:45<3:55:09,  1.73s/it, loss=0.133, lr=1e-5]Steps:  46%|████▌     | 6826/15001 [4:21:47<4:16:52,  1.89s/it, loss=0.133, lr=1e-5]Steps:  46%|████▌     | 6826/15001 [4:21:47<4:16:52,  1.89s/it, loss=0.156, lr=1e-5]Steps:  46%|████▌     | 6827/15001 [4:21:49<4:14:23,  1.87s/it, loss=0.156, lr=1e-5]Steps:  46%|████▌     | 6827/15001 [4:21:49<4:14:23,  1.87s/it, loss=0.191, lr=1e-5]Steps:  46%|████▌     | 6828/15001 [4:21:50<4:09:32,  1.83s/it, loss=0.191, lr=1e-5]Steps:  46%|████▌     | 6828/15001 [4:21:51<4:09:32,  1.83s/it, loss=0.147, lr=1e-5]Steps:  46%|████▌     | 6829/15001 [4:21:52<4:05:31,  1.80s/it, loss=0.147, lr=1e-5]Steps:  46%|████▌     | 6829/15001 [4:21:53<4:05:31,  1.80s/it, loss=0.0961, lr=1e-5]Steps:  46%|████▌     | 6830/15001 [4:21:54<4:14:08,  1.87s/it, loss=0.0961, lr=1e-5]Steps:  46%|████▌     | 6830/15001 [4:21:54<4:14:08,  1.87s/it, loss=0.127, lr=1e-5] Steps:  46%|████▌     | 6831/15001 [4:21:56<4:02:20,  1.78s/it, loss=0.127, lr=1e-5]Steps:  46%|████▌     | 6831/15001 [4:21:56<4:02:20,  1.78s/it, loss=0.191, lr=1e-5]Steps:  46%|████▌     | 6832/15001 [4:21:58<4:15:44,  1.88s/it, loss=0.191, lr=1e-5]Steps:  46%|████▌     | 6832/15001 [4:21:58<4:15:44,  1.88s/it, loss=0.244, lr=1e-5]Steps:  46%|████▌     | 6833/15001 [4:22:00<4:14:46,  1.87s/it, loss=0.244, lr=1e-5]Steps:  46%|████▌     | 6833/15001 [4:22:00<4:14:46,  1.87s/it, loss=0.117, lr=1e-5]Steps:  46%|████▌     | 6834/15001 [4:22:02<4:18:44,  1.90s/it, loss=0.117, lr=1e-5]Steps:  46%|████▌     | 6834/15001 [4:22:02<4:18:44,  1.90s/it, loss=0.161, lr=1e-5]Steps:  46%|████▌     | 6835/15001 [4:22:04<4:29:34,  1.98s/it, loss=0.161, lr=1e-5]Steps:  46%|████▌     | 6835/15001 [4:22:04<4:29:34,  1.98s/it, loss=0.13, lr=1e-5] Steps:  46%|████▌     | 6836/15001 [4:22:06<4:25:14,  1.95s/it, loss=0.13, lr=1e-5]Steps:  46%|████▌     | 6836/15001 [4:22:06<4:25:14,  1.95s/it, loss=0.143, lr=1e-5]Steps:  46%|████▌     | 6837/15001 [4:22:08<4:26:04,  1.96s/it, loss=0.143, lr=1e-5]Steps:  46%|████▌     | 6837/15001 [4:22:08<4:26:04,  1.96s/it, loss=0.171, lr=1e-5]Steps:  46%|████▌     | 6838/15001 [4:22:10<4:33:07,  2.01s/it, loss=0.171, lr=1e-5]Steps:  46%|████▌     | 6838/15001 [4:22:10<4:33:07,  2.01s/it, loss=0.283, lr=1e-5]Steps:  46%|████▌     | 6839/15001 [4:22:12<4:28:23,  1.97s/it, loss=0.283, lr=1e-5]Steps:  46%|████▌     | 6839/15001 [4:22:12<4:28:23,  1.97s/it, loss=0.215, lr=1e-5]Steps:  46%|████▌     | 6840/15001 [4:22:14<4:22:01,  1.93s/it, loss=0.215, lr=1e-5]Steps:  46%|████▌     | 6840/15001 [4:22:14<4:22:01,  1.93s/it, loss=0.194, lr=1e-5]Steps:  46%|████▌     | 6841/15001 [4:22:15<4:10:19,  1.84s/it, loss=0.194, lr=1e-5]Steps:  46%|████▌     | 6841/15001 [4:22:15<4:10:19,  1.84s/it, loss=0.3, lr=1e-5]  Steps:  46%|████▌     | 6842/15001 [4:22:17<4:19:51,  1.91s/it, loss=0.3, lr=1e-5]Steps:  46%|████▌     | 6842/15001 [4:22:17<4:19:51,  1.91s/it, loss=0.215, lr=1e-5]Steps:  46%|████▌     | 6843/15001 [4:22:19<4:02:56,  1.79s/it, loss=0.215, lr=1e-5]Steps:  46%|████▌     | 6843/15001 [4:22:19<4:02:56,  1.79s/it, loss=0.323, lr=1e-5]Steps:  46%|████▌     | 6844/15001 [4:22:21<4:05:44,  1.81s/it, loss=0.323, lr=1e-5]Steps:  46%|████▌     | 6844/15001 [4:22:21<4:05:44,  1.81s/it, loss=0.0722, lr=1e-5]Steps:  46%|████▌     | 6845/15001 [4:22:22<4:02:43,  1.79s/it, loss=0.0722, lr=1e-5]Steps:  46%|████▌     | 6845/15001 [4:22:23<4:02:43,  1.79s/it, loss=0.0924, lr=1e-5]Steps:  46%|████▌     | 6846/15001 [4:22:24<4:17:36,  1.90s/it, loss=0.0924, lr=1e-5]Steps:  46%|████▌     | 6846/15001 [4:22:25<4:17:36,  1.90s/it, loss=0.229, lr=1e-5] Steps:  46%|████▌     | 6847/15001 [4:22:26<4:16:34,  1.89s/it, loss=0.229, lr=1e-5]Steps:  46%|████▌     | 6847/15001 [4:22:27<4:16:34,  1.89s/it, loss=0.0616, lr=1e-5]Steps:  46%|████▌     | 6848/15001 [4:22:28<4:15:39,  1.88s/it, loss=0.0616, lr=1e-5]Steps:  46%|████▌     | 6848/15001 [4:22:28<4:15:39,  1.88s/it, loss=0.11, lr=1e-5]  Steps:  46%|████▌     | 6849/15001 [4:22:30<4:08:27,  1.83s/it, loss=0.11, lr=1e-5]Steps:  46%|████▌     | 6849/15001 [4:22:30<4:08:27,  1.83s/it, loss=0.109, lr=1e-5]Steps:  46%|████▌     | 6850/15001 [4:22:32<4:01:46,  1.78s/it, loss=0.109, lr=1e-5]Steps:  46%|████▌     | 6850/15001 [4:22:32<4:01:46,  1.78s/it, loss=0.0643, lr=1e-5]Steps:  46%|████▌     | 6851/15001 [4:22:34<4:11:02,  1.85s/it, loss=0.0643, lr=1e-5]Steps:  46%|████▌     | 6851/15001 [4:22:34<4:11:02,  1.85s/it, loss=0.157, lr=1e-5] Steps:  46%|████▌     | 6852/15001 [4:22:35<4:03:26,  1.79s/it, loss=0.157, lr=1e-5]Steps:  46%|████▌     | 6852/15001 [4:22:36<4:03:26,  1.79s/it, loss=0.178, lr=1e-5]Steps:  46%|████▌     | 6853/15001 [4:22:37<4:07:52,  1.83s/it, loss=0.178, lr=1e-5]Steps:  46%|████▌     | 6853/15001 [4:22:37<4:07:52,  1.83s/it, loss=0.223, lr=1e-5]Steps:  46%|████▌     | 6854/15001 [4:22:39<4:06:09,  1.81s/it, loss=0.223, lr=1e-5]Steps:  46%|████▌     | 6854/15001 [4:22:39<4:06:09,  1.81s/it, loss=0.171, lr=1e-5]Steps:  46%|████▌     | 6855/15001 [4:22:41<4:09:09,  1.84s/it, loss=0.171, lr=1e-5]Steps:  46%|████▌     | 6855/15001 [4:22:41<4:09:09,  1.84s/it, loss=0.0265, lr=1e-5]Steps:  46%|████▌     | 6856/15001 [4:22:43<4:24:53,  1.95s/it, loss=0.0265, lr=1e-5]Steps:  46%|████▌     | 6856/15001 [4:22:43<4:24:53,  1.95s/it, loss=0.0989, lr=1e-5]Steps:  46%|████▌     | 6857/15001 [4:22:45<4:12:21,  1.86s/it, loss=0.0989, lr=1e-5]Steps:  46%|████▌     | 6857/15001 [4:22:45<4:12:21,  1.86s/it, loss=0.105, lr=1e-5] Steps:  46%|████▌     | 6858/15001 [4:22:47<4:28:28,  1.98s/it, loss=0.105, lr=1e-5]Steps:  46%|████▌     | 6858/15001 [4:22:47<4:28:28,  1.98s/it, loss=0.0513, lr=1e-5]Steps:  46%|████▌     | 6859/15001 [4:22:49<4:16:03,  1.89s/it, loss=0.0513, lr=1e-5]Steps:  46%|████▌     | 6859/15001 [4:22:49<4:16:03,  1.89s/it, loss=0.171, lr=1e-5] Steps:  46%|████▌     | 6860/15001 [4:22:51<4:29:32,  1.99s/it, loss=0.171, lr=1e-5]Steps:  46%|████▌     | 6860/15001 [4:22:51<4:29:32,  1.99s/it, loss=0.227, lr=1e-5]Steps:  46%|████▌     | 6861/15001 [4:22:53<4:26:39,  1.97s/it, loss=0.227, lr=1e-5]Steps:  46%|████▌     | 6861/15001 [4:22:53<4:26:39,  1.97s/it, loss=0.228, lr=1e-5]Steps:  46%|████▌     | 6862/15001 [4:22:55<4:29:32,  1.99s/it, loss=0.228, lr=1e-5]Steps:  46%|████▌     | 6862/15001 [4:22:55<4:29:32,  1.99s/it, loss=0.0635, lr=1e-5]Steps:  46%|████▌     | 6863/15001 [4:22:57<4:20:28,  1.92s/it, loss=0.0635, lr=1e-5]Steps:  46%|████▌     | 6863/15001 [4:22:57<4:20:28,  1.92s/it, loss=0.226, lr=1e-5] Steps:  46%|████▌     | 6864/15001 [4:22:58<4:08:53,  1.84s/it, loss=0.226, lr=1e-5]Steps:  46%|████▌     | 6864/15001 [4:22:59<4:08:53,  1.84s/it, loss=0.0539, lr=1e-5]Steps:  46%|████▌     | 6865/15001 [4:23:00<4:12:28,  1.86s/it, loss=0.0539, lr=1e-5]Steps:  46%|████▌     | 6865/15001 [4:23:00<4:12:28,  1.86s/it, loss=0.29, lr=1e-5]  Steps:  46%|████▌     | 6866/15001 [4:23:02<4:16:57,  1.90s/it, loss=0.29, lr=1e-5]Steps:  46%|████▌     | 6866/15001 [4:23:02<4:16:57,  1.90s/it, loss=0.157, lr=1e-5]Steps:  46%|████▌     | 6867/15001 [4:23:04<4:14:00,  1.87s/it, loss=0.157, lr=1e-5]Steps:  46%|████▌     | 6867/15001 [4:23:04<4:14:00,  1.87s/it, loss=0.14, lr=1e-5] Steps:  46%|████▌     | 6868/15001 [4:23:06<4:09:20,  1.84s/it, loss=0.14, lr=1e-5]Steps:  46%|████▌     | 6868/15001 [4:23:06<4:09:20,  1.84s/it, loss=0.0666, lr=1e-5]Steps:  46%|████▌     | 6869/15001 [4:23:07<3:58:21,  1.76s/it, loss=0.0666, lr=1e-5]Steps:  46%|████▌     | 6869/15001 [4:23:08<3:58:21,  1.76s/it, loss=0.221, lr=1e-5] Steps:  46%|████▌     | 6870/15001 [4:23:09<4:11:35,  1.86s/it, loss=0.221, lr=1e-5]Steps:  46%|████▌     | 6870/15001 [4:23:09<4:11:35,  1.86s/it, loss=0.282, lr=1e-5]Steps:  46%|████▌     | 6871/15001 [4:23:11<4:05:12,  1.81s/it, loss=0.282, lr=1e-5]Steps:  46%|████▌     | 6871/15001 [4:23:11<4:05:12,  1.81s/it, loss=0.121, lr=1e-5]Steps:  46%|████▌     | 6872/15001 [4:23:13<4:12:06,  1.86s/it, loss=0.121, lr=1e-5]Steps:  46%|████▌     | 6872/15001 [4:23:13<4:12:06,  1.86s/it, loss=0.27, lr=1e-5] Steps:  46%|████▌     | 6873/15001 [4:23:15<4:15:21,  1.89s/it, loss=0.27, lr=1e-5]Steps:  46%|████▌     | 6873/15001 [4:23:15<4:15:21,  1.89s/it, loss=0.2, lr=1e-5] Steps:  46%|████▌     | 6874/15001 [4:23:17<4:08:16,  1.83s/it, loss=0.2, lr=1e-5]Steps:  46%|████▌     | 6874/15001 [4:23:17<4:08:16,  1.83s/it, loss=0.153, lr=1e-5]Steps:  46%|████▌     | 6875/15001 [4:23:18<4:06:16,  1.82s/it, loss=0.153, lr=1e-5]Steps:  46%|████▌     | 6875/15001 [4:23:19<4:06:16,  1.82s/it, loss=0.214, lr=1e-5]Steps:  46%|████▌     | 6876/15001 [4:23:20<4:02:35,  1.79s/it, loss=0.214, lr=1e-5]Steps:  46%|████▌     | 6876/15001 [4:23:21<4:02:35,  1.79s/it, loss=0.189, lr=1e-5]Steps:  46%|████▌     | 6877/15001 [4:23:22<4:15:35,  1.89s/it, loss=0.189, lr=1e-5]Steps:  46%|████▌     | 6877/15001 [4:23:22<4:15:35,  1.89s/it, loss=0.0904, lr=1e-5]Steps:  46%|████▌     | 6878/15001 [4:23:24<4:14:27,  1.88s/it, loss=0.0904, lr=1e-5]Steps:  46%|████▌     | 6878/15001 [4:23:24<4:14:27,  1.88s/it, loss=0.21, lr=1e-5]  Steps:  46%|████▌     | 6879/15001 [4:23:26<4:27:28,  1.98s/it, loss=0.21, lr=1e-5]Steps:  46%|████▌     | 6879/15001 [4:23:27<4:27:28,  1.98s/it, loss=0.335, lr=1e-5]Steps:  46%|████▌     | 6880/15001 [4:23:28<4:28:30,  1.98s/it, loss=0.335, lr=1e-5]Steps:  46%|████▌     | 6880/15001 [4:23:28<4:28:30,  1.98s/it, loss=0.0435, lr=1e-5]Steps:  46%|████▌     | 6881/15001 [4:23:30<4:27:37,  1.98s/it, loss=0.0435, lr=1e-5]Steps:  46%|████▌     | 6881/15001 [4:23:30<4:27:37,  1.98s/it, loss=0.0984, lr=1e-5]Steps:  46%|████▌     | 6882/15001 [4:23:32<4:26:31,  1.97s/it, loss=0.0984, lr=1e-5]Steps:  46%|████▌     | 6882/15001 [4:23:32<4:26:31,  1.97s/it, loss=0.0728, lr=1e-5]Steps:  46%|████▌     | 6883/15001 [4:23:34<4:25:06,  1.96s/it, loss=0.0728, lr=1e-5]Steps:  46%|████▌     | 6883/15001 [4:23:34<4:25:06,  1.96s/it, loss=0.423, lr=1e-5] Steps:  46%|████▌     | 6884/15001 [4:23:36<4:27:23,  1.98s/it, loss=0.423, lr=1e-5]Steps:  46%|████▌     | 6884/15001 [4:23:36<4:27:23,  1.98s/it, loss=0.145, lr=1e-5]Steps:  46%|████▌     | 6885/15001 [4:23:38<4:20:29,  1.93s/it, loss=0.145, lr=1e-5]Steps:  46%|████▌     | 6885/15001 [4:23:38<4:20:29,  1.93s/it, loss=0.0772, lr=1e-5]Steps:  46%|████▌     | 6886/15001 [4:23:40<4:09:34,  1.85s/it, loss=0.0772, lr=1e-5]Steps:  46%|████▌     | 6886/15001 [4:23:40<4:09:34,  1.85s/it, loss=0.339, lr=1e-5] Steps:  46%|████▌     | 6887/15001 [4:23:42<4:13:48,  1.88s/it, loss=0.339, lr=1e-5]Steps:  46%|████▌     | 6887/15001 [4:23:42<4:13:48,  1.88s/it, loss=0.0229, lr=1e-5]Steps:  46%|████▌     | 6888/15001 [4:23:43<4:09:42,  1.85s/it, loss=0.0229, lr=1e-5]Steps:  46%|████▌     | 6888/15001 [4:23:44<4:09:42,  1.85s/it, loss=0.121, lr=1e-5] Steps:  46%|████▌     | 6889/15001 [4:23:45<4:10:43,  1.85s/it, loss=0.121, lr=1e-5]Steps:  46%|████▌     | 6889/15001 [4:23:45<4:10:43,  1.85s/it, loss=0.0824, lr=1e-5]Steps:  46%|████▌     | 6890/15001 [4:23:47<4:06:54,  1.83s/it, loss=0.0824, lr=1e-5]Steps:  46%|████▌     | 6890/15001 [4:23:47<4:06:54,  1.83s/it, loss=0.207, lr=1e-5] Steps:  46%|████▌     | 6891/15001 [4:23:49<4:09:57,  1.85s/it, loss=0.207, lr=1e-5]Steps:  46%|████▌     | 6891/15001 [4:23:49<4:09:57,  1.85s/it, loss=0.215, lr=1e-5]Steps:  46%|████▌     | 6892/15001 [4:23:51<4:04:01,  1.81s/it, loss=0.215, lr=1e-5]Steps:  46%|████▌     | 6892/15001 [4:23:51<4:04:01,  1.81s/it, loss=0.0574, lr=1e-5]Steps:  46%|████▌     | 6893/15001 [4:23:53<4:05:53,  1.82s/it, loss=0.0574, lr=1e-5]Steps:  46%|████▌     | 6893/15001 [4:23:53<4:05:53,  1.82s/it, loss=0.0938, lr=1e-5]Steps:  46%|████▌     | 6894/15001 [4:23:54<3:58:36,  1.77s/it, loss=0.0938, lr=1e-5]Steps:  46%|████▌     | 6894/15001 [4:23:54<3:58:36,  1.77s/it, loss=0.0922, lr=1e-5]Steps:  46%|████▌     | 6895/15001 [4:23:56<4:06:47,  1.83s/it, loss=0.0922, lr=1e-5]Steps:  46%|████▌     | 6895/15001 [4:23:56<4:06:47,  1.83s/it, loss=0.225, lr=1e-5] Steps:  46%|████▌     | 6896/15001 [4:23:58<4:01:16,  1.79s/it, loss=0.225, lr=1e-5]Steps:  46%|████▌     | 6896/15001 [4:23:58<4:01:16,  1.79s/it, loss=0.236, lr=1e-5]Steps:  46%|████▌     | 6897/15001 [4:24:00<4:02:00,  1.79s/it, loss=0.236, lr=1e-5]Steps:  46%|████▌     | 6897/15001 [4:24:00<4:02:00,  1.79s/it, loss=0.0531, lr=1e-5]Steps:  46%|████▌     | 6898/15001 [4:24:01<4:00:36,  1.78s/it, loss=0.0531, lr=1e-5]Steps:  46%|████▌     | 6898/15001 [4:24:02<4:00:36,  1.78s/it, loss=0.243, lr=1e-5] Steps:  46%|████▌     | 6899/15001 [4:24:03<4:01:57,  1.79s/it, loss=0.243, lr=1e-5]Steps:  46%|████▌     | 6899/15001 [4:24:03<4:01:57,  1.79s/it, loss=0.124, lr=1e-5]Steps:  46%|████▌     | 6900/15001 [4:24:05<4:05:29,  1.82s/it, loss=0.124, lr=1e-5]Steps:  46%|████▌     | 6900/15001 [4:24:05<4:05:29,  1.82s/it, loss=0.19, lr=1e-5] Steps:  46%|████▌     | 6901/15001 [4:24:07<4:08:01,  1.84s/it, loss=0.19, lr=1e-5]Steps:  46%|████▌     | 6901/15001 [4:24:07<4:08:01,  1.84s/it, loss=0.108, lr=1e-5]Steps:  46%|████▌     | 6902/15001 [4:24:09<4:12:01,  1.87s/it, loss=0.108, lr=1e-5]Steps:  46%|████▌     | 6902/15001 [4:24:09<4:12:01,  1.87s/it, loss=0.094, lr=1e-5]Steps:  46%|████▌     | 6903/15001 [4:24:11<4:08:01,  1.84s/it, loss=0.094, lr=1e-5]Steps:  46%|████▌     | 6903/15001 [4:24:11<4:08:01,  1.84s/it, loss=0.189, lr=1e-5]Steps:  46%|████▌     | 6904/15001 [4:24:13<4:11:58,  1.87s/it, loss=0.189, lr=1e-5]Steps:  46%|████▌     | 6904/15001 [4:24:13<4:11:58,  1.87s/it, loss=0.167, lr=1e-5]Steps:  46%|████▌     | 6905/15001 [4:24:15<4:20:39,  1.93s/it, loss=0.167, lr=1e-5]Steps:  46%|████▌     | 6905/15001 [4:24:15<4:20:39,  1.93s/it, loss=0.0773, lr=1e-5]Steps:  46%|████▌     | 6906/15001 [4:24:17<4:20:58,  1.93s/it, loss=0.0773, lr=1e-5]Steps:  46%|████▌     | 6906/15001 [4:24:17<4:20:58,  1.93s/it, loss=0.0165, lr=1e-5]Steps:  46%|████▌     | 6907/15001 [4:24:19<4:34:29,  2.03s/it, loss=0.0165, lr=1e-5]Steps:  46%|████▌     | 6907/15001 [4:24:19<4:34:29,  2.03s/it, loss=0.0356, lr=1e-5]Steps:  46%|████▌     | 6908/15001 [4:24:20<4:14:49,  1.89s/it, loss=0.0356, lr=1e-5]Steps:  46%|████▌     | 6908/15001 [4:24:21<4:14:49,  1.89s/it, loss=0.0412, lr=1e-5]Steps:  46%|████▌     | 6909/15001 [4:24:22<4:12:33,  1.87s/it, loss=0.0412, lr=1e-5]Steps:  46%|████▌     | 6909/15001 [4:24:23<4:12:33,  1.87s/it, loss=0.121, lr=1e-5] Steps:  46%|████▌     | 6910/15001 [4:24:24<4:16:01,  1.90s/it, loss=0.121, lr=1e-5]Steps:  46%|████▌     | 6910/15001 [4:24:24<4:16:01,  1.90s/it, loss=0.448, lr=1e-5]Steps:  46%|████▌     | 6911/15001 [4:24:26<4:00:31,  1.78s/it, loss=0.448, lr=1e-5]Steps:  46%|████▌     | 6911/15001 [4:24:26<4:00:31,  1.78s/it, loss=0.0923, lr=1e-5]Steps:  46%|████▌     | 6912/15001 [4:24:28<4:07:01,  1.83s/it, loss=0.0923, lr=1e-5]Steps:  46%|████▌     | 6912/15001 [4:24:28<4:07:01,  1.83s/it, loss=0.217, lr=1e-5] Steps:  46%|████▌     | 6913/15001 [4:24:30<4:09:19,  1.85s/it, loss=0.217, lr=1e-5]Steps:  46%|████▌     | 6913/15001 [4:24:30<4:09:19,  1.85s/it, loss=0.15, lr=1e-5] Steps:  46%|████▌     | 6914/15001 [4:24:32<4:14:20,  1.89s/it, loss=0.15, lr=1e-5]Steps:  46%|████▌     | 6914/15001 [4:24:32<4:14:20,  1.89s/it, loss=0.142, lr=1e-5]Steps:  46%|████▌     | 6915/15001 [4:24:33<4:08:55,  1.85s/it, loss=0.142, lr=1e-5]Steps:  46%|████▌     | 6915/15001 [4:24:33<4:08:55,  1.85s/it, loss=0.0521, lr=1e-5]Steps:  46%|████▌     | 6916/15001 [4:24:35<4:03:09,  1.80s/it, loss=0.0521, lr=1e-5]Steps:  46%|████▌     | 6916/15001 [4:24:35<4:03:09,  1.80s/it, loss=0.049, lr=1e-5] Steps:  46%|████▌     | 6917/15001 [4:24:37<4:07:30,  1.84s/it, loss=0.049, lr=1e-5]Steps:  46%|████▌     | 6917/15001 [4:24:37<4:07:30,  1.84s/it, loss=0.151, lr=1e-5]Steps:  46%|████▌     | 6918/15001 [4:24:39<4:10:09,  1.86s/it, loss=0.151, lr=1e-5]Steps:  46%|████▌     | 6918/15001 [4:24:39<4:10:09,  1.86s/it, loss=0.182, lr=1e-5]Steps:  46%|████▌     | 6919/15001 [4:24:41<4:04:44,  1.82s/it, loss=0.182, lr=1e-5]Steps:  46%|████▌     | 6919/15001 [4:24:41<4:04:44,  1.82s/it, loss=0.206, lr=1e-5]Steps:  46%|████▌     | 6920/15001 [4:24:42<4:06:37,  1.83s/it, loss=0.206, lr=1e-5]Steps:  46%|████▌     | 6920/15001 [4:24:42<4:06:37,  1.83s/it, loss=0.0862, lr=1e-5]Steps:  46%|████▌     | 6921/15001 [4:24:44<3:56:21,  1.76s/it, loss=0.0862, lr=1e-5]Steps:  46%|████▌     | 6921/15001 [4:24:44<3:56:21,  1.76s/it, loss=0.205, lr=1e-5] Steps:  46%|████▌     | 6922/15001 [4:24:46<4:10:03,  1.86s/it, loss=0.205, lr=1e-5]Steps:  46%|████▌     | 6922/15001 [4:24:46<4:10:03,  1.86s/it, loss=0.173, lr=1e-5]Steps:  46%|████▌     | 6923/15001 [4:24:48<4:01:48,  1.80s/it, loss=0.173, lr=1e-5]Steps:  46%|████▌     | 6923/15001 [4:24:48<4:01:48,  1.80s/it, loss=0.134, lr=1e-5]Steps:  46%|████▌     | 6924/15001 [4:24:50<4:06:34,  1.83s/it, loss=0.134, lr=1e-5]Steps:  46%|████▌     | 6924/15001 [4:24:50<4:06:34,  1.83s/it, loss=0.0654, lr=1e-5]Steps:  46%|████▌     | 6925/15001 [4:24:52<4:12:52,  1.88s/it, loss=0.0654, lr=1e-5]Steps:  46%|████▌     | 6925/15001 [4:24:52<4:12:52,  1.88s/it, loss=0.0602, lr=1e-5]Steps:  46%|████▌     | 6926/15001 [4:24:54<4:16:58,  1.91s/it, loss=0.0602, lr=1e-5]Steps:  46%|████▌     | 6926/15001 [4:24:54<4:16:58,  1.91s/it, loss=0.124, lr=1e-5] Steps:  46%|████▌     | 6927/15001 [4:24:56<4:19:24,  1.93s/it, loss=0.124, lr=1e-5]Steps:  46%|████▌     | 6927/15001 [4:24:56<4:19:24,  1.93s/it, loss=0.252, lr=1e-5]Steps:  46%|████▌     | 6928/15001 [4:24:58<4:19:20,  1.93s/it, loss=0.252, lr=1e-5]Steps:  46%|████▌     | 6928/15001 [4:24:58<4:19:20,  1.93s/it, loss=0.155, lr=1e-5]Steps:  46%|████▌     | 6929/15001 [4:25:00<4:24:02,  1.96s/it, loss=0.155, lr=1e-5]Steps:  46%|████▌     | 6929/15001 [4:25:00<4:24:02,  1.96s/it, loss=0.291, lr=1e-5]Steps:  46%|████▌     | 6930/15001 [4:25:02<4:26:27,  1.98s/it, loss=0.291, lr=1e-5]Steps:  46%|████▌     | 6930/15001 [4:25:02<4:26:27,  1.98s/it, loss=0.0778, lr=1e-5]Steps:  46%|████▌     | 6931/15001 [4:25:03<4:14:35,  1.89s/it, loss=0.0778, lr=1e-5]Steps:  46%|████▌     | 6931/15001 [4:25:03<4:14:35,  1.89s/it, loss=0.166, lr=1e-5] Steps:  46%|████▌     | 6932/15001 [4:25:05<4:16:05,  1.90s/it, loss=0.166, lr=1e-5]Steps:  46%|████▌     | 6932/15001 [4:25:05<4:16:05,  1.90s/it, loss=0.221, lr=1e-5]Steps:  46%|████▌     | 6933/15001 [4:25:07<4:10:39,  1.86s/it, loss=0.221, lr=1e-5]Steps:  46%|████▌     | 6933/15001 [4:25:07<4:10:39,  1.86s/it, loss=0.262, lr=1e-5]Steps:  46%|████▌     | 6934/15001 [4:25:09<4:05:42,  1.83s/it, loss=0.262, lr=1e-5]Steps:  46%|████▌     | 6934/15001 [4:25:09<4:05:42,  1.83s/it, loss=0.199, lr=1e-5]Steps:  46%|████▌     | 6935/15001 [4:25:10<4:00:19,  1.79s/it, loss=0.199, lr=1e-5]Steps:  46%|████▌     | 6935/15001 [4:25:11<4:00:19,  1.79s/it, loss=0.0723, lr=1e-5]Steps:  46%|████▌     | 6936/15001 [4:25:12<4:05:00,  1.82s/it, loss=0.0723, lr=1e-5]Steps:  46%|████▌     | 6936/15001 [4:25:13<4:05:00,  1.82s/it, loss=0.152, lr=1e-5] Steps:  46%|████▌     | 6937/15001 [4:25:14<4:13:45,  1.89s/it, loss=0.152, lr=1e-5]Steps:  46%|████▌     | 6937/15001 [4:25:14<4:13:45,  1.89s/it, loss=0.022, lr=1e-5]Steps:  46%|████▋     | 6938/15001 [4:25:16<4:07:50,  1.84s/it, loss=0.022, lr=1e-5]Steps:  46%|████▋     | 6938/15001 [4:25:16<4:07:50,  1.84s/it, loss=0.159, lr=1e-5]Steps:  46%|████▋     | 6939/15001 [4:25:18<4:05:28,  1.83s/it, loss=0.159, lr=1e-5]Steps:  46%|████▋     | 6939/15001 [4:25:18<4:05:28,  1.83s/it, loss=0.25, lr=1e-5] Steps:  46%|████▋     | 6940/15001 [4:25:20<4:04:34,  1.82s/it, loss=0.25, lr=1e-5]Steps:  46%|████▋     | 6940/15001 [4:25:20<4:04:34,  1.82s/it, loss=0.106, lr=1e-5]Steps:  46%|████▋     | 6941/15001 [4:25:21<4:03:10,  1.81s/it, loss=0.106, lr=1e-5]Steps:  46%|████▋     | 6941/15001 [4:25:22<4:03:10,  1.81s/it, loss=0.223, lr=1e-5]Steps:  46%|████▋     | 6942/15001 [4:25:23<4:06:45,  1.84s/it, loss=0.223, lr=1e-5]Steps:  46%|████▋     | 6942/15001 [4:25:24<4:06:45,  1.84s/it, loss=0.229, lr=1e-5]Steps:  46%|████▋     | 6943/15001 [4:25:25<4:00:42,  1.79s/it, loss=0.229, lr=1e-5]Steps:  46%|████▋     | 6943/15001 [4:25:25<4:00:42,  1.79s/it, loss=0.109, lr=1e-5]Steps:  46%|████▋     | 6944/15001 [4:25:27<4:07:18,  1.84s/it, loss=0.109, lr=1e-5]Steps:  46%|████▋     | 6944/15001 [4:25:27<4:07:18,  1.84s/it, loss=0.242, lr=1e-5]Steps:  46%|████▋     | 6945/15001 [4:25:29<3:52:57,  1.74s/it, loss=0.242, lr=1e-5]Steps:  46%|████▋     | 6945/15001 [4:25:29<3:52:57,  1.74s/it, loss=0.213, lr=1e-5]Steps:  46%|████▋     | 6946/15001 [4:25:31<4:06:38,  1.84s/it, loss=0.213, lr=1e-5]Steps:  46%|████▋     | 6946/15001 [4:25:31<4:06:38,  1.84s/it, loss=0.185, lr=1e-5]Steps:  46%|████▋     | 6947/15001 [4:25:32<4:08:13,  1.85s/it, loss=0.185, lr=1e-5]Steps:  46%|████▋     | 6947/15001 [4:25:33<4:08:13,  1.85s/it, loss=0.134, lr=1e-5]Steps:  46%|████▋     | 6948/15001 [4:25:35<4:18:50,  1.93s/it, loss=0.134, lr=1e-5]Steps:  46%|████▋     | 6948/15001 [4:25:35<4:18:50,  1.93s/it, loss=0.169, lr=1e-5]Steps:  46%|████▋     | 6949/15001 [4:25:36<4:16:25,  1.91s/it, loss=0.169, lr=1e-5]Steps:  46%|████▋     | 6949/15001 [4:25:37<4:16:25,  1.91s/it, loss=0.239, lr=1e-5]Steps:  46%|████▋     | 6950/15001 [4:25:38<4:15:51,  1.91s/it, loss=0.239, lr=1e-5]Steps:  46%|████▋     | 6950/15001 [4:25:39<4:15:51,  1.91s/it, loss=0.272, lr=1e-5]Steps:  46%|████▋     | 6951/15001 [4:25:40<4:22:06,  1.95s/it, loss=0.272, lr=1e-5]Steps:  46%|████▋     | 6951/15001 [4:25:41<4:22:06,  1.95s/it, loss=0.29, lr=1e-5] Steps:  46%|████▋     | 6952/15001 [4:25:42<4:21:25,  1.95s/it, loss=0.29, lr=1e-5]Steps:  46%|████▋     | 6952/15001 [4:25:43<4:21:25,  1.95s/it, loss=0.239, lr=1e-5]Steps:  46%|████▋     | 6953/15001 [4:25:44<4:24:03,  1.97s/it, loss=0.239, lr=1e-5]Steps:  46%|████▋     | 6953/15001 [4:25:44<4:24:03,  1.97s/it, loss=0.172, lr=1e-5]Steps:  46%|████▋     | 6954/15001 [4:25:46<4:15:55,  1.91s/it, loss=0.172, lr=1e-5]Steps:  46%|████▋     | 6954/15001 [4:25:46<4:15:55,  1.91s/it, loss=0.13, lr=1e-5] Steps:  46%|████▋     | 6955/15001 [4:25:48<4:08:25,  1.85s/it, loss=0.13, lr=1e-5]Steps:  46%|████▋     | 6955/15001 [4:25:48<4:08:25,  1.85s/it, loss=0.254, lr=1e-5]Steps:  46%|████▋     | 6956/15001 [4:25:50<4:09:52,  1.86s/it, loss=0.254, lr=1e-5]Steps:  46%|████▋     | 6956/15001 [4:25:50<4:09:52,  1.86s/it, loss=0.103, lr=1e-5]Steps:  46%|████▋     | 6957/15001 [4:25:52<4:12:51,  1.89s/it, loss=0.103, lr=1e-5]Steps:  46%|████▋     | 6957/15001 [4:25:52<4:12:51,  1.89s/it, loss=0.122, lr=1e-5]Steps:  46%|████▋     | 6958/15001 [4:25:54<4:11:10,  1.87s/it, loss=0.122, lr=1e-5]Steps:  46%|████▋     | 6958/15001 [4:25:54<4:11:10,  1.87s/it, loss=0.072, lr=1e-5]Steps:  46%|████▋     | 6959/15001 [4:25:55<4:07:21,  1.85s/it, loss=0.072, lr=1e-5]Steps:  46%|████▋     | 6959/15001 [4:25:55<4:07:21,  1.85s/it, loss=0.263, lr=1e-5]Steps:  46%|████▋     | 6960/15001 [4:25:57<4:04:12,  1.82s/it, loss=0.263, lr=1e-5]Steps:  46%|████▋     | 6960/15001 [4:25:57<4:04:12,  1.82s/it, loss=0.202, lr=1e-5]Steps:  46%|████▋     | 6961/15001 [4:25:59<4:03:10,  1.81s/it, loss=0.202, lr=1e-5]Steps:  46%|████▋     | 6961/15001 [4:25:59<4:03:10,  1.81s/it, loss=0.123, lr=1e-5]Steps:  46%|████▋     | 6962/15001 [4:26:01<3:57:44,  1.77s/it, loss=0.123, lr=1e-5]Steps:  46%|████▋     | 6962/15001 [4:26:01<3:57:44,  1.77s/it, loss=0.0944, lr=1e-5]Steps:  46%|████▋     | 6963/15001 [4:26:03<4:07:19,  1.85s/it, loss=0.0944, lr=1e-5]Steps:  46%|████▋     | 6963/15001 [4:26:03<4:07:19,  1.85s/it, loss=0.0826, lr=1e-5]Steps:  46%|████▋     | 6964/15001 [4:26:04<4:10:25,  1.87s/it, loss=0.0826, lr=1e-5]Steps:  46%|████▋     | 6964/15001 [4:26:05<4:10:25,  1.87s/it, loss=0.201, lr=1e-5] Steps:  46%|████▋     | 6965/15001 [4:26:06<4:01:49,  1.81s/it, loss=0.201, lr=1e-5]Steps:  46%|████▋     | 6965/15001 [4:26:06<4:01:49,  1.81s/it, loss=0.197, lr=1e-5]Steps:  46%|████▋     | 6966/15001 [4:26:08<4:08:39,  1.86s/it, loss=0.197, lr=1e-5]Steps:  46%|████▋     | 6966/15001 [4:26:08<4:08:39,  1.86s/it, loss=0.15, lr=1e-5] Steps:  46%|████▋     | 6967/15001 [4:26:10<4:03:55,  1.82s/it, loss=0.15, lr=1e-5]Steps:  46%|████▋     | 6967/15001 [4:26:10<4:03:55,  1.82s/it, loss=0.075, lr=1e-5]Steps:  46%|████▋     | 6968/15001 [4:26:12<4:06:30,  1.84s/it, loss=0.075, lr=1e-5]Steps:  46%|████▋     | 6968/15001 [4:26:12<4:06:30,  1.84s/it, loss=0.126, lr=1e-5]Steps:  46%|████▋     | 6969/15001 [4:26:13<3:58:07,  1.78s/it, loss=0.126, lr=1e-5]Steps:  46%|████▋     | 6969/15001 [4:26:14<3:58:07,  1.78s/it, loss=0.155, lr=1e-5]Steps:  46%|████▋     | 6970/15001 [4:26:16<4:12:59,  1.89s/it, loss=0.155, lr=1e-5]Steps:  46%|████▋     | 6970/15001 [4:26:16<4:12:59,  1.89s/it, loss=0.135, lr=1e-5]Steps:  46%|████▋     | 6971/15001 [4:26:18<4:27:51,  2.00s/it, loss=0.135, lr=1e-5]Steps:  46%|████▋     | 6971/15001 [4:26:18<4:27:51,  2.00s/it, loss=0.241, lr=1e-5]Steps:  46%|████▋     | 6972/15001 [4:26:20<4:23:24,  1.97s/it, loss=0.241, lr=1e-5]Steps:  46%|████▋     | 6972/15001 [4:26:20<4:23:24,  1.97s/it, loss=0.2, lr=1e-5]  Steps:  46%|████▋     | 6973/15001 [4:26:22<4:30:18,  2.02s/it, loss=0.2, lr=1e-5]Steps:  46%|████▋     | 6973/15001 [4:26:22<4:30:18,  2.02s/it, loss=0.206, lr=1e-5]Steps:  46%|████▋     | 6974/15001 [4:26:24<4:20:59,  1.95s/it, loss=0.206, lr=1e-5]Steps:  46%|████▋     | 6974/15001 [4:26:24<4:20:59,  1.95s/it, loss=0.368, lr=1e-5]Steps:  46%|████▋     | 6975/15001 [4:26:26<4:24:49,  1.98s/it, loss=0.368, lr=1e-5]Steps:  46%|████▋     | 6975/15001 [4:26:26<4:24:49,  1.98s/it, loss=0.265, lr=1e-5]Steps:  47%|████▋     | 6976/15001 [4:26:28<4:25:16,  1.98s/it, loss=0.265, lr=1e-5]Steps:  47%|████▋     | 6976/15001 [4:26:28<4:25:16,  1.98s/it, loss=0.264, lr=1e-5]Steps:  47%|████▋     | 6977/15001 [4:26:29<4:17:59,  1.93s/it, loss=0.264, lr=1e-5]Steps:  47%|████▋     | 6977/15001 [4:26:30<4:17:59,  1.93s/it, loss=0.206, lr=1e-5]Steps:  47%|████▋     | 6978/15001 [4:26:31<4:08:09,  1.86s/it, loss=0.206, lr=1e-5]Steps:  47%|████▋     | 6978/15001 [4:26:31<4:08:09,  1.86s/it, loss=0.264, lr=1e-5]Steps:  47%|████▋     | 6979/15001 [4:26:33<4:04:08,  1.83s/it, loss=0.264, lr=1e-5]Steps:  47%|████▋     | 6979/15001 [4:26:33<4:04:08,  1.83s/it, loss=0.19, lr=1e-5] Steps:  47%|████▋     | 6980/15001 [4:26:35<4:04:32,  1.83s/it, loss=0.19, lr=1e-5]Steps:  47%|████▋     | 6980/15001 [4:26:35<4:04:32,  1.83s/it, loss=0.0599, lr=1e-5]Steps:  47%|████▋     | 6981/15001 [4:26:36<4:01:42,  1.81s/it, loss=0.0599, lr=1e-5]Steps:  47%|████▋     | 6981/15001 [4:26:37<4:01:42,  1.81s/it, loss=0.109, lr=1e-5] Steps:  47%|████▋     | 6982/15001 [4:26:38<4:01:03,  1.80s/it, loss=0.109, lr=1e-5]Steps:  47%|████▋     | 6982/15001 [4:26:38<4:01:03,  1.80s/it, loss=0.241, lr=1e-5]Steps:  47%|████▋     | 6983/15001 [4:26:40<4:02:06,  1.81s/it, loss=0.241, lr=1e-5]Steps:  47%|████▋     | 6983/15001 [4:26:40<4:02:06,  1.81s/it, loss=0.265, lr=1e-5]Steps:  47%|████▋     | 6984/15001 [4:26:42<4:00:18,  1.80s/it, loss=0.265, lr=1e-5]Steps:  47%|████▋     | 6984/15001 [4:26:42<4:00:18,  1.80s/it, loss=0.143, lr=1e-5]Steps:  47%|████▋     | 6985/15001 [4:26:44<3:58:33,  1.79s/it, loss=0.143, lr=1e-5]Steps:  47%|████▋     | 6985/15001 [4:26:44<3:58:33,  1.79s/it, loss=0.0995, lr=1e-5]Steps:  47%|████▋     | 6986/15001 [4:26:46<4:01:29,  1.81s/it, loss=0.0995, lr=1e-5]Steps:  47%|████▋     | 6986/15001 [4:26:46<4:01:29,  1.81s/it, loss=0.258, lr=1e-5] Steps:  47%|████▋     | 6987/15001 [4:26:47<4:00:01,  1.80s/it, loss=0.258, lr=1e-5]Steps:  47%|████▋     | 6987/15001 [4:26:48<4:00:01,  1.80s/it, loss=0.132, lr=1e-5]Steps:  47%|████▋     | 6988/15001 [4:26:49<4:06:19,  1.84s/it, loss=0.132, lr=1e-5]Steps:  47%|████▋     | 6988/15001 [4:26:50<4:06:19,  1.84s/it, loss=0.156, lr=1e-5]Steps:  47%|████▋     | 6989/15001 [4:26:51<4:14:02,  1.90s/it, loss=0.156, lr=1e-5]Steps:  47%|████▋     | 6989/15001 [4:26:51<4:14:02,  1.90s/it, loss=0.0872, lr=1e-5]Steps:  47%|████▋     | 6990/15001 [4:26:53<4:05:27,  1.84s/it, loss=0.0872, lr=1e-5]Steps:  47%|████▋     | 6990/15001 [4:26:53<4:05:27,  1.84s/it, loss=0.0533, lr=1e-5]Steps:  47%|████▋     | 6991/15001 [4:26:55<4:04:55,  1.83s/it, loss=0.0533, lr=1e-5]Steps:  47%|████▋     | 6991/15001 [4:26:55<4:04:55,  1.83s/it, loss=0.208, lr=1e-5] Steps:  47%|████▋     | 6992/15001 [4:26:56<4:00:05,  1.80s/it, loss=0.208, lr=1e-5]Steps:  47%|████▋     | 6992/15001 [4:26:57<4:00:05,  1.80s/it, loss=0.253, lr=1e-5]Steps:  47%|████▋     | 6993/15001 [4:26:59<4:28:40,  2.01s/it, loss=0.253, lr=1e-5]Steps:  47%|████▋     | 6993/15001 [4:26:59<4:28:40,  2.01s/it, loss=0.117, lr=1e-5]Steps:  47%|████▋     | 6994/15001 [4:27:01<4:25:31,  1.99s/it, loss=0.117, lr=1e-5]Steps:  47%|████▋     | 6994/15001 [4:27:01<4:25:31,  1.99s/it, loss=0.0625, lr=1e-5]Steps:  47%|████▋     | 6995/15001 [4:27:03<4:30:41,  2.03s/it, loss=0.0625, lr=1e-5]Steps:  47%|████▋     | 6995/15001 [4:27:03<4:30:41,  2.03s/it, loss=0.187, lr=1e-5] Steps:  47%|████▋     | 6996/15001 [4:27:05<4:23:33,  1.98s/it, loss=0.187, lr=1e-5]Steps:  47%|████▋     | 6996/15001 [4:27:05<4:23:33,  1.98s/it, loss=0.222, lr=1e-5]Steps:  47%|████▋     | 6997/15001 [4:27:07<4:26:47,  2.00s/it, loss=0.222, lr=1e-5]Steps:  47%|████▋     | 6997/15001 [4:27:07<4:26:47,  2.00s/it, loss=0.209, lr=1e-5]Steps:  47%|████▋     | 6998/15001 [4:27:09<4:10:41,  1.88s/it, loss=0.209, lr=1e-5]Steps:  47%|████▋     | 6998/15001 [4:27:09<4:10:41,  1.88s/it, loss=0.204, lr=1e-5]Steps:  47%|████▋     | 6999/15001 [4:27:11<4:13:51,  1.90s/it, loss=0.204, lr=1e-5]Steps:  47%|████▋     | 6999/15001 [4:27:11<4:13:51,  1.90s/it, loss=0.128, lr=1e-5]Steps:  47%|████▋     | 7000/15001 [4:27:13<4:20:18,  1.95s/it, loss=0.128, lr=1e-5]02/04/2024 17:29:32 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1612.16it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  47%|████▋     | 7000/15001 [4:30:52<4:20:18,  1.95s/it, loss=0.181, lr=1e-5]Steps:  47%|████▋     | 7001/15001 [4:30:53<149:59:25, 67.50s/it, loss=0.181, lr=1e-5]Steps:  47%|████▋     | 7001/15001 [4:30:53<149:59:25, 67.50s/it, loss=0.153, lr=1e-5]Steps:  47%|████▋     | 7002/15001 [4:30:55<106:09:58, 47.78s/it, loss=0.153, lr=1e-5]Steps:  47%|████▋     | 7002/15001 [4:30:55<106:09:58, 47.78s/it, loss=0.0961, lr=1e-5]Steps:  47%|████▋     | 7003/15001 [4:30:57<75:36:59, 34.04s/it, loss=0.0961, lr=1e-5] Steps:  47%|████▋     | 7003/15001 [4:30:57<75:36:59, 34.04s/it, loss=0.0558, lr=1e-5]Steps:  47%|████▋     | 7004/15001 [4:30:59<54:29:42, 24.53s/it, loss=0.0558, lr=1e-5]Steps:  47%|████▋     | 7004/15001 [4:30:59<54:29:42, 24.53s/it, loss=0.229, lr=1e-5] Steps:  47%|████▋     | 7005/15001 [4:31:01<39:19:15, 17.70s/it, loss=0.229, lr=1e-5]Steps:  47%|████▋     | 7005/15001 [4:31:01<39:19:15, 17.70s/it, loss=0.269, lr=1e-5]Steps:  47%|████▋     | 7006/15001 [4:31:03<28:56:07, 13.03s/it, loss=0.269, lr=1e-5]Steps:  47%|████▋     | 7006/15001 [4:31:03<28:56:07, 13.03s/it, loss=0.248, lr=1e-5]Steps:  47%|████▋     | 7007/15001 [4:31:05<21:30:53,  9.69s/it, loss=0.248, lr=1e-5]Steps:  47%|████▋     | 7007/15001 [4:31:05<21:30:53,  9.69s/it, loss=0.169, lr=1e-5]Steps:  47%|████▋     | 7008/15001 [4:31:07<16:22:00,  7.37s/it, loss=0.169, lr=1e-5]Steps:  47%|████▋     | 7008/15001 [4:31:07<16:22:00,  7.37s/it, loss=0.324, lr=1e-5]Steps:  47%|████▋     | 7009/15001 [4:31:09<12:34:38,  5.67s/it, loss=0.324, lr=1e-5]Steps:  47%|████▋     | 7009/15001 [4:31:09<12:34:38,  5.67s/it, loss=0.293, lr=1e-5]Steps:  47%|████▋     | 7010/15001 [4:31:11<10:10:10,  4.58s/it, loss=0.293, lr=1e-5]Steps:  47%|████▋     | 7010/15001 [4:31:11<10:10:10,  4.58s/it, loss=0.077, lr=1e-5]Steps:  47%|████▋     | 7011/15001 [4:31:12<8:18:41,  3.74s/it, loss=0.077, lr=1e-5] Steps:  47%|████▋     | 7011/15001 [4:31:13<8:18:41,  3.74s/it, loss=0.136, lr=1e-5]Steps:  47%|████▋     | 7012/15001 [4:31:14<7:05:45,  3.20s/it, loss=0.136, lr=1e-5]Steps:  47%|████▋     | 7012/15001 [4:31:14<7:05:45,  3.20s/it, loss=0.334, lr=1e-5]Steps:  47%|████▋     | 7013/15001 [4:31:16<6:02:52,  2.73s/it, loss=0.334, lr=1e-5]Steps:  47%|████▋     | 7013/15001 [4:31:16<6:02:52,  2.73s/it, loss=0.0449, lr=1e-5]Steps:  47%|████▋     | 7014/15001 [4:31:18<5:35:17,  2.52s/it, loss=0.0449, lr=1e-5]Steps:  47%|████▋     | 7014/15001 [4:31:18<5:35:17,  2.52s/it, loss=0.0202, lr=1e-5]Steps:  47%|████▋     | 7015/15001 [4:31:20<5:03:42,  2.28s/it, loss=0.0202, lr=1e-5]Steps:  47%|████▋     | 7015/15001 [4:31:20<5:03:42,  2.28s/it, loss=0.196, lr=1e-5] Steps:  47%|████▋     | 7016/15001 [4:31:21<4:41:44,  2.12s/it, loss=0.196, lr=1e-5]Steps:  47%|████▋     | 7016/15001 [4:31:22<4:41:44,  2.12s/it, loss=0.224, lr=1e-5]Steps:  47%|████▋     | 7017/15001 [4:31:23<4:26:43,  2.00s/it, loss=0.224, lr=1e-5]Steps:  47%|████▋     | 7017/15001 [4:31:23<4:26:43,  2.00s/it, loss=0.252, lr=1e-5]Steps:  47%|████▋     | 7018/15001 [4:31:25<4:17:11,  1.93s/it, loss=0.252, lr=1e-5]Steps:  47%|████▋     | 7018/15001 [4:31:25<4:17:11,  1.93s/it, loss=0.268, lr=1e-5]Steps:  47%|████▋     | 7019/15001 [4:31:27<4:13:02,  1.90s/it, loss=0.268, lr=1e-5]Steps:  47%|████▋     | 7019/15001 [4:31:27<4:13:02,  1.90s/it, loss=0.0357, lr=1e-5]Steps:  47%|████▋     | 7020/15001 [4:31:29<4:09:09,  1.87s/it, loss=0.0357, lr=1e-5]Steps:  47%|████▋     | 7020/15001 [4:31:29<4:09:09,  1.87s/it, loss=0.0794, lr=1e-5]Steps:  47%|████▋     | 7021/15001 [4:31:31<4:17:06,  1.93s/it, loss=0.0794, lr=1e-5]Steps:  47%|████▋     | 7021/15001 [4:31:31<4:17:06,  1.93s/it, loss=0.315, lr=1e-5] Steps:  47%|████▋     | 7022/15001 [4:31:32<4:09:12,  1.87s/it, loss=0.315, lr=1e-5]Steps:  47%|████▋     | 7022/15001 [4:31:33<4:09:12,  1.87s/it, loss=0.158, lr=1e-5]Steps:  47%|████▋     | 7023/15001 [4:31:34<4:04:44,  1.84s/it, loss=0.158, lr=1e-5]Steps:  47%|████▋     | 7023/15001 [4:31:35<4:04:44,  1.84s/it, loss=0.256, lr=1e-5]Steps:  47%|████▋     | 7024/15001 [4:31:36<4:11:24,  1.89s/it, loss=0.256, lr=1e-5]Steps:  47%|████▋     | 7024/15001 [4:31:36<4:11:24,  1.89s/it, loss=0.16, lr=1e-5] Steps:  47%|████▋     | 7025/15001 [4:31:38<4:20:36,  1.96s/it, loss=0.16, lr=1e-5]Steps:  47%|████▋     | 7025/15001 [4:31:38<4:20:36,  1.96s/it, loss=0.199, lr=1e-5]Steps:  47%|████▋     | 7026/15001 [4:31:40<4:20:31,  1.96s/it, loss=0.199, lr=1e-5]Steps:  47%|████▋     | 7026/15001 [4:31:40<4:20:31,  1.96s/it, loss=0.214, lr=1e-5]Steps:  47%|████▋     | 7027/15001 [4:31:42<4:26:55,  2.01s/it, loss=0.214, lr=1e-5]Steps:  47%|████▋     | 7027/15001 [4:31:42<4:26:55,  2.01s/it, loss=0.205, lr=1e-5]Steps:  47%|████▋     | 7028/15001 [4:31:44<4:28:17,  2.02s/it, loss=0.205, lr=1e-5]Steps:  47%|████▋     | 7028/15001 [4:31:45<4:28:17,  2.02s/it, loss=0.142, lr=1e-5]Steps:  47%|████▋     | 7029/15001 [4:31:46<4:18:29,  1.95s/it, loss=0.142, lr=1e-5]Steps:  47%|████▋     | 7029/15001 [4:31:47<4:18:29,  1.95s/it, loss=0.2, lr=1e-5]  Steps:  47%|████▋     | 7030/15001 [4:31:48<4:29:29,  2.03s/it, loss=0.2, lr=1e-5]Steps:  47%|████▋     | 7030/15001 [4:31:49<4:29:29,  2.03s/it, loss=0.0813, lr=1e-5]Steps:  47%|████▋     | 7031/15001 [4:31:50<4:16:38,  1.93s/it, loss=0.0813, lr=1e-5]Steps:  47%|████▋     | 7031/15001 [4:31:50<4:16:38,  1.93s/it, loss=0.217, lr=1e-5] Steps:  47%|████▋     | 7032/15001 [4:31:52<4:14:15,  1.91s/it, loss=0.217, lr=1e-5]Steps:  47%|████▋     | 7032/15001 [4:31:52<4:14:15,  1.91s/it, loss=0.233, lr=1e-5]Steps:  47%|████▋     | 7033/15001 [4:31:54<4:09:42,  1.88s/it, loss=0.233, lr=1e-5]Steps:  47%|████▋     | 7033/15001 [4:31:54<4:09:42,  1.88s/it, loss=0.298, lr=1e-5]Steps:  47%|████▋     | 7034/15001 [4:31:56<4:10:07,  1.88s/it, loss=0.298, lr=1e-5]Steps:  47%|████▋     | 7034/15001 [4:31:56<4:10:07,  1.88s/it, loss=0.12, lr=1e-5] Steps:  47%|████▋     | 7035/15001 [4:31:58<4:14:07,  1.91s/it, loss=0.12, lr=1e-5]Steps:  47%|████▋     | 7035/15001 [4:31:58<4:14:07,  1.91s/it, loss=0.129, lr=1e-5]Steps:  47%|████▋     | 7036/15001 [4:31:59<4:09:21,  1.88s/it, loss=0.129, lr=1e-5]Steps:  47%|████▋     | 7036/15001 [4:32:00<4:09:21,  1.88s/it, loss=0.0561, lr=1e-5]Steps:  47%|████▋     | 7037/15001 [4:32:01<4:08:11,  1.87s/it, loss=0.0561, lr=1e-5]Steps:  47%|████▋     | 7037/15001 [4:32:02<4:08:11,  1.87s/it, loss=0.0915, lr=1e-5]Steps:  47%|████▋     | 7038/15001 [4:32:03<4:06:42,  1.86s/it, loss=0.0915, lr=1e-5]Steps:  47%|████▋     | 7038/15001 [4:32:03<4:06:42,  1.86s/it, loss=0.243, lr=1e-5] Steps:  47%|████▋     | 7039/15001 [4:32:05<4:11:21,  1.89s/it, loss=0.243, lr=1e-5]Steps:  47%|████▋     | 7039/15001 [4:32:05<4:11:21,  1.89s/it, loss=0.374, lr=1e-5]Steps:  47%|████▋     | 7040/15001 [4:32:07<4:02:58,  1.83s/it, loss=0.374, lr=1e-5]Steps:  47%|████▋     | 7040/15001 [4:32:07<4:02:58,  1.83s/it, loss=0.128, lr=1e-5]Steps:  47%|████▋     | 7041/15001 [4:32:09<4:06:33,  1.86s/it, loss=0.128, lr=1e-5]Steps:  47%|████▋     | 7041/15001 [4:32:09<4:06:33,  1.86s/it, loss=0.0911, lr=1e-5]Steps:  47%|████▋     | 7042/15001 [4:32:11<4:04:36,  1.84s/it, loss=0.0911, lr=1e-5]Steps:  47%|████▋     | 7042/15001 [4:32:11<4:04:36,  1.84s/it, loss=0.116, lr=1e-5] Steps:  47%|████▋     | 7043/15001 [4:32:12<3:55:11,  1.77s/it, loss=0.116, lr=1e-5]Steps:  47%|████▋     | 7043/15001 [4:32:13<3:55:11,  1.77s/it, loss=0.0458, lr=1e-5]Steps:  47%|████▋     | 7044/15001 [4:32:14<4:03:04,  1.83s/it, loss=0.0458, lr=1e-5]Steps:  47%|████▋     | 7044/15001 [4:32:15<4:03:04,  1.83s/it, loss=0.151, lr=1e-5] Steps:  47%|████▋     | 7045/15001 [4:32:16<4:12:15,  1.90s/it, loss=0.151, lr=1e-5]Steps:  47%|████▋     | 7045/15001 [4:32:16<4:12:15,  1.90s/it, loss=0.0267, lr=1e-5]Steps:  47%|████▋     | 7046/15001 [4:32:18<4:08:33,  1.87s/it, loss=0.0267, lr=1e-5]Steps:  47%|████▋     | 7046/15001 [4:32:18<4:08:33,  1.87s/it, loss=0.0931, lr=1e-5]Steps:  47%|████▋     | 7047/15001 [4:32:20<4:05:41,  1.85s/it, loss=0.0931, lr=1e-5]Steps:  47%|████▋     | 7047/15001 [4:32:20<4:05:41,  1.85s/it, loss=0.226, lr=1e-5] Steps:  47%|████▋     | 7048/15001 [4:32:22<4:26:26,  2.01s/it, loss=0.226, lr=1e-5]Steps:  47%|████▋     | 7048/15001 [4:32:22<4:26:26,  2.01s/it, loss=0.147, lr=1e-5]Steps:  47%|████▋     | 7049/15001 [4:32:24<4:20:44,  1.97s/it, loss=0.147, lr=1e-5]Steps:  47%|████▋     | 7049/15001 [4:32:24<4:20:44,  1.97s/it, loss=0.193, lr=1e-5]Steps:  47%|████▋     | 7050/15001 [4:32:26<4:31:12,  2.05s/it, loss=0.193, lr=1e-5]Steps:  47%|████▋     | 7050/15001 [4:32:26<4:31:12,  2.05s/it, loss=0.134, lr=1e-5]Steps:  47%|████▋     | 7051/15001 [4:32:28<4:15:46,  1.93s/it, loss=0.134, lr=1e-5]Steps:  47%|████▋     | 7051/15001 [4:32:28<4:15:46,  1.93s/it, loss=0.271, lr=1e-5]Steps:  47%|████▋     | 7052/15001 [4:32:30<4:29:02,  2.03s/it, loss=0.271, lr=1e-5]Steps:  47%|████▋     | 7052/15001 [4:32:30<4:29:02,  2.03s/it, loss=0.128, lr=1e-5]Steps:  47%|████▋     | 7053/15001 [4:32:32<4:18:53,  1.95s/it, loss=0.128, lr=1e-5]Steps:  47%|████▋     | 7053/15001 [4:32:32<4:18:53,  1.95s/it, loss=0.187, lr=1e-5]Steps:  47%|████▋     | 7054/15001 [4:32:34<4:16:54,  1.94s/it, loss=0.187, lr=1e-5]Steps:  47%|████▋     | 7054/15001 [4:32:34<4:16:54,  1.94s/it, loss=0.274, lr=1e-5]Steps:  47%|████▋     | 7055/15001 [4:32:36<4:15:59,  1.93s/it, loss=0.274, lr=1e-5]Steps:  47%|████▋     | 7055/15001 [4:32:36<4:15:59,  1.93s/it, loss=0.0495, lr=1e-5]Steps:  47%|████▋     | 7056/15001 [4:32:38<4:18:15,  1.95s/it, loss=0.0495, lr=1e-5]Steps:  47%|████▋     | 7056/15001 [4:32:38<4:18:15,  1.95s/it, loss=0.166, lr=1e-5] Steps:  47%|████▋     | 7057/15001 [4:32:39<4:06:37,  1.86s/it, loss=0.166, lr=1e-5]Steps:  47%|████▋     | 7057/15001 [4:32:41<4:06:37,  1.86s/it, loss=0.282, lr=1e-5]Steps:  47%|████▋     | 7058/15001 [4:32:42<4:50:11,  2.19s/it, loss=0.282, lr=1e-5]Steps:  47%|████▋     | 7058/15001 [4:32:43<4:50:11,  2.19s/it, loss=0.305, lr=1e-5]Steps:  47%|████▋     | 7059/15001 [4:32:44<4:37:00,  2.09s/it, loss=0.305, lr=1e-5]Steps:  47%|████▋     | 7059/15001 [4:32:44<4:37:00,  2.09s/it, loss=0.0493, lr=1e-5]Steps:  47%|████▋     | 7060/15001 [4:32:46<4:19:57,  1.96s/it, loss=0.0493, lr=1e-5]Steps:  47%|████▋     | 7060/15001 [4:32:46<4:19:57,  1.96s/it, loss=0.239, lr=1e-5] Steps:  47%|████▋     | 7061/15001 [4:32:48<4:09:53,  1.89s/it, loss=0.239, lr=1e-5]Steps:  47%|████▋     | 7061/15001 [4:32:48<4:09:53,  1.89s/it, loss=0.0961, lr=1e-5]Steps:  47%|████▋     | 7062/15001 [4:32:50<4:13:11,  1.91s/it, loss=0.0961, lr=1e-5]Steps:  47%|████▋     | 7062/15001 [4:32:50<4:13:11,  1.91s/it, loss=0.18, lr=1e-5]  Steps:  47%|████▋     | 7063/15001 [4:32:51<4:07:02,  1.87s/it, loss=0.18, lr=1e-5]Steps:  47%|████▋     | 7063/15001 [4:32:52<4:07:02,  1.87s/it, loss=0.264, lr=1e-5]Steps:  47%|████▋     | 7064/15001 [4:32:53<4:05:07,  1.85s/it, loss=0.264, lr=1e-5]Steps:  47%|████▋     | 7064/15001 [4:32:53<4:05:07,  1.85s/it, loss=0.128, lr=1e-5]Steps:  47%|████▋     | 7065/15001 [4:32:55<4:11:17,  1.90s/it, loss=0.128, lr=1e-5]Steps:  47%|████▋     | 7065/15001 [4:32:55<4:11:17,  1.90s/it, loss=0.108, lr=1e-5]Steps:  47%|████▋     | 7066/15001 [4:32:57<4:05:22,  1.86s/it, loss=0.108, lr=1e-5]Steps:  47%|████▋     | 7066/15001 [4:32:57<4:05:22,  1.86s/it, loss=0.0804, lr=1e-5]Steps:  47%|████▋     | 7067/15001 [4:32:59<3:57:23,  1.80s/it, loss=0.0804, lr=1e-5]Steps:  47%|████▋     | 7067/15001 [4:32:59<3:57:23,  1.80s/it, loss=0.0801, lr=1e-5]Steps:  47%|████▋     | 7068/15001 [4:33:01<4:02:15,  1.83s/it, loss=0.0801, lr=1e-5]Steps:  47%|████▋     | 7068/15001 [4:33:01<4:02:15,  1.83s/it, loss=0.19, lr=1e-5]  Steps:  47%|████▋     | 7069/15001 [4:33:02<4:00:42,  1.82s/it, loss=0.19, lr=1e-5]Steps:  47%|████▋     | 7069/15001 [4:33:03<4:00:42,  1.82s/it, loss=0.0323, lr=1e-5]Steps:  47%|████▋     | 7070/15001 [4:33:04<4:10:29,  1.89s/it, loss=0.0323, lr=1e-5]Steps:  47%|████▋     | 7070/15001 [4:33:05<4:10:29,  1.89s/it, loss=0.213, lr=1e-5] Steps:  47%|████▋     | 7071/15001 [4:33:06<4:13:42,  1.92s/it, loss=0.213, lr=1e-5]Steps:  47%|████▋     | 7071/15001 [4:33:07<4:13:42,  1.92s/it, loss=0.0639, lr=1e-5]Steps:  47%|████▋     | 7072/15001 [4:33:08<4:10:04,  1.89s/it, loss=0.0639, lr=1e-5]Steps:  47%|████▋     | 7072/15001 [4:33:09<4:10:04,  1.89s/it, loss=0.171, lr=1e-5] Steps:  47%|████▋     | 7073/15001 [4:33:11<4:27:06,  2.02s/it, loss=0.171, lr=1e-5]Steps:  47%|████▋     | 7073/15001 [4:33:11<4:27:06,  2.02s/it, loss=0.0858, lr=1e-5]Steps:  47%|████▋     | 7074/15001 [4:33:12<4:15:21,  1.93s/it, loss=0.0858, lr=1e-5]Steps:  47%|████▋     | 7074/15001 [4:33:13<4:15:21,  1.93s/it, loss=0.203, lr=1e-5] Steps:  47%|████▋     | 7075/15001 [4:33:14<4:21:42,  1.98s/it, loss=0.203, lr=1e-5]Steps:  47%|████▋     | 7075/15001 [4:33:14<4:21:42,  1.98s/it, loss=0.194, lr=1e-5]Steps:  47%|████▋     | 7076/15001 [4:33:16<4:11:01,  1.90s/it, loss=0.194, lr=1e-5]Steps:  47%|████▋     | 7076/15001 [4:33:16<4:11:01,  1.90s/it, loss=0.17, lr=1e-5] Steps:  47%|████▋     | 7077/15001 [4:33:18<4:13:19,  1.92s/it, loss=0.17, lr=1e-5]Steps:  47%|████▋     | 7077/15001 [4:33:18<4:13:19,  1.92s/it, loss=0.135, lr=1e-5]Steps:  47%|████▋     | 7078/15001 [4:33:20<4:08:43,  1.88s/it, loss=0.135, lr=1e-5]Steps:  47%|████▋     | 7078/15001 [4:33:20<4:08:43,  1.88s/it, loss=0.32, lr=1e-5] Steps:  47%|████▋     | 7079/15001 [4:33:22<4:00:31,  1.82s/it, loss=0.32, lr=1e-5]Steps:  47%|████▋     | 7079/15001 [4:33:22<4:00:31,  1.82s/it, loss=0.235, lr=1e-5]Steps:  47%|████▋     | 7080/15001 [4:33:23<4:03:02,  1.84s/it, loss=0.235, lr=1e-5]Steps:  47%|████▋     | 7080/15001 [4:33:24<4:03:02,  1.84s/it, loss=0.132, lr=1e-5]Steps:  47%|████▋     | 7081/15001 [4:33:25<3:59:11,  1.81s/it, loss=0.132, lr=1e-5]Steps:  47%|████▋     | 7081/15001 [4:33:25<3:59:11,  1.81s/it, loss=0.08, lr=1e-5] Steps:  47%|████▋     | 7082/15001 [4:33:27<3:58:19,  1.81s/it, loss=0.08, lr=1e-5]Steps:  47%|████▋     | 7082/15001 [4:33:27<3:58:19,  1.81s/it, loss=0.101, lr=1e-5]Steps:  47%|████▋     | 7083/15001 [4:33:29<4:08:57,  1.89s/it, loss=0.101, lr=1e-5]Steps:  47%|████▋     | 7083/15001 [4:33:29<4:08:57,  1.89s/it, loss=0.0486, lr=1e-5]Steps:  47%|████▋     | 7084/15001 [4:33:31<4:11:40,  1.91s/it, loss=0.0486, lr=1e-5]Steps:  47%|████▋     | 7084/15001 [4:33:31<4:11:40,  1.91s/it, loss=0.29, lr=1e-5]  Steps:  47%|████▋     | 7085/15001 [4:33:33<4:06:26,  1.87s/it, loss=0.29, lr=1e-5]Steps:  47%|████▋     | 7085/15001 [4:33:33<4:06:26,  1.87s/it, loss=0.186, lr=1e-5]Steps:  47%|████▋     | 7086/15001 [4:33:35<4:08:28,  1.88s/it, loss=0.186, lr=1e-5]Steps:  47%|████▋     | 7086/15001 [4:33:35<4:08:28,  1.88s/it, loss=0.0778, lr=1e-5]Steps:  47%|████▋     | 7087/15001 [4:33:36<4:03:20,  1.84s/it, loss=0.0778, lr=1e-5]Steps:  47%|████▋     | 7087/15001 [4:33:37<4:03:20,  1.84s/it, loss=0.0779, lr=1e-5]Steps:  47%|████▋     | 7088/15001 [4:33:38<4:09:50,  1.89s/it, loss=0.0779, lr=1e-5]Steps:  47%|████▋     | 7088/15001 [4:33:38<4:09:50,  1.89s/it, loss=0.421, lr=1e-5] Steps:  47%|████▋     | 7089/15001 [4:33:40<4:01:09,  1.83s/it, loss=0.421, lr=1e-5]Steps:  47%|████▋     | 7089/15001 [4:33:40<4:01:09,  1.83s/it, loss=0.123, lr=1e-5]Steps:  47%|████▋     | 7090/15001 [4:33:42<4:00:08,  1.82s/it, loss=0.123, lr=1e-5]Steps:  47%|████▋     | 7090/15001 [4:33:42<4:00:08,  1.82s/it, loss=0.343, lr=1e-5]Steps:  47%|████▋     | 7091/15001 [4:33:44<4:05:19,  1.86s/it, loss=0.343, lr=1e-5]Steps:  47%|████▋     | 7091/15001 [4:33:44<4:05:19,  1.86s/it, loss=0.193, lr=1e-5]Steps:  47%|████▋     | 7092/15001 [4:33:46<4:03:33,  1.85s/it, loss=0.193, lr=1e-5]Steps:  47%|████▋     | 7092/15001 [4:33:46<4:03:33,  1.85s/it, loss=0.245, lr=1e-5]Steps:  47%|████▋     | 7093/15001 [4:33:48<4:19:09,  1.97s/it, loss=0.245, lr=1e-5]Steps:  47%|████▋     | 7093/15001 [4:33:48<4:19:09,  1.97s/it, loss=0.345, lr=1e-5]Steps:  47%|████▋     | 7094/15001 [4:33:50<4:22:34,  1.99s/it, loss=0.345, lr=1e-5]Steps:  47%|████▋     | 7094/15001 [4:33:50<4:22:34,  1.99s/it, loss=0.32, lr=1e-5] Steps:  47%|████▋     | 7095/15001 [4:33:52<4:20:47,  1.98s/it, loss=0.32, lr=1e-5]Steps:  47%|████▋     | 7095/15001 [4:33:52<4:20:47,  1.98s/it, loss=0.144, lr=1e-5]Steps:  47%|████▋     | 7096/15001 [4:33:54<4:20:03,  1.97s/it, loss=0.144, lr=1e-5]Steps:  47%|████▋     | 7096/15001 [4:33:54<4:20:03,  1.97s/it, loss=0.0193, lr=1e-5]Steps:  47%|████▋     | 7097/15001 [4:33:56<4:23:00,  2.00s/it, loss=0.0193, lr=1e-5]Steps:  47%|████▋     | 7097/15001 [4:33:56<4:23:00,  2.00s/it, loss=0.222, lr=1e-5] Steps:  47%|████▋     | 7098/15001 [4:33:58<4:15:47,  1.94s/it, loss=0.222, lr=1e-5]Steps:  47%|████▋     | 7098/15001 [4:33:58<4:15:47,  1.94s/it, loss=0.188, lr=1e-5]Steps:  47%|████▋     | 7099/15001 [4:34:00<4:22:44,  1.99s/it, loss=0.188, lr=1e-5]Steps:  47%|████▋     | 7099/15001 [4:34:00<4:22:44,  1.99s/it, loss=0.335, lr=1e-5]Steps:  47%|████▋     | 7100/15001 [4:34:02<4:16:11,  1.95s/it, loss=0.335, lr=1e-5]Steps:  47%|████▋     | 7100/15001 [4:34:02<4:16:11,  1.95s/it, loss=0.176, lr=1e-5]Steps:  47%|████▋     | 7101/15001 [4:34:03<4:09:21,  1.89s/it, loss=0.176, lr=1e-5]Steps:  47%|████▋     | 7101/15001 [4:34:03<4:09:21,  1.89s/it, loss=0.112, lr=1e-5]Steps:  47%|████▋     | 7102/15001 [4:34:05<4:02:39,  1.84s/it, loss=0.112, lr=1e-5]Steps:  47%|████▋     | 7102/15001 [4:34:05<4:02:39,  1.84s/it, loss=0.0199, lr=1e-5]Steps:  47%|████▋     | 7103/15001 [4:34:07<3:58:33,  1.81s/it, loss=0.0199, lr=1e-5]Steps:  47%|████▋     | 7103/15001 [4:34:07<3:58:33,  1.81s/it, loss=0.102, lr=1e-5] Steps:  47%|████▋     | 7104/15001 [4:34:09<3:57:51,  1.81s/it, loss=0.102, lr=1e-5]Steps:  47%|████▋     | 7104/15001 [4:34:09<3:57:51,  1.81s/it, loss=0.236, lr=1e-5]Steps:  47%|████▋     | 7105/15001 [4:34:10<3:47:20,  1.73s/it, loss=0.236, lr=1e-5]Steps:  47%|████▋     | 7105/15001 [4:34:11<3:47:20,  1.73s/it, loss=0.195, lr=1e-5]Steps:  47%|████▋     | 7106/15001 [4:34:12<3:57:53,  1.81s/it, loss=0.195, lr=1e-5]Steps:  47%|████▋     | 7106/15001 [4:34:12<3:57:53,  1.81s/it, loss=0.194, lr=1e-5]Steps:  47%|████▋     | 7107/15001 [4:34:14<3:53:26,  1.77s/it, loss=0.194, lr=1e-5]Steps:  47%|████▋     | 7107/15001 [4:34:14<3:53:26,  1.77s/it, loss=0.125, lr=1e-5]Steps:  47%|████▋     | 7108/15001 [4:34:16<3:57:42,  1.81s/it, loss=0.125, lr=1e-5]Steps:  47%|████▋     | 7108/15001 [4:34:16<3:57:42,  1.81s/it, loss=0.2, lr=1e-5]  Steps:  47%|████▋     | 7109/15001 [4:34:17<3:50:25,  1.75s/it, loss=0.2, lr=1e-5]Steps:  47%|████▋     | 7109/15001 [4:34:18<3:50:25,  1.75s/it, loss=0.162, lr=1e-5]Steps:  47%|████▋     | 7110/15001 [4:34:20<4:03:08,  1.85s/it, loss=0.162, lr=1e-5]Steps:  47%|████▋     | 7110/15001 [4:34:20<4:03:08,  1.85s/it, loss=0.201, lr=1e-5]Steps:  47%|████▋     | 7111/15001 [4:34:21<3:59:11,  1.82s/it, loss=0.201, lr=1e-5]Steps:  47%|████▋     | 7111/15001 [4:34:21<3:59:11,  1.82s/it, loss=0.097, lr=1e-5]Steps:  47%|████▋     | 7112/15001 [4:34:23<4:00:10,  1.83s/it, loss=0.097, lr=1e-5]Steps:  47%|████▋     | 7112/15001 [4:34:23<4:00:10,  1.83s/it, loss=0.303, lr=1e-5]Steps:  47%|████▋     | 7113/15001 [4:34:25<3:56:52,  1.80s/it, loss=0.303, lr=1e-5]Steps:  47%|████▋     | 7113/15001 [4:34:25<3:56:52,  1.80s/it, loss=0.0937, lr=1e-5]Steps:  47%|████▋     | 7114/15001 [4:34:27<3:53:14,  1.77s/it, loss=0.0937, lr=1e-5]Steps:  47%|████▋     | 7114/15001 [4:34:27<3:53:14,  1.77s/it, loss=0.166, lr=1e-5] Steps:  47%|████▋     | 7115/15001 [4:34:29<4:08:15,  1.89s/it, loss=0.166, lr=1e-5]Steps:  47%|████▋     | 7115/15001 [4:34:29<4:08:15,  1.89s/it, loss=0.242, lr=1e-5]Steps:  47%|████▋     | 7116/15001 [4:34:31<4:08:19,  1.89s/it, loss=0.242, lr=1e-5]Steps:  47%|████▋     | 7116/15001 [4:34:31<4:08:19,  1.89s/it, loss=0.112, lr=1e-5]Steps:  47%|████▋     | 7117/15001 [4:34:33<4:11:33,  1.91s/it, loss=0.112, lr=1e-5]Steps:  47%|████▋     | 7117/15001 [4:34:33<4:11:33,  1.91s/it, loss=0.238, lr=1e-5]Steps:  47%|████▋     | 7118/15001 [4:34:35<4:13:48,  1.93s/it, loss=0.238, lr=1e-5]Steps:  47%|████▋     | 7118/15001 [4:34:35<4:13:48,  1.93s/it, loss=0.153, lr=1e-5]Steps:  47%|████▋     | 7119/15001 [4:34:37<4:19:01,  1.97s/it, loss=0.153, lr=1e-5]Steps:  47%|████▋     | 7119/15001 [4:34:37<4:19:01,  1.97s/it, loss=0.0691, lr=1e-5]Steps:  47%|████▋     | 7120/15001 [4:34:39<4:24:23,  2.01s/it, loss=0.0691, lr=1e-5]Steps:  47%|████▋     | 7120/15001 [4:34:39<4:24:23,  2.01s/it, loss=0.1, lr=1e-5]   Steps:  47%|████▋     | 7121/15001 [4:34:40<4:10:45,  1.91s/it, loss=0.1, lr=1e-5]Steps:  47%|████▋     | 7121/15001 [4:34:41<4:10:45,  1.91s/it, loss=0.0606, lr=1e-5]Steps:  47%|████▋     | 7122/15001 [4:34:42<4:12:40,  1.92s/it, loss=0.0606, lr=1e-5]Steps:  47%|████▋     | 7122/15001 [4:34:42<4:12:40,  1.92s/it, loss=0.12, lr=1e-5]  Steps:  47%|████▋     | 7123/15001 [4:34:44<3:58:08,  1.81s/it, loss=0.12, lr=1e-5]Steps:  47%|████▋     | 7123/15001 [4:34:44<3:58:08,  1.81s/it, loss=0.0338, lr=1e-5]Steps:  47%|████▋     | 7124/15001 [4:34:46<4:04:42,  1.86s/it, loss=0.0338, lr=1e-5]Steps:  47%|████▋     | 7124/15001 [4:34:46<4:04:42,  1.86s/it, loss=0.386, lr=1e-5] Steps:  47%|████▋     | 7125/15001 [4:34:48<4:04:31,  1.86s/it, loss=0.386, lr=1e-5]Steps:  47%|████▋     | 7125/15001 [4:34:48<4:04:31,  1.86s/it, loss=0.321, lr=1e-5]Steps:  48%|████▊     | 7126/15001 [4:34:50<4:03:12,  1.85s/it, loss=0.321, lr=1e-5]Steps:  48%|████▊     | 7126/15001 [4:34:50<4:03:12,  1.85s/it, loss=0.137, lr=1e-5]Steps:  48%|████▊     | 7127/15001 [4:34:51<3:55:25,  1.79s/it, loss=0.137, lr=1e-5]Steps:  48%|████▊     | 7127/15001 [4:34:52<3:55:25,  1.79s/it, loss=0.0989, lr=1e-5]Steps:  48%|████▊     | 7128/15001 [4:34:53<3:56:16,  1.80s/it, loss=0.0989, lr=1e-5]Steps:  48%|████▊     | 7128/15001 [4:34:53<3:56:16,  1.80s/it, loss=0.0624, lr=1e-5]Steps:  48%|████▊     | 7129/15001 [4:34:55<3:58:17,  1.82s/it, loss=0.0624, lr=1e-5]Steps:  48%|████▊     | 7129/15001 [4:34:55<3:58:17,  1.82s/it, loss=0.182, lr=1e-5] Steps:  48%|████▊     | 7130/15001 [4:34:57<3:52:45,  1.77s/it, loss=0.182, lr=1e-5]Steps:  48%|████▊     | 7130/15001 [4:34:57<3:52:45,  1.77s/it, loss=0.0541, lr=1e-5]Steps:  48%|████▊     | 7131/15001 [4:34:59<4:00:41,  1.83s/it, loss=0.0541, lr=1e-5]Steps:  48%|████▊     | 7131/15001 [4:34:59<4:00:41,  1.83s/it, loss=0.122, lr=1e-5] Steps:  48%|████▊     | 7132/15001 [4:35:00<3:55:44,  1.80s/it, loss=0.122, lr=1e-5]Steps:  48%|████▊     | 7132/15001 [4:35:00<3:55:44,  1.80s/it, loss=0.073, lr=1e-5]Steps:  48%|████▊     | 7133/15001 [4:35:02<4:01:13,  1.84s/it, loss=0.073, lr=1e-5]Steps:  48%|████▊     | 7133/15001 [4:35:02<4:01:13,  1.84s/it, loss=0.238, lr=1e-5]Steps:  48%|████▊     | 7134/15001 [4:35:04<3:58:21,  1.82s/it, loss=0.238, lr=1e-5]Steps:  48%|████▊     | 7134/15001 [4:35:04<3:58:21,  1.82s/it, loss=0.0776, lr=1e-5]Steps:  48%|████▊     | 7135/15001 [4:35:06<3:53:44,  1.78s/it, loss=0.0776, lr=1e-5]Steps:  48%|████▊     | 7135/15001 [4:35:06<3:53:44,  1.78s/it, loss=0.0755, lr=1e-5]Steps:  48%|████▊     | 7136/15001 [4:35:07<3:50:33,  1.76s/it, loss=0.0755, lr=1e-5]Steps:  48%|████▊     | 7136/15001 [4:35:08<3:50:33,  1.76s/it, loss=0.0867, lr=1e-5]Steps:  48%|████▊     | 7137/15001 [4:35:09<3:50:22,  1.76s/it, loss=0.0867, lr=1e-5]Steps:  48%|████▊     | 7137/15001 [4:35:10<3:50:22,  1.76s/it, loss=0.0916, lr=1e-5]Steps:  48%|████▊     | 7138/15001 [4:35:11<4:08:32,  1.90s/it, loss=0.0916, lr=1e-5]Steps:  48%|████▊     | 7138/15001 [4:35:12<4:08:32,  1.90s/it, loss=0.0855, lr=1e-5]Steps:  48%|████▊     | 7139/15001 [4:35:13<4:15:32,  1.95s/it, loss=0.0855, lr=1e-5]Steps:  48%|████▊     | 7139/15001 [4:35:14<4:15:32,  1.95s/it, loss=0.186, lr=1e-5] Steps:  48%|████▊     | 7140/15001 [4:35:15<4:13:52,  1.94s/it, loss=0.186, lr=1e-5]Steps:  48%|████▊     | 7140/15001 [4:35:15<4:13:52,  1.94s/it, loss=0.303, lr=1e-5]Steps:  48%|████▊     | 7141/15001 [4:35:17<4:11:18,  1.92s/it, loss=0.303, lr=1e-5]Steps:  48%|████▊     | 7141/15001 [4:35:17<4:11:18,  1.92s/it, loss=0.0874, lr=1e-5]Steps:  48%|████▊     | 7142/15001 [4:35:19<4:11:53,  1.92s/it, loss=0.0874, lr=1e-5]Steps:  48%|████▊     | 7142/15001 [4:35:19<4:11:53,  1.92s/it, loss=0.314, lr=1e-5] Steps:  48%|████▊     | 7143/15001 [4:35:21<4:06:50,  1.88s/it, loss=0.314, lr=1e-5]Steps:  48%|████▊     | 7143/15001 [4:35:21<4:06:50,  1.88s/it, loss=0.144, lr=1e-5]Steps:  48%|████▊     | 7144/15001 [4:35:23<4:12:15,  1.93s/it, loss=0.144, lr=1e-5]Steps:  48%|████▊     | 7144/15001 [4:35:23<4:12:15,  1.93s/it, loss=0.165, lr=1e-5]Steps:  48%|████▊     | 7145/15001 [4:35:25<4:05:08,  1.87s/it, loss=0.165, lr=1e-5]Steps:  48%|████▊     | 7145/15001 [4:35:25<4:05:08,  1.87s/it, loss=0.184, lr=1e-5]Steps:  48%|████▊     | 7146/15001 [4:35:27<4:03:23,  1.86s/it, loss=0.184, lr=1e-5]Steps:  48%|████▊     | 7146/15001 [4:35:27<4:03:23,  1.86s/it, loss=0.0767, lr=1e-5]Steps:  48%|████▊     | 7147/15001 [4:35:29<4:10:55,  1.92s/it, loss=0.0767, lr=1e-5]Steps:  48%|████▊     | 7147/15001 [4:35:29<4:10:55,  1.92s/it, loss=0.346, lr=1e-5] Steps:  48%|████▊     | 7148/15001 [4:35:30<4:06:30,  1.88s/it, loss=0.346, lr=1e-5]Steps:  48%|████▊     | 7148/15001 [4:35:31<4:06:30,  1.88s/it, loss=0.306, lr=1e-5]Steps:  48%|████▊     | 7149/15001 [4:35:32<4:09:41,  1.91s/it, loss=0.306, lr=1e-5]Steps:  48%|████▊     | 7149/15001 [4:35:32<4:09:41,  1.91s/it, loss=0.147, lr=1e-5]Steps:  48%|████▊     | 7150/15001 [4:35:34<4:07:49,  1.89s/it, loss=0.147, lr=1e-5]Steps:  48%|████▊     | 7150/15001 [4:35:34<4:07:49,  1.89s/it, loss=0.0222, lr=1e-5]Steps:  48%|████▊     | 7151/15001 [4:35:36<3:51:59,  1.77s/it, loss=0.0222, lr=1e-5]Steps:  48%|████▊     | 7151/15001 [4:35:36<3:51:59,  1.77s/it, loss=0.191, lr=1e-5] Steps:  48%|████▊     | 7152/15001 [4:35:38<3:57:25,  1.81s/it, loss=0.191, lr=1e-5]Steps:  48%|████▊     | 7152/15001 [4:35:38<3:57:25,  1.81s/it, loss=0.229, lr=1e-5]Steps:  48%|████▊     | 7153/15001 [4:35:40<4:02:36,  1.85s/it, loss=0.229, lr=1e-5]Steps:  48%|████▊     | 7153/15001 [4:35:40<4:02:36,  1.85s/it, loss=0.255, lr=1e-5]Steps:  48%|████▊     | 7154/15001 [4:35:41<3:55:09,  1.80s/it, loss=0.255, lr=1e-5]Steps:  48%|████▊     | 7154/15001 [4:35:41<3:55:09,  1.80s/it, loss=0.239, lr=1e-5]Steps:  48%|████▊     | 7155/15001 [4:35:43<3:51:29,  1.77s/it, loss=0.239, lr=1e-5]Steps:  48%|████▊     | 7155/15001 [4:35:43<3:51:29,  1.77s/it, loss=0.063, lr=1e-5]Steps:  48%|████▊     | 7156/15001 [4:35:45<3:54:23,  1.79s/it, loss=0.063, lr=1e-5]Steps:  48%|████▊     | 7156/15001 [4:35:45<3:54:23,  1.79s/it, loss=0.298, lr=1e-5]Steps:  48%|████▊     | 7157/15001 [4:35:47<3:59:09,  1.83s/it, loss=0.298, lr=1e-5]Steps:  48%|████▊     | 7157/15001 [4:35:47<3:59:09,  1.83s/it, loss=0.138, lr=1e-5]Steps:  48%|████▊     | 7158/15001 [4:35:48<3:56:07,  1.81s/it, loss=0.138, lr=1e-5]Steps:  48%|████▊     | 7158/15001 [4:35:49<3:56:07,  1.81s/it, loss=0.0639, lr=1e-5]Steps:  48%|████▊     | 7159/15001 [4:35:50<3:54:54,  1.80s/it, loss=0.0639, lr=1e-5]Steps:  48%|████▊     | 7159/15001 [4:35:50<3:54:54,  1.80s/it, loss=0.134, lr=1e-5] Steps:  48%|████▊     | 7160/15001 [4:35:52<4:02:36,  1.86s/it, loss=0.134, lr=1e-5]Steps:  48%|████▊     | 7160/15001 [4:35:52<4:02:36,  1.86s/it, loss=0.293, lr=1e-5]Steps:  48%|████▊     | 7161/15001 [4:35:54<4:04:08,  1.87s/it, loss=0.293, lr=1e-5]Steps:  48%|████▊     | 7161/15001 [4:35:54<4:04:08,  1.87s/it, loss=0.253, lr=1e-5]Steps:  48%|████▊     | 7162/15001 [4:35:56<4:08:13,  1.90s/it, loss=0.253, lr=1e-5]Steps:  48%|████▊     | 7162/15001 [4:35:56<4:08:13,  1.90s/it, loss=0.312, lr=1e-5]Steps:  48%|████▊     | 7163/15001 [4:35:58<4:20:58,  2.00s/it, loss=0.312, lr=1e-5]Steps:  48%|████▊     | 7163/15001 [4:35:58<4:20:58,  2.00s/it, loss=0.134, lr=1e-5]Steps:  48%|████▊     | 7164/15001 [4:36:00<4:10:34,  1.92s/it, loss=0.134, lr=1e-5]Steps:  48%|████▊     | 7164/15001 [4:36:00<4:10:34,  1.92s/it, loss=0.028, lr=1e-5]Steps:  48%|████▊     | 7165/15001 [4:36:02<4:20:23,  1.99s/it, loss=0.028, lr=1e-5]Steps:  48%|████▊     | 7165/15001 [4:36:02<4:20:23,  1.99s/it, loss=0.0625, lr=1e-5]Steps:  48%|████▊     | 7166/15001 [4:36:04<4:19:42,  1.99s/it, loss=0.0625, lr=1e-5]Steps:  48%|████▊     | 7166/15001 [4:36:05<4:19:42,  1.99s/it, loss=0.182, lr=1e-5] Steps:  48%|████▊     | 7167/15001 [4:36:06<4:21:12,  2.00s/it, loss=0.182, lr=1e-5]Steps:  48%|████▊     | 7167/15001 [4:36:06<4:21:12,  2.00s/it, loss=0.33, lr=1e-5] Steps:  48%|████▊     | 7168/15001 [4:36:08<4:20:58,  2.00s/it, loss=0.33, lr=1e-5]Steps:  48%|████▊     | 7168/15001 [4:36:08<4:20:58,  2.00s/it, loss=0.117, lr=1e-5]Steps:  48%|████▊     | 7169/15001 [4:36:10<4:12:21,  1.93s/it, loss=0.117, lr=1e-5]Steps:  48%|████▊     | 7169/15001 [4:36:10<4:12:21,  1.93s/it, loss=0.133, lr=1e-5]Steps:  48%|████▊     | 7170/15001 [4:36:12<4:05:59,  1.88s/it, loss=0.133, lr=1e-5]Steps:  48%|████▊     | 7170/15001 [4:36:12<4:05:59,  1.88s/it, loss=0.135, lr=1e-5]Steps:  48%|████▊     | 7171/15001 [4:36:14<4:02:15,  1.86s/it, loss=0.135, lr=1e-5]Steps:  48%|████▊     | 7171/15001 [4:36:14<4:02:15,  1.86s/it, loss=0.114, lr=1e-5]Steps:  48%|████▊     | 7172/15001 [4:36:15<3:51:08,  1.77s/it, loss=0.114, lr=1e-5]Steps:  48%|████▊     | 7172/15001 [4:36:16<3:51:08,  1.77s/it, loss=0.183, lr=1e-5]Steps:  48%|████▊     | 7173/15001 [4:36:17<4:07:15,  1.90s/it, loss=0.183, lr=1e-5]Steps:  48%|████▊     | 7173/15001 [4:36:18<4:07:15,  1.90s/it, loss=0.331, lr=1e-5]Steps:  48%|████▊     | 7174/15001 [4:36:19<4:04:31,  1.87s/it, loss=0.331, lr=1e-5]Steps:  48%|████▊     | 7174/15001 [4:36:19<4:04:31,  1.87s/it, loss=0.176, lr=1e-5]Steps:  48%|████▊     | 7175/15001 [4:36:21<4:03:52,  1.87s/it, loss=0.176, lr=1e-5]Steps:  48%|████▊     | 7175/15001 [4:36:21<4:03:52,  1.87s/it, loss=0.0568, lr=1e-5]Steps:  48%|████▊     | 7176/15001 [4:36:23<4:03:46,  1.87s/it, loss=0.0568, lr=1e-5]Steps:  48%|████▊     | 7176/15001 [4:36:23<4:03:46,  1.87s/it, loss=0.104, lr=1e-5] Steps:  48%|████▊     | 7177/15001 [4:36:25<4:05:08,  1.88s/it, loss=0.104, lr=1e-5]Steps:  48%|████▊     | 7177/15001 [4:36:25<4:05:08,  1.88s/it, loss=0.112, lr=1e-5]Steps:  48%|████▊     | 7178/15001 [4:36:27<4:04:41,  1.88s/it, loss=0.112, lr=1e-5]Steps:  48%|████▊     | 7178/15001 [4:36:27<4:04:41,  1.88s/it, loss=0.163, lr=1e-5]Steps:  48%|████▊     | 7179/15001 [4:36:28<4:00:15,  1.84s/it, loss=0.163, lr=1e-5]Steps:  48%|████▊     | 7179/15001 [4:36:29<4:00:15,  1.84s/it, loss=0.056, lr=1e-5]Steps:  48%|████▊     | 7180/15001 [4:36:30<4:01:48,  1.86s/it, loss=0.056, lr=1e-5]Steps:  48%|████▊     | 7180/15001 [4:36:31<4:01:48,  1.86s/it, loss=0.0859, lr=1e-5]Steps:  48%|████▊     | 7181/15001 [4:36:32<4:06:43,  1.89s/it, loss=0.0859, lr=1e-5]Steps:  48%|████▊     | 7181/15001 [4:36:32<4:06:43,  1.89s/it, loss=0.0533, lr=1e-5]Steps:  48%|████▊     | 7182/15001 [4:36:34<3:58:27,  1.83s/it, loss=0.0533, lr=1e-5]Steps:  48%|████▊     | 7182/15001 [4:36:34<3:58:27,  1.83s/it, loss=0.237, lr=1e-5] Steps:  48%|████▊     | 7183/15001 [4:36:36<3:53:05,  1.79s/it, loss=0.237, lr=1e-5]Steps:  48%|████▊     | 7183/15001 [4:36:36<3:53:05,  1.79s/it, loss=0.0851, lr=1e-5]Steps:  48%|████▊     | 7184/15001 [4:36:38<4:11:59,  1.93s/it, loss=0.0851, lr=1e-5]Steps:  48%|████▊     | 7184/15001 [4:36:38<4:11:59,  1.93s/it, loss=0.305, lr=1e-5] Steps:  48%|████▊     | 7185/15001 [4:36:40<4:14:41,  1.96s/it, loss=0.305, lr=1e-5]Steps:  48%|████▊     | 7185/15001 [4:36:40<4:14:41,  1.96s/it, loss=0.105, lr=1e-5]Steps:  48%|████▊     | 7186/15001 [4:36:42<4:11:14,  1.93s/it, loss=0.105, lr=1e-5]Steps:  48%|████▊     | 7186/15001 [4:36:42<4:11:14,  1.93s/it, loss=0.0503, lr=1e-5]Steps:  48%|████▊     | 7187/15001 [4:36:44<4:21:42,  2.01s/it, loss=0.0503, lr=1e-5]Steps:  48%|████▊     | 7187/15001 [4:36:44<4:21:42,  2.01s/it, loss=0.226, lr=1e-5] Steps:  48%|████▊     | 7188/15001 [4:36:46<4:07:32,  1.90s/it, loss=0.226, lr=1e-5]Steps:  48%|████▊     | 7188/15001 [4:36:46<4:07:32,  1.90s/it, loss=0.126, lr=1e-5]Steps:  48%|████▊     | 7189/15001 [4:36:48<4:11:55,  1.93s/it, loss=0.126, lr=1e-5]Steps:  48%|████▊     | 7189/15001 [4:36:48<4:11:55,  1.93s/it, loss=0.267, lr=1e-5]Steps:  48%|████▊     | 7190/15001 [4:36:50<4:19:08,  1.99s/it, loss=0.267, lr=1e-5]Steps:  48%|████▊     | 7190/15001 [4:36:50<4:19:08,  1.99s/it, loss=0.271, lr=1e-5]Steps:  48%|████▊     | 7191/15001 [4:36:52<4:09:47,  1.92s/it, loss=0.271, lr=1e-5]Steps:  48%|████▊     | 7191/15001 [4:36:52<4:09:47,  1.92s/it, loss=0.138, lr=1e-5]Steps:  48%|████▊     | 7192/15001 [4:36:53<4:03:25,  1.87s/it, loss=0.138, lr=1e-5]Steps:  48%|████▊     | 7192/15001 [4:36:53<4:03:25,  1.87s/it, loss=0.0478, lr=1e-5]Steps:  48%|████▊     | 7193/15001 [4:36:55<3:58:03,  1.83s/it, loss=0.0478, lr=1e-5]Steps:  48%|████▊     | 7193/15001 [4:36:55<3:58:03,  1.83s/it, loss=0.0884, lr=1e-5]Steps:  48%|████▊     | 7194/15001 [4:36:57<3:57:10,  1.82s/it, loss=0.0884, lr=1e-5]Steps:  48%|████▊     | 7194/15001 [4:36:57<3:57:10,  1.82s/it, loss=0.106, lr=1e-5] Steps:  48%|████▊     | 7195/15001 [4:36:59<3:59:11,  1.84s/it, loss=0.106, lr=1e-5]Steps:  48%|████▊     | 7195/15001 [4:36:59<3:59:11,  1.84s/it, loss=0.216, lr=1e-5]Steps:  48%|████▊     | 7196/15001 [4:37:00<3:51:40,  1.78s/it, loss=0.216, lr=1e-5]Steps:  48%|████▊     | 7196/15001 [4:37:01<3:51:40,  1.78s/it, loss=0.143, lr=1e-5]Steps:  48%|████▊     | 7197/15001 [4:37:02<3:50:28,  1.77s/it, loss=0.143, lr=1e-5]Steps:  48%|████▊     | 7197/15001 [4:37:02<3:50:28,  1.77s/it, loss=0.202, lr=1e-5]Steps:  48%|████▊     | 7198/15001 [4:37:04<3:59:16,  1.84s/it, loss=0.202, lr=1e-5]Steps:  48%|████▊     | 7198/15001 [4:37:04<3:59:16,  1.84s/it, loss=0.23, lr=1e-5] Steps:  48%|████▊     | 7199/15001 [4:37:06<3:52:22,  1.79s/it, loss=0.23, lr=1e-5]Steps:  48%|████▊     | 7199/15001 [4:37:06<3:52:22,  1.79s/it, loss=0.0776, lr=1e-5]Steps:  48%|████▊     | 7200/15001 [4:37:08<3:53:57,  1.80s/it, loss=0.0776, lr=1e-5]Steps:  48%|████▊     | 7200/15001 [4:37:08<3:53:57,  1.80s/it, loss=0.259, lr=1e-5] Steps:  48%|████▊     | 7201/15001 [4:37:09<3:55:56,  1.81s/it, loss=0.259, lr=1e-5]Steps:  48%|████▊     | 7201/15001 [4:37:10<3:55:56,  1.81s/it, loss=0.203, lr=1e-5]Steps:  48%|████▊     | 7202/15001 [4:37:11<3:52:50,  1.79s/it, loss=0.203, lr=1e-5]Steps:  48%|████▊     | 7202/15001 [4:37:12<3:52:50,  1.79s/it, loss=0.181, lr=1e-5]Steps:  48%|████▊     | 7203/15001 [4:37:13<4:06:40,  1.90s/it, loss=0.181, lr=1e-5]Steps:  48%|████▊     | 7203/15001 [4:37:13<4:06:40,  1.90s/it, loss=0.0936, lr=1e-5]Steps:  48%|████▊     | 7204/15001 [4:37:15<3:59:17,  1.84s/it, loss=0.0936, lr=1e-5]Steps:  48%|████▊     | 7204/15001 [4:37:15<3:59:17,  1.84s/it, loss=0.101, lr=1e-5] Steps:  48%|████▊     | 7205/15001 [4:37:17<3:49:46,  1.77s/it, loss=0.101, lr=1e-5]Steps:  48%|████▊     | 7205/15001 [4:37:17<3:49:46,  1.77s/it, loss=0.167, lr=1e-5]Steps:  48%|████▊     | 7206/15001 [4:37:19<4:07:10,  1.90s/it, loss=0.167, lr=1e-5]Steps:  48%|████▊     | 7206/15001 [4:37:19<4:07:10,  1.90s/it, loss=0.304, lr=1e-5]Steps:  48%|████▊     | 7207/15001 [4:37:21<4:03:58,  1.88s/it, loss=0.304, lr=1e-5]Steps:  48%|████▊     | 7207/15001 [4:37:21<4:03:58,  1.88s/it, loss=0.199, lr=1e-5]Steps:  48%|████▊     | 7208/15001 [4:37:23<4:09:31,  1.92s/it, loss=0.199, lr=1e-5]Steps:  48%|████▊     | 7208/15001 [4:37:23<4:09:31,  1.92s/it, loss=0.162, lr=1e-5]Steps:  48%|████▊     | 7209/15001 [4:37:25<4:13:38,  1.95s/it, loss=0.162, lr=1e-5]Steps:  48%|████▊     | 7209/15001 [4:37:25<4:13:38,  1.95s/it, loss=0.0984, lr=1e-5]Steps:  48%|████▊     | 7210/15001 [4:37:27<4:17:51,  1.99s/it, loss=0.0984, lr=1e-5]Steps:  48%|████▊     | 7210/15001 [4:37:27<4:17:51,  1.99s/it, loss=0.125, lr=1e-5] Steps:  48%|████▊     | 7211/15001 [4:37:29<4:07:16,  1.90s/it, loss=0.125, lr=1e-5]Steps:  48%|████▊     | 7211/15001 [4:37:29<4:07:16,  1.90s/it, loss=0.119, lr=1e-5]Steps:  48%|████▊     | 7212/15001 [4:37:30<4:04:22,  1.88s/it, loss=0.119, lr=1e-5]Steps:  48%|████▊     | 7212/15001 [4:37:31<4:04:22,  1.88s/it, loss=0.305, lr=1e-5]Steps:  48%|████▊     | 7213/15001 [4:37:32<4:10:31,  1.93s/it, loss=0.305, lr=1e-5]Steps:  48%|████▊     | 7213/15001 [4:37:33<4:10:31,  1.93s/it, loss=0.0433, lr=1e-5]Steps:  48%|████▊     | 7214/15001 [4:37:34<4:02:49,  1.87s/it, loss=0.0433, lr=1e-5]Steps:  48%|████▊     | 7214/15001 [4:37:34<4:02:49,  1.87s/it, loss=0.283, lr=1e-5] Steps:  48%|████▊     | 7215/15001 [4:37:36<4:05:10,  1.89s/it, loss=0.283, lr=1e-5]Steps:  48%|████▊     | 7215/15001 [4:37:36<4:05:10,  1.89s/it, loss=0.24, lr=1e-5] Steps:  48%|████▊     | 7216/15001 [4:37:38<4:03:11,  1.87s/it, loss=0.24, lr=1e-5]Steps:  48%|████▊     | 7216/15001 [4:37:38<4:03:11,  1.87s/it, loss=0.23, lr=1e-5]Steps:  48%|████▊     | 7217/15001 [4:37:40<4:05:26,  1.89s/it, loss=0.23, lr=1e-5]Steps:  48%|████▊     | 7217/15001 [4:37:40<4:05:26,  1.89s/it, loss=0.111, lr=1e-5]Steps:  48%|████▊     | 7218/15001 [4:37:41<3:54:46,  1.81s/it, loss=0.111, lr=1e-5]Steps:  48%|████▊     | 7218/15001 [4:37:42<3:54:46,  1.81s/it, loss=0.161, lr=1e-5]Steps:  48%|████▊     | 7219/15001 [4:37:43<4:02:52,  1.87s/it, loss=0.161, lr=1e-5]Steps:  48%|████▊     | 7219/15001 [4:37:44<4:02:52,  1.87s/it, loss=0.236, lr=1e-5]Steps:  48%|████▊     | 7220/15001 [4:37:45<3:54:55,  1.81s/it, loss=0.236, lr=1e-5]Steps:  48%|████▊     | 7220/15001 [4:37:45<3:54:55,  1.81s/it, loss=0.0564, lr=1e-5]Steps:  48%|████▊     | 7221/15001 [4:37:47<3:47:35,  1.76s/it, loss=0.0564, lr=1e-5]Steps:  48%|████▊     | 7221/15001 [4:37:47<3:47:35,  1.76s/it, loss=0.0703, lr=1e-5]Steps:  48%|████▊     | 7222/15001 [4:37:49<3:55:25,  1.82s/it, loss=0.0703, lr=1e-5]Steps:  48%|████▊     | 7222/15001 [4:37:49<3:55:25,  1.82s/it, loss=0.124, lr=1e-5] Steps:  48%|████▊     | 7223/15001 [4:37:50<3:50:50,  1.78s/it, loss=0.124, lr=1e-5]Steps:  48%|████▊     | 7223/15001 [4:37:51<3:50:50,  1.78s/it, loss=0.306, lr=1e-5]Steps:  48%|████▊     | 7224/15001 [4:37:52<4:00:09,  1.85s/it, loss=0.306, lr=1e-5]Steps:  48%|████▊     | 7224/15001 [4:37:53<4:00:09,  1.85s/it, loss=0.106, lr=1e-5]Steps:  48%|████▊     | 7225/15001 [4:37:54<3:58:34,  1.84s/it, loss=0.106, lr=1e-5]Steps:  48%|████▊     | 7225/15001 [4:37:54<3:58:34,  1.84s/it, loss=0.225, lr=1e-5]Steps:  48%|████▊     | 7226/15001 [4:37:56<3:53:14,  1.80s/it, loss=0.225, lr=1e-5]Steps:  48%|████▊     | 7226/15001 [4:37:56<3:53:14,  1.80s/it, loss=0.101, lr=1e-5]Steps:  48%|████▊     | 7227/15001 [4:37:58<4:02:01,  1.87s/it, loss=0.101, lr=1e-5]Steps:  48%|████▊     | 7227/15001 [4:37:58<4:02:01,  1.87s/it, loss=0.105, lr=1e-5]Steps:  48%|████▊     | 7228/15001 [4:38:00<4:02:28,  1.87s/it, loss=0.105, lr=1e-5]Steps:  48%|████▊     | 7228/15001 [4:38:00<4:02:28,  1.87s/it, loss=0.15, lr=1e-5] Steps:  48%|████▊     | 7229/15001 [4:38:02<3:58:45,  1.84s/it, loss=0.15, lr=1e-5]Steps:  48%|████▊     | 7229/15001 [4:38:02<3:58:45,  1.84s/it, loss=0.229, lr=1e-5]Steps:  48%|████▊     | 7230/15001 [4:38:03<3:56:56,  1.83s/it, loss=0.229, lr=1e-5]Steps:  48%|████▊     | 7230/15001 [4:38:04<3:56:56,  1.83s/it, loss=0.0984, lr=1e-5]Steps:  48%|████▊     | 7231/15001 [4:38:06<4:17:03,  1.99s/it, loss=0.0984, lr=1e-5]Steps:  48%|████▊     | 7231/15001 [4:38:06<4:17:03,  1.99s/it, loss=0.217, lr=1e-5] Steps:  48%|████▊     | 7232/15001 [4:38:08<4:10:56,  1.94s/it, loss=0.217, lr=1e-5]Steps:  48%|████▊     | 7232/15001 [4:38:08<4:10:56,  1.94s/it, loss=0.21, lr=1e-5] Steps:  48%|████▊     | 7233/15001 [4:38:10<4:29:51,  2.08s/it, loss=0.21, lr=1e-5]Steps:  48%|████▊     | 7233/15001 [4:38:10<4:29:51,  2.08s/it, loss=0.179, lr=1e-5]Steps:  48%|████▊     | 7234/15001 [4:38:12<4:16:35,  1.98s/it, loss=0.179, lr=1e-5]Steps:  48%|████▊     | 7234/15001 [4:38:12<4:16:35,  1.98s/it, loss=0.11, lr=1e-5] Steps:  48%|████▊     | 7235/15001 [4:38:14<4:18:59,  2.00s/it, loss=0.11, lr=1e-5]Steps:  48%|████▊     | 7235/15001 [4:38:14<4:18:59,  2.00s/it, loss=0.0987, lr=1e-5]Steps:  48%|████▊     | 7236/15001 [4:38:16<4:13:36,  1.96s/it, loss=0.0987, lr=1e-5]Steps:  48%|████▊     | 7236/15001 [4:38:16<4:13:36,  1.96s/it, loss=0.191, lr=1e-5] Steps:  48%|████▊     | 7237/15001 [4:38:18<4:10:50,  1.94s/it, loss=0.191, lr=1e-5]Steps:  48%|████▊     | 7237/15001 [4:38:18<4:10:50,  1.94s/it, loss=0.286, lr=1e-5]Steps:  48%|████▊     | 7238/15001 [4:38:19<4:02:02,  1.87s/it, loss=0.286, lr=1e-5]Steps:  48%|████▊     | 7238/15001 [4:38:19<4:02:02,  1.87s/it, loss=0.121, lr=1e-5]Steps:  48%|████▊     | 7239/15001 [4:38:21<3:58:41,  1.85s/it, loss=0.121, lr=1e-5]Steps:  48%|████▊     | 7239/15001 [4:38:21<3:58:41,  1.85s/it, loss=0.272, lr=1e-5]Steps:  48%|████▊     | 7240/15001 [4:38:23<4:04:44,  1.89s/it, loss=0.272, lr=1e-5]Steps:  48%|████▊     | 7240/15001 [4:38:23<4:04:44,  1.89s/it, loss=0.177, lr=1e-5]Steps:  48%|████▊     | 7241/15001 [4:38:25<3:53:25,  1.80s/it, loss=0.177, lr=1e-5]Steps:  48%|████▊     | 7241/15001 [4:38:25<3:53:25,  1.80s/it, loss=0.128, lr=1e-5]Steps:  48%|████▊     | 7242/15001 [4:38:27<3:56:36,  1.83s/it, loss=0.128, lr=1e-5]Steps:  48%|████▊     | 7242/15001 [4:38:27<3:56:36,  1.83s/it, loss=0.135, lr=1e-5]Steps:  48%|████▊     | 7243/15001 [4:38:28<3:59:42,  1.85s/it, loss=0.135, lr=1e-5]Steps:  48%|████▊     | 7243/15001 [4:38:29<3:59:42,  1.85s/it, loss=0.115, lr=1e-5]Steps:  48%|████▊     | 7244/15001 [4:38:30<3:52:02,  1.79s/it, loss=0.115, lr=1e-5]Steps:  48%|████▊     | 7244/15001 [4:38:30<3:52:02,  1.79s/it, loss=0.083, lr=1e-5]Steps:  48%|████▊     | 7245/15001 [4:38:32<3:49:43,  1.78s/it, loss=0.083, lr=1e-5]Steps:  48%|████▊     | 7245/15001 [4:38:32<3:49:43,  1.78s/it, loss=0.364, lr=1e-5]Steps:  48%|████▊     | 7246/15001 [4:38:34<3:58:51,  1.85s/it, loss=0.364, lr=1e-5]Steps:  48%|████▊     | 7246/15001 [4:38:34<3:58:51,  1.85s/it, loss=0.0833, lr=1e-5]Steps:  48%|████▊     | 7247/15001 [4:38:36<3:59:26,  1.85s/it, loss=0.0833, lr=1e-5]Steps:  48%|████▊     | 7247/15001 [4:38:36<3:59:26,  1.85s/it, loss=0.222, lr=1e-5] Steps:  48%|████▊     | 7248/15001 [4:38:38<4:00:32,  1.86s/it, loss=0.222, lr=1e-5]Steps:  48%|████▊     | 7248/15001 [4:38:38<4:00:32,  1.86s/it, loss=0.174, lr=1e-5]Steps:  48%|████▊     | 7249/15001 [4:38:39<3:59:39,  1.85s/it, loss=0.174, lr=1e-5]Steps:  48%|████▊     | 7249/15001 [4:38:40<3:59:39,  1.85s/it, loss=0.242, lr=1e-5]Steps:  48%|████▊     | 7250/15001 [4:38:41<3:50:53,  1.79s/it, loss=0.242, lr=1e-5]Steps:  48%|████▊     | 7250/15001 [4:38:41<3:50:53,  1.79s/it, loss=0.191, lr=1e-5]Steps:  48%|████▊     | 7251/15001 [4:38:43<3:56:02,  1.83s/it, loss=0.191, lr=1e-5]Steps:  48%|████▊     | 7251/15001 [4:38:43<3:56:02,  1.83s/it, loss=0.12, lr=1e-5] Steps:  48%|████▊     | 7252/15001 [4:38:45<3:57:02,  1.84s/it, loss=0.12, lr=1e-5]Steps:  48%|████▊     | 7252/15001 [4:38:45<3:57:02,  1.84s/it, loss=0.171, lr=1e-5]Steps:  48%|████▊     | 7253/15001 [4:38:47<4:04:11,  1.89s/it, loss=0.171, lr=1e-5]Steps:  48%|████▊     | 7253/15001 [4:38:47<4:04:11,  1.89s/it, loss=0.11, lr=1e-5] Steps:  48%|████▊     | 7254/15001 [4:38:49<4:04:59,  1.90s/it, loss=0.11, lr=1e-5]Steps:  48%|████▊     | 7254/15001 [4:38:49<4:04:59,  1.90s/it, loss=0.0641, lr=1e-5]Steps:  48%|████▊     | 7255/15001 [4:38:51<4:15:49,  1.98s/it, loss=0.0641, lr=1e-5]Steps:  48%|████▊     | 7255/15001 [4:38:51<4:15:49,  1.98s/it, loss=0.2, lr=1e-5]   Steps:  48%|████▊     | 7256/15001 [4:38:53<4:13:29,  1.96s/it, loss=0.2, lr=1e-5]Steps:  48%|████▊     | 7256/15001 [4:38:53<4:13:29,  1.96s/it, loss=0.337, lr=1e-5]Steps:  48%|████▊     | 7257/15001 [4:38:55<4:15:17,  1.98s/it, loss=0.337, lr=1e-5]Steps:  48%|████▊     | 7257/15001 [4:38:55<4:15:17,  1.98s/it, loss=0.253, lr=1e-5]Steps:  48%|████▊     | 7258/15001 [4:38:57<4:04:04,  1.89s/it, loss=0.253, lr=1e-5]Steps:  48%|████▊     | 7258/15001 [4:38:57<4:04:04,  1.89s/it, loss=0.132, lr=1e-5]Steps:  48%|████▊     | 7259/15001 [4:38:59<4:13:43,  1.97s/it, loss=0.132, lr=1e-5]Steps:  48%|████▊     | 7259/15001 [4:38:59<4:13:43,  1.97s/it, loss=0.217, lr=1e-5]Steps:  48%|████▊     | 7260/15001 [4:39:00<4:01:06,  1.87s/it, loss=0.217, lr=1e-5]Steps:  48%|████▊     | 7260/15001 [4:39:01<4:01:06,  1.87s/it, loss=0.237, lr=1e-5]Steps:  48%|████▊     | 7261/15001 [4:39:02<4:00:58,  1.87s/it, loss=0.237, lr=1e-5]Steps:  48%|████▊     | 7261/15001 [4:39:02<4:00:58,  1.87s/it, loss=0.219, lr=1e-5]Steps:  48%|████▊     | 7262/15001 [4:39:04<4:01:10,  1.87s/it, loss=0.219, lr=1e-5]Steps:  48%|████▊     | 7262/15001 [4:39:04<4:01:10,  1.87s/it, loss=0.161, lr=1e-5]Steps:  48%|████▊     | 7263/15001 [4:39:06<3:57:32,  1.84s/it, loss=0.161, lr=1e-5]Steps:  48%|████▊     | 7263/15001 [4:39:06<3:57:32,  1.84s/it, loss=0.12, lr=1e-5] Steps:  48%|████▊     | 7264/15001 [4:39:08<3:55:12,  1.82s/it, loss=0.12, lr=1e-5]Steps:  48%|████▊     | 7264/15001 [4:39:08<3:55:12,  1.82s/it, loss=0.347, lr=1e-5]Steps:  48%|████▊     | 7265/15001 [4:39:10<4:03:51,  1.89s/it, loss=0.347, lr=1e-5]Steps:  48%|████▊     | 7265/15001 [4:39:10<4:03:51,  1.89s/it, loss=0.168, lr=1e-5]Steps:  48%|████▊     | 7266/15001 [4:39:11<3:54:21,  1.82s/it, loss=0.168, lr=1e-5]Steps:  48%|████▊     | 7266/15001 [4:39:12<3:54:21,  1.82s/it, loss=0.0447, lr=1e-5]Steps:  48%|████▊     | 7267/15001 [4:39:13<3:58:35,  1.85s/it, loss=0.0447, lr=1e-5]Steps:  48%|████▊     | 7267/15001 [4:39:13<3:58:35,  1.85s/it, loss=0.0347, lr=1e-5]Steps:  48%|████▊     | 7268/15001 [4:39:15<3:57:00,  1.84s/it, loss=0.0347, lr=1e-5]Steps:  48%|████▊     | 7268/15001 [4:39:15<3:57:00,  1.84s/it, loss=0.107, lr=1e-5] Steps:  48%|████▊     | 7269/15001 [4:39:17<3:51:14,  1.79s/it, loss=0.107, lr=1e-5]Steps:  48%|████▊     | 7269/15001 [4:39:17<3:51:14,  1.79s/it, loss=0.0618, lr=1e-5]Steps:  48%|████▊     | 7270/15001 [4:39:19<3:55:12,  1.83s/it, loss=0.0618, lr=1e-5]Steps:  48%|████▊     | 7270/15001 [4:39:19<3:55:12,  1.83s/it, loss=0.189, lr=1e-5] Steps:  48%|████▊     | 7271/15001 [4:39:20<3:52:54,  1.81s/it, loss=0.189, lr=1e-5]Steps:  48%|████▊     | 7271/15001 [4:39:21<3:52:54,  1.81s/it, loss=0.22, lr=1e-5] Steps:  48%|████▊     | 7272/15001 [4:39:22<3:50:18,  1.79s/it, loss=0.22, lr=1e-5]Steps:  48%|████▊     | 7272/15001 [4:39:23<3:50:18,  1.79s/it, loss=0.0599, lr=1e-5]Steps:  48%|████▊     | 7273/15001 [4:39:24<3:52:30,  1.81s/it, loss=0.0599, lr=1e-5]Steps:  48%|████▊     | 7273/15001 [4:39:24<3:52:30,  1.81s/it, loss=0.11, lr=1e-5]  Steps:  48%|████▊     | 7274/15001 [4:39:26<3:49:22,  1.78s/it, loss=0.11, lr=1e-5]Steps:  48%|████▊     | 7274/15001 [4:39:26<3:49:22,  1.78s/it, loss=0.0778, lr=1e-5]Steps:  48%|████▊     | 7275/15001 [4:39:28<4:03:41,  1.89s/it, loss=0.0778, lr=1e-5]Steps:  48%|████▊     | 7275/15001 [4:39:28<4:03:41,  1.89s/it, loss=0.0681, lr=1e-5]Steps:  49%|████▊     | 7276/15001 [4:39:30<4:13:26,  1.97s/it, loss=0.0681, lr=1e-5]Steps:  49%|████▊     | 7276/15001 [4:39:30<4:13:26,  1.97s/it, loss=0.185, lr=1e-5] Steps:  49%|████▊     | 7277/15001 [4:39:32<4:23:47,  2.05s/it, loss=0.185, lr=1e-5]Steps:  49%|████▊     | 7277/15001 [4:39:32<4:23:47,  2.05s/it, loss=0.103, lr=1e-5]Steps:  49%|████▊     | 7278/15001 [4:39:34<4:12:11,  1.96s/it, loss=0.103, lr=1e-5]Steps:  49%|████▊     | 7278/15001 [4:39:34<4:12:11,  1.96s/it, loss=0.144, lr=1e-5]Steps:  49%|████▊     | 7279/15001 [4:39:36<4:18:05,  2.01s/it, loss=0.144, lr=1e-5]Steps:  49%|████▊     | 7279/15001 [4:39:36<4:18:05,  2.01s/it, loss=0.041, lr=1e-5]Steps:  49%|████▊     | 7280/15001 [4:39:38<4:12:56,  1.97s/it, loss=0.041, lr=1e-5]Steps:  49%|████▊     | 7280/15001 [4:39:38<4:12:56,  1.97s/it, loss=0.237, lr=1e-5]Steps:  49%|████▊     | 7281/15001 [4:39:40<4:08:23,  1.93s/it, loss=0.237, lr=1e-5]Steps:  49%|████▊     | 7281/15001 [4:39:40<4:08:23,  1.93s/it, loss=0.225, lr=1e-5]Steps:  49%|████▊     | 7282/15001 [4:39:42<4:05:20,  1.91s/it, loss=0.225, lr=1e-5]Steps:  49%|████▊     | 7282/15001 [4:39:42<4:05:20,  1.91s/it, loss=0.159, lr=1e-5]Steps:  49%|████▊     | 7283/15001 [4:39:44<4:05:56,  1.91s/it, loss=0.159, lr=1e-5]Steps:  49%|████▊     | 7283/15001 [4:39:44<4:05:56,  1.91s/it, loss=0.106, lr=1e-5]Steps:  49%|████▊     | 7284/15001 [4:39:46<4:05:23,  1.91s/it, loss=0.106, lr=1e-5]Steps:  49%|████▊     | 7284/15001 [4:39:46<4:05:23,  1.91s/it, loss=0.0993, lr=1e-5]Steps:  49%|████▊     | 7285/15001 [4:39:47<4:04:43,  1.90s/it, loss=0.0993, lr=1e-5]Steps:  49%|████▊     | 7285/15001 [4:39:48<4:04:43,  1.90s/it, loss=0.0826, lr=1e-5]Steps:  49%|████▊     | 7286/15001 [4:39:49<3:57:16,  1.85s/it, loss=0.0826, lr=1e-5]Steps:  49%|████▊     | 7286/15001 [4:39:49<3:57:16,  1.85s/it, loss=0.0653, lr=1e-5]Steps:  49%|████▊     | 7287/15001 [4:39:51<3:55:00,  1.83s/it, loss=0.0653, lr=1e-5]Steps:  49%|████▊     | 7287/15001 [4:39:51<3:55:00,  1.83s/it, loss=0.111, lr=1e-5] Steps:  49%|████▊     | 7288/15001 [4:39:53<3:59:25,  1.86s/it, loss=0.111, lr=1e-5]Steps:  49%|████▊     | 7288/15001 [4:39:53<3:59:25,  1.86s/it, loss=0.508, lr=1e-5]Steps:  49%|████▊     | 7289/15001 [4:39:55<3:54:52,  1.83s/it, loss=0.508, lr=1e-5]Steps:  49%|████▊     | 7289/15001 [4:39:55<3:54:52,  1.83s/it, loss=0.158, lr=1e-5]Steps:  49%|████▊     | 7290/15001 [4:39:56<3:53:34,  1.82s/it, loss=0.158, lr=1e-5]Steps:  49%|████▊     | 7290/15001 [4:39:57<3:53:34,  1.82s/it, loss=0.414, lr=1e-5]Steps:  49%|████▊     | 7291/15001 [4:39:58<3:57:53,  1.85s/it, loss=0.414, lr=1e-5]Steps:  49%|████▊     | 7291/15001 [4:39:59<3:57:53,  1.85s/it, loss=0.112, lr=1e-5]Steps:  49%|████▊     | 7292/15001 [4:40:00<4:02:04,  1.88s/it, loss=0.112, lr=1e-5]Steps:  49%|████▊     | 7292/15001 [4:40:00<4:02:04,  1.88s/it, loss=0.185, lr=1e-5]Steps:  49%|████▊     | 7293/15001 [4:40:02<4:02:06,  1.88s/it, loss=0.185, lr=1e-5]Steps:  49%|████▊     | 7293/15001 [4:40:02<4:02:06,  1.88s/it, loss=0.259, lr=1e-5]Steps:  49%|████▊     | 7294/15001 [4:40:04<3:55:40,  1.83s/it, loss=0.259, lr=1e-5]Steps:  49%|████▊     | 7294/15001 [4:40:04<3:55:40,  1.83s/it, loss=0.126, lr=1e-5]Steps:  49%|████▊     | 7295/15001 [4:40:06<3:54:30,  1.83s/it, loss=0.126, lr=1e-5]Steps:  49%|████▊     | 7295/15001 [4:40:06<3:54:30,  1.83s/it, loss=0.0857, lr=1e-5]Steps:  49%|████▊     | 7296/15001 [4:40:08<3:54:47,  1.83s/it, loss=0.0857, lr=1e-5]Steps:  49%|████▊     | 7296/15001 [4:40:08<3:54:47,  1.83s/it, loss=0.199, lr=1e-5] Steps:  49%|████▊     | 7297/15001 [4:40:09<3:54:38,  1.83s/it, loss=0.199, lr=1e-5]Steps:  49%|████▊     | 7297/15001 [4:40:09<3:54:38,  1.83s/it, loss=0.0604, lr=1e-5]Steps:  49%|████▊     | 7298/15001 [4:40:11<4:03:22,  1.90s/it, loss=0.0604, lr=1e-5]Steps:  49%|████▊     | 7298/15001 [4:40:12<4:03:22,  1.90s/it, loss=0.14, lr=1e-5]  Steps:  49%|████▊     | 7299/15001 [4:40:13<4:03:30,  1.90s/it, loss=0.14, lr=1e-5]Steps:  49%|████▊     | 7299/15001 [4:40:13<4:03:30,  1.90s/it, loss=0.138, lr=1e-5]Steps:  49%|████▊     | 7300/15001 [4:40:15<4:08:29,  1.94s/it, loss=0.138, lr=1e-5]Steps:  49%|████▊     | 7300/15001 [4:40:15<4:08:29,  1.94s/it, loss=0.261, lr=1e-5]Steps:  49%|████▊     | 7301/15001 [4:40:17<4:09:30,  1.94s/it, loss=0.261, lr=1e-5]Steps:  49%|████▊     | 7301/15001 [4:40:17<4:09:30,  1.94s/it, loss=0.0764, lr=1e-5]Steps:  49%|████▊     | 7302/15001 [4:40:20<4:17:26,  2.01s/it, loss=0.0764, lr=1e-5]Steps:  49%|████▊     | 7302/15001 [4:40:20<4:17:26,  2.01s/it, loss=0.0802, lr=1e-5]Steps:  49%|████▊     | 7303/15001 [4:40:22<4:16:49,  2.00s/it, loss=0.0802, lr=1e-5]Steps:  49%|████▊     | 7303/15001 [4:40:22<4:16:49,  2.00s/it, loss=0.408, lr=1e-5] Steps:  49%|████▊     | 7304/15001 [4:40:23<4:01:34,  1.88s/it, loss=0.408, lr=1e-5]Steps:  49%|████▊     | 7304/15001 [4:40:23<4:01:34,  1.88s/it, loss=0.114, lr=1e-5]Steps:  49%|████▊     | 7305/15001 [4:40:25<4:02:29,  1.89s/it, loss=0.114, lr=1e-5]Steps:  49%|████▊     | 7305/15001 [4:40:25<4:02:29,  1.89s/it, loss=0.419, lr=1e-5]Steps:  49%|████▊     | 7306/15001 [4:40:27<3:56:32,  1.84s/it, loss=0.419, lr=1e-5]Steps:  49%|████▊     | 7306/15001 [4:40:27<3:56:32,  1.84s/it, loss=0.104, lr=1e-5]Steps:  49%|████▊     | 7307/15001 [4:40:28<3:52:42,  1.81s/it, loss=0.104, lr=1e-5]Steps:  49%|████▊     | 7307/15001 [4:40:29<3:52:42,  1.81s/it, loss=0.238, lr=1e-5]Steps:  49%|████▊     | 7308/15001 [4:40:30<3:56:53,  1.85s/it, loss=0.238, lr=1e-5]Steps:  49%|████▊     | 7308/15001 [4:40:31<3:56:53,  1.85s/it, loss=0.152, lr=1e-5]Steps:  49%|████▊     | 7309/15001 [4:40:32<3:54:18,  1.83s/it, loss=0.152, lr=1e-5]Steps:  49%|████▊     | 7309/15001 [4:40:32<3:54:18,  1.83s/it, loss=0.31, lr=1e-5] Steps:  49%|████▊     | 7310/15001 [4:40:34<3:54:28,  1.83s/it, loss=0.31, lr=1e-5]Steps:  49%|████▊     | 7310/15001 [4:40:34<3:54:28,  1.83s/it, loss=0.148, lr=1e-5]Steps:  49%|████▊     | 7311/15001 [4:40:36<3:53:19,  1.82s/it, loss=0.148, lr=1e-5]Steps:  49%|████▊     | 7311/15001 [4:40:36<3:53:19,  1.82s/it, loss=0.0953, lr=1e-5]Steps:  49%|████▊     | 7312/15001 [4:40:38<3:52:02,  1.81s/it, loss=0.0953, lr=1e-5]Steps:  49%|████▊     | 7312/15001 [4:40:38<3:52:02,  1.81s/it, loss=0.0985, lr=1e-5]Steps:  49%|████▉     | 7313/15001 [4:40:39<3:47:26,  1.78s/it, loss=0.0985, lr=1e-5]Steps:  49%|████▉     | 7313/15001 [4:40:39<3:47:26,  1.78s/it, loss=0.129, lr=1e-5] Steps:  49%|████▉     | 7314/15001 [4:40:41<3:46:50,  1.77s/it, loss=0.129, lr=1e-5]Steps:  49%|████▉     | 7314/15001 [4:40:41<3:46:50,  1.77s/it, loss=0.0445, lr=1e-5]Steps:  49%|████▉     | 7315/15001 [4:40:43<3:44:22,  1.75s/it, loss=0.0445, lr=1e-5]Steps:  49%|████▉     | 7315/15001 [4:40:43<3:44:22,  1.75s/it, loss=0.125, lr=1e-5] Steps:  49%|████▉     | 7316/15001 [4:40:45<3:44:37,  1.75s/it, loss=0.125, lr=1e-5]Steps:  49%|████▉     | 7316/15001 [4:40:45<3:44:37,  1.75s/it, loss=0.172, lr=1e-5]Steps:  49%|████▉     | 7317/15001 [4:40:46<3:45:17,  1.76s/it, loss=0.172, lr=1e-5]Steps:  49%|████▉     | 7317/15001 [4:40:47<3:45:17,  1.76s/it, loss=0.108, lr=1e-5]Steps:  49%|████▉     | 7318/15001 [4:40:48<3:48:25,  1.78s/it, loss=0.108, lr=1e-5]Steps:  49%|████▉     | 7318/15001 [4:40:48<3:48:25,  1.78s/it, loss=0.268, lr=1e-5]Steps:  49%|████▉     | 7319/15001 [4:40:50<3:43:35,  1.75s/it, loss=0.268, lr=1e-5]Steps:  49%|████▉     | 7319/15001 [4:40:50<3:43:35,  1.75s/it, loss=0.21, lr=1e-5] Steps:  49%|████▉     | 7320/15001 [4:40:52<3:57:37,  1.86s/it, loss=0.21, lr=1e-5]Steps:  49%|████▉     | 7320/15001 [4:40:52<3:57:37,  1.86s/it, loss=0.23, lr=1e-5]Steps:  49%|████▉     | 7321/15001 [4:40:54<4:01:12,  1.88s/it, loss=0.23, lr=1e-5]Steps:  49%|████▉     | 7321/15001 [4:40:54<4:01:12,  1.88s/it, loss=0.264, lr=1e-5]Steps:  49%|████▉     | 7322/15001 [4:40:56<3:59:28,  1.87s/it, loss=0.264, lr=1e-5]Steps:  49%|████▉     | 7322/15001 [4:40:56<3:59:28,  1.87s/it, loss=0.115, lr=1e-5]Steps:  49%|████▉     | 7323/15001 [4:40:58<3:58:22,  1.86s/it, loss=0.115, lr=1e-5]Steps:  49%|████▉     | 7323/15001 [4:40:58<3:58:22,  1.86s/it, loss=0.198, lr=1e-5]Steps:  49%|████▉     | 7324/15001 [4:41:00<4:17:20,  2.01s/it, loss=0.198, lr=1e-5]Steps:  49%|████▉     | 7324/15001 [4:41:00<4:17:20,  2.01s/it, loss=0.074, lr=1e-5]Steps:  49%|████▉     | 7325/15001 [4:41:02<4:25:21,  2.07s/it, loss=0.074, lr=1e-5]Steps:  49%|████▉     | 7325/15001 [4:41:02<4:25:21,  2.07s/it, loss=0.0785, lr=1e-5]Steps:  49%|████▉     | 7326/15001 [4:41:04<4:05:49,  1.92s/it, loss=0.0785, lr=1e-5]Steps:  49%|████▉     | 7326/15001 [4:41:04<4:05:49,  1.92s/it, loss=0.171, lr=1e-5] Steps:  49%|████▉     | 7327/15001 [4:41:06<4:01:42,  1.89s/it, loss=0.171, lr=1e-5]Steps:  49%|████▉     | 7327/15001 [4:41:06<4:01:42,  1.89s/it, loss=0.0732, lr=1e-5]Steps:  49%|████▉     | 7328/15001 [4:41:08<4:07:16,  1.93s/it, loss=0.0732, lr=1e-5]Steps:  49%|████▉     | 7328/15001 [4:41:08<4:07:16,  1.93s/it, loss=0.166, lr=1e-5] Steps:  49%|████▉     | 7329/15001 [4:41:10<4:09:23,  1.95s/it, loss=0.166, lr=1e-5]Steps:  49%|████▉     | 7329/15001 [4:41:10<4:09:23,  1.95s/it, loss=0.15, lr=1e-5] Steps:  49%|████▉     | 7330/15001 [4:41:11<3:53:34,  1.83s/it, loss=0.15, lr=1e-5]Steps:  49%|████▉     | 7330/15001 [4:41:11<3:53:34,  1.83s/it, loss=0.13, lr=1e-5]Steps:  49%|████▉     | 7331/15001 [4:41:13<3:54:24,  1.83s/it, loss=0.13, lr=1e-5]Steps:  49%|████▉     | 7331/15001 [4:41:13<3:54:24,  1.83s/it, loss=0.107, lr=1e-5]Steps:  49%|████▉     | 7332/15001 [4:41:15<3:54:28,  1.83s/it, loss=0.107, lr=1e-5]Steps:  49%|████▉     | 7332/15001 [4:41:15<3:54:28,  1.83s/it, loss=0.0767, lr=1e-5]Steps:  49%|████▉     | 7333/15001 [4:41:17<4:05:38,  1.92s/it, loss=0.0767, lr=1e-5]Steps:  49%|████▉     | 7333/15001 [4:41:17<4:05:38,  1.92s/it, loss=0.125, lr=1e-5] Steps:  49%|████▉     | 7334/15001 [4:41:19<3:58:28,  1.87s/it, loss=0.125, lr=1e-5]Steps:  49%|████▉     | 7334/15001 [4:41:19<3:58:28,  1.87s/it, loss=0.17, lr=1e-5] Steps:  49%|████▉     | 7335/15001 [4:41:20<3:55:57,  1.85s/it, loss=0.17, lr=1e-5]Steps:  49%|████▉     | 7335/15001 [4:41:21<3:55:57,  1.85s/it, loss=0.299, lr=1e-5]Steps:  49%|████▉     | 7336/15001 [4:41:22<3:47:31,  1.78s/it, loss=0.299, lr=1e-5]Steps:  49%|████▉     | 7336/15001 [4:41:22<3:47:31,  1.78s/it, loss=0.197, lr=1e-5]Steps:  49%|████▉     | 7337/15001 [4:41:24<3:53:21,  1.83s/it, loss=0.197, lr=1e-5]Steps:  49%|████▉     | 7337/15001 [4:41:24<3:53:21,  1.83s/it, loss=0.208, lr=1e-5]Steps:  49%|████▉     | 7338/15001 [4:41:26<3:50:48,  1.81s/it, loss=0.208, lr=1e-5]Steps:  49%|████▉     | 7338/15001 [4:41:26<3:50:48,  1.81s/it, loss=0.142, lr=1e-5]Steps:  49%|████▉     | 7339/15001 [4:41:28<3:57:46,  1.86s/it, loss=0.142, lr=1e-5]Steps:  49%|████▉     | 7339/15001 [4:41:28<3:57:46,  1.86s/it, loss=0.219, lr=1e-5]Steps:  49%|████▉     | 7340/15001 [4:41:30<4:00:42,  1.89s/it, loss=0.219, lr=1e-5]Steps:  49%|████▉     | 7340/15001 [4:41:30<4:00:42,  1.89s/it, loss=0.0235, lr=1e-5]Steps:  49%|████▉     | 7341/15001 [4:41:31<3:52:04,  1.82s/it, loss=0.0235, lr=1e-5]Steps:  49%|████▉     | 7341/15001 [4:41:32<3:52:04,  1.82s/it, loss=0.154, lr=1e-5] Steps:  49%|████▉     | 7342/15001 [4:41:33<3:47:28,  1.78s/it, loss=0.154, lr=1e-5]Steps:  49%|████▉     | 7342/15001 [4:41:34<3:47:28,  1.78s/it, loss=0.259, lr=1e-5]Steps:  49%|████▉     | 7343/15001 [4:41:35<4:08:51,  1.95s/it, loss=0.259, lr=1e-5]Steps:  49%|████▉     | 7343/15001 [4:41:35<4:08:51,  1.95s/it, loss=0.161, lr=1e-5]Steps:  49%|████▉     | 7344/15001 [4:41:37<4:07:46,  1.94s/it, loss=0.161, lr=1e-5]Steps:  49%|████▉     | 7344/15001 [4:41:37<4:07:46,  1.94s/it, loss=0.0238, lr=1e-5]Steps:  49%|████▉     | 7345/15001 [4:41:39<4:08:47,  1.95s/it, loss=0.0238, lr=1e-5]Steps:  49%|████▉     | 7345/15001 [4:41:39<4:08:47,  1.95s/it, loss=0.132, lr=1e-5] Steps:  49%|████▉     | 7346/15001 [4:41:41<4:09:16,  1.95s/it, loss=0.132, lr=1e-5]Steps:  49%|████▉     | 7346/15001 [4:41:41<4:09:16,  1.95s/it, loss=0.145, lr=1e-5]Steps:  49%|████▉     | 7347/15001 [4:41:43<4:09:23,  1.96s/it, loss=0.145, lr=1e-5]Steps:  49%|████▉     | 7347/15001 [4:41:44<4:09:23,  1.96s/it, loss=0.393, lr=1e-5]Steps:  49%|████▉     | 7348/15001 [4:41:45<4:10:49,  1.97s/it, loss=0.393, lr=1e-5]Steps:  49%|████▉     | 7348/15001 [4:41:45<4:10:49,  1.97s/it, loss=0.272, lr=1e-5]Steps:  49%|████▉     | 7349/15001 [4:41:47<4:11:17,  1.97s/it, loss=0.272, lr=1e-5]Steps:  49%|████▉     | 7349/15001 [4:41:47<4:11:17,  1.97s/it, loss=0.0893, lr=1e-5]Steps:  49%|████▉     | 7350/15001 [4:41:49<4:14:21,  1.99s/it, loss=0.0893, lr=1e-5]Steps:  49%|████▉     | 7350/15001 [4:41:49<4:14:21,  1.99s/it, loss=0.14, lr=1e-5]  Steps:  49%|████▉     | 7351/15001 [4:41:51<4:06:19,  1.93s/it, loss=0.14, lr=1e-5]Steps:  49%|████▉     | 7351/15001 [4:41:51<4:06:19,  1.93s/it, loss=0.0434, lr=1e-5]Steps:  49%|████▉     | 7352/15001 [4:41:53<3:51:47,  1.82s/it, loss=0.0434, lr=1e-5]Steps:  49%|████▉     | 7352/15001 [4:41:53<3:51:47,  1.82s/it, loss=0.272, lr=1e-5] Steps:  49%|████▉     | 7353/15001 [4:41:54<3:55:58,  1.85s/it, loss=0.272, lr=1e-5]Steps:  49%|████▉     | 7353/15001 [4:41:55<3:55:58,  1.85s/it, loss=0.29, lr=1e-5] Steps:  49%|████▉     | 7354/15001 [4:41:56<3:53:01,  1.83s/it, loss=0.29, lr=1e-5]Steps:  49%|████▉     | 7354/15001 [4:41:56<3:53:01,  1.83s/it, loss=0.116, lr=1e-5]Steps:  49%|████▉     | 7355/15001 [4:41:58<3:54:16,  1.84s/it, loss=0.116, lr=1e-5]Steps:  49%|████▉     | 7355/15001 [4:41:58<3:54:16,  1.84s/it, loss=0.227, lr=1e-5]Steps:  49%|████▉     | 7356/15001 [4:42:00<3:48:23,  1.79s/it, loss=0.227, lr=1e-5]Steps:  49%|████▉     | 7356/15001 [4:42:00<3:48:23,  1.79s/it, loss=0.209, lr=1e-5]Steps:  49%|████▉     | 7357/15001 [4:42:02<3:56:24,  1.86s/it, loss=0.209, lr=1e-5]Steps:  49%|████▉     | 7357/15001 [4:42:02<3:56:24,  1.86s/it, loss=0.187, lr=1e-5]Steps:  49%|████▉     | 7358/15001 [4:42:04<3:54:32,  1.84s/it, loss=0.187, lr=1e-5]Steps:  49%|████▉     | 7358/15001 [4:42:04<3:54:32,  1.84s/it, loss=0.0857, lr=1e-5]Steps:  49%|████▉     | 7359/15001 [4:42:06<4:01:44,  1.90s/it, loss=0.0857, lr=1e-5]Steps:  49%|████▉     | 7359/15001 [4:42:06<4:01:44,  1.90s/it, loss=0.148, lr=1e-5] Steps:  49%|████▉     | 7360/15001 [4:42:08<4:00:43,  1.89s/it, loss=0.148, lr=1e-5]Steps:  49%|████▉     | 7360/15001 [4:42:08<4:00:43,  1.89s/it, loss=0.0404, lr=1e-5]Steps:  49%|████▉     | 7361/15001 [4:42:09<3:57:07,  1.86s/it, loss=0.0404, lr=1e-5]Steps:  49%|████▉     | 7361/15001 [4:42:09<3:57:07,  1.86s/it, loss=0.151, lr=1e-5] Steps:  49%|████▉     | 7362/15001 [4:42:11<3:45:43,  1.77s/it, loss=0.151, lr=1e-5]Steps:  49%|████▉     | 7362/15001 [4:42:11<3:45:43,  1.77s/it, loss=0.255, lr=1e-5]Steps:  49%|████▉     | 7363/15001 [4:42:13<3:43:34,  1.76s/it, loss=0.255, lr=1e-5]Steps:  49%|████▉     | 7363/15001 [4:42:13<3:43:34,  1.76s/it, loss=0.17, lr=1e-5] Steps:  49%|████▉     | 7364/15001 [4:42:15<3:53:20,  1.83s/it, loss=0.17, lr=1e-5]Steps:  49%|████▉     | 7364/15001 [4:42:15<3:53:20,  1.83s/it, loss=0.101, lr=1e-5]Steps:  49%|████▉     | 7365/15001 [4:42:16<3:49:20,  1.80s/it, loss=0.101, lr=1e-5]Steps:  49%|████▉     | 7365/15001 [4:42:17<3:49:20,  1.80s/it, loss=0.124, lr=1e-5]Steps:  49%|████▉     | 7366/15001 [4:42:18<3:57:07,  1.86s/it, loss=0.124, lr=1e-5]Steps:  49%|████▉     | 7366/15001 [4:42:18<3:57:07,  1.86s/it, loss=0.0321, lr=1e-5]Steps:  49%|████▉     | 7367/15001 [4:42:20<3:52:20,  1.83s/it, loss=0.0321, lr=1e-5]Steps:  49%|████▉     | 7367/15001 [4:42:20<3:52:20,  1.83s/it, loss=0.115, lr=1e-5] Steps:  49%|████▉     | 7368/15001 [4:42:22<4:07:54,  1.95s/it, loss=0.115, lr=1e-5]Steps:  49%|████▉     | 7368/15001 [4:42:23<4:07:54,  1.95s/it, loss=0.371, lr=1e-5]Steps:  49%|████▉     | 7369/15001 [4:42:24<4:05:31,  1.93s/it, loss=0.371, lr=1e-5]Steps:  49%|████▉     | 7369/15001 [4:42:24<4:05:31,  1.93s/it, loss=0.0666, lr=1e-5]Steps:  49%|████▉     | 7370/15001 [4:42:26<4:11:17,  1.98s/it, loss=0.0666, lr=1e-5]Steps:  49%|████▉     | 7370/15001 [4:42:27<4:11:17,  1.98s/it, loss=0.117, lr=1e-5] Steps:  49%|████▉     | 7371/15001 [4:42:29<4:20:39,  2.05s/it, loss=0.117, lr=1e-5]Steps:  49%|████▉     | 7371/15001 [4:42:29<4:20:39,  2.05s/it, loss=0.168, lr=1e-5]Steps:  49%|████▉     | 7372/15001 [4:42:30<4:14:38,  2.00s/it, loss=0.168, lr=1e-5]Steps:  49%|████▉     | 7372/15001 [4:42:31<4:14:38,  2.00s/it, loss=0.267, lr=1e-5]Steps:  49%|████▉     | 7373/15001 [4:42:32<4:14:04,  2.00s/it, loss=0.267, lr=1e-5]Steps:  49%|████▉     | 7373/15001 [4:42:33<4:14:04,  2.00s/it, loss=0.0857, lr=1e-5]Steps:  49%|████▉     | 7374/15001 [4:42:34<4:08:32,  1.96s/it, loss=0.0857, lr=1e-5]Steps:  49%|████▉     | 7374/15001 [4:42:34<4:08:32,  1.96s/it, loss=0.391, lr=1e-5] Steps:  49%|████▉     | 7375/15001 [4:42:36<4:08:39,  1.96s/it, loss=0.391, lr=1e-5]Steps:  49%|████▉     | 7375/15001 [4:42:36<4:08:39,  1.96s/it, loss=0.398, lr=1e-5]Steps:  49%|████▉     | 7376/15001 [4:42:38<4:01:35,  1.90s/it, loss=0.398, lr=1e-5]Steps:  49%|████▉     | 7376/15001 [4:42:38<4:01:35,  1.90s/it, loss=0.289, lr=1e-5]Steps:  49%|████▉     | 7377/15001 [4:42:40<3:55:12,  1.85s/it, loss=0.289, lr=1e-5]Steps:  49%|████▉     | 7377/15001 [4:42:40<3:55:12,  1.85s/it, loss=0.157, lr=1e-5]Steps:  49%|████▉     | 7378/15001 [4:42:42<3:58:13,  1.88s/it, loss=0.157, lr=1e-5]Steps:  49%|████▉     | 7378/15001 [4:42:42<3:58:13,  1.88s/it, loss=0.209, lr=1e-5]Steps:  49%|████▉     | 7379/15001 [4:42:43<3:51:31,  1.82s/it, loss=0.209, lr=1e-5]Steps:  49%|████▉     | 7379/15001 [4:42:43<3:51:31,  1.82s/it, loss=0.136, lr=1e-5]Steps:  49%|████▉     | 7380/15001 [4:42:45<3:52:14,  1.83s/it, loss=0.136, lr=1e-5]Steps:  49%|████▉     | 7380/15001 [4:42:45<3:52:14,  1.83s/it, loss=0.25, lr=1e-5] Steps:  49%|████▉     | 7381/15001 [4:42:47<3:45:55,  1.78s/it, loss=0.25, lr=1e-5]Steps:  49%|████▉     | 7381/15001 [4:42:47<3:45:55,  1.78s/it, loss=0.311, lr=1e-5]Steps:  49%|████▉     | 7382/15001 [4:42:49<3:41:32,  1.74s/it, loss=0.311, lr=1e-5]Steps:  49%|████▉     | 7382/15001 [4:42:49<3:41:32,  1.74s/it, loss=0.165, lr=1e-5]Steps:  49%|████▉     | 7383/15001 [4:42:50<3:43:58,  1.76s/it, loss=0.165, lr=1e-5]Steps:  49%|████▉     | 7383/15001 [4:42:51<3:43:58,  1.76s/it, loss=0.152, lr=1e-5]Steps:  49%|████▉     | 7384/15001 [4:42:52<3:55:09,  1.85s/it, loss=0.152, lr=1e-5]Steps:  49%|████▉     | 7384/15001 [4:42:52<3:55:09,  1.85s/it, loss=0.0956, lr=1e-5]Steps:  49%|████▉     | 7385/15001 [4:42:54<3:51:54,  1.83s/it, loss=0.0956, lr=1e-5]Steps:  49%|████▉     | 7385/15001 [4:42:54<3:51:54,  1.83s/it, loss=0.213, lr=1e-5] Steps:  49%|████▉     | 7386/15001 [4:42:56<3:53:57,  1.84s/it, loss=0.213, lr=1e-5]Steps:  49%|████▉     | 7386/15001 [4:42:56<3:53:57,  1.84s/it, loss=0.197, lr=1e-5]Steps:  49%|████▉     | 7387/15001 [4:42:58<3:50:39,  1.82s/it, loss=0.197, lr=1e-5]Steps:  49%|████▉     | 7387/15001 [4:42:58<3:50:39,  1.82s/it, loss=0.218, lr=1e-5]Steps:  49%|████▉     | 7388/15001 [4:43:00<3:49:59,  1.81s/it, loss=0.218, lr=1e-5]Steps:  49%|████▉     | 7388/15001 [4:43:00<3:49:59,  1.81s/it, loss=0.178, lr=1e-5]Steps:  49%|████▉     | 7389/15001 [4:43:01<3:49:19,  1.81s/it, loss=0.178, lr=1e-5]Steps:  49%|████▉     | 7389/15001 [4:43:02<3:49:19,  1.81s/it, loss=0.234, lr=1e-5]Steps:  49%|████▉     | 7390/15001 [4:43:03<3:54:07,  1.85s/it, loss=0.234, lr=1e-5]Steps:  49%|████▉     | 7390/15001 [4:43:04<3:54:07,  1.85s/it, loss=0.308, lr=1e-5]Steps:  49%|████▉     | 7391/15001 [4:43:05<4:04:06,  1.92s/it, loss=0.308, lr=1e-5]Steps:  49%|████▉     | 7391/15001 [4:43:06<4:04:06,  1.92s/it, loss=0.246, lr=1e-5]Steps:  49%|████▉     | 7392/15001 [4:43:07<4:04:36,  1.93s/it, loss=0.246, lr=1e-5]Steps:  49%|████▉     | 7392/15001 [4:43:08<4:04:36,  1.93s/it, loss=0.2, lr=1e-5]  Steps:  49%|████▉     | 7393/15001 [4:43:09<4:00:15,  1.89s/it, loss=0.2, lr=1e-5]Steps:  49%|████▉     | 7393/15001 [4:43:09<4:00:15,  1.89s/it, loss=0.265, lr=1e-5]Steps:  49%|████▉     | 7394/15001 [4:43:11<4:04:46,  1.93s/it, loss=0.265, lr=1e-5]Steps:  49%|████▉     | 7394/15001 [4:43:11<4:04:46,  1.93s/it, loss=0.0526, lr=1e-5]Steps:  49%|████▉     | 7395/15001 [4:43:13<4:06:24,  1.94s/it, loss=0.0526, lr=1e-5]Steps:  49%|████▉     | 7395/15001 [4:43:13<4:06:24,  1.94s/it, loss=0.0217, lr=1e-5]Steps:  49%|████▉     | 7396/15001 [4:43:15<3:54:14,  1.85s/it, loss=0.0217, lr=1e-5]Steps:  49%|████▉     | 7396/15001 [4:43:15<3:54:14,  1.85s/it, loss=0.212, lr=1e-5] Steps:  49%|████▉     | 7397/15001 [4:43:17<3:49:32,  1.81s/it, loss=0.212, lr=1e-5]Steps:  49%|████▉     | 7397/15001 [4:43:17<3:49:32,  1.81s/it, loss=0.202, lr=1e-5]Steps:  49%|████▉     | 7398/15001 [4:43:19<4:08:29,  1.96s/it, loss=0.202, lr=1e-5]Steps:  49%|████▉     | 7398/15001 [4:43:19<4:08:29,  1.96s/it, loss=0.17, lr=1e-5] Steps:  49%|████▉     | 7399/15001 [4:43:21<3:59:24,  1.89s/it, loss=0.17, lr=1e-5]Steps:  49%|████▉     | 7399/15001 [4:43:21<3:59:24,  1.89s/it, loss=0.214, lr=1e-5]Steps:  49%|████▉     | 7400/15001 [4:43:22<3:56:32,  1.87s/it, loss=0.214, lr=1e-5]Steps:  49%|████▉     | 7400/15001 [4:43:23<3:56:32,  1.87s/it, loss=0.194, lr=1e-5]Steps:  49%|████▉     | 7401/15001 [4:43:24<3:59:36,  1.89s/it, loss=0.194, lr=1e-5]Steps:  49%|████▉     | 7401/15001 [4:43:24<3:59:36,  1.89s/it, loss=0.102, lr=1e-5]Steps:  49%|████▉     | 7402/15001 [4:43:26<3:53:31,  1.84s/it, loss=0.102, lr=1e-5]Steps:  49%|████▉     | 7402/15001 [4:43:26<3:53:31,  1.84s/it, loss=0.276, lr=1e-5]Steps:  49%|████▉     | 7403/15001 [4:43:28<3:57:37,  1.88s/it, loss=0.276, lr=1e-5]Steps:  49%|████▉     | 7403/15001 [4:43:28<3:57:37,  1.88s/it, loss=0.111, lr=1e-5]Steps:  49%|████▉     | 7404/15001 [4:43:30<3:52:41,  1.84s/it, loss=0.111, lr=1e-5]Steps:  49%|████▉     | 7404/15001 [4:43:30<3:52:41,  1.84s/it, loss=0.119, lr=1e-5]Steps:  49%|████▉     | 7405/15001 [4:43:31<3:42:38,  1.76s/it, loss=0.119, lr=1e-5]Steps:  49%|████▉     | 7405/15001 [4:43:32<3:42:38,  1.76s/it, loss=0.405, lr=1e-5]Steps:  49%|████▉     | 7406/15001 [4:43:33<3:48:41,  1.81s/it, loss=0.405, lr=1e-5]Steps:  49%|████▉     | 7406/15001 [4:43:34<3:48:41,  1.81s/it, loss=0.0212, lr=1e-5]Steps:  49%|████▉     | 7407/15001 [4:43:35<3:56:33,  1.87s/it, loss=0.0212, lr=1e-5]Steps:  49%|████▉     | 7407/15001 [4:43:35<3:56:33,  1.87s/it, loss=0.202, lr=1e-5] Steps:  49%|████▉     | 7408/15001 [4:43:37<3:51:15,  1.83s/it, loss=0.202, lr=1e-5]Steps:  49%|████▉     | 7408/15001 [4:43:37<3:51:15,  1.83s/it, loss=0.128, lr=1e-5]Steps:  49%|████▉     | 7409/15001 [4:43:39<3:54:32,  1.85s/it, loss=0.128, lr=1e-5]Steps:  49%|████▉     | 7409/15001 [4:43:39<3:54:32,  1.85s/it, loss=0.164, lr=1e-5]Steps:  49%|████▉     | 7410/15001 [4:43:41<3:57:50,  1.88s/it, loss=0.164, lr=1e-5]Steps:  49%|████▉     | 7410/15001 [4:43:41<3:57:50,  1.88s/it, loss=0.121, lr=1e-5]Steps:  49%|████▉     | 7411/15001 [4:43:43<3:54:14,  1.85s/it, loss=0.121, lr=1e-5]Steps:  49%|████▉     | 7411/15001 [4:43:43<3:54:14,  1.85s/it, loss=0.194, lr=1e-5]Steps:  49%|████▉     | 7412/15001 [4:43:45<3:55:31,  1.86s/it, loss=0.194, lr=1e-5]Steps:  49%|████▉     | 7412/15001 [4:43:45<3:55:31,  1.86s/it, loss=0.313, lr=1e-5]Steps:  49%|████▉     | 7413/15001 [4:43:46<3:56:04,  1.87s/it, loss=0.313, lr=1e-5]Steps:  49%|████▉     | 7413/15001 [4:43:47<3:56:04,  1.87s/it, loss=0.195, lr=1e-5]Steps:  49%|████▉     | 7414/15001 [4:43:48<4:03:42,  1.93s/it, loss=0.195, lr=1e-5]Steps:  49%|████▉     | 7414/15001 [4:43:49<4:03:42,  1.93s/it, loss=0.241, lr=1e-5]Steps:  49%|████▉     | 7415/15001 [4:43:51<4:08:53,  1.97s/it, loss=0.241, lr=1e-5]Steps:  49%|████▉     | 7415/15001 [4:43:51<4:08:53,  1.97s/it, loss=0.155, lr=1e-5]Steps:  49%|████▉     | 7416/15001 [4:43:53<4:15:12,  2.02s/it, loss=0.155, lr=1e-5]Steps:  49%|████▉     | 7416/15001 [4:43:53<4:15:12,  2.02s/it, loss=0.14, lr=1e-5] Steps:  49%|████▉     | 7417/15001 [4:43:55<4:18:44,  2.05s/it, loss=0.14, lr=1e-5]Steps:  49%|████▉     | 7417/15001 [4:43:55<4:18:44,  2.05s/it, loss=0.0491, lr=1e-5]Steps:  49%|████▉     | 7418/15001 [4:43:57<4:14:34,  2.01s/it, loss=0.0491, lr=1e-5]Steps:  49%|████▉     | 7418/15001 [4:43:57<4:14:34,  2.01s/it, loss=0.167, lr=1e-5] Steps:  49%|████▉     | 7419/15001 [4:43:58<3:59:31,  1.90s/it, loss=0.167, lr=1e-5]Steps:  49%|████▉     | 7419/15001 [4:43:59<3:59:31,  1.90s/it, loss=0.0835, lr=1e-5]Steps:  49%|████▉     | 7420/15001 [4:44:00<3:57:18,  1.88s/it, loss=0.0835, lr=1e-5]Steps:  49%|████▉     | 7420/15001 [4:44:00<3:57:18,  1.88s/it, loss=0.244, lr=1e-5] Steps:  49%|████▉     | 7421/15001 [4:44:02<3:59:54,  1.90s/it, loss=0.244, lr=1e-5]Steps:  49%|████▉     | 7421/15001 [4:44:02<3:59:54,  1.90s/it, loss=0.154, lr=1e-5]Steps:  49%|████▉     | 7422/15001 [4:44:04<3:52:10,  1.84s/it, loss=0.154, lr=1e-5]Steps:  49%|████▉     | 7422/15001 [4:44:04<3:52:10,  1.84s/it, loss=0.207, lr=1e-5]Steps:  49%|████▉     | 7423/15001 [4:44:05<3:45:56,  1.79s/it, loss=0.207, lr=1e-5]Steps:  49%|████▉     | 7423/15001 [4:44:06<3:45:56,  1.79s/it, loss=0.0841, lr=1e-5]Steps:  49%|████▉     | 7424/15001 [4:44:07<3:49:35,  1.82s/it, loss=0.0841, lr=1e-5]Steps:  49%|████▉     | 7424/15001 [4:44:08<3:49:35,  1.82s/it, loss=0.064, lr=1e-5] Steps:  49%|████▉     | 7425/15001 [4:44:10<4:02:45,  1.92s/it, loss=0.064, lr=1e-5]Steps:  49%|████▉     | 7425/15001 [4:44:10<4:02:45,  1.92s/it, loss=0.0826, lr=1e-5]Steps:  50%|████▉     | 7426/15001 [4:44:11<3:53:29,  1.85s/it, loss=0.0826, lr=1e-5]Steps:  50%|████▉     | 7426/15001 [4:44:12<3:53:29,  1.85s/it, loss=0.0293, lr=1e-5]Steps:  50%|████▉     | 7427/15001 [4:44:13<3:52:57,  1.85s/it, loss=0.0293, lr=1e-5]Steps:  50%|████▉     | 7427/15001 [4:44:13<3:52:57,  1.85s/it, loss=0.0784, lr=1e-5]Steps:  50%|████▉     | 7428/15001 [4:44:15<3:56:08,  1.87s/it, loss=0.0784, lr=1e-5]Steps:  50%|████▉     | 7428/15001 [4:44:15<3:56:08,  1.87s/it, loss=0.0434, lr=1e-5]Steps:  50%|████▉     | 7429/15001 [4:44:17<3:56:59,  1.88s/it, loss=0.0434, lr=1e-5]Steps:  50%|████▉     | 7429/15001 [4:44:17<3:56:59,  1.88s/it, loss=0.079, lr=1e-5] Steps:  50%|████▉     | 7430/15001 [4:44:19<3:51:50,  1.84s/it, loss=0.079, lr=1e-5]Steps:  50%|████▉     | 7430/15001 [4:44:19<3:51:50,  1.84s/it, loss=0.254, lr=1e-5]Steps:  50%|████▉     | 7431/15001 [4:44:20<3:46:13,  1.79s/it, loss=0.254, lr=1e-5]Steps:  50%|████▉     | 7431/15001 [4:44:21<3:46:13,  1.79s/it, loss=0.168, lr=1e-5]Steps:  50%|████▉     | 7432/15001 [4:44:22<3:41:23,  1.76s/it, loss=0.168, lr=1e-5]Steps:  50%|████▉     | 7432/15001 [4:44:22<3:41:23,  1.76s/it, loss=0.161, lr=1e-5]Steps:  50%|████▉     | 7433/15001 [4:44:24<3:40:46,  1.75s/it, loss=0.161, lr=1e-5]Steps:  50%|████▉     | 7433/15001 [4:44:24<3:40:46,  1.75s/it, loss=0.0898, lr=1e-5]Steps:  50%|████▉     | 7434/15001 [4:44:26<3:55:01,  1.86s/it, loss=0.0898, lr=1e-5]Steps:  50%|████▉     | 7434/15001 [4:44:26<3:55:01,  1.86s/it, loss=0.239, lr=1e-5] Steps:  50%|████▉     | 7435/15001 [4:44:28<3:59:15,  1.90s/it, loss=0.239, lr=1e-5]Steps:  50%|████▉     | 7435/15001 [4:44:28<3:59:15,  1.90s/it, loss=0.0262, lr=1e-5]Steps:  50%|████▉     | 7436/15001 [4:44:30<3:53:31,  1.85s/it, loss=0.0262, lr=1e-5]Steps:  50%|████▉     | 7436/15001 [4:44:30<3:53:31,  1.85s/it, loss=0.372, lr=1e-5] Steps:  50%|████▉     | 7437/15001 [4:44:32<4:12:38,  2.00s/it, loss=0.372, lr=1e-5]Steps:  50%|████▉     | 7437/15001 [4:44:32<4:12:38,  2.00s/it, loss=0.131, lr=1e-5]Steps:  50%|████▉     | 7438/15001 [4:44:34<4:08:13,  1.97s/it, loss=0.131, lr=1e-5]Steps:  50%|████▉     | 7438/15001 [4:44:34<4:08:13,  1.97s/it, loss=0.111, lr=1e-5]Steps:  50%|████▉     | 7439/15001 [4:44:36<4:06:33,  1.96s/it, loss=0.111, lr=1e-5]Steps:  50%|████▉     | 7439/15001 [4:44:36<4:06:33,  1.96s/it, loss=0.358, lr=1e-5]Steps:  50%|████▉     | 7440/15001 [4:44:38<4:09:06,  1.98s/it, loss=0.358, lr=1e-5]Steps:  50%|████▉     | 7440/15001 [4:44:38<4:09:06,  1.98s/it, loss=0.145, lr=1e-5]Steps:  50%|████▉     | 7441/15001 [4:44:40<4:09:20,  1.98s/it, loss=0.145, lr=1e-5]Steps:  50%|████▉     | 7441/15001 [4:44:40<4:09:20,  1.98s/it, loss=0.0968, lr=1e-5]Steps:  50%|████▉     | 7442/15001 [4:44:42<4:02:59,  1.93s/it, loss=0.0968, lr=1e-5]Steps:  50%|████▉     | 7442/15001 [4:44:42<4:02:59,  1.93s/it, loss=0.0522, lr=1e-5]Steps:  50%|████▉     | 7443/15001 [4:44:43<3:53:44,  1.86s/it, loss=0.0522, lr=1e-5]Steps:  50%|████▉     | 7443/15001 [4:44:44<3:53:44,  1.86s/it, loss=0.18, lr=1e-5]  Steps:  50%|████▉     | 7444/15001 [4:44:45<3:52:22,  1.84s/it, loss=0.18, lr=1e-5]Steps:  50%|████▉     | 7444/15001 [4:44:45<3:52:22,  1.84s/it, loss=0.155, lr=1e-5]Steps:  50%|████▉     | 7445/15001 [4:44:47<3:58:59,  1.90s/it, loss=0.155, lr=1e-5]Steps:  50%|████▉     | 7445/15001 [4:44:47<3:58:59,  1.90s/it, loss=0.176, lr=1e-5]Steps:  50%|████▉     | 7446/15001 [4:44:49<3:54:57,  1.87s/it, loss=0.176, lr=1e-5]Steps:  50%|████▉     | 7446/15001 [4:44:49<3:54:57,  1.87s/it, loss=0.0557, lr=1e-5]Steps:  50%|████▉     | 7447/15001 [4:44:51<3:58:03,  1.89s/it, loss=0.0557, lr=1e-5]Steps:  50%|████▉     | 7447/15001 [4:44:51<3:58:03,  1.89s/it, loss=0.196, lr=1e-5] Steps:  50%|████▉     | 7448/15001 [4:44:52<3:45:55,  1.79s/it, loss=0.196, lr=1e-5]Steps:  50%|████▉     | 7448/15001 [4:44:53<3:45:55,  1.79s/it, loss=0.242, lr=1e-5]Steps:  50%|████▉     | 7449/15001 [4:44:54<3:48:59,  1.82s/it, loss=0.242, lr=1e-5]Steps:  50%|████▉     | 7449/15001 [4:44:55<3:48:59,  1.82s/it, loss=0.198, lr=1e-5]Steps:  50%|████▉     | 7450/15001 [4:44:56<4:02:30,  1.93s/it, loss=0.198, lr=1e-5]Steps:  50%|████▉     | 7450/15001 [4:44:57<4:02:30,  1.93s/it, loss=0.0874, lr=1e-5]Steps:  50%|████▉     | 7451/15001 [4:44:58<3:49:53,  1.83s/it, loss=0.0874, lr=1e-5]Steps:  50%|████▉     | 7451/15001 [4:44:58<3:49:53,  1.83s/it, loss=0.273, lr=1e-5] Steps:  50%|████▉     | 7452/15001 [4:45:00<3:53:54,  1.86s/it, loss=0.273, lr=1e-5]Steps:  50%|████▉     | 7452/15001 [4:45:00<3:53:54,  1.86s/it, loss=0.136, lr=1e-5]Steps:  50%|████▉     | 7453/15001 [4:45:02<3:46:37,  1.80s/it, loss=0.136, lr=1e-5]Steps:  50%|████▉     | 7453/15001 [4:45:02<3:46:37,  1.80s/it, loss=0.124, lr=1e-5]Steps:  50%|████▉     | 7454/15001 [4:45:04<3:51:17,  1.84s/it, loss=0.124, lr=1e-5]Steps:  50%|████▉     | 7454/15001 [4:45:04<3:51:17,  1.84s/it, loss=0.169, lr=1e-5]Steps:  50%|████▉     | 7455/15001 [4:45:05<3:48:16,  1.82s/it, loss=0.169, lr=1e-5]Steps:  50%|████▉     | 7455/15001 [4:45:06<3:48:16,  1.82s/it, loss=0.236, lr=1e-5]Steps:  50%|████▉     | 7456/15001 [4:45:07<3:52:11,  1.85s/it, loss=0.236, lr=1e-5]Steps:  50%|████▉     | 7456/15001 [4:45:07<3:52:11,  1.85s/it, loss=0.28, lr=1e-5] Steps:  50%|████▉     | 7457/15001 [4:45:09<3:46:59,  1.81s/it, loss=0.28, lr=1e-5]Steps:  50%|████▉     | 7457/15001 [4:45:09<3:46:59,  1.81s/it, loss=0.16, lr=1e-5]Steps:  50%|████▉     | 7458/15001 [4:45:11<3:51:18,  1.84s/it, loss=0.16, lr=1e-5]Steps:  50%|████▉     | 7458/15001 [4:45:11<3:51:18,  1.84s/it, loss=0.15, lr=1e-5]Steps:  50%|████▉     | 7459/15001 [4:45:13<3:57:26,  1.89s/it, loss=0.15, lr=1e-5]Steps:  50%|████▉     | 7459/15001 [4:45:13<3:57:26,  1.89s/it, loss=0.282, lr=1e-5]Steps:  50%|████▉     | 7460/15001 [4:45:15<3:59:25,  1.90s/it, loss=0.282, lr=1e-5]Steps:  50%|████▉     | 7460/15001 [4:45:15<3:59:25,  1.90s/it, loss=0.198, lr=1e-5]Steps:  50%|████▉     | 7461/15001 [4:45:17<4:09:10,  1.98s/it, loss=0.198, lr=1e-5]Steps:  50%|████▉     | 7461/15001 [4:45:17<4:09:10,  1.98s/it, loss=0.199, lr=1e-5]Steps:  50%|████▉     | 7462/15001 [4:45:19<4:10:48,  2.00s/it, loss=0.199, lr=1e-5]Steps:  50%|████▉     | 7462/15001 [4:45:19<4:10:48,  2.00s/it, loss=0.0813, lr=1e-5]Steps:  50%|████▉     | 7463/15001 [4:45:21<4:13:07,  2.01s/it, loss=0.0813, lr=1e-5]Steps:  50%|████▉     | 7463/15001 [4:45:21<4:13:07,  2.01s/it, loss=0.266, lr=1e-5] Steps:  50%|████▉     | 7464/15001 [4:45:23<3:58:37,  1.90s/it, loss=0.266, lr=1e-5]Steps:  50%|████▉     | 7464/15001 [4:45:23<3:58:37,  1.90s/it, loss=0.105, lr=1e-5]Steps:  50%|████▉     | 7465/15001 [4:45:25<4:03:05,  1.94s/it, loss=0.105, lr=1e-5]Steps:  50%|████▉     | 7465/15001 [4:45:25<4:03:05,  1.94s/it, loss=0.201, lr=1e-5]Steps:  50%|████▉     | 7466/15001 [4:45:26<3:48:48,  1.82s/it, loss=0.201, lr=1e-5]Steps:  50%|████▉     | 7466/15001 [4:45:27<3:48:48,  1.82s/it, loss=0.238, lr=1e-5]Steps:  50%|████▉     | 7467/15001 [4:45:28<3:52:43,  1.85s/it, loss=0.238, lr=1e-5]Steps:  50%|████▉     | 7467/15001 [4:45:28<3:52:43,  1.85s/it, loss=0.0809, lr=1e-5]Steps:  50%|████▉     | 7468/15001 [4:45:30<3:39:12,  1.75s/it, loss=0.0809, lr=1e-5]Steps:  50%|████▉     | 7468/15001 [4:45:30<3:39:12,  1.75s/it, loss=0.13, lr=1e-5]  Steps:  50%|████▉     | 7469/15001 [4:45:32<3:46:40,  1.81s/it, loss=0.13, lr=1e-5]Steps:  50%|████▉     | 7469/15001 [4:45:32<3:46:40,  1.81s/it, loss=0.0961, lr=1e-5]Steps:  50%|████▉     | 7470/15001 [4:45:34<4:00:03,  1.91s/it, loss=0.0961, lr=1e-5]Steps:  50%|████▉     | 7470/15001 [4:45:34<4:00:03,  1.91s/it, loss=0.113, lr=1e-5] Steps:  50%|████▉     | 7471/15001 [4:45:36<3:56:29,  1.88s/it, loss=0.113, lr=1e-5]Steps:  50%|████▉     | 7471/15001 [4:45:36<3:56:29,  1.88s/it, loss=0.0323, lr=1e-5]Steps:  50%|████▉     | 7472/15001 [4:45:37<3:51:36,  1.85s/it, loss=0.0323, lr=1e-5]Steps:  50%|████▉     | 7472/15001 [4:45:38<3:51:36,  1.85s/it, loss=0.152, lr=1e-5] Steps:  50%|████▉     | 7473/15001 [4:45:39<4:00:13,  1.91s/it, loss=0.152, lr=1e-5]Steps:  50%|████▉     | 7473/15001 [4:45:40<4:00:13,  1.91s/it, loss=0.256, lr=1e-5]Steps:  50%|████▉     | 7474/15001 [4:45:41<3:52:29,  1.85s/it, loss=0.256, lr=1e-5]Steps:  50%|████▉     | 7474/15001 [4:45:41<3:52:29,  1.85s/it, loss=0.121, lr=1e-5]Steps:  50%|████▉     | 7475/15001 [4:45:43<3:59:24,  1.91s/it, loss=0.121, lr=1e-5]Steps:  50%|████▉     | 7475/15001 [4:45:43<3:59:24,  1.91s/it, loss=0.107, lr=1e-5]Steps:  50%|████▉     | 7476/15001 [4:45:45<3:45:52,  1.80s/it, loss=0.107, lr=1e-5]Steps:  50%|████▉     | 7476/15001 [4:45:45<3:45:52,  1.80s/it, loss=0.208, lr=1e-5]Steps:  50%|████▉     | 7477/15001 [4:45:47<3:51:36,  1.85s/it, loss=0.208, lr=1e-5]Steps:  50%|████▉     | 7477/15001 [4:45:47<3:51:36,  1.85s/it, loss=0.189, lr=1e-5]Steps:  50%|████▉     | 7478/15001 [4:45:48<3:40:59,  1.76s/it, loss=0.189, lr=1e-5]Steps:  50%|████▉     | 7478/15001 [4:45:49<3:40:59,  1.76s/it, loss=0.0775, lr=1e-5]Steps:  50%|████▉     | 7479/15001 [4:45:50<3:54:00,  1.87s/it, loss=0.0775, lr=1e-5]Steps:  50%|████▉     | 7479/15001 [4:45:51<3:54:00,  1.87s/it, loss=0.299, lr=1e-5] Steps:  50%|████▉     | 7480/15001 [4:45:52<4:00:20,  1.92s/it, loss=0.299, lr=1e-5]Steps:  50%|████▉     | 7480/15001 [4:45:52<4:00:20,  1.92s/it, loss=0.24, lr=1e-5] Steps:  50%|████▉     | 7481/15001 [4:45:54<3:55:26,  1.88s/it, loss=0.24, lr=1e-5]Steps:  50%|████▉     | 7481/15001 [4:45:54<3:55:26,  1.88s/it, loss=0.241, lr=1e-5]Steps:  50%|████▉     | 7482/15001 [4:45:56<3:59:36,  1.91s/it, loss=0.241, lr=1e-5]Steps:  50%|████▉     | 7482/15001 [4:45:57<3:59:36,  1.91s/it, loss=0.196, lr=1e-5]Steps:  50%|████▉     | 7483/15001 [4:45:58<4:07:55,  1.98s/it, loss=0.196, lr=1e-5]Steps:  50%|████▉     | 7483/15001 [4:45:58<4:07:55,  1.98s/it, loss=0.214, lr=1e-5]Steps:  50%|████▉     | 7484/15001 [4:46:00<3:59:33,  1.91s/it, loss=0.214, lr=1e-5]Steps:  50%|████▉     | 7484/15001 [4:46:00<3:59:33,  1.91s/it, loss=0.0851, lr=1e-5]Steps:  50%|████▉     | 7485/15001 [4:46:02<4:12:51,  2.02s/it, loss=0.0851, lr=1e-5]Steps:  50%|████▉     | 7485/15001 [4:46:02<4:12:51,  2.02s/it, loss=0.361, lr=1e-5] Steps:  50%|████▉     | 7486/15001 [4:46:04<4:06:08,  1.97s/it, loss=0.361, lr=1e-5]Steps:  50%|████▉     | 7486/15001 [4:46:04<4:06:08,  1.97s/it, loss=0.0681, lr=1e-5]Steps:  50%|████▉     | 7487/15001 [4:46:06<3:51:59,  1.85s/it, loss=0.0681, lr=1e-5]Steps:  50%|████▉     | 7487/15001 [4:46:06<3:51:59,  1.85s/it, loss=0.219, lr=1e-5] Steps:  50%|████▉     | 7488/15001 [4:46:08<4:02:20,  1.94s/it, loss=0.219, lr=1e-5]Steps:  50%|████▉     | 7488/15001 [4:46:08<4:02:20,  1.94s/it, loss=0.0374, lr=1e-5]Steps:  50%|████▉     | 7489/15001 [4:46:10<3:51:42,  1.85s/it, loss=0.0374, lr=1e-5]Steps:  50%|████▉     | 7489/15001 [4:46:10<3:51:42,  1.85s/it, loss=0.257, lr=1e-5] Steps:  50%|████▉     | 7490/15001 [4:46:12<4:00:13,  1.92s/it, loss=0.257, lr=1e-5]Steps:  50%|████▉     | 7490/15001 [4:46:12<4:00:13,  1.92s/it, loss=0.122, lr=1e-5]Steps:  50%|████▉     | 7491/15001 [4:46:13<3:51:41,  1.85s/it, loss=0.122, lr=1e-5]Steps:  50%|████▉     | 7491/15001 [4:46:14<3:51:41,  1.85s/it, loss=0.15, lr=1e-5] Steps:  50%|████▉     | 7492/15001 [4:46:15<3:41:10,  1.77s/it, loss=0.15, lr=1e-5]Steps:  50%|████▉     | 7492/15001 [4:46:15<3:41:10,  1.77s/it, loss=0.074, lr=1e-5]Steps:  50%|████▉     | 7493/15001 [4:46:17<3:59:03,  1.91s/it, loss=0.074, lr=1e-5]Steps:  50%|████▉     | 7493/15001 [4:46:17<3:59:03,  1.91s/it, loss=0.264, lr=1e-5]Steps:  50%|████▉     | 7494/15001 [4:46:19<3:55:58,  1.89s/it, loss=0.264, lr=1e-5]Steps:  50%|████▉     | 7494/15001 [4:46:19<3:55:58,  1.89s/it, loss=0.238, lr=1e-5]Steps:  50%|████▉     | 7495/15001 [4:46:21<3:56:18,  1.89s/it, loss=0.238, lr=1e-5]Steps:  50%|████▉     | 7495/15001 [4:46:21<3:56:18,  1.89s/it, loss=0.352, lr=1e-5]Steps:  50%|████▉     | 7496/15001 [4:46:23<3:56:14,  1.89s/it, loss=0.352, lr=1e-5]Steps:  50%|████▉     | 7496/15001 [4:46:23<3:56:14,  1.89s/it, loss=0.286, lr=1e-5]Steps:  50%|████▉     | 7497/15001 [4:46:24<3:47:28,  1.82s/it, loss=0.286, lr=1e-5]Steps:  50%|████▉     | 7497/15001 [4:46:25<3:47:28,  1.82s/it, loss=0.148, lr=1e-5]Steps:  50%|████▉     | 7498/15001 [4:46:26<3:52:17,  1.86s/it, loss=0.148, lr=1e-5]Steps:  50%|████▉     | 7498/15001 [4:46:27<3:52:17,  1.86s/it, loss=0.231, lr=1e-5]Steps:  50%|████▉     | 7499/15001 [4:46:28<3:52:22,  1.86s/it, loss=0.231, lr=1e-5]Steps:  50%|████▉     | 7499/15001 [4:46:28<3:52:22,  1.86s/it, loss=0.13, lr=1e-5] Steps:  50%|████▉     | 7500/15001 [4:46:30<3:49:26,  1.84s/it, loss=0.13, lr=1e-5]02/04/2024 17:48:49 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1701.43it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  50%|████▉     | 7500/15001 [4:50:09<3:49:26,  1.84s/it, loss=0.0822, lr=1e-5]Steps:  50%|█████     | 7501/15001 [4:50:11<140:40:59, 67.53s/it, loss=0.0822, lr=1e-5]Steps:  50%|█████     | 7501/15001 [4:50:11<140:40:59, 67.53s/it, loss=0.237, lr=1e-5] Steps:  50%|█████     | 7502/15001 [4:50:13<99:40:15, 47.85s/it, loss=0.237, lr=1e-5] Steps:  50%|█████     | 7502/15001 [4:50:13<99:40:15, 47.85s/it, loss=0.151, lr=1e-5]Steps:  50%|█████     | 7503/15001 [4:50:14<70:46:56, 33.98s/it, loss=0.151, lr=1e-5]Steps:  50%|█████     | 7503/15001 [4:50:15<70:46:56, 33.98s/it, loss=0.06, lr=1e-5] Steps:  50%|█████     | 7504/15001 [4:50:16<50:38:13, 24.32s/it, loss=0.06, lr=1e-5]Steps:  50%|█████     | 7504/15001 [4:50:17<50:38:13, 24.32s/it, loss=0.12, lr=1e-5]Steps:  50%|█████     | 7505/15001 [4:50:18<36:49:16, 17.68s/it, loss=0.12, lr=1e-5]Steps:  50%|█████     | 7505/15001 [4:50:18<36:49:16, 17.68s/it, loss=0.109, lr=1e-5]Steps:  50%|█████     | 7506/15001 [4:50:20<26:44:51, 12.85s/it, loss=0.109, lr=1e-5]Steps:  50%|█████     | 7506/15001 [4:50:20<26:44:51, 12.85s/it, loss=0.131, lr=1e-5]Steps:  50%|█████     | 7507/15001 [4:50:22<19:49:19,  9.52s/it, loss=0.131, lr=1e-5]Steps:  50%|█████     | 7507/15001 [4:50:22<19:49:19,  9.52s/it, loss=0.186, lr=1e-5]Steps:  50%|█████     | 7508/15001 [4:50:24<15:06:40,  7.26s/it, loss=0.186, lr=1e-5]Steps:  50%|█████     | 7508/15001 [4:50:24<15:06:40,  7.26s/it, loss=0.171, lr=1e-5]Steps:  50%|█████     | 7509/15001 [4:50:27<12:37:05,  6.06s/it, loss=0.171, lr=1e-5]Steps:  50%|█████     | 7509/15001 [4:50:27<12:37:05,  6.06s/it, loss=0.101, lr=1e-5]Steps:  50%|█████     | 7510/15001 [4:50:29<9:53:12,  4.75s/it, loss=0.101, lr=1e-5] Steps:  50%|█████     | 7510/15001 [4:50:29<9:53:12,  4.75s/it, loss=0.302, lr=1e-5]Steps:  50%|█████     | 7511/15001 [4:50:31<8:05:38,  3.89s/it, loss=0.302, lr=1e-5]Steps:  50%|█████     | 7511/15001 [4:50:31<8:05:38,  3.89s/it, loss=0.135, lr=1e-5]Steps:  50%|█████     | 7512/15001 [4:50:33<7:00:24,  3.37s/it, loss=0.135, lr=1e-5]Steps:  50%|█████     | 7512/15001 [4:50:33<7:00:24,  3.37s/it, loss=0.389, lr=1e-5]Steps:  50%|█████     | 7513/15001 [4:50:34<5:52:53,  2.83s/it, loss=0.389, lr=1e-5]Steps:  50%|█████     | 7513/15001 [4:50:35<5:52:53,  2.83s/it, loss=0.218, lr=1e-5]Steps:  50%|█████     | 7514/15001 [4:50:36<5:30:26,  2.65s/it, loss=0.218, lr=1e-5]Steps:  50%|█████     | 7514/15001 [4:50:37<5:30:26,  2.65s/it, loss=0.208, lr=1e-5]Steps:  50%|█████     | 7515/15001 [4:50:38<5:04:19,  2.44s/it, loss=0.208, lr=1e-5]Steps:  50%|█████     | 7515/15001 [4:50:39<5:04:19,  2.44s/it, loss=0.123, lr=1e-5]Steps:  50%|█████     | 7516/15001 [4:50:40<4:45:26,  2.29s/it, loss=0.123, lr=1e-5]Steps:  50%|█████     | 7516/15001 [4:50:41<4:45:26,  2.29s/it, loss=0.172, lr=1e-5]Steps:  50%|█████     | 7517/15001 [4:50:42<4:29:32,  2.16s/it, loss=0.172, lr=1e-5]Steps:  50%|█████     | 7517/15001 [4:50:42<4:29:32,  2.16s/it, loss=0.0911, lr=1e-5]Steps:  50%|█████     | 7518/15001 [4:50:44<4:14:59,  2.04s/it, loss=0.0911, lr=1e-5]Steps:  50%|█████     | 7518/15001 [4:50:44<4:14:59,  2.04s/it, loss=0.201, lr=1e-5] Steps:  50%|█████     | 7519/15001 [4:50:46<3:57:07,  1.90s/it, loss=0.201, lr=1e-5]Steps:  50%|█████     | 7519/15001 [4:50:46<3:57:07,  1.90s/it, loss=0.121, lr=1e-5]Steps:  50%|█████     | 7520/15001 [4:50:48<4:03:08,  1.95s/it, loss=0.121, lr=1e-5]Steps:  50%|█████     | 7520/15001 [4:50:48<4:03:08,  1.95s/it, loss=0.0705, lr=1e-5]Steps:  50%|█████     | 7521/15001 [4:50:50<4:03:09,  1.95s/it, loss=0.0705, lr=1e-5]Steps:  50%|█████     | 7521/15001 [4:50:50<4:03:09,  1.95s/it, loss=0.0633, lr=1e-5]Steps:  50%|█████     | 7522/15001 [4:50:51<3:55:51,  1.89s/it, loss=0.0633, lr=1e-5]Steps:  50%|█████     | 7522/15001 [4:50:51<3:55:51,  1.89s/it, loss=0.175, lr=1e-5] Steps:  50%|█████     | 7523/15001 [4:50:53<3:48:08,  1.83s/it, loss=0.175, lr=1e-5]Steps:  50%|█████     | 7523/15001 [4:50:53<3:48:08,  1.83s/it, loss=0.169, lr=1e-5]Steps:  50%|█████     | 7524/15001 [4:50:55<3:53:15,  1.87s/it, loss=0.169, lr=1e-5]Steps:  50%|█████     | 7524/15001 [4:50:55<3:53:15,  1.87s/it, loss=0.155, lr=1e-5]Steps:  50%|█████     | 7525/15001 [4:50:57<3:48:11,  1.83s/it, loss=0.155, lr=1e-5]Steps:  50%|█████     | 7525/15001 [4:50:57<3:48:11,  1.83s/it, loss=0.0143, lr=1e-5]Steps:  50%|█████     | 7526/15001 [4:50:58<3:41:07,  1.77s/it, loss=0.0143, lr=1e-5]Steps:  50%|█████     | 7526/15001 [4:50:59<3:41:07,  1.77s/it, loss=0.348, lr=1e-5] Steps:  50%|█████     | 7527/15001 [4:51:00<3:40:42,  1.77s/it, loss=0.348, lr=1e-5]Steps:  50%|█████     | 7527/15001 [4:51:01<3:40:42,  1.77s/it, loss=0.232, lr=1e-5]Steps:  50%|█████     | 7528/15001 [4:51:02<3:51:52,  1.86s/it, loss=0.232, lr=1e-5]Steps:  50%|█████     | 7528/15001 [4:51:02<3:51:52,  1.86s/it, loss=0.108, lr=1e-5]Steps:  50%|█████     | 7529/15001 [4:51:04<3:53:35,  1.88s/it, loss=0.108, lr=1e-5]Steps:  50%|█████     | 7529/15001 [4:51:04<3:53:35,  1.88s/it, loss=0.179, lr=1e-5]Steps:  50%|█████     | 7530/15001 [4:51:06<3:51:15,  1.86s/it, loss=0.179, lr=1e-5]Steps:  50%|█████     | 7530/15001 [4:51:06<3:51:15,  1.86s/it, loss=0.186, lr=1e-5]Steps:  50%|█████     | 7531/15001 [4:51:08<3:43:52,  1.80s/it, loss=0.186, lr=1e-5]Steps:  50%|█████     | 7531/15001 [4:51:08<3:43:52,  1.80s/it, loss=0.0222, lr=1e-5]Steps:  50%|█████     | 7532/15001 [4:51:09<3:43:08,  1.79s/it, loss=0.0222, lr=1e-5]Steps:  50%|█████     | 7532/15001 [4:51:10<3:43:08,  1.79s/it, loss=0.17, lr=1e-5]  Steps:  50%|█████     | 7533/15001 [4:51:11<3:51:11,  1.86s/it, loss=0.17, lr=1e-5]Steps:  50%|█████     | 7533/15001 [4:51:12<3:51:11,  1.86s/it, loss=0.261, lr=1e-5]Steps:  50%|█████     | 7534/15001 [4:51:13<3:51:24,  1.86s/it, loss=0.261, lr=1e-5]Steps:  50%|█████     | 7534/15001 [4:51:14<3:51:24,  1.86s/it, loss=0.135, lr=1e-5]Steps:  50%|█████     | 7535/15001 [4:51:15<4:04:13,  1.96s/it, loss=0.135, lr=1e-5]Steps:  50%|█████     | 7535/15001 [4:51:16<4:04:13,  1.96s/it, loss=0.388, lr=1e-5]Steps:  50%|█████     | 7536/15001 [4:51:18<4:09:02,  2.00s/it, loss=0.388, lr=1e-5]Steps:  50%|█████     | 7536/15001 [4:51:18<4:09:02,  2.00s/it, loss=0.303, lr=1e-5]Steps:  50%|█████     | 7537/15001 [4:51:20<4:09:44,  2.01s/it, loss=0.303, lr=1e-5]Steps:  50%|█████     | 7537/15001 [4:51:20<4:09:44,  2.01s/it, loss=0.123, lr=1e-5]Steps:  50%|█████     | 7538/15001 [4:51:22<4:08:36,  2.00s/it, loss=0.123, lr=1e-5]Steps:  50%|█████     | 7538/15001 [4:51:22<4:08:36,  2.00s/it, loss=0.253, lr=1e-5]Steps:  50%|█████     | 7539/15001 [4:51:23<3:57:40,  1.91s/it, loss=0.253, lr=1e-5]Steps:  50%|█████     | 7539/15001 [4:51:24<3:57:40,  1.91s/it, loss=0.0891, lr=1e-5]Steps:  50%|█████     | 7540/15001 [4:51:25<4:02:52,  1.95s/it, loss=0.0891, lr=1e-5]Steps:  50%|█████     | 7540/15001 [4:51:25<4:02:52,  1.95s/it, loss=0.0981, lr=1e-5]Steps:  50%|█████     | 7541/15001 [4:51:27<3:56:02,  1.90s/it, loss=0.0981, lr=1e-5]Steps:  50%|█████     | 7541/15001 [4:51:27<3:56:02,  1.90s/it, loss=0.34, lr=1e-5]  Steps:  50%|█████     | 7542/15001 [4:51:29<3:53:57,  1.88s/it, loss=0.34, lr=1e-5]Steps:  50%|█████     | 7542/15001 [4:51:29<3:53:57,  1.88s/it, loss=0.152, lr=1e-5]Steps:  50%|█████     | 7543/15001 [4:51:31<3:57:26,  1.91s/it, loss=0.152, lr=1e-5]Steps:  50%|█████     | 7543/15001 [4:51:31<3:57:26,  1.91s/it, loss=0.263, lr=1e-5]Steps:  50%|█████     | 7544/15001 [4:51:33<3:52:51,  1.87s/it, loss=0.263, lr=1e-5]Steps:  50%|█████     | 7544/15001 [4:51:33<3:52:51,  1.87s/it, loss=0.316, lr=1e-5]Steps:  50%|█████     | 7545/15001 [4:51:34<3:49:56,  1.85s/it, loss=0.316, lr=1e-5]Steps:  50%|█████     | 7545/15001 [4:51:35<3:49:56,  1.85s/it, loss=0.12, lr=1e-5] Steps:  50%|█████     | 7546/15001 [4:51:36<3:45:33,  1.82s/it, loss=0.12, lr=1e-5]Steps:  50%|█████     | 7546/15001 [4:51:37<3:45:33,  1.82s/it, loss=0.275, lr=1e-5]Steps:  50%|█████     | 7547/15001 [4:51:38<3:51:26,  1.86s/it, loss=0.275, lr=1e-5]Steps:  50%|█████     | 7547/15001 [4:51:38<3:51:26,  1.86s/it, loss=0.106, lr=1e-5]Steps:  50%|█████     | 7548/15001 [4:51:40<3:49:48,  1.85s/it, loss=0.106, lr=1e-5]Steps:  50%|█████     | 7548/15001 [4:51:40<3:49:48,  1.85s/it, loss=0.179, lr=1e-5]Steps:  50%|█████     | 7549/15001 [4:51:42<3:49:03,  1.84s/it, loss=0.179, lr=1e-5]Steps:  50%|█████     | 7549/15001 [4:51:42<3:49:03,  1.84s/it, loss=0.147, lr=1e-5]Steps:  50%|█████     | 7550/15001 [4:51:44<3:49:14,  1.85s/it, loss=0.147, lr=1e-5]Steps:  50%|█████     | 7550/15001 [4:51:44<3:49:14,  1.85s/it, loss=0.0854, lr=1e-5]Steps:  50%|█████     | 7551/15001 [4:51:46<3:52:39,  1.87s/it, loss=0.0854, lr=1e-5]Steps:  50%|█████     | 7551/15001 [4:51:46<3:52:39,  1.87s/it, loss=0.169, lr=1e-5] Steps:  50%|█████     | 7552/15001 [4:51:48<3:56:43,  1.91s/it, loss=0.169, lr=1e-5]Steps:  50%|█████     | 7552/15001 [4:51:48<3:56:43,  1.91s/it, loss=0.076, lr=1e-5]Steps:  50%|█████     | 7553/15001 [4:51:49<3:50:40,  1.86s/it, loss=0.076, lr=1e-5]Steps:  50%|█████     | 7553/15001 [4:51:49<3:50:40,  1.86s/it, loss=0.204, lr=1e-5]Steps:  50%|█████     | 7554/15001 [4:51:51<3:51:42,  1.87s/it, loss=0.204, lr=1e-5]Steps:  50%|█████     | 7554/15001 [4:51:51<3:51:42,  1.87s/it, loss=0.091, lr=1e-5]Steps:  50%|█████     | 7555/15001 [4:51:53<3:43:28,  1.80s/it, loss=0.091, lr=1e-5]Steps:  50%|█████     | 7555/15001 [4:51:53<3:43:28,  1.80s/it, loss=0.188, lr=1e-5]Steps:  50%|█████     | 7556/15001 [4:51:55<3:51:51,  1.87s/it, loss=0.188, lr=1e-5]Steps:  50%|█████     | 7556/15001 [4:51:55<3:51:51,  1.87s/it, loss=0.226, lr=1e-5]Steps:  50%|█████     | 7557/15001 [4:51:57<4:01:18,  1.95s/it, loss=0.226, lr=1e-5]Steps:  50%|█████     | 7557/15001 [4:51:57<4:01:18,  1.95s/it, loss=0.148, lr=1e-5]Steps:  50%|█████     | 7558/15001 [4:51:59<4:00:18,  1.94s/it, loss=0.148, lr=1e-5]Steps:  50%|█████     | 7558/15001 [4:51:59<4:00:18,  1.94s/it, loss=0.127, lr=1e-5]Steps:  50%|█████     | 7559/15001 [4:52:01<4:09:25,  2.01s/it, loss=0.127, lr=1e-5]Steps:  50%|█████     | 7559/15001 [4:52:01<4:09:25,  2.01s/it, loss=0.243, lr=1e-5]Steps:  50%|█████     | 7560/15001 [4:52:03<4:05:42,  1.98s/it, loss=0.243, lr=1e-5]Steps:  50%|█████     | 7560/15001 [4:52:03<4:05:42,  1.98s/it, loss=0.199, lr=1e-5]Steps:  50%|█████     | 7561/15001 [4:52:05<3:58:46,  1.93s/it, loss=0.199, lr=1e-5]Steps:  50%|█████     | 7561/15001 [4:52:05<3:58:46,  1.93s/it, loss=0.169, lr=1e-5]Steps:  50%|█████     | 7562/15001 [4:52:07<4:03:47,  1.97s/it, loss=0.169, lr=1e-5]Steps:  50%|█████     | 7562/15001 [4:52:07<4:03:47,  1.97s/it, loss=0.277, lr=1e-5]Steps:  50%|█████     | 7563/15001 [4:52:09<3:55:05,  1.90s/it, loss=0.277, lr=1e-5]Steps:  50%|█████     | 7563/15001 [4:52:09<3:55:05,  1.90s/it, loss=0.195, lr=1e-5]Steps:  50%|█████     | 7564/15001 [4:52:11<3:55:44,  1.90s/it, loss=0.195, lr=1e-5]Steps:  50%|█████     | 7564/15001 [4:52:11<3:55:44,  1.90s/it, loss=0.121, lr=1e-5]Steps:  50%|█████     | 7565/15001 [4:52:12<3:48:45,  1.85s/it, loss=0.121, lr=1e-5]Steps:  50%|█████     | 7565/15001 [4:52:12<3:48:45,  1.85s/it, loss=0.145, lr=1e-5]Steps:  50%|█████     | 7566/15001 [4:52:14<3:47:46,  1.84s/it, loss=0.145, lr=1e-5]Steps:  50%|█████     | 7566/15001 [4:52:14<3:47:46,  1.84s/it, loss=0.26, lr=1e-5] Steps:  50%|█████     | 7567/15001 [4:52:16<3:45:46,  1.82s/it, loss=0.26, lr=1e-5]Steps:  50%|█████     | 7567/15001 [4:52:16<3:45:46,  1.82s/it, loss=0.215, lr=1e-5]Steps:  50%|█████     | 7568/15001 [4:52:18<3:41:30,  1.79s/it, loss=0.215, lr=1e-5]Steps:  50%|█████     | 7568/15001 [4:52:18<3:41:30,  1.79s/it, loss=0.122, lr=1e-5]Steps:  50%|█████     | 7569/15001 [4:52:19<3:37:36,  1.76s/it, loss=0.122, lr=1e-5]Steps:  50%|█████     | 7569/15001 [4:52:20<3:37:36,  1.76s/it, loss=0.134, lr=1e-5]Steps:  50%|█████     | 7570/15001 [4:52:21<3:44:18,  1.81s/it, loss=0.134, lr=1e-5]Steps:  50%|█████     | 7570/15001 [4:52:21<3:44:18,  1.81s/it, loss=0.308, lr=1e-5]Steps:  50%|█████     | 7571/15001 [4:52:23<3:43:30,  1.80s/it, loss=0.308, lr=1e-5]Steps:  50%|█████     | 7571/15001 [4:52:23<3:43:30,  1.80s/it, loss=0.0808, lr=1e-5]Steps:  50%|█████     | 7572/15001 [4:52:25<3:44:27,  1.81s/it, loss=0.0808, lr=1e-5]Steps:  50%|█████     | 7572/15001 [4:52:25<3:44:27,  1.81s/it, loss=0.0829, lr=1e-5]Steps:  50%|█████     | 7573/15001 [4:52:27<3:45:08,  1.82s/it, loss=0.0829, lr=1e-5]Steps:  50%|█████     | 7573/15001 [4:52:27<3:45:08,  1.82s/it, loss=0.215, lr=1e-5] Steps:  50%|█████     | 7574/15001 [4:52:29<3:51:24,  1.87s/it, loss=0.215, lr=1e-5]Steps:  50%|█████     | 7574/15001 [4:52:29<3:51:24,  1.87s/it, loss=0.211, lr=1e-5]Steps:  50%|█████     | 7575/15001 [4:52:30<3:39:59,  1.78s/it, loss=0.211, lr=1e-5]Steps:  50%|█████     | 7575/15001 [4:52:30<3:39:59,  1.78s/it, loss=0.116, lr=1e-5]Steps:  51%|█████     | 7576/15001 [4:52:32<3:48:35,  1.85s/it, loss=0.116, lr=1e-5]Steps:  51%|█████     | 7576/15001 [4:52:32<3:48:35,  1.85s/it, loss=0.181, lr=1e-5]Steps:  51%|█████     | 7577/15001 [4:52:34<3:45:10,  1.82s/it, loss=0.181, lr=1e-5]Steps:  51%|█████     | 7577/15001 [4:52:34<3:45:10,  1.82s/it, loss=0.287, lr=1e-5]Steps:  51%|█████     | 7578/15001 [4:52:36<3:56:12,  1.91s/it, loss=0.287, lr=1e-5]Steps:  51%|█████     | 7578/15001 [4:52:36<3:56:12,  1.91s/it, loss=0.089, lr=1e-5]Steps:  51%|█████     | 7579/15001 [4:52:38<3:56:39,  1.91s/it, loss=0.089, lr=1e-5]Steps:  51%|█████     | 7579/15001 [4:52:38<3:56:39,  1.91s/it, loss=0.264, lr=1e-5]Steps:  51%|█████     | 7580/15001 [4:52:40<3:46:34,  1.83s/it, loss=0.264, lr=1e-5]Steps:  51%|█████     | 7580/15001 [4:52:40<3:46:34,  1.83s/it, loss=0.0669, lr=1e-5]Steps:  51%|█████     | 7581/15001 [4:52:42<4:01:04,  1.95s/it, loss=0.0669, lr=1e-5]Steps:  51%|█████     | 7581/15001 [4:52:42<4:01:04,  1.95s/it, loss=0.109, lr=1e-5] Steps:  51%|█████     | 7582/15001 [4:52:44<4:11:35,  2.03s/it, loss=0.109, lr=1e-5]Steps:  51%|█████     | 7582/15001 [4:52:44<4:11:35,  2.03s/it, loss=0.121, lr=1e-5]Steps:  51%|█████     | 7583/15001 [4:52:46<4:05:55,  1.99s/it, loss=0.121, lr=1e-5]Steps:  51%|█████     | 7583/15001 [4:52:46<4:05:55,  1.99s/it, loss=0.0792, lr=1e-5]Steps:  51%|█████     | 7584/15001 [4:52:48<4:08:48,  2.01s/it, loss=0.0792, lr=1e-5]Steps:  51%|█████     | 7584/15001 [4:52:48<4:08:48,  2.01s/it, loss=0.0915, lr=1e-5]Steps:  51%|█████     | 7585/15001 [4:52:50<4:05:39,  1.99s/it, loss=0.0915, lr=1e-5]Steps:  51%|█████     | 7585/15001 [4:52:50<4:05:39,  1.99s/it, loss=0.137, lr=1e-5] Steps:  51%|█████     | 7586/15001 [4:52:52<3:51:54,  1.88s/it, loss=0.137, lr=1e-5]Steps:  51%|█████     | 7586/15001 [4:52:52<3:51:54,  1.88s/it, loss=0.114, lr=1e-5]Steps:  51%|█████     | 7587/15001 [4:52:54<3:53:29,  1.89s/it, loss=0.114, lr=1e-5]Steps:  51%|█████     | 7587/15001 [4:52:54<3:53:29,  1.89s/it, loss=0.334, lr=1e-5]Steps:  51%|█████     | 7588/15001 [4:52:55<3:49:07,  1.85s/it, loss=0.334, lr=1e-5]Steps:  51%|█████     | 7588/15001 [4:52:55<3:49:07,  1.85s/it, loss=0.129, lr=1e-5]Steps:  51%|█████     | 7589/15001 [4:52:57<3:51:57,  1.88s/it, loss=0.129, lr=1e-5]Steps:  51%|█████     | 7589/15001 [4:52:57<3:51:57,  1.88s/it, loss=0.271, lr=1e-5]Steps:  51%|█████     | 7590/15001 [4:52:59<3:49:46,  1.86s/it, loss=0.271, lr=1e-5]Steps:  51%|█████     | 7590/15001 [4:52:59<3:49:46,  1.86s/it, loss=0.0796, lr=1e-5]Steps:  51%|█████     | 7591/15001 [4:53:01<3:59:04,  1.94s/it, loss=0.0796, lr=1e-5]Steps:  51%|█████     | 7591/15001 [4:53:01<3:59:04,  1.94s/it, loss=0.135, lr=1e-5] Steps:  51%|█████     | 7592/15001 [4:53:03<3:44:49,  1.82s/it, loss=0.135, lr=1e-5]Steps:  51%|█████     | 7592/15001 [4:53:03<3:44:49,  1.82s/it, loss=0.0636, lr=1e-5]Steps:  51%|█████     | 7593/15001 [4:53:05<3:51:10,  1.87s/it, loss=0.0636, lr=1e-5]Steps:  51%|█████     | 7593/15001 [4:53:05<3:51:10,  1.87s/it, loss=0.326, lr=1e-5] Steps:  51%|█████     | 7594/15001 [4:53:06<3:46:11,  1.83s/it, loss=0.326, lr=1e-5]Steps:  51%|█████     | 7594/15001 [4:53:07<3:46:11,  1.83s/it, loss=0.0999, lr=1e-5]Steps:  51%|█████     | 7595/15001 [4:53:08<3:52:51,  1.89s/it, loss=0.0999, lr=1e-5]Steps:  51%|█████     | 7595/15001 [4:53:09<3:52:51,  1.89s/it, loss=0.236, lr=1e-5] Steps:  51%|█████     | 7596/15001 [4:53:10<3:44:21,  1.82s/it, loss=0.236, lr=1e-5]Steps:  51%|█████     | 7596/15001 [4:53:10<3:44:21,  1.82s/it, loss=0.088, lr=1e-5]Steps:  51%|█████     | 7597/15001 [4:53:12<3:43:23,  1.81s/it, loss=0.088, lr=1e-5]Steps:  51%|█████     | 7597/15001 [4:53:12<3:43:23,  1.81s/it, loss=0.102, lr=1e-5]Steps:  51%|█████     | 7598/15001 [4:53:14<3:46:42,  1.84s/it, loss=0.102, lr=1e-5]Steps:  51%|█████     | 7598/15001 [4:53:14<3:46:42,  1.84s/it, loss=0.414, lr=1e-5]Steps:  51%|█████     | 7599/15001 [4:53:16<3:50:20,  1.87s/it, loss=0.414, lr=1e-5]Steps:  51%|█████     | 7599/15001 [4:53:16<3:50:20,  1.87s/it, loss=0.0526, lr=1e-5]Steps:  51%|█████     | 7600/15001 [4:53:17<3:45:43,  1.83s/it, loss=0.0526, lr=1e-5]Steps:  51%|█████     | 7600/15001 [4:53:18<3:45:43,  1.83s/it, loss=0.204, lr=1e-5] Steps:  51%|█████     | 7601/15001 [4:53:19<3:44:28,  1.82s/it, loss=0.204, lr=1e-5]Steps:  51%|█████     | 7601/15001 [4:53:19<3:44:28,  1.82s/it, loss=0.0978, lr=1e-5]Steps:  51%|█████     | 7602/15001 [4:53:21<3:41:08,  1.79s/it, loss=0.0978, lr=1e-5]Steps:  51%|█████     | 7602/15001 [4:53:21<3:41:08,  1.79s/it, loss=0.235, lr=1e-5] Steps:  51%|█████     | 7603/15001 [4:53:23<3:56:21,  1.92s/it, loss=0.235, lr=1e-5]Steps:  51%|█████     | 7603/15001 [4:53:23<3:56:21,  1.92s/it, loss=0.191, lr=1e-5]Steps:  51%|█████     | 7604/15001 [4:53:25<3:59:46,  1.94s/it, loss=0.191, lr=1e-5]Steps:  51%|█████     | 7604/15001 [4:53:25<3:59:46,  1.94s/it, loss=0.232, lr=1e-5]Steps:  51%|█████     | 7605/15001 [4:53:27<4:08:45,  2.02s/it, loss=0.232, lr=1e-5]Steps:  51%|█████     | 7605/15001 [4:53:27<4:08:45,  2.02s/it, loss=0.153, lr=1e-5]Steps:  51%|█████     | 7606/15001 [4:53:29<3:58:50,  1.94s/it, loss=0.153, lr=1e-5]Steps:  51%|█████     | 7606/15001 [4:53:29<3:58:50,  1.94s/it, loss=0.289, lr=1e-5]Steps:  51%|█████     | 7607/15001 [4:53:31<4:05:46,  1.99s/it, loss=0.289, lr=1e-5]Steps:  51%|█████     | 7607/15001 [4:53:31<4:05:46,  1.99s/it, loss=0.447, lr=1e-5]Steps:  51%|█████     | 7608/15001 [4:53:33<3:58:30,  1.94s/it, loss=0.447, lr=1e-5]Steps:  51%|█████     | 7608/15001 [4:53:33<3:58:30,  1.94s/it, loss=0.228, lr=1e-5]Steps:  51%|█████     | 7609/15001 [4:53:35<3:55:02,  1.91s/it, loss=0.228, lr=1e-5]Steps:  51%|█████     | 7609/15001 [4:53:35<3:55:02,  1.91s/it, loss=0.278, lr=1e-5]Steps:  51%|█████     | 7610/15001 [4:53:37<3:47:55,  1.85s/it, loss=0.278, lr=1e-5]Steps:  51%|█████     | 7610/15001 [4:53:37<3:47:55,  1.85s/it, loss=0.262, lr=1e-5]Steps:  51%|█████     | 7611/15001 [4:53:39<3:53:36,  1.90s/it, loss=0.262, lr=1e-5]Steps:  51%|█████     | 7611/15001 [4:53:39<3:53:36,  1.90s/it, loss=0.0926, lr=1e-5]Steps:  51%|█████     | 7612/15001 [4:53:41<3:55:17,  1.91s/it, loss=0.0926, lr=1e-5]Steps:  51%|█████     | 7612/15001 [4:53:41<3:55:17,  1.91s/it, loss=0.188, lr=1e-5] Steps:  51%|█████     | 7613/15001 [4:53:42<3:52:58,  1.89s/it, loss=0.188, lr=1e-5]Steps:  51%|█████     | 7613/15001 [4:53:43<3:52:58,  1.89s/it, loss=0.245, lr=1e-5]Steps:  51%|█████     | 7614/15001 [4:53:44<3:43:11,  1.81s/it, loss=0.245, lr=1e-5]Steps:  51%|█████     | 7614/15001 [4:53:44<3:43:11,  1.81s/it, loss=0.201, lr=1e-5]Steps:  51%|█████     | 7615/15001 [4:53:46<3:47:57,  1.85s/it, loss=0.201, lr=1e-5]Steps:  51%|█████     | 7615/15001 [4:53:46<3:47:57,  1.85s/it, loss=0.068, lr=1e-5]Steps:  51%|█████     | 7616/15001 [4:53:48<3:46:46,  1.84s/it, loss=0.068, lr=1e-5]Steps:  51%|█████     | 7616/15001 [4:53:48<3:46:46,  1.84s/it, loss=0.2, lr=1e-5]  Steps:  51%|█████     | 7617/15001 [4:53:50<3:47:21,  1.85s/it, loss=0.2, lr=1e-5]Steps:  51%|█████     | 7617/15001 [4:53:50<3:47:21,  1.85s/it, loss=0.173, lr=1e-5]Steps:  51%|█████     | 7618/15001 [4:53:51<3:40:35,  1.79s/it, loss=0.173, lr=1e-5]Steps:  51%|█████     | 7618/15001 [4:53:52<3:40:35,  1.79s/it, loss=0.139, lr=1e-5]Steps:  51%|█████     | 7619/15001 [4:53:53<3:41:34,  1.80s/it, loss=0.139, lr=1e-5]Steps:  51%|█████     | 7619/15001 [4:53:54<3:41:34,  1.80s/it, loss=0.138, lr=1e-5]Steps:  51%|█████     | 7620/15001 [4:53:55<3:43:01,  1.81s/it, loss=0.138, lr=1e-5]Steps:  51%|█████     | 7620/15001 [4:53:55<3:43:01,  1.81s/it, loss=0.0392, lr=1e-5]Steps:  51%|█████     | 7621/15001 [4:53:57<3:44:44,  1.83s/it, loss=0.0392, lr=1e-5]Steps:  51%|█���███     | 7621/15001 [4:53:57<3:44:44,  1.83s/it, loss=0.177, lr=1e-5] Steps:  51%|█████     | 7622/15001 [4:53:59<3:47:16,  1.85s/it, loss=0.177, lr=1e-5]Steps:  51%|█████     | 7622/15001 [4:53:59<3:47:16,  1.85s/it, loss=0.0384, lr=1e-5]Steps:  51%|█████     | 7623/15001 [4:54:00<3:34:11,  1.74s/it, loss=0.0384, lr=1e-5]Steps:  51%|█████     | 7623/15001 [4:54:01<3:34:11,  1.74s/it, loss=0.0425, lr=1e-5]Steps:  51%|█████     | 7624/15001 [4:54:02<3:34:14,  1.74s/it, loss=0.0425, lr=1e-5]Steps:  51%|█████     | 7624/15001 [4:54:02<3:34:14,  1.74s/it, loss=0.106, lr=1e-5] Steps:  51%|█████     | 7625/15001 [4:54:04<3:48:32,  1.86s/it, loss=0.106, lr=1e-5]Steps:  51%|█████     | 7625/15001 [4:54:05<3:48:32,  1.86s/it, loss=0.108, lr=1e-5]Steps:  51%|█████     | 7626/15001 [4:54:06<4:00:14,  1.95s/it, loss=0.108, lr=1e-5]Steps:  51%|█████     | 7626/15001 [4:54:06<4:00:14,  1.95s/it, loss=0.123, lr=1e-5]Steps:  51%|█████     | 7627/15001 [4:54:08<4:00:24,  1.96s/it, loss=0.123, lr=1e-5]Steps:  51%|█████     | 7627/15001 [4:54:08<4:00:24,  1.96s/it, loss=0.276, lr=1e-5]Steps:  51%|█████     | 7628/15001 [4:54:10<4:02:39,  1.97s/it, loss=0.276, lr=1e-5]Steps:  51%|█████     | 7628/15001 [4:54:10<4:02:39,  1.97s/it, loss=0.142, lr=1e-5]Steps:  51%|█████     | 7629/15001 [4:54:12<3:51:13,  1.88s/it, loss=0.142, lr=1e-5]Steps:  51%|█████     | 7629/15001 [4:54:12<3:51:13,  1.88s/it, loss=0.197, lr=1e-5]Steps:  51%|█████     | 7630/15001 [4:54:14<4:02:29,  1.97s/it, loss=0.197, lr=1e-5]Steps:  51%|█████     | 7630/15001 [4:54:14<4:02:29,  1.97s/it, loss=0.109, lr=1e-5]Steps:  51%|█████     | 7631/15001 [4:54:16<3:53:01,  1.90s/it, loss=0.109, lr=1e-5]Steps:  51%|█████     | 7631/15001 [4:54:16<3:53:01,  1.90s/it, loss=0.138, lr=1e-5]Steps:  51%|█████     | 7632/15001 [4:54:18<3:47:40,  1.85s/it, loss=0.138, lr=1e-5]Steps:  51%|█████     | 7632/15001 [4:54:18<3:47:40,  1.85s/it, loss=0.198, lr=1e-5]Steps:  51%|█████     | 7633/15001 [4:54:19<3:43:31,  1.82s/it, loss=0.198, lr=1e-5]Steps:  51%|█████     | 7633/15001 [4:54:20<3:43:31,  1.82s/it, loss=0.134, lr=1e-5]Steps:  51%|█████     | 7634/15001 [4:54:21<3:38:40,  1.78s/it, loss=0.134, lr=1e-5]Steps:  51%|█████     | 7634/15001 [4:54:22<3:38:40,  1.78s/it, loss=0.157, lr=1e-5]Steps:  51%|█████     | 7635/15001 [4:54:23<3:55:44,  1.92s/it, loss=0.157, lr=1e-5]Steps:  51%|█████     | 7635/15001 [4:54:23<3:55:44,  1.92s/it, loss=0.106, lr=1e-5]Steps:  51%|█████     | 7636/15001 [4:54:25<3:40:47,  1.80s/it, loss=0.106, lr=1e-5]Steps:  51%|█████     | 7636/15001 [4:54:25<3:40:47,  1.80s/it, loss=0.333, lr=1e-5]Steps:  51%|█████     | 7637/15001 [4:54:27<3:48:42,  1.86s/it, loss=0.333, lr=1e-5]Steps:  51%|█████     | 7637/15001 [4:54:27<3:48:42,  1.86s/it, loss=0.128, lr=1e-5]Steps:  51%|█████     | 7638/15001 [4:54:29<3:48:46,  1.86s/it, loss=0.128, lr=1e-5]Steps:  51%|█████     | 7638/15001 [4:54:29<3:48:46,  1.86s/it, loss=0.157, lr=1e-5]Steps:  51%|█████     | 7639/15001 [4:54:31<3:51:37,  1.89s/it, loss=0.157, lr=1e-5]Steps:  51%|█████     | 7639/15001 [4:54:31<3:51:37,  1.89s/it, loss=0.228, lr=1e-5]Steps:  51%|█████     | 7640/15001 [4:54:32<3:46:00,  1.84s/it, loss=0.228, lr=1e-5]Steps:  51%|█████     | 7640/15001 [4:54:32<3:46:00,  1.84s/it, loss=0.132, lr=1e-5]Steps:  51%|█████     | 7641/15001 [4:54:34<3:42:03,  1.81s/it, loss=0.132, lr=1e-5]Steps:  51%|█████     | 7641/15001 [4:54:34<3:42:03,  1.81s/it, loss=0.35, lr=1e-5] Steps:  51%|█████     | 7642/15001 [4:54:36<3:38:05,  1.78s/it, loss=0.35, lr=1e-5]Steps:  51%|█████     | 7642/15001 [4:54:36<3:38:05,  1.78s/it, loss=0.234, lr=1e-5]Steps:  51%|█████     | 7643/15001 [4:54:38<3:41:25,  1.81s/it, loss=0.234, lr=1e-5]Steps:  51%|█████     | 7643/15001 [4:54:38<3:41:25,  1.81s/it, loss=0.416, lr=1e-5]Steps:  51%|█████     | 7644/15001 [4:54:39<3:38:39,  1.78s/it, loss=0.416, lr=1e-5]Steps:  51%|█████     | 7644/15001 [4:54:40<3:38:39,  1.78s/it, loss=0.277, lr=1e-5]Steps:  51%|█████     | 7645/15001 [4:54:41<3:47:36,  1.86s/it, loss=0.277, lr=1e-5]Steps:  51%|█████     | 7645/15001 [4:54:42<3:47:36,  1.86s/it, loss=0.198, lr=1e-5]Steps:  51%|█████     | 7646/15001 [4:54:43<3:40:50,  1.80s/it, loss=0.198, lr=1e-5]Steps:  51%|█████     | 7646/15001 [4:54:43<3:40:50,  1.80s/it, loss=0.2, lr=1e-5]  Steps:  51%|█████     | 7647/15001 [4:54:45<3:34:38,  1.75s/it, loss=0.2, lr=1e-5]Steps:  51%|█████     | 7647/15001 [4:54:45<3:34:38,  1.75s/it, loss=0.52, lr=1e-5]Steps:  51%|█████     | 7648/15001 [4:54:47<3:53:31,  1.91s/it, loss=0.52, lr=1e-5]Steps:  51%|█████     | 7648/15001 [4:54:47<3:53:31,  1.91s/it, loss=0.132, lr=1e-5]Steps:  51%|█████     | 7649/15001 [4:54:49<3:51:37,  1.89s/it, loss=0.132, lr=1e-5]Steps:  51%|█████     | 7649/15001 [4:54:49<3:51:37,  1.89s/it, loss=0.111, lr=1e-5]Steps:  51%|█████     | 7650/15001 [4:54:51<3:55:05,  1.92s/it, loss=0.111, lr=1e-5]Steps:  51%|█████     | 7650/15001 [4:54:51<3:55:05,  1.92s/it, loss=0.205, lr=1e-5]Steps:  51%|█████     | 7651/15001 [4:54:53<3:58:56,  1.95s/it, loss=0.205, lr=1e-5]Steps:  51%|█████     | 7651/15001 [4:54:53<3:58:56,  1.95s/it, loss=0.193, lr=1e-5]Steps:  51%|█████     | 7652/15001 [4:54:55<3:57:34,  1.94s/it, loss=0.193, lr=1e-5]Steps:  51%|█████     | 7652/15001 [4:54:55<3:57:34,  1.94s/it, loss=0.066, lr=1e-5]Steps:  51%|█████     | 7653/15001 [4:54:57<4:05:17,  2.00s/it, loss=0.066, lr=1e-5]Steps:  51%|█████     | 7653/15001 [4:54:57<4:05:17,  2.00s/it, loss=0.238, lr=1e-5]Steps:  51%|█████     | 7654/15001 [4:54:59<4:00:05,  1.96s/it, loss=0.238, lr=1e-5]Steps:  51%|█████     | 7654/15001 [4:54:59<4:00:05,  1.96s/it, loss=0.318, lr=1e-5]Steps:  51%|█████     | 7655/15001 [4:55:00<3:46:12,  1.85s/it, loss=0.318, lr=1e-5]Steps:  51%|█████     | 7655/15001 [4:55:01<3:46:12,  1.85s/it, loss=0.126, lr=1e-5]Steps:  51%|█████     | 7656/15001 [4:55:02<3:43:53,  1.83s/it, loss=0.126, lr=1e-5]Steps:  51%|█████     | 7656/15001 [4:55:02<3:43:53,  1.83s/it, loss=0.358, lr=1e-5]Steps:  51%|█████     | 7657/15001 [4:55:04<3:44:46,  1.84s/it, loss=0.358, lr=1e-5]Steps:  51%|█████     | 7657/15001 [4:55:04<3:44:46,  1.84s/it, loss=0.201, lr=1e-5]Steps:  51%|█████     | 7658/15001 [4:55:06<3:46:15,  1.85s/it, loss=0.201, lr=1e-5]Steps:  51%|█████     | 7658/15001 [4:55:06<3:46:15,  1.85s/it, loss=0.142, lr=1e-5]Steps:  51%|█████     | 7659/15001 [4:55:08<3:50:41,  1.89s/it, loss=0.142, lr=1e-5]Steps:  51%|█████     | 7659/15001 [4:55:08<3:50:41,  1.89s/it, loss=0.441, lr=1e-5]Steps:  51%|█████     | 7660/15001 [4:55:10<3:48:25,  1.87s/it, loss=0.441, lr=1e-5]Steps:  51%|█████     | 7660/15001 [4:55:10<3:48:25,  1.87s/it, loss=0.159, lr=1e-5]Steps:  51%|█████     | 7661/15001 [4:55:12<3:46:17,  1.85s/it, loss=0.159, lr=1e-5]Steps:  51%|█████     | 7661/15001 [4:55:12<3:46:17,  1.85s/it, loss=0.269, lr=1e-5]Steps:  51%|█████     | 7662/15001 [4:55:13<3:34:45,  1.76s/it, loss=0.269, lr=1e-5]Steps:  51%|█████     | 7662/15001 [4:55:13<3:34:45,  1.76s/it, loss=0.0414, lr=1e-5]Steps:  51%|█████     | 7663/15001 [4:55:15<3:40:25,  1.80s/it, loss=0.0414, lr=1e-5]Steps:  51%|█████     | 7663/15001 [4:55:15<3:40:25,  1.80s/it, loss=0.323, lr=1e-5] Steps:  51%|█████     | 7664/15001 [4:55:17<3:41:37,  1.81s/it, loss=0.323, lr=1e-5]Steps:  51%|█████     | 7664/15001 [4:55:17<3:41:37,  1.81s/it, loss=0.188, lr=1e-5]Steps:  51%|█████     | 7665/15001 [4:55:19<3:42:37,  1.82s/it, loss=0.188, lr=1e-5]Steps:  51%|█████     | 7665/15001 [4:55:19<3:42:37,  1.82s/it, loss=0.182, lr=1e-5]Steps:  51%|█████     | 7666/15001 [4:55:21<3:51:07,  1.89s/it, loss=0.182, lr=1e-5]Steps:  51%|█████     | 7666/15001 [4:55:21<3:51:07,  1.89s/it, loss=0.108, lr=1e-5]Steps:  51%|█████     | 7667/15001 [4:55:23<3:49:28,  1.88s/it, loss=0.108, lr=1e-5]Steps:  51%|█████     | 7667/15001 [4:55:23<3:49:28,  1.88s/it, loss=0.0877, lr=1e-5]Steps:  51%|█████     | 7668/15001 [4:55:24<3:41:07,  1.81s/it, loss=0.0877, lr=1e-5]Steps:  51%|█████     | 7668/15001 [4:55:24<3:41:07,  1.81s/it, loss=0.0653, lr=1e-5]Steps:  51%|█████     | 7669/15001 [4:55:26<3:39:38,  1.80s/it, loss=0.0653, lr=1e-5]Steps:  51%|█████     | 7669/15001 [4:55:26<3:39:38,  1.80s/it, loss=0.205, lr=1e-5] Steps:  51%|█████     | 7670/15001 [4:55:28<3:46:56,  1.86s/it, loss=0.205, lr=1e-5]Steps:  51%|█████     | 7670/15001 [4:55:28<3:46:56,  1.86s/it, loss=0.0943, lr=1e-5]Steps:  51%|█████     | 7671/15001 [4:55:30<3:54:36,  1.92s/it, loss=0.0943, lr=1e-5]Steps:  51%|█████     | 7671/15001 [4:55:30<3:54:36,  1.92s/it, loss=0.21, lr=1e-5]  Steps:  51%|█████     | 7672/15001 [4:55:32<3:48:00,  1.87s/it, loss=0.21, lr=1e-5]Steps:  51%|█████     | 7672/15001 [4:55:32<3:48:00,  1.87s/it, loss=0.268, lr=1e-5]Steps:  51%|█████     | 7673/15001 [4:55:34<3:50:08,  1.88s/it, loss=0.268, lr=1e-5]Steps:  51%|█████     | 7673/15001 [4:55:34<3:50:08,  1.88s/it, loss=0.166, lr=1e-5]Steps:  51%|█████     | 7674/15001 [4:55:36<4:06:07,  2.02s/it, loss=0.166, lr=1e-5]Steps:  51%|█████     | 7674/15001 [4:55:36<4:06:07,  2.02s/it, loss=0.171, lr=1e-5]Steps:  51%|█████     | 7675/15001 [4:55:38<4:04:15,  2.00s/it, loss=0.171, lr=1e-5]Steps:  51%|█████     | 7675/15001 [4:55:38<4:04:15,  2.00s/it, loss=0.164, lr=1e-5]Steps:  51%|█████     | 7676/15001 [4:55:40<3:53:44,  1.91s/it, loss=0.164, lr=1e-5]Steps:  51%|█████     | 7676/15001 [4:55:40<3:53:44,  1.91s/it, loss=0.0338, lr=1e-5]Steps:  51%|█████     | 7677/15001 [4:55:42<3:51:08,  1.89s/it, loss=0.0338, lr=1e-5]Steps:  51%|█████     | 7677/15001 [4:55:42<3:51:08,  1.89s/it, loss=0.146, lr=1e-5] Steps:  51%|█████     | 7678/15001 [4:55:43<3:47:04,  1.86s/it, loss=0.146, lr=1e-5]Steps:  51%|█████     | 7678/15001 [4:55:44<3:47:04,  1.86s/it, loss=0.293, lr=1e-5]Steps:  51%|█████     | 7679/15001 [4:55:45<3:44:55,  1.84s/it, loss=0.293, lr=1e-5]Steps:  51%|█████     | 7679/15001 [4:55:45<3:44:55,  1.84s/it, loss=0.424, lr=1e-5]Steps:  51%|█████     | 7680/15001 [4:55:47<3:42:35,  1.82s/it, loss=0.424, lr=1e-5]Steps:  51%|█████     | 7680/15001 [4:55:47<3:42:35,  1.82s/it, loss=0.197, lr=1e-5]Steps:  51%|█████     | 7681/15001 [4:55:49<3:45:40,  1.85s/it, loss=0.197, lr=1e-5]Steps:  51%|█████     | 7681/15001 [4:55:49<3:45:40,  1.85s/it, loss=0.253, lr=1e-5]Steps:  51%|█████     | 7682/15001 [4:55:51<3:49:04,  1.88s/it, loss=0.253, lr=1e-5]Steps:  51%|█████     | 7682/15001 [4:55:51<3:49:04,  1.88s/it, loss=0.114, lr=1e-5]Steps:  51%|█████     | 7683/15001 [4:55:53<3:46:31,  1.86s/it, loss=0.114, lr=1e-5]Steps:  51%|█████     | 7683/15001 [4:55:53<3:46:31,  1.86s/it, loss=0.218, lr=1e-5]Steps:  51%|█████     | 7684/15001 [4:55:54<3:38:54,  1.80s/it, loss=0.218, lr=1e-5]Steps:  51%|█████     | 7684/15001 [4:55:54<3:38:54,  1.80s/it, loss=0.26, lr=1e-5] Steps:  51%|█████     | 7685/15001 [4:55:56<3:33:06,  1.75s/it, loss=0.26, lr=1e-5]Steps:  51%|█████     | 7685/15001 [4:55:56<3:33:06,  1.75s/it, loss=0.246, lr=1e-5]Steps:  51%|█████     | 7686/15001 [4:55:58<3:45:16,  1.85s/it, loss=0.246, lr=1e-5]Steps:  51%|█████     | 7686/15001 [4:55:58<3:45:16,  1.85s/it, loss=0.122, lr=1e-5]Steps:  51%|█████     | 7687/15001 [4:56:00<3:42:45,  1.83s/it, loss=0.122, lr=1e-5]Steps:  51%|█████     | 7687/15001 [4:56:00<3:42:45,  1.83s/it, loss=0.219, lr=1e-5]Steps:  51%|█████     | 7688/15001 [4:56:01<3:38:11,  1.79s/it, loss=0.219, lr=1e-5]Steps:  51%|█████     | 7688/15001 [4:56:02<3:38:11,  1.79s/it, loss=0.012, lr=1e-5]Steps:  51%|█████▏    | 7689/15001 [4:56:03<3:45:36,  1.85s/it, loss=0.012, lr=1e-5]Steps:  51%|█████▏    | 7689/15001 [4:56:04<3:45:36,  1.85s/it, loss=0.128, lr=1e-5]Steps:  51%|█████▏    | 7690/15001 [4:56:05<3:38:57,  1.80s/it, loss=0.128, lr=1e-5]Steps:  51%|█████▏    | 7690/15001 [4:56:05<3:38:57,  1.80s/it, loss=0.0563, lr=1e-5]Steps:  51%|█████▏    | 7691/15001 [4:56:07<3:45:40,  1.85s/it, loss=0.0563, lr=1e-5]Steps:  51%|█████▏    | 7691/15001 [4:56:07<3:45:40,  1.85s/it, loss=0.153, lr=1e-5] Steps:  51%|█████▏    | 7692/15001 [4:56:09<3:39:59,  1.81s/it, loss=0.153, lr=1e-5]Steps:  51%|█████▏    | 7692/15001 [4:56:09<3:39:59,  1.81s/it, loss=0.139, lr=1e-5]Steps:  51%|█████▏    | 7693/15001 [4:56:11<3:42:24,  1.83s/it, loss=0.139, lr=1e-5]Steps:  51%|█████▏    | 7693/15001 [4:56:11<3:42:24,  1.83s/it, loss=0.146, lr=1e-5]Steps:  51%|█████▏    | 7694/15001 [4:56:12<3:43:29,  1.84s/it, loss=0.146, lr=1e-5]Steps:  51%|█████▏    | 7694/15001 [4:56:13<3:43:29,  1.84s/it, loss=0.124, lr=1e-5]Steps:  51%|█████▏    | 7695/15001 [4:56:15<3:52:36,  1.91s/it, loss=0.124, lr=1e-5]Steps:  51%|█████▏    | 7695/15001 [4:56:15<3:52:36,  1.91s/it, loss=0.103, lr=1e-5]Steps:  51%|█████▏    | 7696/15001 [4:56:17<3:56:10,  1.94s/it, loss=0.103, lr=1e-5]Steps:  51%|█████▏    | 7696/15001 [4:56:17<3:56:10,  1.94s/it, loss=0.142, lr=1e-5]Steps:  51%|█████▏    | 7697/15001 [4:56:18<3:54:59,  1.93s/it, loss=0.142, lr=1e-5]Steps:  51%|█████▏    | 7697/15001 [4:56:19<3:54:59,  1.93s/it, loss=0.222, lr=1e-5]Steps:  51%|█████▏    | 7698/15001 [4:56:20<3:57:30,  1.95s/it, loss=0.222, lr=1e-5]Steps:  51%|█████▏    | 7698/15001 [4:56:21<3:57:30,  1.95s/it, loss=0.148, lr=1e-5]Steps:  51%|█████▏    | 7699/15001 [4:56:23<4:03:43,  2.00s/it, loss=0.148, lr=1e-5]Steps:  51%|█████▏    | 7699/15001 [4:56:23<4:03:43,  2.00s/it, loss=0.281, lr=1e-5]Steps:  51%|█████▏    | 7700/15001 [4:56:25<4:01:00,  1.98s/it, loss=0.281, lr=1e-5]Steps:  51%|█████▏    | 7700/15001 [4:56:25<4:01:00,  1.98s/it, loss=0.416, lr=1e-5]Steps:  51%|█████▏    | 7701/15001 [4:56:26<3:55:14,  1.93s/it, loss=0.416, lr=1e-5]Steps:  51%|█████▏    | 7701/15001 [4:56:27<3:55:14,  1.93s/it, loss=0.0594, lr=1e-5]Steps:  51%|█████▏    | 7702/15001 [4:56:28<3:55:24,  1.94s/it, loss=0.0594, lr=1e-5]Steps:  51%|█████▏    | 7702/15001 [4:56:28<3:55:24,  1.94s/it, loss=0.0523, lr=1e-5]Steps:  51%|█████▏    | 7703/15001 [4:56:30<3:46:07,  1.86s/it, loss=0.0523, lr=1e-5]Steps:  51%|█████▏    | 7703/15001 [4:56:30<3:46:07,  1.86s/it, loss=0.248, lr=1e-5] Steps:  51%|█████▏    | 7704/15001 [4:56:32<3:49:06,  1.88s/it, loss=0.248, lr=1e-5]Steps:  51%|█████▏    | 7704/15001 [4:56:32<3:49:06,  1.88s/it, loss=0.204, lr=1e-5]Steps:  51%|█████▏    | 7705/15001 [4:56:34<3:43:19,  1.84s/it, loss=0.204, lr=1e-5]Steps:  51%|█████▏    | 7705/15001 [4:56:34<3:43:19,  1.84s/it, loss=0.316, lr=1e-5]Steps:  51%|█████▏    | 7706/15001 [4:56:36<3:55:46,  1.94s/it, loss=0.316, lr=1e-5]Steps:  51%|█████▏    | 7706/15001 [4:56:36<3:55:46,  1.94s/it, loss=0.0615, lr=1e-5]Steps:  51%|█████▏    | 7707/15001 [4:56:37<3:43:25,  1.84s/it, loss=0.0615, lr=1e-5]Steps:  51%|█████▏    | 7707/15001 [4:56:38<3:43:25,  1.84s/it, loss=0.0198, lr=1e-5]Steps:  51%|█████▏    | 7708/15001 [4:56:39<3:49:05,  1.88s/it, loss=0.0198, lr=1e-5]Steps:  51%|█████▏    | 7708/15001 [4:56:40<3:49:05,  1.88s/it, loss=0.211, lr=1e-5] Steps:  51%|█████▏    | 7709/15001 [4:56:41<3:43:03,  1.84s/it, loss=0.211, lr=1e-5]Steps:  51%|█████▏    | 7709/15001 [4:56:41<3:43:03,  1.84s/it, loss=0.059, lr=1e-5]Steps:  51%|█████▏    | 7710/15001 [4:56:43<3:47:13,  1.87s/it, loss=0.059, lr=1e-5]Steps:  51%|█████▏    | 7710/15001 [4:56:43<3:47:13,  1.87s/it, loss=0.17, lr=1e-5] Steps:  51%|█████▏    | 7711/15001 [4:56:45<3:40:57,  1.82s/it, loss=0.17, lr=1e-5]Steps:  51%|█████▏    | 7711/15001 [4:56:45<3:40:57,  1.82s/it, loss=0.185, lr=1e-5]Steps:  51%|█████▏    | 7712/15001 [4:56:46<3:34:28,  1.77s/it, loss=0.185, lr=1e-5]Steps:  51%|█████▏    | 7712/15001 [4:56:47<3:34:28,  1.77s/it, loss=0.15, lr=1e-5] Steps:  51%|█████▏    | 7713/15001 [4:56:48<3:37:31,  1.79s/it, loss=0.15, lr=1e-5]Steps:  51%|█████▏    | 7713/15001 [4:56:49<3:37:31,  1.79s/it, loss=0.278, lr=1e-5]Steps:  51%|█████▏    | 7714/15001 [4:56:50<3:43:01,  1.84s/it, loss=0.278, lr=1e-5]Steps:  51%|█████▏    | 7714/15001 [4:56:50<3:43:01,  1.84s/it, loss=0.149, lr=1e-5]Steps:  51%|█████▏    | 7715/15001 [4:56:52<3:48:32,  1.88s/it, loss=0.149, lr=1e-5]Steps:  51%|█████▏    | 7715/15001 [4:56:52<3:48:32,  1.88s/it, loss=0.155, lr=1e-5]Steps:  51%|█████▏    | 7716/15001 [4:56:54<3:46:28,  1.87s/it, loss=0.155, lr=1e-5]Steps:  51%|█████▏    | 7716/15001 [4:56:54<3:46:28,  1.87s/it, loss=0.178, lr=1e-5]Steps:  51%|█████▏    | 7717/15001 [4:56:56<3:50:13,  1.90s/it, loss=0.178, lr=1e-5]Steps:  51%|█████▏    | 7717/15001 [4:56:56<3:50:13,  1.90s/it, loss=0.375, lr=1e-5]Steps:  51%|█████▏    | 7718/15001 [4:56:58<3:59:49,  1.98s/it, loss=0.375, lr=1e-5]Steps:  51%|█████▏    | 7718/15001 [4:56:59<3:59:49,  1.98s/it, loss=0.168, lr=1e-5]Steps:  51%|█████▏    | 7719/15001 [4:57:00<4:06:02,  2.03s/it, loss=0.168, lr=1e-5]Steps:  51%|█████▏    | 7719/15001 [4:57:00<4:06:02,  2.03s/it, loss=0.374, lr=1e-5]Steps:  51%|█████▏    | 7720/15001 [4:57:02<4:06:06,  2.03s/it, loss=0.374, lr=1e-5]Steps:  51%|█████▏    | 7720/15001 [4:57:02<4:06:06,  2.03s/it, loss=0.181, lr=1e-5]Steps:  51%|█████▏    | 7721/15001 [4:57:04<4:03:24,  2.01s/it, loss=0.181, lr=1e-5]Steps:  51%|█████▏    | 7721/15001 [4:57:04<4:03:24,  2.01s/it, loss=0.203, lr=1e-5]Steps:  51%|█████▏    | 7722/15001 [4:57:06<3:47:41,  1.88s/it, loss=0.203, lr=1e-5]Steps:  51%|█████▏    | 7722/15001 [4:57:06<3:47:41,  1.88s/it, loss=0.0632, lr=1e-5]Steps:  51%|█████▏    | 7723/15001 [4:57:08<3:58:40,  1.97s/it, loss=0.0632, lr=1e-5]Steps:  51%|█████▏    | 7723/15001 [4:57:08<3:58:40,  1.97s/it, loss=0.274, lr=1e-5] Steps:  51%|█████▏    | 7724/15001 [4:57:10<3:53:20,  1.92s/it, loss=0.274, lr=1e-5]Steps:  51%|█████▏    | 7724/15001 [4:57:10<3:53:20,  1.92s/it, loss=0.0158, lr=1e-5]Steps:  51%|█████▏    | 7725/15001 [4:57:12<3:43:10,  1.84s/it, loss=0.0158, lr=1e-5]Steps:  51%|█████▏    | 7725/15001 [4:57:12<3:43:10,  1.84s/it, loss=0.115, lr=1e-5] Steps:  52%|█████▏    | 7726/15001 [4:57:14<3:50:57,  1.90s/it, loss=0.115, lr=1e-5]Steps:  52%|█████▏    | 7726/15001 [4:57:14<3:50:57,  1.90s/it, loss=0.202, lr=1e-5]Steps:  52%|█████▏    | 7727/15001 [4:57:15<3:39:41,  1.81s/it, loss=0.202, lr=1e-5]Steps:  52%|█████▏    | 7727/15001 [4:57:15<3:39:41,  1.81s/it, loss=0.256, lr=1e-5]Steps:  52%|█████▏    | 7728/15001 [4:57:17<3:41:56,  1.83s/it, loss=0.256, lr=1e-5]Steps:  52%|█████▏    | 7728/15001 [4:57:17<3:41:56,  1.83s/it, loss=0.048, lr=1e-5]Steps:  52%|█████▏    | 7729/15001 [4:57:19<3:53:49,  1.93s/it, loss=0.048, lr=1e-5]Steps:  52%|█████▏    | 7729/15001 [4:57:19<3:53:49,  1.93s/it, loss=0.131, lr=1e-5]Steps:  52%|█████▏    | 7730/15001 [4:57:21<3:47:22,  1.88s/it, loss=0.131, lr=1e-5]Steps:  52%|█████▏    | 7730/15001 [4:57:21<3:47:22,  1.88s/it, loss=0.166, lr=1e-5]Steps:  52%|█████▏    | 7731/15001 [4:57:23<3:44:57,  1.86s/it, loss=0.166, lr=1e-5]Steps:  52%|█████▏    | 7731/15001 [4:57:23<3:44:57,  1.86s/it, loss=0.135, lr=1e-5]Steps:  52%|█████▏    | 7732/15001 [4:57:25<3:44:12,  1.85s/it, loss=0.135, lr=1e-5]Steps:  52%|█████▏    | 7732/15001 [4:57:25<3:44:12,  1.85s/it, loss=0.0822, lr=1e-5]Steps:  52%|█████▏    | 7733/15001 [4:57:26<3:38:53,  1.81s/it, loss=0.0822, lr=1e-5]Steps:  52%|█████▏    | 7733/15001 [4:57:26<3:38:53,  1.81s/it, loss=0.188, lr=1e-5] Steps:  52%|█████▏    | 7734/15001 [4:57:28<3:39:41,  1.81s/it, loss=0.188, lr=1e-5]Steps:  52%|█████▏    | 7734/15001 [4:57:28<3:39:41,  1.81s/it, loss=0.223, lr=1e-5]Steps:  52%|█████▏    | 7735/15001 [4:57:30<3:35:12,  1.78s/it, loss=0.223, lr=1e-5]Steps:  52%|█████▏    | 7735/15001 [4:57:30<3:35:12,  1.78s/it, loss=0.125, lr=1e-5]Steps:  52%|█████▏    | 7736/15001 [4:57:32<3:38:37,  1.81s/it, loss=0.125, lr=1e-5]Steps:  52%|█████▏    | 7736/15001 [4:57:32<3:38:37,  1.81s/it, loss=0.296, lr=1e-5]Steps:  52%|█████▏    | 7737/15001 [4:57:33<3:36:28,  1.79s/it, loss=0.296, lr=1e-5]Steps:  52%|█████▏    | 7737/15001 [4:57:34<3:36:28,  1.79s/it, loss=0.14, lr=1e-5] Steps:  52%|█████▏    | 7738/15001 [4:57:35<3:30:34,  1.74s/it, loss=0.14, lr=1e-5]Steps:  52%|█████▏    | 7738/15001 [4:57:35<3:30:34,  1.74s/it, loss=0.293, lr=1e-5]Steps:  52%|█████▏    | 7739/15001 [4:57:37<3:47:47,  1.88s/it, loss=0.293, lr=1e-5]Steps:  52%|█████▏    | 7739/15001 [4:57:37<3:47:47,  1.88s/it, loss=0.134, lr=1e-5]Steps:  52%|█████▏    | 7740/15001 [4:57:39<3:46:33,  1.87s/it, loss=0.134, lr=1e-5]Steps:  52%|█████▏    | 7740/15001 [4:57:39<3:46:33,  1.87s/it, loss=0.34, lr=1e-5] Steps:  52%|█████▏    | 7741/15001 [4:57:41<3:55:32,  1.95s/it, loss=0.34, lr=1e-5]Steps:  52%|█████▏    | 7741/15001 [4:57:41<3:55:32,  1.95s/it, loss=0.11, lr=1e-5]Steps:  52%|█████▏    | 7742/15001 [4:57:43<3:49:29,  1.90s/it, loss=0.11, lr=1e-5]Steps:  52%|█████▏    | 7742/15001 [4:57:43<3:49:29,  1.90s/it, loss=0.153, lr=1e-5]Steps:  52%|█████▏    | 7743/15001 [4:57:45<4:00:23,  1.99s/it, loss=0.153, lr=1e-5]Steps:  52%|█████▏    | 7743/15001 [4:57:45<4:00:23,  1.99s/it, loss=0.23, lr=1e-5] Steps:  52%|█████▏    | 7744/15001 [4:57:47<3:59:21,  1.98s/it, loss=0.23, lr=1e-5]Steps:  52%|█████▏    | 7744/15001 [4:57:47<3:59:21,  1.98s/it, loss=0.194, lr=1e-5]Steps:  52%|█████▏    | 7745/15001 [4:57:49<3:43:39,  1.85s/it, loss=0.194, lr=1e-5]Steps:  52%|█████▏    | 7745/15001 [4:57:49<3:43:39,  1.85s/it, loss=0.109, lr=1e-5]Steps:  52%|█████▏    | 7746/15001 [4:57:51<3:48:46,  1.89s/it, loss=0.109, lr=1e-5]Steps:  52%|█████▏    | 7746/15001 [4:57:51<3:48:46,  1.89s/it, loss=0.0457, lr=1e-5]Steps:  52%|█████▏    | 7747/15001 [4:57:52<3:37:20,  1.80s/it, loss=0.0457, lr=1e-5]Steps:  52%|█████▏    | 7747/15001 [4:57:53<3:37:20,  1.80s/it, loss=0.133, lr=1e-5] Steps:  52%|█████▏    | 7748/15001 [4:57:54<3:33:41,  1.77s/it, loss=0.133, lr=1e-5]Steps:  52%|█████▏    | 7748/15001 [4:57:54<3:33:41,  1.77s/it, loss=0.101, lr=1e-5]Steps:  52%|█████▏    | 7749/15001 [4:57:56<3:44:26,  1.86s/it, loss=0.101, lr=1e-5]Steps:  52%|█████▏    | 7749/15001 [4:57:56<3:44:26,  1.86s/it, loss=0.162, lr=1e-5]Steps:  52%|█████▏    | 7750/15001 [4:57:58<3:45:09,  1.86s/it, loss=0.162, lr=1e-5]Steps:  52%|█████▏    | 7750/15001 [4:57:58<3:45:09,  1.86s/it, loss=0.165, lr=1e-5]Steps:  52%|█████▏    | 7751/15001 [4:58:00<3:45:21,  1.87s/it, loss=0.165, lr=1e-5]Steps:  52%|█████▏    | 7751/15001 [4:58:00<3:45:21,  1.87s/it, loss=0.191, lr=1e-5]Steps:  52%|█████▏    | 7752/15001 [4:58:02<3:39:23,  1.82s/it, loss=0.191, lr=1e-5]Steps:  52%|█████▏    | 7752/15001 [4:58:02<3:39:23,  1.82s/it, loss=0.135, lr=1e-5]Steps:  52%|█████▏    | 7753/15001 [4:58:03<3:35:07,  1.78s/it, loss=0.135, lr=1e-5]Steps:  52%|█████▏    | 7753/15001 [4:58:04<3:35:07,  1.78s/it, loss=0.0686, lr=1e-5]Steps:  52%|█████▏    | 7754/15001 [4:58:05<3:47:46,  1.89s/it, loss=0.0686, lr=1e-5]Steps:  52%|█████▏    | 7754/15001 [4:58:06<3:47:46,  1.89s/it, loss=0.301, lr=1e-5] Steps:  52%|█████▏    | 7755/15001 [4:58:07<3:45:55,  1.87s/it, loss=0.301, lr=1e-5]Steps:  52%|█████▏    | 7755/15001 [4:58:07<3:45:55,  1.87s/it, loss=0.424, lr=1e-5]Steps:  52%|█████▏    | 7756/15001 [4:58:09<3:44:07,  1.86s/it, loss=0.424, lr=1e-5]Steps:  52%|█████▏    | 7756/15001 [4:58:09<3:44:07,  1.86s/it, loss=0.112, lr=1e-5]Steps:  52%|█████▏    | 7757/15001 [4:58:11<3:45:51,  1.87s/it, loss=0.112, lr=1e-5]Steps:  52%|█████▏    | 7757/15001 [4:58:11<3:45:51,  1.87s/it, loss=0.194, lr=1e-5]Steps:  52%|█████▏    | 7758/15001 [4:58:13<3:45:20,  1.87s/it, loss=0.194, lr=1e-5]Steps:  52%|█████▏    | 7758/15001 [4:58:13<3:45:20,  1.87s/it, loss=0.314, lr=1e-5]Steps:  52%|█████▏    | 7759/15001 [4:58:15<3:42:03,  1.84s/it, loss=0.314, lr=1e-5]Steps:  52%|█████▏    | 7759/15001 [4:58:15<3:42:03,  1.84s/it, loss=0.223, lr=1e-5]Steps:  52%|█████▏    | 7760/15001 [4:58:16<3:28:41,  1.73s/it, loss=0.223, lr=1e-5]Steps:  52%|█████▏    | 7760/15001 [4:58:16<3:28:41,  1.73s/it, loss=0.166, lr=1e-5]Steps:  52%|█████▏    | 7761/15001 [4:58:18<3:38:05,  1.81s/it, loss=0.166, lr=1e-5]Steps:  52%|█████▏    | 7761/15001 [4:58:18<3:38:05,  1.81s/it, loss=0.14, lr=1e-5] Steps:  52%|█████▏    | 7762/15001 [4:58:20<3:51:23,  1.92s/it, loss=0.14, lr=1e-5]Steps:  52%|█████▏    | 7762/15001 [4:58:20<3:51:23,  1.92s/it, loss=0.0456, lr=1e-5]Steps:  52%|█████▏    | 7763/15001 [4:58:22<3:48:00,  1.89s/it, loss=0.0456, lr=1e-5]Steps:  52%|█████▏    | 7763/15001 [4:58:22<3:48:00,  1.89s/it, loss=0.132, lr=1e-5] Steps:  52%|█████▏    | 7764/15001 [4:58:24<3:50:56,  1.91s/it, loss=0.132, lr=1e-5]Steps:  52%|█████▏    | 7764/15001 [4:58:25<3:50:56,  1.91s/it, loss=0.235, lr=1e-5]Steps:  52%|█████▏    | 7765/15001 [4:58:26<4:04:17,  2.03s/it, loss=0.235, lr=1e-5]Steps:  52%|█████▏    | 7765/15001 [4:58:26<4:04:17,  2.03s/it, loss=0.05, lr=1e-5] Steps:  52%|█████▏    | 7766/15001 [4:58:28<3:53:28,  1.94s/it, loss=0.05, lr=1e-5]Steps:  52%|█████▏    | 7766/15001 [4:58:28<3:53:28,  1.94s/it, loss=0.12, lr=1e-5]Steps:  52%|█████▏    | 7767/15001 [4:58:30<4:02:18,  2.01s/it, loss=0.12, lr=1e-5]Steps:  52%|█████▏    | 7767/15001 [4:58:30<4:02:18,  2.01s/it, loss=0.0656, lr=1e-5]Steps:  52%|█████▏    | 7768/15001 [4:58:32<3:55:53,  1.96s/it, loss=0.0656, lr=1e-5]Steps:  52%|█████▏    | 7768/15001 [4:58:32<3:55:53,  1.96s/it, loss=0.0633, lr=1e-5]Steps:  52%|█████▏    | 7769/15001 [4:58:34<3:49:27,  1.90s/it, loss=0.0633, lr=1e-5]Steps:  52%|█████▏    | 7769/15001 [4:58:34<3:49:27,  1.90s/it, loss=0.166, lr=1e-5] Steps:  52%|█████▏    | 7770/15001 [4:58:36<3:56:20,  1.96s/it, loss=0.166, lr=1e-5]Steps:  52%|█████▏    | 7770/15001 [4:58:36<3:56:20,  1.96s/it, loss=0.138, lr=1e-5]Steps:  52%|█████▏    | 7771/15001 [4:58:38<3:49:04,  1.90s/it, loss=0.138, lr=1e-5]Steps:  52%|█████▏    | 7771/15001 [4:58:38<3:49:04,  1.90s/it, loss=0.0399, lr=1e-5]Steps:  52%|█████▏    | 7772/15001 [4:58:39<3:42:45,  1.85s/it, loss=0.0399, lr=1e-5]Steps:  52%|█████▏    | 7772/15001 [4:58:40<3:42:45,  1.85s/it, loss=0.103, lr=1e-5] Steps:  52%|█████▏    | 7773/15001 [4:58:41<3:41:50,  1.84s/it, loss=0.103, lr=1e-5]Steps:  52%|█████▏    | 7773/15001 [4:58:41<3:41:50,  1.84s/it, loss=0.152, lr=1e-5]Steps:  52%|█████▏    | 7774/15001 [4:58:43<3:42:23,  1.85s/it, loss=0.152, lr=1e-5]Steps:  52%|█████▏    | 7774/15001 [4:58:43<3:42:23,  1.85s/it, loss=0.257, lr=1e-5]Steps:  52%|█████▏    | 7775/15001 [4:58:45<3:32:52,  1.77s/it, loss=0.257, lr=1e-5]Steps:  52%|█████▏    | 7775/15001 [4:58:45<3:32:52,  1.77s/it, loss=0.157, lr=1e-5]Steps:  52%|█████▏    | 7776/15001 [4:58:46<3:33:57,  1.78s/it, loss=0.157, lr=1e-5]Steps:  52%|█████▏    | 7776/15001 [4:58:47<3:33:57,  1.78s/it, loss=0.13, lr=1e-5] Steps:  52%|█████▏    | 7777/15001 [4:58:48<3:38:54,  1.82s/it, loss=0.13, lr=1e-5]Steps:  52%|█████▏    | 7777/15001 [4:58:49<3:38:54,  1.82s/it, loss=0.0877, lr=1e-5]Steps:  52%|█████▏    | 7778/15001 [4:58:50<3:36:32,  1.80s/it, loss=0.0877, lr=1e-5]Steps:  52%|█████▏    | 7778/15001 [4:58:50<3:36:32,  1.80s/it, loss=0.119, lr=1e-5] Steps:  52%|█████▏    | 7779/15001 [4:58:52<3:34:41,  1.78s/it, loss=0.119, lr=1e-5]Steps:  52%|█████▏    | 7779/15001 [4:58:52<3:34:41,  1.78s/it, loss=0.187, lr=1e-5]Steps:  52%|█████▏    | 7780/15001 [4:58:54<3:46:22,  1.88s/it, loss=0.187, lr=1e-5]Steps:  52%|█████▏    | 7780/15001 [4:58:54<3:46:22,  1.88s/it, loss=0.0563, lr=1e-5]Steps:  52%|██���██▏    | 7781/15001 [4:58:56<3:37:09,  1.80s/it, loss=0.0563, lr=1e-5]Steps:  52%|█████▏    | 7781/15001 [4:58:56<3:37:09,  1.80s/it, loss=0.157, lr=1e-5] Steps:  52%|█████▏    | 7782/15001 [4:58:58<3:41:18,  1.84s/it, loss=0.157, lr=1e-5]Steps:  52%|█████▏    | 7782/15001 [4:58:58<3:41:18,  1.84s/it, loss=0.123, lr=1e-5]Steps:  52%|█████▏    | 7783/15001 [4:58:59<3:39:30,  1.82s/it, loss=0.123, lr=1e-5]Steps:  52%|█████▏    | 7783/15001 [4:58:59<3:39:30,  1.82s/it, loss=0.184, lr=1e-5]Steps:  52%|█████▏    | 7784/15001 [4:59:01<3:36:52,  1.80s/it, loss=0.184, lr=1e-5]Steps:  52%|█████▏    | 7784/15001 [4:59:01<3:36:52,  1.80s/it, loss=0.382, lr=1e-5]Steps:  52%|█████▏    | 7785/15001 [4:59:03<3:42:38,  1.85s/it, loss=0.382, lr=1e-5]Steps:  52%|█████▏    | 7785/15001 [4:59:03<3:42:38,  1.85s/it, loss=0.273, lr=1e-5]Steps:  52%|█████▏    | 7786/15001 [4:59:05<3:37:55,  1.81s/it, loss=0.273, lr=1e-5]Steps:  52%|█████▏    | 7786/15001 [4:59:05<3:37:55,  1.81s/it, loss=0.0301, lr=1e-5]Steps:  52%|█████▏    | 7787/15001 [4:59:07<3:42:35,  1.85s/it, loss=0.0301, lr=1e-5]Steps:  52%|█████▏    | 7787/15001 [4:59:07<3:42:35,  1.85s/it, loss=0.108, lr=1e-5] Steps:  52%|█████▏    | 7788/15001 [4:59:09<3:46:54,  1.89s/it, loss=0.108, lr=1e-5]Steps:  52%|█████▏    | 7788/15001 [4:59:09<3:46:54,  1.89s/it, loss=0.283, lr=1e-5]Steps:  52%|█████▏    | 7789/15001 [4:59:11<4:01:39,  2.01s/it, loss=0.283, lr=1e-5]Steps:  52%|█████▏    | 7789/15001 [4:59:11<4:01:39,  2.01s/it, loss=0.169, lr=1e-5]Steps:  52%|█████▏    | 7790/15001 [4:59:13<3:58:23,  1.98s/it, loss=0.169, lr=1e-5]Steps:  52%|█████▏    | 7790/15001 [4:59:13<3:58:23,  1.98s/it, loss=0.168, lr=1e-5]Steps:  52%|█████▏    | 7791/15001 [4:59:15<3:49:29,  1.91s/it, loss=0.168, lr=1e-5]Steps:  52%|█████▏    | 7791/15001 [4:59:15<3:49:29,  1.91s/it, loss=0.275, lr=1e-5]Steps:  52%|█████▏    | 7792/15001 [4:59:16<3:44:48,  1.87s/it, loss=0.275, lr=1e-5]Steps:  52%|█████▏    | 7792/15001 [4:59:17<3:44:48,  1.87s/it, loss=0.176, lr=1e-5]Steps:  52%|█████▏    | 7793/15001 [4:59:18<3:40:16,  1.83s/it, loss=0.176, lr=1e-5]Steps:  52%|█████▏    | 7793/15001 [4:59:18<3:40:16,  1.83s/it, loss=0.143, lr=1e-5]Steps:  52%|█████▏    | 7794/15001 [4:59:20<3:50:39,  1.92s/it, loss=0.143, lr=1e-5]Steps:  52%|█████▏    | 7794/15001 [4:59:20<3:50:39,  1.92s/it, loss=0.276, lr=1e-5]Steps:  52%|█████▏    | 7795/15001 [4:59:22<3:48:11,  1.90s/it, loss=0.276, lr=1e-5]Steps:  52%|█████▏    | 7795/15001 [4:59:22<3:48:11,  1.90s/it, loss=0.448, lr=1e-5]Steps:  52%|█████▏    | 7796/15001 [4:59:24<3:37:39,  1.81s/it, loss=0.448, lr=1e-5]Steps:  52%|█████▏    | 7796/15001 [4:59:24<3:37:39,  1.81s/it, loss=0.292, lr=1e-5]Steps:  52%|█████▏    | 7797/15001 [4:59:25<3:30:37,  1.75s/it, loss=0.292, lr=1e-5]Steps:  52%|█████▏    | 7797/15001 [4:59:26<3:30:37,  1.75s/it, loss=0.456, lr=1e-5]Steps:  52%|█████▏    | 7798/15001 [4:59:28<3:48:56,  1.91s/it, loss=0.456, lr=1e-5]Steps:  52%|█████▏    | 7798/15001 [4:59:28<3:48:56,  1.91s/it, loss=0.181, lr=1e-5]Steps:  52%|█████▏    | 7799/15001 [4:59:29<3:40:13,  1.83s/it, loss=0.181, lr=1e-5]Steps:  52%|█████▏    | 7799/15001 [4:59:30<3:40:13,  1.83s/it, loss=0.211, lr=1e-5]Steps:  52%|█████▏    | 7800/15001 [4:59:31<3:45:11,  1.88s/it, loss=0.211, lr=1e-5]Steps:  52%|█████▏    | 7800/15001 [4:59:31<3:45:11,  1.88s/it, loss=0.262, lr=1e-5]Steps:  52%|█████▏    | 7801/15001 [4:59:33<3:41:38,  1.85s/it, loss=0.262, lr=1e-5]Steps:  52%|█████▏    | 7801/15001 [4:59:33<3:41:38,  1.85s/it, loss=0.473, lr=1e-5]Steps:  52%|█████▏    | 7802/15001 [4:59:35<3:39:37,  1.83s/it, loss=0.473, lr=1e-5]Steps:  52%|█████▏    | 7802/15001 [4:59:35<3:39:37,  1.83s/it, loss=0.149, lr=1e-5]Steps:  52%|█████▏    | 7803/15001 [4:59:36<3:30:56,  1.76s/it, loss=0.149, lr=1e-5]Steps:  52%|█████▏    | 7803/15001 [4:59:37<3:30:56,  1.76s/it, loss=0.258, lr=1e-5]Steps:  52%|█████▏    | 7804/15001 [4:59:38<3:40:29,  1.84s/it, loss=0.258, lr=1e-5]Steps:  52%|█████▏    | 7804/15001 [4:59:39<3:40:29,  1.84s/it, loss=0.13, lr=1e-5] Steps:  52%|█████▏    | 7805/15001 [4:59:40<3:39:44,  1.83s/it, loss=0.13, lr=1e-5]Steps:  52%|█████▏    | 7805/15001 [4:59:40<3:39:44,  1.83s/it, loss=0.0593, lr=1e-5]Steps:  52%|█████▏    | 7806/15001 [4:59:42<3:38:53,  1.83s/it, loss=0.0593, lr=1e-5]Steps:  52%|█████▏    | 7806/15001 [4:59:42<3:38:53,  1.83s/it, loss=0.0619, lr=1e-5]Steps:  52%|█████▏    | 7807/15001 [4:59:44<3:31:27,  1.76s/it, loss=0.0619, lr=1e-5]Steps:  52%|█████▏    | 7807/15001 [4:59:44<3:31:27,  1.76s/it, loss=0.256, lr=1e-5] Steps:  52%|█████▏    | 7808/15001 [4:59:46<3:38:06,  1.82s/it, loss=0.256, lr=1e-5]Steps:  52%|█████▏    | 7808/15001 [4:59:46<3:38:06,  1.82s/it, loss=0.141, lr=1e-5]Steps:  52%|█████▏    | 7809/15001 [4:59:48<3:42:33,  1.86s/it, loss=0.141, lr=1e-5]Steps:  52%|█████▏    | 7809/15001 [4:59:48<3:42:33,  1.86s/it, loss=0.0779, lr=1e-5]Steps:  52%|█████▏    | 7810/15001 [4:59:50<3:55:38,  1.97s/it, loss=0.0779, lr=1e-5]Steps:  52%|█████▏    | 7810/15001 [4:59:50<3:55:38,  1.97s/it, loss=0.3, lr=1e-5]   Steps:  52%|█████▏    | 7811/15001 [4:59:52<3:50:43,  1.93s/it, loss=0.3, lr=1e-5]Steps:  52%|█████▏    | 7811/15001 [4:59:52<3:50:43,  1.93s/it, loss=0.281, lr=1e-5]Steps:  52%|█████▏    | 7812/15001 [4:59:54<4:03:38,  2.03s/it, loss=0.281, lr=1e-5]Steps:  52%|█████▏    | 7812/15001 [4:59:54<4:03:38,  2.03s/it, loss=0.295, lr=1e-5]Steps:  52%|█████▏    | 7813/15001 [4:59:56<4:07:05,  2.06s/it, loss=0.295, lr=1e-5]Steps:  52%|█████▏    | 7813/15001 [4:59:56<4:07:05,  2.06s/it, loss=0.125, lr=1e-5]Steps:  52%|█████▏    | 7814/15001 [4:59:58<3:55:10,  1.96s/it, loss=0.125, lr=1e-5]Steps:  52%|█████▏    | 7814/15001 [4:59:58<3:55:10,  1.96s/it, loss=0.129, lr=1e-5]Steps:  52%|█████▏    | 7815/15001 [5:00:00<3:49:47,  1.92s/it, loss=0.129, lr=1e-5]Steps:  52%|█████▏    | 7815/15001 [5:00:00<3:49:47,  1.92s/it, loss=0.368, lr=1e-5]Steps:  52%|█████▏    | 7816/15001 [5:00:01<3:41:32,  1.85s/it, loss=0.368, lr=1e-5]Steps:  52%|█████▏    | 7816/15001 [5:00:02<3:41:32,  1.85s/it, loss=0.254, lr=1e-5]Steps:  52%|█████▏    | 7817/15001 [5:00:03<3:44:29,  1.87s/it, loss=0.254, lr=1e-5]Steps:  52%|█████▏    | 7817/15001 [5:00:03<3:44:29,  1.87s/it, loss=0.154, lr=1e-5]Steps:  52%|█████▏    | 7818/15001 [5:00:05<3:40:21,  1.84s/it, loss=0.154, lr=1e-5]Steps:  52%|█████▏    | 7818/15001 [5:00:05<3:40:21,  1.84s/it, loss=0.0689, lr=1e-5]Steps:  52%|█████▏    | 7819/15001 [5:00:07<3:46:08,  1.89s/it, loss=0.0689, lr=1e-5]Steps:  52%|█████▏    | 7819/15001 [5:00:07<3:46:08,  1.89s/it, loss=0.0749, lr=1e-5]Steps:  52%|█████▏    | 7820/15001 [5:00:09<3:36:49,  1.81s/it, loss=0.0749, lr=1e-5]Steps:  52%|█████▏    | 7820/15001 [5:00:09<3:36:49,  1.81s/it, loss=0.182, lr=1e-5] Steps:  52%|█████▏    | 7821/15001 [5:00:10<3:35:12,  1.80s/it, loss=0.182, lr=1e-5]Steps:  52%|█████▏    | 7821/15001 [5:00:11<3:35:12,  1.80s/it, loss=0.0167, lr=1e-5]Steps:  52%|█████▏    | 7822/15001 [5:00:12<3:39:21,  1.83s/it, loss=0.0167, lr=1e-5]Steps:  52%|█████▏    | 7822/15001 [5:00:12<3:39:21,  1.83s/it, loss=0.0197, lr=1e-5]Steps:  52%|█████▏    | 7823/15001 [5:00:14<3:39:51,  1.84s/it, loss=0.0197, lr=1e-5]Steps:  52%|█████▏    | 7823/15001 [5:00:14<3:39:51,  1.84s/it, loss=0.299, lr=1e-5] Steps:  52%|█████▏    | 7824/15001 [5:00:16<3:38:45,  1.83s/it, loss=0.299, lr=1e-5]Steps:  52%|█████▏    | 7824/15001 [5:00:16<3:38:45,  1.83s/it, loss=0.23, lr=1e-5] Steps:  52%|█████▏    | 7825/15001 [5:00:18<3:39:50,  1.84s/it, loss=0.23, lr=1e-5]Steps:  52%|█████▏    | 7825/15001 [5:00:18<3:39:50,  1.84s/it, loss=0.255, lr=1e-5]Steps:  52%|█████▏    | 7826/15001 [5:00:19<3:31:30,  1.77s/it, loss=0.255, lr=1e-5]Steps:  52%|█████▏    | 7826/15001 [5:00:20<3:31:30,  1.77s/it, loss=0.165, lr=1e-5]Steps:  52%|█████▏    | 7827/15001 [5:00:21<3:37:38,  1.82s/it, loss=0.165, lr=1e-5]Steps:  52%|█████▏    | 7827/15001 [5:00:21<3:37:38,  1.82s/it, loss=0.0778, lr=1e-5]Steps:  52%|█████▏    | 7828/15001 [5:00:23<3:33:57,  1.79s/it, loss=0.0778, lr=1e-5]Steps:  52%|█████▏    | 7828/15001 [5:00:23<3:33:57,  1.79s/it, loss=0.104, lr=1e-5] Steps:  52%|█████▏    | 7829/15001 [5:00:25<3:37:22,  1.82s/it, loss=0.104, lr=1e-5]Steps:  52%|█████▏    | 7829/15001 [5:00:25<3:37:22,  1.82s/it, loss=0.0819, lr=1e-5]Steps:  52%|█████▏    | 7830/15001 [5:00:27<3:39:03,  1.83s/it, loss=0.0819, lr=1e-5]Steps:  52%|█████▏    | 7830/15001 [5:00:27<3:39:03,  1.83s/it, loss=0.148, lr=1e-5] Steps:  52%|█████▏    | 7831/15001 [5:00:29<3:47:18,  1.90s/it, loss=0.148, lr=1e-5]Steps:  52%|█████▏    | 7831/15001 [5:00:29<3:47:18,  1.90s/it, loss=0.101, lr=1e-5]Steps:  52%|█████▏    | 7832/15001 [5:00:31<3:51:49,  1.94s/it, loss=0.101, lr=1e-5]Steps:  52%|█████▏    | 7832/15001 [5:00:31<3:51:49,  1.94s/it, loss=0.0917, lr=1e-5]Steps:  52%|█████▏    | 7833/15001 [5:00:33<4:00:24,  2.01s/it, loss=0.0917, lr=1e-5]Steps:  52%|█████▏    | 7833/15001 [5:00:33<4:00:24,  2.01s/it, loss=0.177, lr=1e-5] Steps:  52%|█████▏    | 7834/15001 [5:00:35<3:50:08,  1.93s/it, loss=0.177, lr=1e-5]Steps:  52%|█████▏    | 7834/15001 [5:00:35<3:50:08,  1.93s/it, loss=0.154, lr=1e-5]Steps:  52%|█████▏    | 7835/15001 [5:00:37<3:57:56,  1.99s/it, loss=0.154, lr=1e-5]Steps:  52%|█████▏    | 7835/15001 [5:00:37<3:57:56,  1.99s/it, loss=0.178, lr=1e-5]Steps:  52%|█████▏    | 7836/15001 [5:00:39<4:02:33,  2.03s/it, loss=0.178, lr=1e-5]Steps:  52%|█████▏    | 7836/15001 [5:00:39<4:02:33,  2.03s/it, loss=0.299, lr=1e-5]Steps:  52%|█████▏    | 7837/15001 [5:00:41<3:55:48,  1.97s/it, loss=0.299, lr=1e-5]Steps:  52%|█████▏    | 7837/15001 [5:00:41<3:55:48,  1.97s/it, loss=0.158, lr=1e-5]Steps:  52%|█████▏    | 7838/15001 [5:00:43<3:56:47,  1.98s/it, loss=0.158, lr=1e-5]Steps:  52%|█████▏    | 7838/15001 [5:00:43<3:56:47,  1.98s/it, loss=0.426, lr=1e-5]Steps:  52%|█████▏    | 7839/15001 [5:00:45<3:42:14,  1.86s/it, loss=0.426, lr=1e-5]Steps:  52%|█████▏    | 7839/15001 [5:00:45<3:42:14,  1.86s/it, loss=0.0929, lr=1e-5]Steps:  52%|█████▏    | 7840/15001 [5:00:47<3:54:07,  1.96s/it, loss=0.0929, lr=1e-5]Steps:  52%|█████▏    | 7840/15001 [5:00:47<3:54:07,  1.96s/it, loss=0.0451, lr=1e-5]Steps:  52%|█████▏    | 7841/15001 [5:00:48<3:43:45,  1.88s/it, loss=0.0451, lr=1e-5]Steps:  52%|█████▏    | 7841/15001 [5:00:49<3:43:45,  1.88s/it, loss=0.0577, lr=1e-5]Steps:  52%|█████▏    | 7842/15001 [5:00:50<3:42:43,  1.87s/it, loss=0.0577, lr=1e-5]Steps:  52%|█████▏    | 7842/15001 [5:00:51<3:42:43,  1.87s/it, loss=0.157, lr=1e-5] Steps:  52%|█████▏    | 7843/15001 [5:00:52<3:44:28,  1.88s/it, loss=0.157, lr=1e-5]Steps:  52%|█████▏    | 7843/15001 [5:00:52<3:44:28,  1.88s/it, loss=0.286, lr=1e-5]Steps:  52%|█████▏    | 7844/15001 [5:00:54<3:37:36,  1.82s/it, loss=0.286, lr=1e-5]Steps:  52%|█████▏    | 7844/15001 [5:00:54<3:37:36,  1.82s/it, loss=0.215, lr=1e-5]Steps:  52%|█████▏    | 7845/15001 [5:00:56<3:40:26,  1.85s/it, loss=0.215, lr=1e-5]Steps:  52%|█████▏    | 7845/15001 [5:00:56<3:40:26,  1.85s/it, loss=0.38, lr=1e-5] Steps:  52%|█████▏    | 7846/15001 [5:00:58<3:37:31,  1.82s/it, loss=0.38, lr=1e-5]Steps:  52%|█████▏    | 7846/15001 [5:00:58<3:37:31,  1.82s/it, loss=0.127, lr=1e-5]Steps:  52%|█████▏    | 7847/15001 [5:00:59<3:38:13,  1.83s/it, loss=0.127, lr=1e-5]Steps:  52%|█████▏    | 7847/15001 [5:00:59<3:38:13,  1.83s/it, loss=0.105, lr=1e-5]Steps:  52%|█████▏    | 7848/15001 [5:01:01<3:31:28,  1.77s/it, loss=0.105, lr=1e-5]Steps:  52%|█████▏    | 7848/15001 [5:01:01<3:31:28,  1.77s/it, loss=0.0806, lr=1e-5]Steps:  52%|█████▏    | 7849/15001 [5:01:03<3:37:40,  1.83s/it, loss=0.0806, lr=1e-5]Steps:  52%|█████▏    | 7849/15001 [5:01:03<3:37:40,  1.83s/it, loss=0.152, lr=1e-5] Steps:  52%|█████▏    | 7850/15001 [5:01:05<3:33:13,  1.79s/it, loss=0.152, lr=1e-5]Steps:  52%|█████▏    | 7850/15001 [5:01:05<3:33:13,  1.79s/it, loss=0.136, lr=1e-5]Steps:  52%|█████▏    | 7851/15001 [5:01:06<3:32:40,  1.78s/it, loss=0.136, lr=1e-5]Steps:  52%|█████▏    | 7851/15001 [5:01:07<3:32:40,  1.78s/it, loss=0.143, lr=1e-5]Steps:  52%|█████▏    | 7852/15001 [5:01:08<3:32:10,  1.78s/it, loss=0.143, lr=1e-5]Steps:  52%|█████▏    | 7852/15001 [5:01:08<3:32:10,  1.78s/it, loss=0.0886, lr=1e-5]Steps:  52%|█████▏    | 7853/15001 [5:01:10<3:37:29,  1.83s/it, loss=0.0886, lr=1e-5]Steps:  52%|█████▏    | 7853/15001 [5:01:10<3:37:29,  1.83s/it, loss=0.196, lr=1e-5] Steps:  52%|█████▏    | 7854/15001 [5:01:12<3:42:36,  1.87s/it, loss=0.196, lr=1e-5]Steps:  52%|█████▏    | 7854/15001 [5:01:12<3:42:36,  1.87s/it, loss=0.112, lr=1e-5]Steps:  52%|█████▏    | 7855/15001 [5:01:14<3:43:22,  1.88s/it, loss=0.112, lr=1e-5]Steps:  52%|█████▏    | 7855/15001 [5:01:14<3:43:22,  1.88s/it, loss=0.25, lr=1e-5] Steps:  52%|█████▏    | 7856/15001 [5:01:16<3:46:28,  1.90s/it, loss=0.25, lr=1e-5]Steps:  52%|█████▏    | 7856/15001 [5:01:16<3:46:28,  1.90s/it, loss=0.335, lr=1e-5]Steps:  52%|█████▏    | 7857/15001 [5:01:18<3:51:16,  1.94s/it, loss=0.335, lr=1e-5]Steps:  52%|█████▏    | 7857/15001 [5:01:18<3:51:16,  1.94s/it, loss=0.131, lr=1e-5]Steps:  52%|█████▏    | 7858/15001 [5:01:20<3:45:45,  1.90s/it, loss=0.131, lr=1e-5]Steps:  52%|█████▏    | 7858/15001 [5:01:20<3:45:45,  1.90s/it, loss=0.179, lr=1e-5]Steps:  52%|█████▏    | 7859/15001 [5:01:22<4:01:05,  2.03s/it, loss=0.179, lr=1e-5]Steps:  52%|█████▏    | 7859/15001 [5:01:22<4:01:05,  2.03s/it, loss=0.337, lr=1e-5]Steps:  52%|��████▏    | 7860/15001 [5:01:24<4:00:49,  2.02s/it, loss=0.337, lr=1e-5]Steps:  52%|█████▏    | 7860/15001 [5:01:24<4:00:49,  2.02s/it, loss=0.258, lr=1e-5]Steps:  52%|█████▏    | 7861/15001 [5:01:26<3:50:14,  1.93s/it, loss=0.258, lr=1e-5]Steps:  52%|█████▏    | 7861/15001 [5:01:26<3:50:14,  1.93s/it, loss=0.122, lr=1e-5]Steps:  52%|█████▏    | 7862/15001 [5:01:27<3:37:35,  1.83s/it, loss=0.122, lr=1e-5]Steps:  52%|█████▏    | 7862/15001 [5:01:28<3:37:35,  1.83s/it, loss=0.227, lr=1e-5]Steps:  52%|█████▏    | 7863/15001 [5:01:29<3:36:30,  1.82s/it, loss=0.227, lr=1e-5]Steps:  52%|█████▏    | 7863/15001 [5:01:30<3:36:30,  1.82s/it, loss=0.107, lr=1e-5]Steps:  52%|█████▏    | 7864/15001 [5:01:31<3:44:30,  1.89s/it, loss=0.107, lr=1e-5]Steps:  52%|█████▏    | 7864/15001 [5:01:31<3:44:30,  1.89s/it, loss=0.0823, lr=1e-5]Steps:  52%|█████▏    | 7865/15001 [5:01:33<3:41:21,  1.86s/it, loss=0.0823, lr=1e-5]Steps:  52%|█████▏    | 7865/15001 [5:01:33<3:41:21,  1.86s/it, loss=0.16, lr=1e-5]  Steps:  52%|█████▏    | 7866/15001 [5:01:35<3:33:53,  1.80s/it, loss=0.16, lr=1e-5]Steps:  52%|█████▏    | 7866/15001 [5:01:35<3:33:53,  1.80s/it, loss=0.234, lr=1e-5]Steps:  52%|█████▏    | 7867/15001 [5:01:36<3:32:36,  1.79s/it, loss=0.234, lr=1e-5]Steps:  52%|█████▏    | 7867/15001 [5:01:37<3:32:36,  1.79s/it, loss=0.263, lr=1e-5]Steps:  52%|█████▏    | 7868/15001 [5:01:38<3:37:38,  1.83s/it, loss=0.263, lr=1e-5]Steps:  52%|█████▏    | 7868/15001 [5:01:39<3:37:38,  1.83s/it, loss=0.177, lr=1e-5]Steps:  52%|█████▏    | 7869/15001 [5:01:40<3:31:23,  1.78s/it, loss=0.177, lr=1e-5]Steps:  52%|█████▏    | 7869/15001 [5:01:40<3:31:23,  1.78s/it, loss=0.293, lr=1e-5]Steps:  52%|█████▏    | 7870/15001 [5:01:42<3:35:32,  1.81s/it, loss=0.293, lr=1e-5]Steps:  52%|█████▏    | 7870/15001 [5:01:42<3:35:32,  1.81s/it, loss=0.206, lr=1e-5]Steps:  52%|█████▏    | 7871/15001 [5:01:44<3:33:50,  1.80s/it, loss=0.206, lr=1e-5]Steps:  52%|█████▏    | 7871/15001 [5:01:44<3:33:50,  1.80s/it, loss=0.143, lr=1e-5]Steps:  52%|█████▏    | 7872/15001 [5:01:45<3:29:51,  1.77s/it, loss=0.143, lr=1e-5]Steps:  52%|█████▏    | 7872/15001 [5:01:46<3:29:51,  1.77s/it, loss=0.36, lr=1e-5] Steps:  52%|█████▏    | 7873/15001 [5:01:47<3:37:29,  1.83s/it, loss=0.36, lr=1e-5]Steps:  52%|█████▏    | 7873/15001 [5:01:48<3:37:29,  1.83s/it, loss=0.219, lr=1e-5]Steps:  52%|█████▏    | 7874/15001 [5:01:49<3:39:47,  1.85s/it, loss=0.219, lr=1e-5]Steps:  52%|█████▏    | 7874/15001 [5:01:50<3:39:47,  1.85s/it, loss=0.182, lr=1e-5]Steps:  52%|█████▏    | 7875/15001 [5:01:51<3:39:00,  1.84s/it, loss=0.182, lr=1e-5]Steps:  52%|█████▏    | 7875/15001 [5:01:51<3:39:00,  1.84s/it, loss=0.328, lr=1e-5]Steps:  53%|█████▎    | 7876/15001 [5:01:53<3:36:18,  1.82s/it, loss=0.328, lr=1e-5]Steps:  53%|█████▎    | 7876/15001 [5:01:53<3:36:18,  1.82s/it, loss=0.183, lr=1e-5]Steps:  53%|█████▎    | 7877/15001 [5:01:55<3:30:02,  1.77s/it, loss=0.183, lr=1e-5]Steps:  53%|█████▎    | 7877/15001 [5:01:55<3:30:02,  1.77s/it, loss=0.178, lr=1e-5]Steps:  53%|█████▎    | 7878/15001 [5:01:57<3:40:26,  1.86s/it, loss=0.178, lr=1e-5]Steps:  53%|█████▎    | 7878/15001 [5:01:57<3:40:26,  1.86s/it, loss=0.264, lr=1e-5]Steps:  53%|█████▎    | 7879/15001 [5:01:59<3:52:52,  1.96s/it, loss=0.264, lr=1e-5]Steps:  53%|█████▎    | 7879/15001 [5:01:59<3:52:52,  1.96s/it, loss=0.145, lr=1e-5]Steps:  53%|█████▎    | 7880/15001 [5:02:01<3:49:22,  1.93s/it, loss=0.145, lr=1e-5]Steps:  53%|█████▎    | 7880/15001 [5:02:01<3:49:22,  1.93s/it, loss=0.16, lr=1e-5] Steps:  53%|█████▎    | 7881/15001 [5:02:03<3:50:11,  1.94s/it, loss=0.16, lr=1e-5]Steps:  53%|█████▎    | 7881/15001 [5:02:03<3:50:11,  1.94s/it, loss=0.189, lr=1e-5]Steps:  53%|█████▎    | 7882/15001 [5:02:05<3:50:22,  1.94s/it, loss=0.189, lr=1e-5]Steps:  53%|█████▎    | 7882/15001 [5:02:05<3:50:22,  1.94s/it, loss=0.0518, lr=1e-5]Steps:  53%|█████▎    | 7883/15001 [5:02:06<3:44:17,  1.89s/it, loss=0.0518, lr=1e-5]Steps:  53%|█████▎    | 7883/15001 [5:02:07<3:44:17,  1.89s/it, loss=0.168, lr=1e-5] Steps:  53%|█████▎    | 7884/15001 [5:02:08<3:47:25,  1.92s/it, loss=0.168, lr=1e-5]Steps:  53%|█████▎    | 7884/15001 [5:02:09<3:47:25,  1.92s/it, loss=0.14, lr=1e-5] Steps:  53%|█████▎    | 7885/15001 [5:02:10<3:42:39,  1.88s/it, loss=0.14, lr=1e-5]Steps:  53%|█████▎    | 7885/15001 [5:02:10<3:42:39,  1.88s/it, loss=0.173, lr=1e-5]Steps:  53%|█████▎    | 7886/15001 [5:02:12<3:39:42,  1.85s/it, loss=0.173, lr=1e-5]Steps:  53%|█████▎    | 7886/15001 [5:02:12<3:39:42,  1.85s/it, loss=0.0821, lr=1e-5]Steps:  53%|█████▎    | 7887/15001 [5:02:14<3:45:03,  1.90s/it, loss=0.0821, lr=1e-5]Steps:  53%|█████▎    | 7887/15001 [5:02:14<3:45:03,  1.90s/it, loss=0.219, lr=1e-5] Steps:  53%|█████▎    | 7888/15001 [5:02:16<3:38:37,  1.84s/it, loss=0.219, lr=1e-5]Steps:  53%|█████▎    | 7888/15001 [5:02:16<3:38:37,  1.84s/it, loss=0.159, lr=1e-5]Steps:  53%|█████▎    | 7889/15001 [5:02:17<3:26:20,  1.74s/it, loss=0.159, lr=1e-5]Steps:  53%|█████▎    | 7889/15001 [5:02:18<3:26:20,  1.74s/it, loss=0.211, lr=1e-5]Steps:  53%|█████▎    | 7890/15001 [5:02:19<3:45:19,  1.90s/it, loss=0.211, lr=1e-5]Steps:  53%|█████▎    | 7890/15001 [5:02:20<3:45:19,  1.90s/it, loss=0.166, lr=1e-5]Steps:  53%|█████▎    | 7891/15001 [5:02:21<3:41:50,  1.87s/it, loss=0.166, lr=1e-5]Steps:  53%|█████▎    | 7891/15001 [5:02:21<3:41:50,  1.87s/it, loss=0.368, lr=1e-5]Steps:  53%|█████▎    | 7892/15001 [5:02:23<3:39:35,  1.85s/it, loss=0.368, lr=1e-5]Steps:  53%|█████▎    | 7892/15001 [5:02:23<3:39:35,  1.85s/it, loss=0.164, lr=1e-5]Steps:  53%|█████▎    | 7893/15001 [5:02:25<3:38:40,  1.85s/it, loss=0.164, lr=1e-5]Steps:  53%|█████▎    | 7893/15001 [5:02:25<3:38:40,  1.85s/it, loss=0.238, lr=1e-5]Steps:  53%|█████▎    | 7894/15001 [5:02:27<3:41:17,  1.87s/it, loss=0.238, lr=1e-5]Steps:  53%|█████▎    | 7894/15001 [5:02:27<3:41:17,  1.87s/it, loss=0.0648, lr=1e-5]Steps:  53%|█████▎    | 7895/15001 [5:02:29<3:36:27,  1.83s/it, loss=0.0648, lr=1e-5]Steps:  53%|█████▎    | 7895/15001 [5:02:29<3:36:27,  1.83s/it, loss=0.265, lr=1e-5] Steps:  53%|█████▎    | 7896/15001 [5:02:30<3:30:30,  1.78s/it, loss=0.265, lr=1e-5]Steps:  53%|█████▎    | 7896/15001 [5:02:30<3:30:30,  1.78s/it, loss=0.167, lr=1e-5]Steps:  53%|█████▎    | 7897/15001 [5:02:32<3:33:07,  1.80s/it, loss=0.167, lr=1e-5]Steps:  53%|█████▎    | 7897/15001 [5:02:32<3:33:07,  1.80s/it, loss=0.0597, lr=1e-5]Steps:  53%|█████▎    | 7898/15001 [5:02:34<3:33:30,  1.80s/it, loss=0.0597, lr=1e-5]Steps:  53%|█████▎    | 7898/15001 [5:02:34<3:33:30,  1.80s/it, loss=0.0887, lr=1e-5]Steps:  53%|█████▎    | 7899/15001 [5:02:36<3:29:42,  1.77s/it, loss=0.0887, lr=1e-5]Steps:  53%|█████▎    | 7899/15001 [5:02:36<3:29:42,  1.77s/it, loss=0.357, lr=1e-5] Steps:  53%|█████▎    | 7900/15001 [5:02:38<3:37:43,  1.84s/it, loss=0.357, lr=1e-5]Steps:  53%|█████▎    | 7900/15001 [5:02:38<3:37:43,  1.84s/it, loss=0.148, lr=1e-5]Steps:  53%|█████▎    | 7901/15001 [5:02:40<3:48:52,  1.93s/it, loss=0.148, lr=1e-5]Steps:  53%|█████▎    | 7901/15001 [5:02:40<3:48:52,  1.93s/it, loss=0.0947, lr=1e-5]Steps:  53%|█████▎    | 7902/15001 [5:02:42<3:48:19,  1.93s/it, loss=0.0947, lr=1e-5]Steps:  53%|█████▎    | 7902/15001 [5:02:42<3:48:19,  1.93s/it, loss=0.235, lr=1e-5] Steps:  53%|█████▎    | 7903/15001 [5:02:44<3:48:23,  1.93s/it, loss=0.235, lr=1e-5]Steps:  53%|█████▎    | 7903/15001 [5:02:44<3:48:23,  1.93s/it, loss=0.185, lr=1e-5]Steps:  53%|█████▎    | 7904/15001 [5:02:45<3:49:14,  1.94s/it, loss=0.185, lr=1e-5]Steps:  53%|█████▎    | 7904/15001 [5:02:46<3:49:14,  1.94s/it, loss=0.101, lr=1e-5]Steps:  53%|█████▎    | 7905/15001 [5:02:47<3:45:30,  1.91s/it, loss=0.101, lr=1e-5]Steps:  53%|█████▎    | 7905/15001 [5:02:48<3:45:30,  1.91s/it, loss=0.468, lr=1e-5]Steps:  53%|█████▎    | 7906/15001 [5:02:49<3:46:00,  1.91s/it, loss=0.468, lr=1e-5]Steps:  53%|█████▎    | 7906/15001 [5:02:50<3:46:00,  1.91s/it, loss=0.0617, lr=1e-5]Steps:  53%|█████▎    | 7907/15001 [5:02:51<3:49:31,  1.94s/it, loss=0.0617, lr=1e-5]Steps:  53%|█████▎    | 7907/15001 [5:02:51<3:49:31,  1.94s/it, loss=0.263, lr=1e-5] Steps:  53%|█████▎    | 7908/15001 [5:02:53<3:41:16,  1.87s/it, loss=0.263, lr=1e-5]Steps:  53%|█████▎    | 7908/15001 [5:02:53<3:41:16,  1.87s/it, loss=0.146, lr=1e-5]Steps:  53%|█████▎    | 7909/15001 [5:02:55<3:48:13,  1.93s/it, loss=0.146, lr=1e-5]Steps:  53%|█████▎    | 7909/15001 [5:02:55<3:48:13,  1.93s/it, loss=0.068, lr=1e-5]Steps:  53%|█████▎    | 7910/15001 [5:02:57<3:41:36,  1.88s/it, loss=0.068, lr=1e-5]Steps:  53%|█████▎    | 7910/15001 [5:02:57<3:41:36,  1.88s/it, loss=0.0512, lr=1e-5]Steps:  53%|█████▎    | 7911/15001 [5:02:59<3:41:28,  1.87s/it, loss=0.0512, lr=1e-5]Steps:  53%|█████▎    | 7911/15001 [5:02:59<3:41:28,  1.87s/it, loss=0.342, lr=1e-5] Steps:  53%|█████▎    | 7912/15001 [5:03:00<3:28:02,  1.76s/it, loss=0.342, lr=1e-5]Steps:  53%|█████▎    | 7912/15001 [5:03:01<3:28:02,  1.76s/it, loss=0.239, lr=1e-5]Steps:  53%|█████▎    | 7913/15001 [5:03:02<3:43:29,  1.89s/it, loss=0.239, lr=1e-5]Steps:  53%|█████▎    | 7913/15001 [5:03:02<3:43:29,  1.89s/it, loss=0.185, lr=1e-5]Steps:  53%|█████▎    | 7914/15001 [5:03:04<3:37:45,  1.84s/it, loss=0.185, lr=1e-5]Steps:  53%|█████▎    | 7914/15001 [5:03:04<3:37:45,  1.84s/it, loss=0.247, lr=1e-5]Steps:  53%|█████▎    | 7915/15001 [5:03:06<3:38:11,  1.85s/it, loss=0.247, lr=1e-5]Steps:  53%|█████▎    | 7915/15001 [5:03:06<3:38:11,  1.85s/it, loss=0.272, lr=1e-5]Steps:  53%|█████▎    | 7916/15001 [5:03:08<3:34:12,  1.81s/it, loss=0.272, lr=1e-5]Steps:  53%|█████▎    | 7916/15001 [5:03:08<3:34:12,  1.81s/it, loss=0.11, lr=1e-5] Steps:  53%|█████▎    | 7917/15001 [5:03:10<3:38:09,  1.85s/it, loss=0.11, lr=1e-5]Steps:  53%|█████▎    | 7917/15001 [5:03:10<3:38:09,  1.85s/it, loss=0.216, lr=1e-5]Steps:  53%|█████▎    | 7918/15001 [5:03:11<3:32:03,  1.80s/it, loss=0.216, lr=1e-5]Steps:  53%|█████▎    | 7918/15001 [5:03:11<3:32:03,  1.80s/it, loss=0.192, lr=1e-5]Steps:  53%|█████▎    | 7919/15001 [5:03:13<3:36:15,  1.83s/it, loss=0.192, lr=1e-5]Steps:  53%|█████▎    | 7919/15001 [5:03:13<3:36:15,  1.83s/it, loss=0.295, lr=1e-5]Steps:  53%|█████▎    | 7920/15001 [5:03:15<3:33:43,  1.81s/it, loss=0.295, lr=1e-5]Steps:  53%|█████▎    | 7920/15001 [5:03:15<3:33:43,  1.81s/it, loss=0.341, lr=1e-5]Steps:  53%|█████▎    | 7921/15001 [5:03:17<3:33:13,  1.81s/it, loss=0.341, lr=1e-5]Steps:  53%|█████▎    | 7921/15001 [5:03:17<3:33:13,  1.81s/it, loss=0.118, lr=1e-5]Steps:  53%|█████▎    | 7922/15001 [5:03:19<3:39:58,  1.86s/it, loss=0.118, lr=1e-5]Steps:  53%|█████▎    | 7922/15001 [5:03:19<3:39:58,  1.86s/it, loss=0.171, lr=1e-5]Steps:  53%|█████▎    | 7923/15001 [5:03:21<3:39:11,  1.86s/it, loss=0.171, lr=1e-5]Steps:  53%|█████▎    | 7923/15001 [5:03:21<3:39:11,  1.86s/it, loss=0.141, lr=1e-5]Steps:  53%|█████▎    | 7924/15001 [5:03:22<3:39:36,  1.86s/it, loss=0.141, lr=1e-5]Steps:  53%|█████▎    | 7924/15001 [5:03:23<3:39:36,  1.86s/it, loss=0.159, lr=1e-5]Steps:  53%|█████▎    | 7925/15001 [5:03:25<3:50:50,  1.96s/it, loss=0.159, lr=1e-5]Steps:  53%|█████▎    | 7925/15001 [5:03:25<3:50:50,  1.96s/it, loss=0.0556, lr=1e-5]Steps:  53%|█████▎    | 7926/15001 [5:03:27<3:55:37,  2.00s/it, loss=0.0556, lr=1e-5]Steps:  53%|█████▎    | 7926/15001 [5:03:27<3:55:37,  2.00s/it, loss=0.269, lr=1e-5] Steps:  53%|█████▎    | 7927/15001 [5:03:29<3:54:24,  1.99s/it, loss=0.269, lr=1e-5]Steps:  53%|█████▎    | 7927/15001 [5:03:29<3:54:24,  1.99s/it, loss=0.0231, lr=1e-5]Steps:  53%|█████▎    | 7928/15001 [5:03:31<3:52:12,  1.97s/it, loss=0.0231, lr=1e-5]Steps:  53%|█████▎    | 7928/15001 [5:03:31<3:52:12,  1.97s/it, loss=0.155, lr=1e-5] Steps:  53%|█████▎    | 7929/15001 [5:03:32<3:44:44,  1.91s/it, loss=0.155, lr=1e-5]Steps:  53%|█████▎    | 7929/15001 [5:03:33<3:44:44,  1.91s/it, loss=0.184, lr=1e-5]Steps:  53%|█████▎    | 7930/15001 [5:03:34<3:48:08,  1.94s/it, loss=0.184, lr=1e-5]Steps:  53%|█████▎    | 7930/15001 [5:03:34<3:48:08,  1.94s/it, loss=0.159, lr=1e-5]Steps:  53%|█████▎    | 7931/15001 [5:03:36<3:32:29,  1.80s/it, loss=0.159, lr=1e-5]Steps:  53%|█████▎    | 7931/15001 [5:03:36<3:32:29,  1.80s/it, loss=0.12, lr=1e-5] Steps:  53%|█████▎    | 7932/15001 [5:03:38<3:39:28,  1.86s/it, loss=0.12, lr=1e-5]Steps:  53%|█████▎    | 7932/15001 [5:03:38<3:39:28,  1.86s/it, loss=0.335, lr=1e-5]Steps:  53%|█████▎    | 7933/15001 [5:03:40<3:40:26,  1.87s/it, loss=0.335, lr=1e-5]Steps:  53%|█████▎    | 7933/15001 [5:03:40<3:40:26,  1.87s/it, loss=0.139, lr=1e-5]Steps:  53%|█████▎    | 7934/15001 [5:03:42<3:41:37,  1.88s/it, loss=0.139, lr=1e-5]Steps:  53%|█████▎    | 7934/15001 [5:03:42<3:41:37,  1.88s/it, loss=0.091, lr=1e-5]Steps:  53%|█████▎    | 7935/15001 [5:03:43<3:38:13,  1.85s/it, loss=0.091, lr=1e-5]Steps:  53%|█████▎    | 7935/15001 [5:03:44<3:38:13,  1.85s/it, loss=0.25, lr=1e-5] Steps:  53%|█████▎    | 7936/15001 [5:03:45<3:30:29,  1.79s/it, loss=0.25, lr=1e-5]Steps:  53%|█████▎    | 7936/15001 [5:03:46<3:30:29,  1.79s/it, loss=0.207, lr=1e-5]Steps:  53%|█████▎    | 7937/15001 [5:03:47<3:41:57,  1.89s/it, loss=0.207, lr=1e-5]Steps:  53%|█████▎    | 7937/15001 [5:03:47<3:41:57,  1.89s/it, loss=0.179, lr=1e-5]Steps:  53%|█████▎    | 7938/15001 [5:03:49<3:38:32,  1.86s/it, loss=0.179, lr=1e-5]Steps:  53%|█████▎    | 7938/15001 [5:03:49<3:38:32,  1.86s/it, loss=0.355, lr=1e-5]Steps:  53%|███��█▎    | 7939/15001 [5:03:51<3:31:23,  1.80s/it, loss=0.355, lr=1e-5]Steps:  53%|█████▎    | 7939/15001 [5:03:51<3:31:23,  1.80s/it, loss=0.208, lr=1e-5]Steps:  53%|█████▎    | 7940/15001 [5:03:52<3:31:30,  1.80s/it, loss=0.208, lr=1e-5]Steps:  53%|█████▎    | 7940/15001 [5:03:53<3:31:30,  1.80s/it, loss=0.209, lr=1e-5]Steps:  53%|█████▎    | 7941/15001 [5:03:54<3:35:54,  1.83s/it, loss=0.209, lr=1e-5]Steps:  53%|█████▎    | 7941/15001 [5:03:54<3:35:54,  1.83s/it, loss=0.109, lr=1e-5]Steps:  53%|█████▎    | 7942/15001 [5:03:56<3:38:57,  1.86s/it, loss=0.109, lr=1e-5]Steps:  53%|█████▎    | 7942/15001 [5:03:56<3:38:57,  1.86s/it, loss=0.146, lr=1e-5]Steps:  53%|█████▎    | 7943/15001 [5:03:58<3:28:22,  1.77s/it, loss=0.146, lr=1e-5]Steps:  53%|█████▎    | 7943/15001 [5:03:58<3:28:22,  1.77s/it, loss=0.327, lr=1e-5]Steps:  53%|█████▎    | 7944/15001 [5:04:00<3:28:59,  1.78s/it, loss=0.327, lr=1e-5]Steps:  53%|█████▎    | 7944/15001 [5:04:00<3:28:59,  1.78s/it, loss=0.219, lr=1e-5]Steps:  53%|█████▎    | 7945/15001 [5:04:02<3:42:57,  1.90s/it, loss=0.219, lr=1e-5]Steps:  53%|█████▎    | 7945/15001 [5:04:02<3:42:57,  1.90s/it, loss=0.127, lr=1e-5]Steps:  53%|█████▎    | 7946/15001 [5:04:04<3:43:51,  1.90s/it, loss=0.127, lr=1e-5]Steps:  53%|█████▎    | 7946/15001 [5:04:04<3:43:51,  1.90s/it, loss=0.0975, lr=1e-5]Steps:  53%|█████▎    | 7947/15001 [5:04:06<3:45:38,  1.92s/it, loss=0.0975, lr=1e-5]Steps:  53%|█████▎    | 7947/15001 [5:04:06<3:45:38,  1.92s/it, loss=0.371, lr=1e-5] Steps:  53%|█████▎    | 7948/15001 [5:04:08<3:49:15,  1.95s/it, loss=0.371, lr=1e-5]Steps:  53%|█████▎    | 7948/15001 [5:04:08<3:49:15,  1.95s/it, loss=0.239, lr=1e-5]Steps:  53%|█████▎    | 7949/15001 [5:04:10<3:52:09,  1.98s/it, loss=0.239, lr=1e-5]Steps:  53%|█████▎    | 7949/15001 [5:04:10<3:52:09,  1.98s/it, loss=0.182, lr=1e-5]Steps:  53%|█████▎    | 7950/15001 [5:04:12<3:51:31,  1.97s/it, loss=0.182, lr=1e-5]Steps:  53%|█████▎    | 7950/15001 [5:04:12<3:51:31,  1.97s/it, loss=0.079, lr=1e-5]Steps:  53%|█████▎    | 7951/15001 [5:04:14<3:47:48,  1.94s/it, loss=0.079, lr=1e-5]Steps:  53%|█████▎    | 7951/15001 [5:04:14<3:47:48,  1.94s/it, loss=0.107, lr=1e-5]Steps:  53%|█████▎    | 7952/15001 [5:04:15<3:40:43,  1.88s/it, loss=0.107, lr=1e-5]Steps:  53%|█████▎    | 7952/15001 [5:04:16<3:40:43,  1.88s/it, loss=0.372, lr=1e-5]Steps:  53%|█████▎    | 7953/15001 [5:04:17<3:38:54,  1.86s/it, loss=0.372, lr=1e-5]Steps:  53%|█████▎    | 7953/15001 [5:04:17<3:38:54,  1.86s/it, loss=0.0301, lr=1e-5]Steps:  53%|█████▎    | 7954/15001 [5:04:19<3:41:53,  1.89s/it, loss=0.0301, lr=1e-5]Steps:  53%|█████▎    | 7954/15001 [5:04:19<3:41:53,  1.89s/it, loss=0.202, lr=1e-5] Steps:  53%|█████▎    | 7955/15001 [5:04:21<3:36:01,  1.84s/it, loss=0.202, lr=1e-5]Steps:  53%|█████▎    | 7955/15001 [5:04:21<3:36:01,  1.84s/it, loss=0.174, lr=1e-5]Steps:  53%|█████▎    | 7956/15001 [5:04:23<3:35:35,  1.84s/it, loss=0.174, lr=1e-5]Steps:  53%|█████▎    | 7956/15001 [5:04:23<3:35:35,  1.84s/it, loss=0.145, lr=1e-5]Steps:  53%|█████▎    | 7957/15001 [5:04:24<3:34:15,  1.82s/it, loss=0.145, lr=1e-5]Steps:  53%|█████▎    | 7957/15001 [5:04:25<3:34:15,  1.82s/it, loss=0.0912, lr=1e-5]Steps:  53%|█████▎    | 7958/15001 [5:04:26<3:30:10,  1.79s/it, loss=0.0912, lr=1e-5]Steps:  53%|█████▎    | 7958/15001 [5:04:26<3:30:10,  1.79s/it, loss=0.149, lr=1e-5] Steps:  53%|█████▎    | 7959/15001 [5:04:28<3:24:08,  1.74s/it, loss=0.149, lr=1e-5]Steps:  53%|█████▎    | 7959/15001 [5:04:28<3:24:08,  1.74s/it, loss=0.2, lr=1e-5]  Steps:  53%|█████▎    | 7960/15001 [5:04:30<3:34:39,  1.83s/it, loss=0.2, lr=1e-5]Steps:  53%|█████▎    | 7960/15001 [5:04:30<3:34:39,  1.83s/it, loss=0.0266, lr=1e-5]Steps:  53%|█████▎    | 7961/15001 [5:04:32<3:31:27,  1.80s/it, loss=0.0266, lr=1e-5]Steps:  53%|█████▎    | 7961/15001 [5:04:32<3:31:27,  1.80s/it, loss=0.218, lr=1e-5] Steps:  53%|█████▎    | 7962/15001 [5:04:33<3:28:33,  1.78s/it, loss=0.218, lr=1e-5]Steps:  53%|█████▎    | 7962/15001 [5:04:33<3:28:33,  1.78s/it, loss=0.175, lr=1e-5]Steps:  53%|█████▎    | 7963/15001 [5:04:35<3:31:31,  1.80s/it, loss=0.175, lr=1e-5]Steps:  53%|█████▎    | 7963/15001 [5:04:35<3:31:31,  1.80s/it, loss=0.152, lr=1e-5]Steps:  53%|█████▎    | 7964/15001 [5:04:37<3:30:30,  1.79s/it, loss=0.152, lr=1e-5]Steps:  53%|█████▎    | 7964/15001 [5:04:37<3:30:30,  1.79s/it, loss=0.342, lr=1e-5]Steps:  53%|█████▎    | 7965/15001 [5:04:39<3:27:52,  1.77s/it, loss=0.342, lr=1e-5]Steps:  53%|█████▎    | 7965/15001 [5:04:39<3:27:52,  1.77s/it, loss=0.139, lr=1e-5]Steps:  53%|█████▎    | 7966/15001 [5:04:40<3:28:21,  1.78s/it, loss=0.139, lr=1e-5]Steps:  53%|█████▎    | 7966/15001 [5:04:41<3:28:21,  1.78s/it, loss=0.332, lr=1e-5]Steps:  53%|█████▎    | 7967/15001 [5:04:42<3:21:40,  1.72s/it, loss=0.332, lr=1e-5]Steps:  53%|█████▎    | 7967/15001 [5:04:42<3:21:40,  1.72s/it, loss=0.0784, lr=1e-5]Steps:  53%|█████▎    | 7968/15001 [5:04:44<3:23:33,  1.74s/it, loss=0.0784, lr=1e-5]Steps:  53%|█████▎    | 7968/15001 [5:04:44<3:23:33,  1.74s/it, loss=0.152, lr=1e-5] Steps:  53%|█████▎    | 7969/15001 [5:04:46<3:36:03,  1.84s/it, loss=0.152, lr=1e-5]Steps:  53%|█████▎    | 7969/15001 [5:04:46<3:36:03,  1.84s/it, loss=0.177, lr=1e-5]Steps:  53%|█████▎    | 7970/15001 [5:04:48<3:32:36,  1.81s/it, loss=0.177, lr=1e-5]Steps:  53%|█████▎    | 7970/15001 [5:04:48<3:32:36,  1.81s/it, loss=0.083, lr=1e-5]Steps:  53%|█████▎    | 7971/15001 [5:04:50<3:45:44,  1.93s/it, loss=0.083, lr=1e-5]Steps:  53%|█████▎    | 7971/15001 [5:04:50<3:45:44,  1.93s/it, loss=0.357, lr=1e-5]Steps:  53%|█████▎    | 7972/15001 [5:04:52<3:49:26,  1.96s/it, loss=0.357, lr=1e-5]Steps:  53%|█████▎    | 7972/15001 [5:04:52<3:49:26,  1.96s/it, loss=0.578, lr=1e-5]Steps:  53%|█████▎    | 7973/15001 [5:04:54<3:48:38,  1.95s/it, loss=0.578, lr=1e-5]Steps:  53%|█████▎    | 7973/15001 [5:04:54<3:48:38,  1.95s/it, loss=0.134, lr=1e-5]Steps:  53%|█████▎    | 7974/15001 [5:04:56<3:54:26,  2.00s/it, loss=0.134, lr=1e-5]Steps:  53%|█████▎    | 7974/15001 [5:04:56<3:54:26,  2.00s/it, loss=0.209, lr=1e-5]Steps:  53%|█████▎    | 7975/15001 [5:04:58<3:49:05,  1.96s/it, loss=0.209, lr=1e-5]Steps:  53%|█████▎    | 7975/15001 [5:04:58<3:49:05,  1.96s/it, loss=0.142, lr=1e-5]Steps:  53%|█████▎    | 7976/15001 [5:05:00<3:42:27,  1.90s/it, loss=0.142, lr=1e-5]Steps:  53%|█████▎    | 7976/15001 [5:05:00<3:42:27,  1.90s/it, loss=0.337, lr=1e-5]Steps:  53%|█████▎    | 7977/15001 [5:05:01<3:41:44,  1.89s/it, loss=0.337, lr=1e-5]Steps:  53%|█████▎    | 7977/15001 [5:05:01<3:41:44,  1.89s/it, loss=0.0861, lr=1e-5]Steps:  53%|█████▎    | 7978/15001 [5:05:03<3:33:51,  1.83s/it, loss=0.0861, lr=1e-5]Steps:  53%|█████▎    | 7978/15001 [5:05:03<3:33:51,  1.83s/it, loss=0.146, lr=1e-5] Steps:  53%|█████▎    | 7979/15001 [5:05:05<3:39:05,  1.87s/it, loss=0.146, lr=1e-5]Steps:  53%|█████▎    | 7979/15001 [5:05:05<3:39:05,  1.87s/it, loss=0.226, lr=1e-5]Steps:  53%|█████▎    | 7980/15001 [5:05:07<3:31:58,  1.81s/it, loss=0.226, lr=1e-5]Steps:  53%|█████▎    | 7980/15001 [5:05:07<3:31:58,  1.81s/it, loss=0.191, lr=1e-5]Steps:  53%|█████▎    | 7981/15001 [5:05:08<3:28:24,  1.78s/it, loss=0.191, lr=1e-5]Steps:  53%|█████▎    | 7981/15001 [5:05:09<3:28:24,  1.78s/it, loss=0.0554, lr=1e-5]Steps:  53%|█████▎    | 7982/15001 [5:05:10<3:32:25,  1.82s/it, loss=0.0554, lr=1e-5]Steps:  53%|█████▎    | 7982/15001 [5:05:10<3:32:25,  1.82s/it, loss=0.142, lr=1e-5] Steps:  53%|█████▎    | 7983/15001 [5:05:12<3:27:19,  1.77s/it, loss=0.142, lr=1e-5]Steps:  53%|█████▎    | 7983/15001 [5:05:12<3:27:19,  1.77s/it, loss=0.0481, lr=1e-5]Steps:  53%|█████▎    | 7984/15001 [5:05:14<3:31:25,  1.81s/it, loss=0.0481, lr=1e-5]Steps:  53%|█████▎    | 7984/15001 [5:05:14<3:31:25,  1.81s/it, loss=0.0797, lr=1e-5]Steps:  53%|█████▎    | 7985/15001 [5:05:16<3:28:36,  1.78s/it, loss=0.0797, lr=1e-5]Steps:  53%|█████▎    | 7985/15001 [5:05:16<3:28:36,  1.78s/it, loss=0.262, lr=1e-5] Steps:  53%|█████▎    | 7986/15001 [5:05:17<3:30:16,  1.80s/it, loss=0.262, lr=1e-5]Steps:  53%|█████▎    | 7986/15001 [5:05:18<3:30:16,  1.80s/it, loss=0.212, lr=1e-5]Steps:  53%|█████▎    | 7987/15001 [5:05:19<3:25:44,  1.76s/it, loss=0.212, lr=1e-5]Steps:  53%|█████▎    | 7987/15001 [5:05:19<3:25:44,  1.76s/it, loss=0.0311, lr=1e-5]Steps:  53%|█████▎    | 7988/15001 [5:05:21<3:24:00,  1.75s/it, loss=0.0311, lr=1e-5]Steps:  53%|█████▎    | 7988/15001 [5:05:21<3:24:00,  1.75s/it, loss=0.393, lr=1e-5] Steps:  53%|█████▎    | 7989/15001 [5:05:23<3:21:44,  1.73s/it, loss=0.393, lr=1e-5]Steps:  53%|█████▎    | 7989/15001 [5:05:23<3:21:44,  1.73s/it, loss=0.208, lr=1e-5]Steps:  53%|█████▎    | 7990/15001 [5:05:24<3:29:39,  1.79s/it, loss=0.208, lr=1e-5]Steps:  53%|█████▎    | 7990/15001 [5:05:25<3:29:39,  1.79s/it, loss=0.132, lr=1e-5]Steps:  53%|█████▎    | 7991/15001 [5:05:26<3:33:21,  1.83s/it, loss=0.132, lr=1e-5]Steps:  53%|█████▎    | 7991/15001 [5:05:27<3:33:21,  1.83s/it, loss=0.0592, lr=1e-5]Steps:  53%|█████▎    | 7992/15001 [5:05:28<3:27:35,  1.78s/it, loss=0.0592, lr=1e-5]Steps:  53%|█████▎    | 7992/15001 [5:05:28<3:27:35,  1.78s/it, loss=0.0844, lr=1e-5]Steps:  53%|█████▎    | 7993/15001 [5:05:30<3:45:28,  1.93s/it, loss=0.0844, lr=1e-5]Steps:  53%|█████▎    | 7993/15001 [5:05:30<3:45:28,  1.93s/it, loss=0.0941, lr=1e-5]Steps:  53%|█████▎    | 7994/15001 [5:05:32<3:39:10,  1.88s/it, loss=0.0941, lr=1e-5]Steps:  53%|█████▎    | 7994/15001 [5:05:32<3:39:10,  1.88s/it, loss=0.0948, lr=1e-5]Steps:  53%|█████▎    | 7995/15001 [5:05:34<3:44:24,  1.92s/it, loss=0.0948, lr=1e-5]Steps:  53%|█████▎    | 7995/15001 [5:05:34<3:44:24,  1.92s/it, loss=0.0366, lr=1e-5]Steps:  53%|█████▎    | 7996/15001 [5:05:36<3:51:40,  1.98s/it, loss=0.0366, lr=1e-5]Steps:  53%|█████▎    | 7996/15001 [5:05:36<3:51:40,  1.98s/it, loss=0.155, lr=1e-5] Steps:  53%|█████▎    | 7997/15001 [5:05:38<3:52:55,  2.00s/it, loss=0.155, lr=1e-5]Steps:  53%|█████▎    | 7997/15001 [5:05:38<3:52:55,  2.00s/it, loss=0.196, lr=1e-5]Steps:  53%|█████▎    | 7998/15001 [5:05:40<3:55:44,  2.02s/it, loss=0.196, lr=1e-5]Steps:  53%|█████▎    | 7998/15001 [5:05:40<3:55:44,  2.02s/it, loss=0.154, lr=1e-5]Steps:  53%|█████▎    | 7999/15001 [5:05:42<3:46:45,  1.94s/it, loss=0.154, lr=1e-5]Steps:  53%|█████▎    | 7999/15001 [5:05:42<3:46:45,  1.94s/it, loss=0.249, lr=1e-5]Steps:  53%|█████▎    | 8000/15001 [5:05:44<3:35:00,  1.84s/it, loss=0.249, lr=1e-5]02/04/2024 18:08:03 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1684.46it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  53%|█████▎    | 8000/15001 [5:09:23<3:35:00,  1.84s/it, loss=0.0985, lr=1e-5]Steps:  53%|█████▎    | 8001/15001 [5:09:24<131:06:57, 67.43s/it, loss=0.0985, lr=1e-5]Steps:  53%|█████▎    | 8001/15001 [5:09:24<131:06:57, 67.43s/it, loss=0.158, lr=1e-5] Steps:  53%|█████▎    | 8002/15001 [5:09:26<92:43:21, 47.69s/it, loss=0.158, lr=1e-5] Steps:  53%|█████▎    | 8002/15001 [5:09:26<92:43:21, 47.69s/it, loss=0.168, lr=1e-5]Steps:  53%|█████▎    | 8003/15001 [5:09:28<66:10:46, 34.04s/it, loss=0.168, lr=1e-5]Steps:  53%|█████▎    | 8003/15001 [5:09:28<66:10:46, 34.04s/it, loss=0.103, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  53%|█████▎    | 8004/15001 [5:09:30<47:27:21, 24.42s/it, loss=0.103, lr=1e-5]Steps:  53%|█████▎    | 8004/15001 [5:09:30<47:27:21, 24.42s/it, loss=0.13, lr=1e-5] Steps:  53%|█████▎    | 8005/15001 [5:09:32<34:10:10, 17.58s/it, loss=0.13, lr=1e-5]Steps:  53%|█████▎    | 8005/15001 [5:09:32<34:10:10, 17.58s/it, loss=0.144, lr=1e-5]Steps:  53%|█████▎    | 8006/15001 [5:09:34<25:22:54, 13.06s/it, loss=0.144, lr=1e-5]Steps:  53%|█████▎    | 8006/15001 [5:09:34<25:22:54, 13.06s/it, loss=0.125, lr=1e-5]Steps:  53%|█████▎    | 8007/15001 [5:09:36<18:54:23,  9.73s/it, loss=0.125, lr=1e-5]Steps:  53%|█████▎    | 8007/15001 [5:09:36<18:54:23,  9.73s/it, loss=0.107, lr=1e-5]Steps:  53%|█████▎    | 8008/15001 [5:09:38<14:22:08,  7.40s/it, loss=0.107, lr=1e-5]Steps:  53%|█████▎    | 8008/15001 [5:09:38<14:22:08,  7.40s/it, loss=0.065, lr=1e-5]Steps:  53%|█████▎    | 8009/15001 [5:09:40<11:00:58,  5.67s/it, loss=0.065, lr=1e-5]Steps:  53%|█████▎    | 8009/15001 [5:09:40<11:00:58,  5.67s/it, loss=0.16, lr=1e-5] Steps:  53%|█████▎    | 8010/15001 [5:09:42<8:53:36,  4.58s/it, loss=0.16, lr=1e-5] Steps:  53%|█████▎    | 8010/15001 [5:09:42<8:53:36,  4.58s/it, loss=0.392, lr=1e-5]Steps:  53%|█████▎    | 8011/15001 [5:09:43<7:15:36,  3.74s/it, loss=0.392, lr=1e-5]Steps:  53%|█████▎    | 8011/15001 [5:09:44<7:15:36,  3.74s/it, loss=0.125, lr=1e-5]Steps:  53%|█████▎    | 8012/15001 [5:09:45<6:12:57,  3.20s/it, loss=0.125, lr=1e-5]Steps:  53%|█████▎    | 8012/15001 [5:09:46<6:12:57,  3.20s/it, loss=0.0978, lr=1e-5]Steps:  53%|█████▎    | 8013/15001 [5:09:47<5:14:38,  2.70s/it, loss=0.0978, lr=1e-5]Steps:  53%|█████▎    | 8013/15001 [5:09:47<5:14:38,  2.70s/it, loss=0.0652, lr=1e-5]Steps:  53%|█████▎    | 8014/15001 [5:09:49<4:47:20,  2.47s/it, loss=0.0652, lr=1e-5]Steps:  53%|█████▎    | 8014/15001 [5:09:49<4:47:20,  2.47s/it, loss=0.174, lr=1e-5] Steps:  53%|█████▎    | 8015/15001 [5:09:51<4:29:08,  2.31s/it, loss=0.174, lr=1e-5]Steps:  53%|█████▎    | 8015/15001 [5:09:51<4:29:08,  2.31s/it, loss=0.276, lr=1e-5]Steps:  53%|█████▎    | 8016/15001 [5:09:53<4:14:58,  2.19s/it, loss=0.276, lr=1e-5]Steps:  53%|█████▎    | 8016/15001 [5:09:53<4:14:58,  2.19s/it, loss=0.241, lr=1e-5]Steps:  53%|█████▎    | 8017/15001 [5:09:54<3:56:45,  2.03s/it, loss=0.241, lr=1e-5]Steps:  53%|█████▎    | 8017/15001 [5:09:55<3:56:45,  2.03s/it, loss=0.149, lr=1e-5]Steps:  53%|█████▎    | 8018/15001 [5:09:56<3:54:28,  2.01s/it, loss=0.149, lr=1e-5]Steps:  53%|█████▎    | 8018/15001 [5:09:57<3:54:28,  2.01s/it, loss=0.157, lr=1e-5]Steps:  53%|█████▎    | 8019/15001 [5:09:58<3:48:42,  1.97s/it, loss=0.157, lr=1e-5]Steps:  53%|█████▎    | 8019/15001 [5:09:58<3:48:42,  1.97s/it, loss=0.251, lr=1e-5]Steps:  53%|█████▎    | 8020/15001 [5:10:00<3:43:17,  1.92s/it, loss=0.251, lr=1e-5]Steps:  53%|█████▎    | 8020/15001 [5:10:00<3:43:17,  1.92s/it, loss=0.195, lr=1e-5]Steps:  53%|█████▎    | 8021/15001 [5:10:02<3:39:28,  1.89s/it, loss=0.195, lr=1e-5]Steps:  53%|█████▎    | 8021/15001 [5:10:02<3:39:28,  1.89s/it, loss=0.167, lr=1e-5]Steps:  53%|█████▎    | 8022/15001 [5:10:03<3:30:26,  1.81s/it, loss=0.167, lr=1e-5]Steps:  53%|█████▎    | 8022/15001 [5:10:04<3:30:26,  1.81s/it, loss=0.141, lr=1e-5]Steps:  53%|█████▎    | 8023/15001 [5:10:05<3:27:17,  1.78s/it, loss=0.141, lr=1e-5]Steps:  53%|█████▎    | 8023/15001 [5:10:05<3:27:17,  1.78s/it, loss=0.193, lr=1e-5]Steps:  53%|█████▎    | 8024/15001 [5:10:07<3:35:05,  1.85s/it, loss=0.193, lr=1e-5]Steps:  53%|█████▎    | 8024/15001 [5:10:07<3:35:05,  1.85s/it, loss=0.286, lr=1e-5]Steps:  53%|█████▎    | 8025/15001 [5:10:09<3:32:22,  1.83s/it, loss=0.286, lr=1e-5]Steps:  53%|█████▎    | 8025/15001 [5:10:09<3:32:22,  1.83s/it, loss=0.278, lr=1e-5]Steps:  54%|█████▎    | 8026/15001 [5:10:11<3:39:41,  1.89s/it, loss=0.278, lr=1e-5]Steps:  54%|█████▎    | 8026/15001 [5:10:11<3:39:41,  1.89s/it, loss=0.199, lr=1e-5]Steps:  54%|█████▎    | 8027/15001 [5:10:13<3:38:29,  1.88s/it, loss=0.199, lr=1e-5]Steps:  54%|█████▎    | 8027/15001 [5:10:13<3:38:29,  1.88s/it, loss=0.0969, lr=1e-5]Steps:  54%|█████▎    | 8028/15001 [5:10:15<3:35:07,  1.85s/it, loss=0.0969, lr=1e-5]Steps:  54%|█████▎    | 8028/15001 [5:10:15<3:35:07,  1.85s/it, loss=0.105, lr=1e-5] Steps:  54%|█████▎    | 8029/15001 [5:10:17<3:43:26,  1.92s/it, loss=0.105, lr=1e-5]Steps:  54%|█████▎    | 8029/15001 [5:10:17<3:43:26,  1.92s/it, loss=0.108, lr=1e-5]Steps:  54%|█████▎    | 8030/15001 [5:10:19<3:43:06,  1.92s/it, loss=0.108, lr=1e-5]Steps:  54%|█████▎    | 8030/15001 [5:10:19<3:43:06,  1.92s/it, loss=0.11, lr=1e-5] Steps:  54%|█████▎    | 8031/15001 [5:10:21<3:58:56,  2.06s/it, loss=0.11, lr=1e-5]Steps:  54%|█████▎    | 8031/15001 [5:10:21<3:58:56,  2.06s/it, loss=0.122, lr=1e-5]Steps:  54%|█████▎    | 8032/15001 [5:10:23<3:54:57,  2.02s/it, loss=0.122, lr=1e-5]Steps:  54%|█████▎    | 8032/15001 [5:10:23<3:54:57,  2.02s/it, loss=0.111, lr=1e-5]Steps:  54%|█████▎    | 8033/15001 [5:10:25<3:44:52,  1.94s/it, loss=0.111, lr=1e-5]Steps:  54%|█████▎    | 8033/15001 [5:10:25<3:44:52,  1.94s/it, loss=0.138, lr=1e-5]Steps:  54%|█████▎    | 8034/15001 [5:10:26<3:35:53,  1.86s/it, loss=0.138, lr=1e-5]Steps:  54%|█████▎    | 8034/15001 [5:10:27<3:35:53,  1.86s/it, loss=0.107, lr=1e-5]Steps:  54%|█████▎    | 8035/15001 [5:10:28<3:42:04,  1.91s/it, loss=0.107, lr=1e-5]Steps:  54%|█████▎    | 8035/15001 [5:10:28<3:42:04,  1.91s/it, loss=0.052, lr=1e-5]Steps:  54%|█████▎    | 8036/15001 [5:10:30<3:34:24,  1.85s/it, loss=0.052, lr=1e-5]Steps:  54%|█████▎    | 8036/15001 [5:10:30<3:34:24,  1.85s/it, loss=0.222, lr=1e-5]Steps:  54%|█████▎    | 8037/15001 [5:10:32<3:35:54,  1.86s/it, loss=0.222, lr=1e-5]Steps:  54%|█████▎    | 8037/15001 [5:10:32<3:35:54,  1.86s/it, loss=0.161, lr=1e-5]Steps:  54%|█████▎    | 8038/15001 [5:10:34<3:37:27,  1.87s/it, loss=0.161, lr=1e-5]Steps:  54%|█████▎    | 8038/15001 [5:10:34<3:37:27,  1.87s/it, loss=0.182, lr=1e-5]Steps:  54%|█████▎    | 8039/15001 [5:10:36<3:32:37,  1.83s/it, loss=0.182, lr=1e-5]Steps:  54%|█████▎    | 8039/15001 [5:10:36<3:32:37,  1.83s/it, loss=0.026, lr=1e-5]Steps:  54%|█████▎    | 8040/15001 [5:10:38<3:34:52,  1.85s/it, loss=0.026, lr=1e-5]Steps:  54%|█████▎    | 8040/15001 [5:10:38<3:34:52,  1.85s/it, loss=0.028, lr=1e-5]Steps:  54%|█████▎    | 8041/15001 [5:10:39<3:30:15,  1.81s/it, loss=0.028, lr=1e-5]Steps:  54%|█████▎    | 8041/15001 [5:10:39<3:30:15,  1.81s/it, loss=0.227, lr=1e-5]Steps:  54%|█████▎    | 8042/15001 [5:10:41<3:22:30,  1.75s/it, loss=0.227, lr=1e-5]Steps:  54%|█████▎    | 8042/15001 [5:10:41<3:22:30,  1.75s/it, loss=0.15, lr=1e-5] Steps:  54%|█████▎    | 8043/15001 [5:10:43<3:23:27,  1.75s/it, loss=0.15, lr=1e-5]Steps:  54%|█████▎    | 8043/15001 [5:10:43<3:23:27,  1.75s/it, loss=0.116, lr=1e-5]Steps:  54%|█████▎    | 8044/15001 [5:10:45<3:33:29,  1.84s/it, loss=0.116, lr=1e-5]Steps:  54%|█████▎    | 8044/15001 [5:10:45<3:33:29,  1.84s/it, loss=0.131, lr=1e-5]Steps:  54%|█████▎    | 8045/15001 [5:10:46<3:29:19,  1.81s/it, loss=0.131, lr=1e-5]Steps:  54%|█████▎    | 8045/15001 [5:10:47<3:29:19,  1.81s/it, loss=0.184, lr=1e-5]Steps:  54%|█████▎    | 8046/15001 [5:10:48<3:29:55,  1.81s/it, loss=0.184, lr=1e-5]Steps:  54%|█████▎    | 8046/15001 [5:10:49<3:29:55,  1.81s/it, loss=0.324, lr=1e-5]Steps:  54%|█████▎    | 8047/15001 [5:10:50<3:38:09,  1.88s/it, loss=0.324, lr=1e-5]Steps:  54%|█████▎    | 8047/15001 [5:10:50<3:38:09,  1.88s/it, loss=0.288, lr=1e-5]Steps:  54%|█████▎    | 8048/15001 [5:10:52<3:43:29,  1.93s/it, loss=0.288, lr=1e-5]Steps:  54%|█████▎    | 8048/15001 [5:10:52<3:43:29,  1.93s/it, loss=0.178, lr=1e-5]Steps:  54%|█████▎    | 8049/15001 [5:10:54<3:47:36,  1.96s/it, loss=0.178, lr=1e-5]Steps:  54%|█████▎    | 8049/15001 [5:10:54<3:47:36,  1.96s/it, loss=0.113, lr=1e-5]Steps:  54%|█████▎    | 8050/15001 [5:10:56<3:37:47,  1.88s/it, loss=0.113, lr=1e-5]Steps:  54%|█████▎    | 8050/15001 [5:10:56<3:37:47,  1.88s/it, loss=0.257, lr=1e-5]Steps:  54%|█████▎    | 8051/15001 [5:10:58<3:40:24,  1.90s/it, loss=0.257, lr=1e-5]Steps:  54%|█████▎    | 8051/15001 [5:10:58<3:40:24,  1.90s/it, loss=0.187, lr=1e-5]Steps:  54%|█████▎    | 8052/15001 [5:11:00<3:43:44,  1.93s/it, loss=0.187, lr=1e-5]Steps:  54%|█████▎    | 8052/15001 [5:11:00<3:43:44,  1.93s/it, loss=0.309, lr=1e-5]Steps:  54%|█████▎    | 8053/15001 [5:11:02<3:43:42,  1.93s/it, loss=0.309, lr=1e-5]Steps:  54%|█████▎    | 8053/15001 [5:11:02<3:43:42,  1.93s/it, loss=0.234, lr=1e-5]Steps:  54%|█████▎    | 8054/15001 [5:11:04<3:48:31,  1.97s/it, loss=0.234, lr=1e-5]Steps:  54%|█████▎    | 8054/15001 [5:11:04<3:48:31,  1.97s/it, loss=0.174, lr=1e-5]Steps:  54%|█████▎    | 8055/15001 [5:11:06<3:46:18,  1.95s/it, loss=0.174, lr=1e-5]Steps:  54%|█████▎    | 8055/15001 [5:11:06<3:46:18,  1.95s/it, loss=0.124, lr=1e-5]Steps:  54%|█████▎    | 8056/15001 [5:11:08<3:38:33,  1.89s/it, loss=0.124, lr=1e-5]Steps:  54%|█████▎    | 8056/15001 [5:11:08<3:38:33,  1.89s/it, loss=0.0457, lr=1e-5]Steps:  54%|█████▎    | 8057/15001 [5:11:10<3:40:03,  1.90s/it, loss=0.0457, lr=1e-5]Steps:  54%|█████▎    | 8057/15001 [5:11:10<3:40:03,  1.90s/it, loss=0.162, lr=1e-5] Steps:  54%|█████▎    | 8058/15001 [5:11:11<3:26:06,  1.78s/it, loss=0.162, lr=1e-5]Steps:  54%|█████▎    | 8058/15001 [5:11:11<3:26:06,  1.78s/it, loss=0.294, lr=1e-5]Steps:  54%|█████▎    | 8059/15001 [5:11:13<3:33:32,  1.85s/it, loss=0.294, lr=1e-5]Steps:  54%|█████▎    | 8059/15001 [5:11:13<3:33:32,  1.85s/it, loss=0.123, lr=1e-5]Steps:  54%|█████▎    | 8060/15001 [5:11:15<3:34:19,  1.85s/it, loss=0.123, lr=1e-5]Steps:  54%|█████▎    | 8060/15001 [5:11:15<3:34:19,  1.85s/it, loss=0.248, lr=1e-5]Steps:  54%|█████▎    | 8061/15001 [5:11:17<3:24:38,  1.77s/it, loss=0.248, lr=1e-5]Steps:  54%|█████▎    | 8061/15001 [5:11:17<3:24:38,  1.77s/it, loss=0.318, lr=1e-5]Steps:  54%|█████▎    | 8062/15001 [5:11:19<3:32:58,  1.84s/it, loss=0.318, lr=1e-5]Steps:  54%|█████▎    | 8062/15001 [5:11:19<3:32:58,  1.84s/it, loss=0.15, lr=1e-5] Steps:  54%|█████▎    | 8063/15001 [5:11:20<3:36:48,  1.87s/it, loss=0.15, lr=1e-5]Steps:  54%|█████▎    | 8063/15001 [5:11:21<3:36:48,  1.87s/it, loss=0.15, lr=1e-5]Steps:  54%|█████▍    | 8064/15001 [5:11:22<3:29:58,  1.82s/it, loss=0.15, lr=1e-5]Steps:  54%|█████▍    | 8064/15001 [5:11:22<3:29:58,  1.82s/it, loss=0.2, lr=1e-5] Steps:  54%|█████▍    | 8065/15001 [5:11:24<3:35:58,  1.87s/it, loss=0.2, lr=1e-5]Steps:  54%|█████▍    | 8065/15001 [5:11:24<3:35:58,  1.87s/it, loss=0.162, lr=1e-5]Steps:  54%|█████▍    | 8066/15001 [5:11:26<3:30:40,  1.82s/it, loss=0.162, lr=1e-5]Steps:  54%|█████▍    | 8066/15001 [5:11:26<3:30:40,  1.82s/it, loss=0.146, lr=1e-5]Steps:  54%|█████▍    | 8067/15001 [5:11:28<3:30:54,  1.82s/it, loss=0.146, lr=1e-5]Steps:  54%|█████▍    | 8067/15001 [5:11:28<3:30:54,  1.82s/it, loss=0.23, lr=1e-5] Steps:  54%|█████▍    | 8068/15001 [5:11:29<3:25:40,  1.78s/it, loss=0.23, lr=1e-5]Steps:  54%|█████▍    | 8068/15001 [5:11:30<3:25:40,  1.78s/it, loss=0.296, lr=1e-5]Steps:  54%|█████▍    | 8069/15001 [5:11:31<3:27:06,  1.79s/it, loss=0.296, lr=1e-5]Steps:  54%|█████▍    | 8069/15001 [5:11:32<3:27:06,  1.79s/it, loss=0.205, lr=1e-5]Steps:  54%|█████▍    | 8070/15001 [5:11:33<3:35:12,  1.86s/it, loss=0.205, lr=1e-5]Steps:  54%|█████▍    | 8070/15001 [5:11:33<3:35:12,  1.86s/it, loss=0.083, lr=1e-5]Steps:  54%|█████▍    | 8071/15001 [5:11:35<3:33:11,  1.85s/it, loss=0.083, lr=1e-5]Steps:  54%|█████▍    | 8071/15001 [5:11:35<3:33:11,  1.85s/it, loss=0.197, lr=1e-5]Steps:  54%|█████▍    | 8072/15001 [5:11:37<3:43:43,  1.94s/it, loss=0.197, lr=1e-5]Steps:  54%|█████▍    | 8072/15001 [5:11:37<3:43:43,  1.94s/it, loss=0.249, lr=1e-5]Steps:  54%|█████▍    | 8073/15001 [5:11:39<3:40:38,  1.91s/it, loss=0.249, lr=1e-5]Steps:  54%|█████▍    | 8073/15001 [5:11:39<3:40:38,  1.91s/it, loss=0.36, lr=1e-5] Steps:  54%|█████▍    | 8074/15001 [5:11:41<3:51:50,  2.01s/it, loss=0.36, lr=1e-5]Steps:  54%|█████▍    | 8074/15001 [5:11:42<3:51:50,  2.01s/it, loss=0.222, lr=1e-5]Steps:  54%|█████▍    | 8075/15001 [5:11:43<3:57:10,  2.05s/it, loss=0.222, lr=1e-5]Steps:  54%|█████▍    | 8075/15001 [5:11:44<3:57:10,  2.05s/it, loss=0.317, lr=1e-5]Steps:  54%|█████▍    | 8076/15001 [5:11:45<3:51:37,  2.01s/it, loss=0.317, lr=1e-5]Steps:  54%|█████▍    | 8076/15001 [5:11:46<3:51:37,  2.01s/it, loss=0.172, lr=1e-5]Steps:  54%|█████▍    | 8077/15001 [5:11:47<3:48:31,  1.98s/it, loss=0.172, lr=1e-5]Steps:  54%|█████▍    | 8077/15001 [5:11:47<3:48:31,  1.98s/it, loss=0.0522, lr=1e-5]Steps:  54%|█████▍    | 8078/15001 [5:11:49<3:43:28,  1.94s/it, loss=0.0522, lr=1e-5]Steps:  54%|█████▍    | 8078/15001 [5:11:49<3:43:28,  1.94s/it, loss=0.188, lr=1e-5] Steps:  54%|█████▍    | 8079/15001 [5:11:51<3:44:58,  1.95s/it, loss=0.188, lr=1e-5]Steps:  54%|█████▍    | 8079/15001 [5:11:51<3:44:58,  1.95s/it, loss=0.272, lr=1e-5]Steps:  54%|█████▍    | 8080/15001 [5:11:53<3:39:28,  1.90s/it, loss=0.272, lr=1e-5]Steps:  54%|█████▍    | 8080/15001 [5:11:53<3:39:28,  1.90s/it, loss=0.279, lr=1e-5]Steps:  54%|█████▍    | 8081/15001 [5:11:55<3:35:13,  1.87s/it, loss=0.279, lr=1e-5]Steps:  54%|█████▍    | 8081/15001 [5:11:55<3:35:13,  1.87s/it, loss=0.129, lr=1e-5]Steps:  54%|█████▍    | 8082/15001 [5:11:56<3:23:24,  1.76s/it, loss=0.129, lr=1e-5]Steps:  54%|█████▍    | 8082/15001 [5:11:56<3:23:24,  1.76s/it, loss=0.0313, lr=1e-5]Steps:  54%|█████▍    | 8083/15001 [5:11:58<3:26:58,  1.80s/it, loss=0.0313, lr=1e-5]Steps:  54%|█████▍    | 8083/15001 [5:11:58<3:26:58,  1.80s/it, loss=0.131, lr=1e-5] Steps:  54%|█████▍    | 8084/15001 [5:12:00<3:31:56,  1.84s/it, loss=0.131, lr=1e-5]Steps:  54%|█████▍    | 8084/15001 [5:12:00<3:31:56,  1.84s/it, loss=0.129, lr=1e-5]Steps:  54%|█████▍    | 8085/15001 [5:12:02<3:27:16,  1.80s/it, loss=0.129, lr=1e-5]Steps:  54%|█████▍    | 8085/15001 [5:12:02<3:27:16,  1.80s/it, loss=0.119, lr=1e-5]Steps:  54%|█████▍    | 8086/15001 [5:12:04<3:35:06,  1.87s/it, loss=0.119, lr=1e-5]Steps:  54%|█████▍    | 8086/15001 [5:12:04<3:35:06,  1.87s/it, loss=0.356, lr=1e-5]Steps:  54%|█████▍    | 8087/15001 [5:12:05<3:30:32,  1.83s/it, loss=0.356, lr=1e-5]Steps:  54%|█████▍    | 8087/15001 [5:12:05<3:30:32,  1.83s/it, loss=0.326, lr=1e-5]Steps:  54%|█████▍    | 8088/15001 [5:12:07<3:27:22,  1.80s/it, loss=0.326, lr=1e-5]Steps:  54%|█████▍    | 8088/15001 [5:12:07<3:27:22,  1.80s/it, loss=0.0925, lr=1e-5]Steps:  54%|█████▍    | 8089/15001 [5:12:09<3:26:12,  1.79s/it, loss=0.0925, lr=1e-5]Steps:  54%|█████▍    | 8089/15001 [5:12:09<3:26:12,  1.79s/it, loss=0.0196, lr=1e-5]Steps:  54%|█████▍    | 8090/15001 [5:12:11<3:23:53,  1.77s/it, loss=0.0196, lr=1e-5]Steps:  54%|█████▍    | 8090/15001 [5:12:11<3:23:53,  1.77s/it, loss=0.167, lr=1e-5] Steps:  54%|█████▍    | 8091/15001 [5:12:13<3:26:46,  1.80s/it, loss=0.167, lr=1e-5]Steps:  54%|█████▍    | 8091/15001 [5:12:13<3:26:46,  1.80s/it, loss=0.347, lr=1e-5]Steps:  54%|█████▍    | 8092/15001 [5:12:14<3:27:21,  1.80s/it, loss=0.347, lr=1e-5]Steps:  54%|█████▍    | 8092/15001 [5:12:14<3:27:21,  1.80s/it, loss=0.114, lr=1e-5]Steps:  54%|█████▍    | 8093/15001 [5:12:16<3:25:04,  1.78s/it, loss=0.114, lr=1e-5]Steps:  54%|█████▍    | 8093/15001 [5:12:16<3:25:04,  1.78s/it, loss=0.182, lr=1e-5]Steps:  54%|█████▍    | 8094/15001 [5:12:18<3:36:58,  1.88s/it, loss=0.182, lr=1e-5]Steps:  54%|█████▍    | 8094/15001 [5:12:18<3:36:58,  1.88s/it, loss=0.279, lr=1e-5]Steps:  54%|█████▍    | 8095/15001 [5:12:20<3:35:30,  1.87s/it, loss=0.279, lr=1e-5]Steps:  54%|█████▍    | 8095/15001 [5:12:20<3:35:30,  1.87s/it, loss=0.293, lr=1e-5]Steps:  54%|█████▍    | 8096/15001 [5:12:22<3:45:58,  1.96s/it, loss=0.293, lr=1e-5]Steps:  54%|█████▍    | 8096/15001 [5:12:22<3:45:58,  1.96s/it, loss=0.168, lr=1e-5]Steps:  54%|█████▍    | 8097/15001 [5:12:24<3:43:57,  1.95s/it, loss=0.168, lr=1e-5]Steps:  54%|█████▍    | 8097/15001 [5:12:24<3:43:57,  1.95s/it, loss=0.12, lr=1e-5] Steps:  54%|█████▍    | 8098/15001 [5:12:26<3:43:36,  1.94s/it, loss=0.12, lr=1e-5]Steps:  54%|█████▍    | 8098/15001 [5:12:27<3:43:36,  1.94s/it, loss=0.168, lr=1e-5]Steps:  54%|█████▍    | 8099/15001 [5:12:29<4:06:15,  2.14s/it, loss=0.168, lr=1e-5]Steps:  54%|█████▍    | 8099/15001 [5:12:29<4:06:15,  2.14s/it, loss=0.205, lr=1e-5]Steps:  54%|█████▍    | 8100/15001 [5:12:30<3:54:53,  2.04s/it, loss=0.205, lr=1e-5]Steps:  54%|█████▍    | 8100/15001 [5:12:31<3:54:53,  2.04s/it, loss=0.135, lr=1e-5]Steps:  54%|█████▍    | 8101/15001 [5:12:32<3:43:35,  1.94s/it, loss=0.135, lr=1e-5]Steps:  54%|█████▍    | 8101/15001 [5:12:32<3:43:35,  1.94s/it, loss=0.146, lr=1e-5]Steps:  54%|█████▍    | 8102/15001 [5:12:34<3:36:38,  1.88s/it, loss=0.146, lr=1e-5]Steps:  54%|█████▍    | 8102/15001 [5:12:34<3:36:38,  1.88s/it, loss=0.0919, lr=1e-5]Steps:  54%|█████▍    | 8103/15001 [5:12:36<3:35:16,  1.87s/it, loss=0.0919, lr=1e-5]Steps:  54%|█████▍    | 8103/15001 [5:12:36<3:35:16,  1.87s/it, loss=0.086, lr=1e-5] Steps:  54%|█████▍    | 8104/15001 [5:12:38<3:38:00,  1.90s/it, loss=0.086, lr=1e-5]Steps:  54%|█████▍    | 8104/15001 [5:12:38<3:38:00,  1.90s/it, loss=0.209, lr=1e-5]Steps:  54%|█████▍    | 8105/15001 [5:12:40<3:34:52,  1.87s/it, loss=0.209, lr=1e-5]Steps:  54%|█████▍    | 8105/15001 [5:12:40<3:34:52,  1.87s/it, loss=0.267, lr=1e-5]Steps:  54%|█████▍    | 8106/15001 [5:12:41<3:34:12,  1.86s/it, loss=0.267, lr=1e-5]Steps:  54%|█████▍    | 8106/15001 [5:12:41<3:34:12,  1.86s/it, loss=0.196, lr=1e-5]Steps:  54%|█████▍    | 8107/15001 [5:12:43<3:27:57,  1.81s/it, loss=0.196, lr=1e-5]Steps:  54%|█████▍    | 8107/15001 [5:12:43<3:27:57,  1.81s/it, loss=0.164, lr=1e-5]Steps:  54%|█████▍    | 8108/15001 [5:12:45<3:23:54,  1.77s/it, loss=0.164, lr=1e-5]Steps:  54%|█████▍    | 8108/15001 [5:12:45<3:23:54,  1.77s/it, loss=0.34, lr=1e-5] Steps:  54%|█████▍    | 8109/15001 [5:12:47<3:28:30,  1.82s/it, loss=0.34, lr=1e-5]Steps:  54%|█████▍    | 8109/15001 [5:12:47<3:28:30,  1.82s/it, loss=0.0615, lr=1e-5]Steps:  54%|█████▍    | 8110/15001 [5:12:48<3:25:59,  1.79s/it, loss=0.0615, lr=1e-5]Steps:  54%|█████▍    | 8110/15001 [5:12:49<3:25:59,  1.79s/it, loss=0.215, lr=1e-5] Steps:  54%|█████▍    | 8111/15001 [5:12:50<3:30:22,  1.83s/it, loss=0.215, lr=1e-5]Steps:  54%|█████▍    | 8111/15001 [5:12:51<3:30:22,  1.83s/it, loss=0.393, lr=1e-5]Steps:  54%|█████▍    | 8112/15001 [5:12:52<3:36:04,  1.88s/it, loss=0.393, lr=1e-5]Steps:  54%|█████▍    | 8112/15001 [5:12:52<3:36:04,  1.88s/it, loss=0.0612, lr=1e-5]Steps:  54%|█████▍    | 8113/15001 [5:12:54<3:30:12,  1.83s/it, loss=0.0612, lr=1e-5]Steps:  54%|█████▍    | 8113/15001 [5:12:54<3:30:12,  1.83s/it, loss=0.184, lr=1e-5] Steps:  54%|█████▍    | 8114/15001 [5:12:56<3:32:54,  1.85s/it, loss=0.184, lr=1e-5]Steps:  54%|█████▍    | 8114/15001 [5:12:56<3:32:54,  1.85s/it, loss=0.283, lr=1e-5]Steps:  54%|█████▍    | 8115/15001 [5:12:58<3:27:48,  1.81s/it, loss=0.283, lr=1e-5]Steps:  54%|█████▍    | 8115/15001 [5:12:58<3:27:48,  1.81s/it, loss=0.197, lr=1e-5]Steps:  54%|█████▍    | 8116/15001 [5:12:59<3:26:03,  1.80s/it, loss=0.197, lr=1e-5]Steps:  54%|█████▍    | 8116/15001 [5:13:00<3:26:03,  1.80s/it, loss=0.359, lr=1e-5]Steps:  54%|█████▍    | 8117/15001 [5:13:01<3:35:43,  1.88s/it, loss=0.359, lr=1e-5]Steps:  54%|█████▍    | 8117/15001 [5:13:02<3:35:43,  1.88s/it, loss=0.228, lr=1e-5]Steps:  54%|█████▍    | 8118/15001 [5:13:03<3:39:12,  1.91s/it, loss=0.228, lr=1e-5]Steps:  54%|█████▍    | 8118/15001 [5:13:04<3:39:12,  1.91s/it, loss=0.159, lr=1e-5]Steps:  54%|█████▍    | 8119/15001 [5:13:06<3:43:49,  1.95s/it, loss=0.159, lr=1e-5]Steps:  54%|█████▍    | 8119/15001 [5:13:06<3:43:49,  1.95s/it, loss=0.221, lr=1e-5]Steps:  54%|█████▍    | 8120/15001 [5:13:08<3:46:02,  1.97s/it, loss=0.221, lr=1e-5]Steps:  54%|█████▍    | 8120/15001 [5:13:08<3:46:02,  1.97s/it, loss=0.288, lr=1e-5]Steps:  54%|█████▍    | 8121/15001 [5:13:10<3:48:21,  1.99s/it, loss=0.288, lr=1e-5]Steps:  54%|█████▍    | 8121/15001 [5:13:10<3:48:21,  1.99s/it, loss=0.209, lr=1e-5]Steps:  54%|█████▍    | 8122/15001 [5:13:12<3:45:50,  1.97s/it, loss=0.209, lr=1e-5]Steps:  54%|█████▍    | 8122/15001 [5:13:12<3:45:50,  1.97s/it, loss=0.175, lr=1e-5]Steps:  54%|█████▍    | 8123/15001 [5:13:14<3:47:12,  1.98s/it, loss=0.175, lr=1e-5]Steps:  54%|█████▍    | 8123/15001 [5:13:14<3:47:12,  1.98s/it, loss=0.0938, lr=1e-5]Steps:  54%|█████▍    | 8124/15001 [5:13:15<3:42:03,  1.94s/it, loss=0.0938, lr=1e-5]Steps:  54%|█████▍    | 8124/15001 [5:13:16<3:42:03,  1.94s/it, loss=0.333, lr=1e-5] Steps:  54%|█████▍    | 8125/15001 [5:13:17<3:43:13,  1.95s/it, loss=0.333, lr=1e-5]Steps:  54%|█████▍    | 8125/15001 [5:13:18<3:43:13,  1.95s/it, loss=0.2, lr=1e-5]  Steps:  54%|█████▍    | 8126/15001 [5:13:19<3:44:41,  1.96s/it, loss=0.2, lr=1e-5]Steps:  54%|█████▍    | 8126/15001 [5:13:19<3:44:41,  1.96s/it, loss=0.266, lr=1e-5]Steps:  54%|█████▍    | 8127/15001 [5:13:21<3:38:33,  1.91s/it, loss=0.266, lr=1e-5]Steps:  54%|█████▍    | 8127/15001 [5:13:21<3:38:33,  1.91s/it, loss=0.0916, lr=1e-5]Steps:  54%|█████▍    | 8128/15001 [5:13:23<3:36:56,  1.89s/it, loss=0.0916, lr=1e-5]Steps:  54%|█████▍    | 8128/15001 [5:13:23<3:36:56,  1.89s/it, loss=0.365, lr=1e-5] Steps:  54%|█████▍    | 8129/15001 [5:13:25<3:35:19,  1.88s/it, loss=0.365, lr=1e-5]Steps:  54%|█████▍    | 8129/15001 [5:13:25<3:35:19,  1.88s/it, loss=0.192, lr=1e-5]Steps:  54%|█████▍    | 8130/15001 [5:13:27<3:33:52,  1.87s/it, loss=0.192, lr=1e-5]Steps:  54%|█████▍    | 8130/15001 [5:13:27<3:33:52,  1.87s/it, loss=0.247, lr=1e-5]Steps:  54%|█████▍    | 8131/15001 [5:13:28<3:26:16,  1.80s/it, loss=0.247, lr=1e-5]Steps:  54%|█████▍    | 8131/15001 [5:13:29<3:26:16,  1.80s/it, loss=0.142, lr=1e-5]Steps:  54%|█████▍    | 8132/15001 [5:13:30<3:28:49,  1.82s/it, loss=0.142, lr=1e-5]Steps:  54%|█████▍    | 8132/15001 [5:13:30<3:28:49,  1.82s/it, loss=0.224, lr=1e-5]Steps:  54%|█████▍    | 8133/15001 [5:13:32<3:21:58,  1.76s/it, loss=0.224, lr=1e-5]Steps:  54%|█████▍    | 8133/15001 [5:13:32<3:21:58,  1.76s/it, loss=0.166, lr=1e-5]Steps:  54%|█████▍    | 8134/15001 [5:13:34<3:26:50,  1.81s/it, loss=0.166, lr=1e-5]Steps:  54%|█████▍    | 8134/15001 [5:13:34<3:26:50,  1.81s/it, loss=0.184, lr=1e-5]Steps:  54%|█████▍    | 8135/15001 [5:13:36<3:29:17,  1.83s/it, loss=0.184, lr=1e-5]Steps:  54%|█████▍    | 8135/15001 [5:13:36<3:29:17,  1.83s/it, loss=0.107, lr=1e-5]Steps:  54%|█████▍    | 8136/15001 [5:13:37<3:26:35,  1.81s/it, loss=0.107, lr=1e-5]Steps:  54%|█████▍    | 8136/15001 [5:13:37<3:26:35,  1.81s/it, loss=0.133, lr=1e-5]Steps:  54%|█████▍    | 8137/15001 [5:13:39<3:18:09,  1.73s/it, loss=0.133, lr=1e-5]Steps:  54%|█████▍    | 8137/15001 [5:13:39<3:18:09,  1.73s/it, loss=0.111, lr=1e-5]Steps:  54%|█████▍    | 8138/15001 [5:13:41<3:24:34,  1.79s/it, loss=0.111, lr=1e-5]Steps:  54%|█████▍    | 8138/15001 [5:13:41<3:24:34,  1.79s/it, loss=0.198, lr=1e-5]Steps:  54%|█████▍    | 8139/15001 [5:13:43<3:25:05,  1.79s/it, loss=0.198, lr=1e-5]Steps:  54%|█████▍    | 8139/15001 [5:13:43<3:25:05,  1.79s/it, loss=0.177, lr=1e-5]Steps:  54%|█████▍    | 8140/15001 [5:13:45<3:36:15,  1.89s/it, loss=0.177, lr=1e-5]Steps:  54%|█████▍    | 8140/15001 [5:13:45<3:36:15,  1.89s/it, loss=0.237, lr=1e-5]Steps:  54%|█████▍    | 8141/15001 [5:13:47<3:37:06,  1.90s/it, loss=0.237, lr=1e-5]Steps:  54%|█████▍    | 8141/15001 [5:13:47<3:37:06,  1.90s/it, loss=0.122, lr=1e-5]Steps:  54%|█████▍    | 8142/15001 [5:13:49<3:48:35,  2.00s/it, loss=0.122, lr=1e-5]Steps:  54%|█████▍    | 8142/15001 [5:13:49<3:48:35,  2.00s/it, loss=0.175, lr=1e-5]Steps:  54%|█████▍    | 8143/15001 [5:13:51<3:47:29,  1.99s/it, loss=0.175, lr=1e-5]Steps:  54%|█████▍    | 8143/15001 [5:13:51<3:47:29,  1.99s/it, loss=0.0967, lr=1e-5]Steps:  54%|███��█▍    | 8144/15001 [5:13:53<3:50:34,  2.02s/it, loss=0.0967, lr=1e-5]Steps:  54%|█████▍    | 8144/15001 [5:13:53<3:50:34,  2.02s/it, loss=0.0855, lr=1e-5]Steps:  54%|█████▍    | 8145/15001 [5:13:55<3:49:12,  2.01s/it, loss=0.0855, lr=1e-5]Steps:  54%|█████▍    | 8145/15001 [5:13:55<3:49:12,  2.01s/it, loss=0.185, lr=1e-5] Steps:  54%|█████▍    | 8146/15001 [5:13:57<3:45:39,  1.98s/it, loss=0.185, lr=1e-5]Steps:  54%|█████▍    | 8146/15001 [5:13:57<3:45:39,  1.98s/it, loss=0.234, lr=1e-5]Steps:  54%|█████▍    | 8147/15001 [5:13:59<3:37:11,  1.90s/it, loss=0.234, lr=1e-5]Steps:  54%|█████▍    | 8147/15001 [5:13:59<3:37:11,  1.90s/it, loss=0.00988, lr=1e-5]Steps:  54%|█████▍    | 8148/15001 [5:14:00<3:24:17,  1.79s/it, loss=0.00988, lr=1e-5]Steps:  54%|█████▍    | 8148/15001 [5:14:01<3:24:17,  1.79s/it, loss=0.218, lr=1e-5]  Steps:  54%|█████▍    | 8149/15001 [5:14:02<3:29:39,  1.84s/it, loss=0.218, lr=1e-5]Steps:  54%|█████▍    | 8149/15001 [5:14:03<3:29:39,  1.84s/it, loss=0.0544, lr=1e-5]Steps:  54%|█████▍    | 8150/15001 [5:14:04<3:43:03,  1.95s/it, loss=0.0544, lr=1e-5]Steps:  54%|█████▍    | 8150/15001 [5:14:04<3:43:03,  1.95s/it, loss=0.119, lr=1e-5] Steps:  54%|█████▍    | 8151/15001 [5:14:06<3:38:26,  1.91s/it, loss=0.119, lr=1e-5]Steps:  54%|█████▍    | 8151/15001 [5:14:06<3:38:26,  1.91s/it, loss=0.134, lr=1e-5]Steps:  54%|█████▍    | 8152/15001 [5:14:08<3:38:11,  1.91s/it, loss=0.134, lr=1e-5]Steps:  54%|█████▍    | 8152/15001 [5:14:08<3:38:11,  1.91s/it, loss=0.229, lr=1e-5]Steps:  54%|█████▍    | 8153/15001 [5:14:10<3:33:51,  1.87s/it, loss=0.229, lr=1e-5]Steps:  54%|█████▍    | 8153/15001 [5:14:10<3:33:51,  1.87s/it, loss=0.518, lr=1e-5]Steps:  54%|█████▍    | 8154/15001 [5:14:12<3:39:43,  1.93s/it, loss=0.518, lr=1e-5]Steps:  54%|█████▍    | 8154/15001 [5:14:12<3:39:43,  1.93s/it, loss=0.308, lr=1e-5]Steps:  54%|█████▍    | 8155/15001 [5:14:13<3:29:38,  1.84s/it, loss=0.308, lr=1e-5]Steps:  54%|█████▍    | 8155/15001 [5:14:14<3:29:38,  1.84s/it, loss=0.214, lr=1e-5]Steps:  54%|█████▍    | 8156/15001 [5:14:15<3:24:32,  1.79s/it, loss=0.214, lr=1e-5]Steps:  54%|█████▍    | 8156/15001 [5:14:15<3:24:32,  1.79s/it, loss=0.0929, lr=1e-5]Steps:  54%|█████▍    | 8157/15001 [5:14:17<3:31:22,  1.85s/it, loss=0.0929, lr=1e-5]Steps:  54%|█████▍    | 8157/15001 [5:14:17<3:31:22,  1.85s/it, loss=0.404, lr=1e-5] Steps:  54%|█████▍    | 8158/15001 [5:14:19<3:24:21,  1.79s/it, loss=0.404, lr=1e-5]Steps:  54%|█████▍    | 8158/15001 [5:14:19<3:24:21,  1.79s/it, loss=0.229, lr=1e-5]Steps:  54%|█████▍    | 8159/15001 [5:14:21<3:30:51,  1.85s/it, loss=0.229, lr=1e-5]Steps:  54%|█████▍    | 8159/15001 [5:14:21<3:30:51,  1.85s/it, loss=0.248, lr=1e-5]Steps:  54%|█████▍    | 8160/15001 [5:14:23<3:28:08,  1.83s/it, loss=0.248, lr=1e-5]Steps:  54%|█████▍    | 8160/15001 [5:14:23<3:28:08,  1.83s/it, loss=0.258, lr=1e-5]Steps:  54%|█████▍    | 8161/15001 [5:14:24<3:22:09,  1.77s/it, loss=0.258, lr=1e-5]Steps:  54%|█████▍    | 8161/15001 [5:14:24<3:22:09,  1.77s/it, loss=0.238, lr=1e-5]Steps:  54%|█████▍    | 8162/15001 [5:14:26<3:29:29,  1.84s/it, loss=0.238, lr=1e-5]Steps:  54%|█████▍    | 8162/15001 [5:14:26<3:29:29,  1.84s/it, loss=0.165, lr=1e-5]Steps:  54%|█████▍    | 8163/15001 [5:14:28<3:35:54,  1.89s/it, loss=0.165, lr=1e-5]Steps:  54%|█████▍    | 8163/15001 [5:14:28<3:35:54,  1.89s/it, loss=0.177, lr=1e-5]Steps:  54%|█████▍    | 8164/15001 [5:14:30<3:31:08,  1.85s/it, loss=0.177, lr=1e-5]Steps:  54%|█████▍    | 8164/15001 [5:14:30<3:31:08,  1.85s/it, loss=0.128, lr=1e-5]Steps:  54%|█████▍    | 8165/15001 [5:14:32<3:41:27,  1.94s/it, loss=0.128, lr=1e-5]Steps:  54%|█████▍    | 8165/15001 [5:14:32<3:41:27,  1.94s/it, loss=0.262, lr=1e-5]Steps:  54%|█████▍    | 8166/15001 [5:14:34<3:42:22,  1.95s/it, loss=0.262, lr=1e-5]Steps:  54%|█████▍    | 8166/15001 [5:14:34<3:42:22,  1.95s/it, loss=0.16, lr=1e-5] Steps:  54%|█████▍    | 8167/15001 [5:14:36<3:44:03,  1.97s/it, loss=0.16, lr=1e-5]Steps:  54%|█████▍    | 8167/15001 [5:14:36<3:44:03,  1.97s/it, loss=0.242, lr=1e-5]Steps:  54%|█████▍    | 8168/15001 [5:14:38<3:44:07,  1.97s/it, loss=0.242, lr=1e-5]Steps:  54%|█████▍    | 8168/15001 [5:14:38<3:44:07,  1.97s/it, loss=0.12, lr=1e-5] Steps:  54%|█████▍    | 8169/15001 [5:14:40<3:47:24,  2.00s/it, loss=0.12, lr=1e-5]Steps:  54%|█████▍    | 8169/15001 [5:14:40<3:47:24,  2.00s/it, loss=0.0866, lr=1e-5]Steps:  54%|█████▍    | 8170/15001 [5:14:42<3:38:54,  1.92s/it, loss=0.0866, lr=1e-5]Steps:  54%|█████▍    | 8170/15001 [5:14:42<3:38:54,  1.92s/it, loss=0.0628, lr=1e-5]Steps:  54%|█████▍    | 8171/15001 [5:14:44<3:36:39,  1.90s/it, loss=0.0628, lr=1e-5]Steps:  54%|█████▍    | 8171/15001 [5:14:44<3:36:39,  1.90s/it, loss=0.168, lr=1e-5] Steps:  54%|█████▍    | 8172/15001 [5:14:46<3:33:19,  1.87s/it, loss=0.168, lr=1e-5]Steps:  54%|█████▍    | 8172/15001 [5:14:46<3:33:19,  1.87s/it, loss=0.148, lr=1e-5]Steps:  54%|█████▍    | 8173/15001 [5:14:47<3:21:05,  1.77s/it, loss=0.148, lr=1e-5]Steps:  54%|█████▍    | 8173/15001 [5:14:47<3:21:05,  1.77s/it, loss=0.22, lr=1e-5] Steps:  54%|█████▍    | 8174/15001 [5:14:49<3:26:14,  1.81s/it, loss=0.22, lr=1e-5]Steps:  54%|█████▍    | 8174/15001 [5:14:49<3:26:14,  1.81s/it, loss=0.0465, lr=1e-5]Steps:  54%|█████▍    | 8175/15001 [5:14:51<3:25:56,  1.81s/it, loss=0.0465, lr=1e-5]Steps:  54%|█████▍    | 8175/15001 [5:14:51<3:25:56,  1.81s/it, loss=0.139, lr=1e-5] Steps:  55%|█████▍    | 8176/15001 [5:14:52<3:21:37,  1.77s/it, loss=0.139, lr=1e-5]Steps:  55%|█████▍    | 8176/15001 [5:14:53<3:21:37,  1.77s/it, loss=0.0761, lr=1e-5]Steps:  55%|█████▍    | 8177/15001 [5:14:54<3:26:28,  1.82s/it, loss=0.0761, lr=1e-5]Steps:  55%|█████▍    | 8177/15001 [5:14:54<3:26:28,  1.82s/it, loss=0.225, lr=1e-5] Steps:  55%|█████▍    | 8178/15001 [5:14:56<3:27:29,  1.82s/it, loss=0.225, lr=1e-5]Steps:  55%|█████▍    | 8178/15001 [5:14:56<3:27:29,  1.82s/it, loss=0.0702, lr=1e-5]Steps:  55%|█████▍    | 8179/15001 [5:14:58<3:20:40,  1.76s/it, loss=0.0702, lr=1e-5]Steps:  55%|█████▍    | 8179/15001 [5:14:58<3:20:40,  1.76s/it, loss=0.204, lr=1e-5] Steps:  55%|█████▍    | 8180/15001 [5:15:00<3:20:57,  1.77s/it, loss=0.204, lr=1e-5]Steps:  55%|█████▍    | 8180/15001 [5:15:00<3:20:57,  1.77s/it, loss=0.182, lr=1e-5]Steps:  55%|█████▍    | 8181/15001 [5:15:02<3:33:41,  1.88s/it, loss=0.182, lr=1e-5]Steps:  55%|█████▍    | 8181/15001 [5:15:02<3:33:41,  1.88s/it, loss=0.205, lr=1e-5]Steps:  55%|█████▍    | 8182/15001 [5:15:04<3:30:49,  1.85s/it, loss=0.205, lr=1e-5]Steps:  55%|█████▍    | 8182/15001 [5:15:04<3:30:49,  1.85s/it, loss=0.278, lr=1e-5]Steps:  55%|█████▍    | 8183/15001 [5:15:05<3:32:57,  1.87s/it, loss=0.278, lr=1e-5]Steps:  55%|█████▍    | 8183/15001 [5:15:06<3:32:57,  1.87s/it, loss=0.266, lr=1e-5]Steps:  55%|█████▍    | 8184/15001 [5:15:07<3:29:22,  1.84s/it, loss=0.266, lr=1e-5]Steps:  55%|█████▍    | 8184/15001 [5:15:07<3:29:22,  1.84s/it, loss=0.051, lr=1e-5]Steps:  55%|█████▍    | 8185/15001 [5:15:09<3:24:23,  1.80s/it, loss=0.051, lr=1e-5]Steps:  55%|█████▍    | 8185/15001 [5:15:09<3:24:23,  1.80s/it, loss=0.0594, lr=1e-5]Steps:  55%|█████▍    | 8186/15001 [5:15:11<3:34:32,  1.89s/it, loss=0.0594, lr=1e-5]Steps:  55%|█████▍    | 8186/15001 [5:15:11<3:34:32,  1.89s/it, loss=0.0795, lr=1e-5]Steps:  55%|█████▍    | 8187/15001 [5:15:13<3:31:44,  1.86s/it, loss=0.0795, lr=1e-5]Steps:  55%|█████▍    | 8187/15001 [5:15:13<3:31:44,  1.86s/it, loss=0.133, lr=1e-5] Steps:  55%|█████▍    | 8188/15001 [5:15:15<3:28:57,  1.84s/it, loss=0.133, lr=1e-5]Steps:  55%|█████▍    | 8188/15001 [5:15:15<3:28:57,  1.84s/it, loss=0.0635, lr=1e-5]Steps:  55%|█████▍    | 8189/15001 [5:15:17<3:40:03,  1.94s/it, loss=0.0635, lr=1e-5]Steps:  55%|█████▍    | 8189/15001 [5:15:17<3:40:03,  1.94s/it, loss=0.125, lr=1e-5] Steps:  55%|█████▍    | 8190/15001 [5:15:19<3:35:19,  1.90s/it, loss=0.125, lr=1e-5]Steps:  55%|█████▍    | 8190/15001 [5:15:19<3:35:19,  1.90s/it, loss=0.189, lr=1e-5]Steps:  55%|█████▍    | 8191/15001 [5:15:21<3:38:15,  1.92s/it, loss=0.189, lr=1e-5]Steps:  55%|█████▍    | 8191/15001 [5:15:21<3:38:15,  1.92s/it, loss=0.182, lr=1e-5]Steps:  55%|█████▍    | 8192/15001 [5:15:23<3:41:06,  1.95s/it, loss=0.182, lr=1e-5]Steps:  55%|█████▍    | 8192/15001 [5:15:23<3:41:06,  1.95s/it, loss=0.0976, lr=1e-5]Steps:  55%|█████▍    | 8193/15001 [5:15:24<3:36:18,  1.91s/it, loss=0.0976, lr=1e-5]Steps:  55%|█████▍    | 8193/15001 [5:15:25<3:36:18,  1.91s/it, loss=0.142, lr=1e-5] Steps:  55%|█████▍    | 8194/15001 [5:15:26<3:34:44,  1.89s/it, loss=0.142, lr=1e-5]Steps:  55%|█████▍    | 8194/15001 [5:15:26<3:34:44,  1.89s/it, loss=0.262, lr=1e-5]Steps:  55%|█████▍    | 8195/15001 [5:15:28<3:30:40,  1.86s/it, loss=0.262, lr=1e-5]Steps:  55%|█████▍    | 8195/15001 [5:15:28<3:30:40,  1.86s/it, loss=0.276, lr=1e-5]Steps:  55%|█████▍    | 8196/15001 [5:15:30<3:36:14,  1.91s/it, loss=0.276, lr=1e-5]Steps:  55%|█████▍    | 8196/15001 [5:15:30<3:36:14,  1.91s/it, loss=0.0381, lr=1e-5]Steps:  55%|█████▍    | 8197/15001 [5:15:32<3:32:42,  1.88s/it, loss=0.0381, lr=1e-5]Steps:  55%|█████▍    | 8197/15001 [5:15:32<3:32:42,  1.88s/it, loss=0.0471, lr=1e-5]Steps:  55%|█████▍    | 8198/15001 [5:15:34<3:26:54,  1.82s/it, loss=0.0471, lr=1e-5]Steps:  55%|█████▍    | 8198/15001 [5:15:34<3:26:54,  1.82s/it, loss=0.0925, lr=1e-5]Steps:  55%|█████▍    | 8199/15001 [5:15:35<3:25:26,  1.81s/it, loss=0.0925, lr=1e-5]Steps:  55%|█████▍    | 8199/15001 [5:15:35<3:25:26,  1.81s/it, loss=0.218, lr=1e-5] Steps:  55%|█████▍    | 8200/15001 [5:15:37<3:28:20,  1.84s/it, loss=0.218, lr=1e-5]Steps:  55%|█████▍    | 8200/15001 [5:15:37<3:28:20,  1.84s/it, loss=0.165, lr=1e-5]Steps:  55%|█████▍    | 8201/15001 [5:15:39<3:23:09,  1.79s/it, loss=0.165, lr=1e-5]Steps:  55%|█████▍    | 8201/15001 [5:15:39<3:23:09,  1.79s/it, loss=0.148, lr=1e-5]Steps:  55%|█████▍    | 8202/15001 [5:15:41<3:25:40,  1.82s/it, loss=0.148, lr=1e-5]Steps:  55%|█████▍    | 8202/15001 [5:15:41<3:25:40,  1.82s/it, loss=0.361, lr=1e-5]Steps:  55%|█████▍    | 8203/15001 [5:15:43<3:26:04,  1.82s/it, loss=0.361, lr=1e-5]Steps:  55%|█████▍    | 8203/15001 [5:15:43<3:26:04,  1.82s/it, loss=0.0653, lr=1e-5]Steps:  55%|█████▍    | 8204/15001 [5:15:45<3:28:17,  1.84s/it, loss=0.0653, lr=1e-5]Steps:  55%|█████▍    | 8204/15001 [5:15:45<3:28:17,  1.84s/it, loss=0.244, lr=1e-5] Steps:  55%|█████▍    | 8205/15001 [5:15:46<3:20:19,  1.77s/it, loss=0.244, lr=1e-5]Steps:  55%|█████▍    | 8205/15001 [5:15:46<3:20:19,  1.77s/it, loss=0.107, lr=1e-5]Steps:  55%|█████▍    | 8206/15001 [5:15:48<3:29:43,  1.85s/it, loss=0.107, lr=1e-5]Steps:  55%|█████▍    | 8206/15001 [5:15:48<3:29:43,  1.85s/it, loss=0.0841, lr=1e-5]Steps:  55%|█████▍    | 8207/15001 [5:15:50<3:28:30,  1.84s/it, loss=0.0841, lr=1e-5]Steps:  55%|█████▍    | 8207/15001 [5:15:50<3:28:30,  1.84s/it, loss=0.335, lr=1e-5] Steps:  55%|█████▍    | 8208/15001 [5:15:52<3:29:23,  1.85s/it, loss=0.335, lr=1e-5]Steps:  55%|█████▍    | 8208/15001 [5:15:52<3:29:23,  1.85s/it, loss=0.179, lr=1e-5]Steps:  55%|█████▍    | 8209/15001 [5:15:54<3:28:09,  1.84s/it, loss=0.179, lr=1e-5]Steps:  55%|█████▍    | 8209/15001 [5:15:54<3:28:09,  1.84s/it, loss=0.142, lr=1e-5]Steps:  55%|█████▍    | 8210/15001 [5:15:56<3:29:33,  1.85s/it, loss=0.142, lr=1e-5]Steps:  55%|█████▍    | 8210/15001 [5:15:56<3:29:33,  1.85s/it, loss=0.335, lr=1e-5]Steps:  55%|█████▍    | 8211/15001 [5:15:58<3:44:49,  1.99s/it, loss=0.335, lr=1e-5]Steps:  55%|█████▍    | 8211/15001 [5:15:58<3:44:49,  1.99s/it, loss=0.312, lr=1e-5]Steps:  55%|█████▍    | 8212/15001 [5:16:00<3:46:55,  2.01s/it, loss=0.312, lr=1e-5]Steps:  55%|█████▍    | 8212/15001 [5:16:00<3:46:55,  2.01s/it, loss=0.25, lr=1e-5] Steps:  55%|█████▍    | 8213/15001 [5:16:02<3:37:53,  1.93s/it, loss=0.25, lr=1e-5]Steps:  55%|█████▍    | 8213/15001 [5:16:02<3:37:53,  1.93s/it, loss=0.104, lr=1e-5]Steps:  55%|█████▍    | 8214/15001 [5:16:04<3:50:01,  2.03s/it, loss=0.104, lr=1e-5]Steps:  55%|█████▍    | 8214/15001 [5:16:04<3:50:01,  2.03s/it, loss=0.284, lr=1e-5]Steps:  55%|█████▍    | 8215/15001 [5:16:06<3:44:39,  1.99s/it, loss=0.284, lr=1e-5]Steps:  55%|█████▍    | 8215/15001 [5:16:06<3:44:39,  1.99s/it, loss=0.284, lr=1e-5]Steps:  55%|█████▍    | 8216/15001 [5:16:08<3:36:04,  1.91s/it, loss=0.284, lr=1e-5]Steps:  55%|█████▍    | 8216/15001 [5:16:08<3:36:04,  1.91s/it, loss=0.178, lr=1e-5]Steps:  55%|█████▍    | 8217/15001 [5:16:09<3:36:16,  1.91s/it, loss=0.178, lr=1e-5]Steps:  55%|█████▍    | 8217/15001 [5:16:10<3:36:16,  1.91s/it, loss=0.183, lr=1e-5]Steps:  55%|█████▍    | 8218/15001 [5:16:11<3:31:11,  1.87s/it, loss=0.183, lr=1e-5]Steps:  55%|█████▍    | 8218/15001 [5:16:11<3:31:11,  1.87s/it, loss=0.178, lr=1e-5]Steps:  55%|█████▍    | 8219/15001 [5:16:13<3:27:29,  1.84s/it, loss=0.178, lr=1e-5]Steps:  55%|█████▍    | 8219/15001 [5:16:13<3:27:29,  1.84s/it, loss=0.173, lr=1e-5]Steps:  55%|█████▍    | 8220/15001 [5:16:15<3:27:59,  1.84s/it, loss=0.173, lr=1e-5]Steps:  55%|█████▍    | 8220/15001 [5:16:15<3:27:59,  1.84s/it, loss=0.191, lr=1e-5]Steps:  55%|█████▍    | 8221/15001 [5:16:17<3:25:20,  1.82s/it, loss=0.191, lr=1e-5]Steps:  55%|█████▍    | 8221/15001 [5:16:17<3:25:20,  1.82s/it, loss=0.0378, lr=1e-5]Steps:  55%|█████▍    | 8222/15001 [5:16:19<3:32:35,  1.88s/it, loss=0.0378, lr=1e-5]Steps:  55%|█████▍    | 8222/15001 [5:16:19<3:32:35,  1.88s/it, loss=0.134, lr=1e-5] Steps:  55%|█████▍    | 8223/15001 [5:16:20<3:30:13,  1.86s/it, loss=0.134, lr=1e-5]Steps:  55%|█████▍    | 8223/15001 [5:16:21<3:30:13,  1.86s/it, loss=0.31, lr=1e-5] Steps:  55%|█████▍    | 8224/15001 [5:16:22<3:19:19,  1.76s/it, loss=0.31, lr=1e-5]Steps:  55%|█████▍    | 8224/15001 [5:16:22<3:19:19,  1.76s/it, loss=0.0535, lr=1e-5]Steps:  55%|█████▍    | 8225/15001 [5:16:24<3:26:40,  1.83s/it, loss=0.0535, lr=1e-5]Steps:  55%|█████▍    | 8225/15001 [5:16:24<3:26:40,  1.83s/it, loss=0.232, lr=1e-5] Steps:  55%|█████▍    | 8226/15001 [5:16:26<3:33:44,  1.89s/it, loss=0.232, lr=1e-5]Steps:  55%|█████▍    | 8226/15001 [5:16:26<3:33:44,  1.89s/it, loss=0.0672, lr=1e-5]Steps:  55%|█████▍    | 8227/15001 [5:16:28<3:29:21,  1.85s/it, loss=0.0672, lr=1e-5]Steps:  55%|█████▍    | 8227/15001 [5:16:28<3:29:21,  1.85s/it, loss=0.232, lr=1e-5] Steps:  55%|█████▍    | 8228/15001 [5:16:30<3:27:58,  1.84s/it, loss=0.232, lr=1e-5]Steps:  55%|█████▍    | 8228/15001 [5:16:30<3:27:58,  1.84s/it, loss=0.18, lr=1e-5] Steps:  55%|█████▍    | 8229/15001 [5:16:31<3:25:49,  1.82s/it, loss=0.18, lr=1e-5]Steps:  55%|█████▍    | 8229/15001 [5:16:32<3:25:49,  1.82s/it, loss=0.194, lr=1e-5]Steps:  55%|█████▍    | 8230/15001 [5:16:33<3:27:04,  1.83s/it, loss=0.194, lr=1e-5]Steps:  55%|█████▍    | 8230/15001 [5:16:33<3:27:04,  1.83s/it, loss=0.32, lr=1e-5] Steps:  55%|█████▍    | 8231/15001 [5:16:35<3:19:16,  1.77s/it, loss=0.32, lr=1e-5]Steps:  55%|█████▍    | 8231/15001 [5:16:35<3:19:16,  1.77s/it, loss=0.322, lr=1e-5]Steps:  55%|█████▍    | 8232/15001 [5:16:37<3:28:37,  1.85s/it, loss=0.322, lr=1e-5]Steps:  55%|█████▍    | 8232/15001 [5:16:37<3:28:37,  1.85s/it, loss=0.124, lr=1e-5]Steps:  55%|█████▍    | 8233/15001 [5:16:39<3:36:34,  1.92s/it, loss=0.124, lr=1e-5]Steps:  55%|█████▍    | 8233/15001 [5:16:39<3:36:34,  1.92s/it, loss=0.0325, lr=1e-5]Steps:  55%|█████▍    | 8234/15001 [5:16:41<3:43:24,  1.98s/it, loss=0.0325, lr=1e-5]Steps:  55%|█████▍    | 8234/15001 [5:16:41<3:43:24,  1.98s/it, loss=0.113, lr=1e-5] Steps:  55%|█████▍    | 8235/15001 [5:16:43<3:41:55,  1.97s/it, loss=0.113, lr=1e-5]Steps:  55%|█████▍    | 8235/15001 [5:16:43<3:41:55,  1.97s/it, loss=0.0512, lr=1e-5]Steps:  55%|█████▍    | 8236/15001 [5:16:45<3:41:42,  1.97s/it, loss=0.0512, lr=1e-5]Steps:  55%|█████▍    | 8236/15001 [5:16:45<3:41:42,  1.97s/it, loss=0.21, lr=1e-5]  Steps:  55%|█████▍    | 8237/15001 [5:16:47<3:38:16,  1.94s/it, loss=0.21, lr=1e-5]Steps:  55%|█████▍    | 8237/15001 [5:16:47<3:38:16,  1.94s/it, loss=0.201, lr=1e-5]Steps:  55%|█████▍    | 8238/15001 [5:16:49<3:31:03,  1.87s/it, loss=0.201, lr=1e-5]Steps:  55%|█████▍    | 8238/15001 [5:16:49<3:31:03,  1.87s/it, loss=0.304, lr=1e-5]Steps:  55%|█████▍    | 8239/15001 [5:16:51<3:36:18,  1.92s/it, loss=0.304, lr=1e-5]Steps:  55%|█████▍    | 8239/15001 [5:16:51<3:36:18,  1.92s/it, loss=0.219, lr=1e-5]Steps:  55%|█████▍    | 8240/15001 [5:16:52<3:31:53,  1.88s/it, loss=0.219, lr=1e-5]Steps:  55%|█████▍    | 8240/15001 [5:16:52<3:31:53,  1.88s/it, loss=0.208, lr=1e-5]Steps:  55%|█████▍    | 8241/15001 [5:16:54<3:31:35,  1.88s/it, loss=0.208, lr=1e-5]Steps:  55%|█████▍    | 8241/15001 [5:16:54<3:31:35,  1.88s/it, loss=0.144, lr=1e-5]Steps:  55%|█████▍    | 8242/15001 [5:16:56<3:25:40,  1.83s/it, loss=0.144, lr=1e-5]Steps:  55%|█████▍    | 8242/15001 [5:16:56<3:25:40,  1.83s/it, loss=0.0215, lr=1e-5]Steps:  55%|█████▍    | 8243/15001 [5:16:58<3:22:44,  1.80s/it, loss=0.0215, lr=1e-5]Steps:  55%|█████▍    | 8243/15001 [5:16:58<3:22:44,  1.80s/it, loss=0.247, lr=1e-5] Steps:  55%|█████▍    | 8244/15001 [5:17:00<3:25:49,  1.83s/it, loss=0.247, lr=1e-5]Steps:  55%|█████▍    | 8244/15001 [5:17:00<3:25:49,  1.83s/it, loss=0.261, lr=1e-5]Steps:  55%|█████▍    | 8245/15001 [5:17:01<3:18:07,  1.76s/it, loss=0.261, lr=1e-5]Steps:  55%|█████▍    | 8245/15001 [5:17:02<3:18:07,  1.76s/it, loss=0.105, lr=1e-5]Steps:  55%|█████▍    | 8246/15001 [5:17:03<3:23:48,  1.81s/it, loss=0.105, lr=1e-5]Steps:  55%|█████▍    | 8246/15001 [5:17:03<3:23:48,  1.81s/it, loss=0.176, lr=1e-5]Steps:  55%|█████▍    | 8247/15001 [5:17:05<3:25:58,  1.83s/it, loss=0.176, lr=1e-5]Steps:  55%|█████▍    | 8247/15001 [5:17:05<3:25:58,  1.83s/it, loss=0.126, lr=1e-5]Steps:  55%|█████▍    | 8248/15001 [5:17:07<3:29:14,  1.86s/it, loss=0.126, lr=1e-5]Steps:  55%|█████▍    | 8248/15001 [5:17:07<3:29:14,  1.86s/it, loss=0.162, lr=1e-5]Steps:  55%|█████▍    | 8249/15001 [5:17:09<3:30:00,  1.87s/it, loss=0.162, lr=1e-5]Steps:  55%|█████▍    | 8249/15001 [5:17:09<3:30:00,  1.87s/it, loss=0.141, lr=1e-5]Steps:  55%|█████▍    | 8250/15001 [5:17:10<3:24:09,  1.81s/it, loss=0.141, lr=1e-5]Steps:  55%|█████▍    | 8250/15001 [5:17:11<3:24:09,  1.81s/it, loss=0.28, lr=1e-5] Steps:  55%|█████▌    | 8251/15001 [5:17:12<3:22:12,  1.80s/it, loss=0.28, lr=1e-5]Steps:  55%|█████▌    | 8251/15001 [5:17:13<3:22:12,  1.80s/it, loss=0.166, lr=1e-5]Steps:  55%|█████▌    | 8252/15001 [5:17:14<3:30:43,  1.87s/it, loss=0.166, lr=1e-5]Steps:  55%|█████▌    | 8252/15001 [5:17:14<3:30:43,  1.87s/it, loss=0.272, lr=1e-5]Steps:  55%|█████▌    | 8253/15001 [5:17:16<3:21:05,  1.79s/it, loss=0.272, lr=1e-5]Steps:  55%|█████▌    | 8253/15001 [5:17:16<3:21:05,  1.79s/it, loss=0.188, lr=1e-5]Steps:  55%|█████▌    | 8254/15001 [5:17:18<3:23:16,  1.81s/it, loss=0.188, lr=1e-5]Steps:  55%|█████▌    | 8254/15001 [5:17:18<3:23:16,  1.81s/it, loss=0.0284, lr=1e-5]Steps:  55%|█████▌    | 8255/15001 [5:17:20<3:28:48,  1.86s/it, loss=0.0284, lr=1e-5]Steps:  55%|█████▌    | 8255/15001 [5:17:20<3:28:48,  1.86s/it, loss=0.12, lr=1e-5]  Steps:  55%|█████▌    | 8256/15001 [5:17:22<3:30:41,  1.87s/it, loss=0.12, lr=1e-5]Steps:  55%|█████▌    | 8256/15001 [5:17:22<3:30:41,  1.87s/it, loss=0.217, lr=1e-5]Steps:  55%|█████▌    | 8257/15001 [5:17:24<3:35:16,  1.92s/it, loss=0.217, lr=1e-5]Steps:  55%|█████▌    | 8257/15001 [5:17:24<3:35:16,  1.92s/it, loss=0.112, lr=1e-5]Steps:  55%|█████▌    | 8258/15001 [5:17:26<3:49:23,  2.04s/it, loss=0.112, lr=1e-5]Steps:  55%|█████▌    | 8258/15001 [5:17:26<3:49:23,  2.04s/it, loss=0.158, lr=1e-5]Steps:  55%|█████▌    | 8259/15001 [5:17:28<3:50:00,  2.05s/it, loss=0.158, lr=1e-5]Steps:  55%|█████▌    | 8259/15001 [5:17:28<3:50:00,  2.05s/it, loss=0.237, lr=1e-5]Steps:  55%|█████▌    | 8260/15001 [5:17:30<3:46:02,  2.01s/it, loss=0.237, lr=1e-5]Steps:  55%|█████▌    | 8260/15001 [5:17:30<3:46:02,  2.01s/it, loss=0.218, lr=1e-5]Steps:  55%|█████▌    | 8261/15001 [5:17:32<3:37:30,  1.94s/it, loss=0.218, lr=1e-5]Steps:  55%|█████▌    | 8261/15001 [5:17:32<3:37:30,  1.94s/it, loss=0.195, lr=1e-5]Steps:  55%|█████▌    | 8262/15001 [5:17:34<3:37:03,  1.93s/it, loss=0.195, lr=1e-5]Steps:  55%|█████▌    | 8262/15001 [5:17:34<3:37:03,  1.93s/it, loss=0.102, lr=1e-5]Steps:  55%|█████▌    | 8263/15001 [5:17:35<3:30:57,  1.88s/it, loss=0.102, lr=1e-5]Steps:  55%|█████▌    | 8263/15001 [5:17:36<3:30:57,  1.88s/it, loss=0.0701, lr=1e-5]Steps:  55%|█████▌    | 8264/15001 [5:17:37<3:32:03,  1.89s/it, loss=0.0701, lr=1e-5]Steps:  55%|█████▌    | 8264/15001 [5:17:37<3:32:03,  1.89s/it, loss=0.308, lr=1e-5] Steps:  55%|█████▌    | 8265/15001 [5:17:39<3:26:44,  1.84s/it, loss=0.308, lr=1e-5]Steps:  55%|█████▌    | 8265/15001 [5:17:39<3:26:44,  1.84s/it, loss=0.128, lr=1e-5]Steps:  55%|█████▌    | 8266/15001 [5:17:41<3:37:48,  1.94s/it, loss=0.128, lr=1e-5]Steps:  55%|█████▌    | 8266/15001 [5:17:41<3:37:48,  1.94s/it, loss=0.119, lr=1e-5]Steps:  55%|█████▌    | 8267/15001 [5:17:43<3:26:22,  1.84s/it, loss=0.119, lr=1e-5]Steps:  55%|█████▌    | 8267/15001 [5:17:43<3:26:22,  1.84s/it, loss=0.185, lr=1e-5]Steps:  55%|█████▌    | 8268/15001 [5:17:45<3:29:11,  1.86s/it, loss=0.185, lr=1e-5]Steps:  55%|█████▌    | 8268/15001 [5:17:45<3:29:11,  1.86s/it, loss=0.148, lr=1e-5]Steps:  55%|█████▌    | 8269/15001 [5:17:47<3:28:16,  1.86s/it, loss=0.148, lr=1e-5]Steps:  55%|█████▌    | 8269/15001 [5:17:47<3:28:16,  1.86s/it, loss=0.0812, lr=1e-5]Steps:  55%|█████▌    | 8270/15001 [5:17:48<3:25:36,  1.83s/it, loss=0.0812, lr=1e-5]Steps:  55%|█████▌    | 8270/15001 [5:17:48<3:25:36,  1.83s/it, loss=0.178, lr=1e-5] Steps:  55%|█████▌    | 8271/15001 [5:17:50<3:15:20,  1.74s/it, loss=0.178, lr=1e-5]Steps:  55%|█████▌    | 8271/15001 [5:17:50<3:15:20,  1.74s/it, loss=0.1, lr=1e-5]  Steps:  55%|█████▌    | 8272/15001 [5:17:52<3:23:19,  1.81s/it, loss=0.1, lr=1e-5]Steps:  55%|█████▌    | 8272/15001 [5:17:52<3:23:19,  1.81s/it, loss=0.245, lr=1e-5]Steps:  55%|█████▌    | 8273/15001 [5:17:54<3:28:54,  1.86s/it, loss=0.245, lr=1e-5]Steps:  55%|█████▌    | 8273/15001 [5:17:54<3:28:54,  1.86s/it, loss=0.0944, lr=1e-5]Steps:  55%|█████▌    | 8274/15001 [5:17:55<3:20:18,  1.79s/it, loss=0.0944, lr=1e-5]Steps:  55%|█████▌    | 8274/15001 [5:17:56<3:20:18,  1.79s/it, loss=0.314, lr=1e-5] Steps:  55%|█████▌    | 8275/15001 [5:17:57<3:21:12,  1.79s/it, loss=0.314, lr=1e-5]Steps:  55%|█████▌    | 8275/15001 [5:17:58<3:21:12,  1.79s/it, loss=0.091, lr=1e-5]Steps:  55%|█████▌    | 8276/15001 [5:17:59<3:28:07,  1.86s/it, loss=0.091, lr=1e-5]Steps:  55%|█████▌    | 8276/15001 [5:17:59<3:28:07,  1.86s/it, loss=0.139, lr=1e-5]Steps:  55%|█████▌    | 8277/15001 [5:18:01<3:24:10,  1.82s/it, loss=0.139, lr=1e-5]Steps:  55%|█████▌    | 8277/15001 [5:18:01<3:24:10,  1.82s/it, loss=0.135, lr=1e-5]Steps:  55%|█████▌    | 8278/15001 [5:18:03<3:31:32,  1.89s/it, loss=0.135, lr=1e-5]Steps:  55%|█████▌    | 8278/15001 [5:18:03<3:31:32,  1.89s/it, loss=0.32, lr=1e-5] Steps:  55%|█████▌    | 8279/15001 [5:18:05<3:32:43,  1.90s/it, loss=0.32, lr=1e-5]Steps:  55%|█████▌    | 8279/15001 [5:18:05<3:32:43,  1.90s/it, loss=0.201, lr=1e-5]Steps:  55%|█████▌    | 8280/15001 [5:18:07<3:43:41,  2.00s/it, loss=0.201, lr=1e-5]Steps:  55%|█████▌    | 8280/15001 [5:18:07<3:43:41,  2.00s/it, loss=0.0958, lr=1e-5]Steps:  55%|█████▌    | 8281/15001 [5:18:09<3:38:33,  1.95s/it, loss=0.0958, lr=1e-5]Steps:  55%|█████▌    | 8281/15001 [5:18:09<3:38:33,  1.95s/it, loss=0.128, lr=1e-5] Steps:  55%|█████▌    | 8282/15001 [5:18:11<3:49:22,  2.05s/it, loss=0.128, lr=1e-5]Steps:  55%|█████▌    | 8282/15001 [5:18:11<3:49:22,  2.05s/it, loss=0.166, lr=1e-5]Steps:  55%|█████▌    | 8283/15001 [5:18:13<3:39:12,  1.96s/it, loss=0.166, lr=1e-5]Steps:  55%|█████▌    | 8283/15001 [5:18:13<3:39:12,  1.96s/it, loss=0.363, lr=1e-5]Steps:  55%|█████▌    | 8284/15001 [5:18:15<3:41:00,  1.97s/it, loss=0.363, lr=1e-5]Steps:  55%|█████▌    | 8284/15001 [5:18:15<3:41:00,  1.97s/it, loss=0.113, lr=1e-5]Steps:  55%|█████▌    | 8285/15001 [5:18:17<3:31:08,  1.89s/it, loss=0.113, lr=1e-5]Steps:  55%|█████▌    | 8285/15001 [5:18:17<3:31:08,  1.89s/it, loss=0.404, lr=1e-5]Steps:  55%|█████▌    | 8286/15001 [5:18:19<3:28:37,  1.86s/it, loss=0.404, lr=1e-5]Steps:  55%|█████▌    | 8286/15001 [5:18:19<3:28:37,  1.86s/it, loss=0.128, lr=1e-5]Steps:  55%|█████▌    | 8287/15001 [5:18:20<3:18:18,  1.77s/it, loss=0.128, lr=1e-5]Steps:  55%|█████▌    | 8287/15001 [5:18:21<3:18:18,  1.77s/it, loss=0.0898, lr=1e-5]Steps:  55%|█████▌    | 8288/15001 [5:18:22<3:30:10,  1.88s/it, loss=0.0898, lr=1e-5]Steps:  55%|█████▌    | 8288/15001 [5:18:22<3:30:10,  1.88s/it, loss=0.156, lr=1e-5] Steps:  55%|█████▌    | 8289/15001 [5:18:24<3:26:58,  1.85s/it, loss=0.156, lr=1e-5]Steps:  55%|█████▌    | 8289/15001 [5:18:24<3:26:58,  1.85s/it, loss=0.125, lr=1e-5]Steps:  55%|█████▌    | 8290/15001 [5:18:26<3:21:12,  1.80s/it, loss=0.125, lr=1e-5]Steps:  55%|█████▌    | 8290/15001 [5:18:26<3:21:12,  1.80s/it, loss=0.118, lr=1e-5]Steps:  55%|█████▌    | 8291/15001 [5:18:27<3:18:31,  1.78s/it, loss=0.118, lr=1e-5]Steps:  55%|█████▌    | 8291/15001 [5:18:28<3:18:31,  1.78s/it, loss=0.0766, lr=1e-5]Steps:  55%|█████▌    | 8292/15001 [5:18:30<3:31:39,  1.89s/it, loss=0.0766, lr=1e-5]Steps:  55%|█████▌    | 8292/15001 [5:18:30<3:31:39,  1.89s/it, loss=0.0878, lr=1e-5]Steps:  55%|█████▌    | 8293/15001 [5:18:31<3:22:32,  1.81s/it, loss=0.0878, lr=1e-5]Steps:  55%|█████▌    | 8293/15001 [5:18:32<3:22:32,  1.81s/it, loss=0.11, lr=1e-5]  Steps:  55%|█████▌    | 8294/15001 [5:18:33<3:31:34,  1.89s/it, loss=0.11, lr=1e-5]Steps:  55%|█████▌    | 8294/15001 [5:18:33<3:31:34,  1.89s/it, loss=0.226, lr=1e-5]Steps:  55%|█████▌    | 8295/15001 [5:18:35<3:29:16,  1.87s/it, loss=0.226, lr=1e-5]Steps:  55%|█████▌    | 8295/15001 [5:18:35<3:29:16,  1.87s/it, loss=0.0596, lr=1e-5]Steps:  55%|█████▌    | 8296/15001 [5:18:37<3:27:20,  1.86s/it, loss=0.0596, lr=1e-5]Steps:  55%|█████▌    | 8296/15001 [5:18:37<3:27:20,  1.86s/it, loss=0.361, lr=1e-5] Steps:  55%|█████▌    | 8297/15001 [5:18:39<3:25:30,  1.84s/it, loss=0.361, lr=1e-5]Steps:  55%|█████▌    | 8297/15001 [5:18:39<3:25:30,  1.84s/it, loss=0.215, lr=1e-5]Steps:  55%|█████▌    | 8298/15001 [5:18:41<3:23:11,  1.82s/it, loss=0.215, lr=1e-5]Steps:  55%|█████▌    | 8298/15001 [5:18:41<3:23:11,  1.82s/it, loss=0.399, lr=1e-5]Steps:  55%|█████▌    | 8299/15001 [5:18:42<3:18:07,  1.77s/it, loss=0.399, lr=1e-5]Steps:  55%|█████▌    | 8299/15001 [5:18:42<3:18:07,  1.77s/it, loss=0.151, lr=1e-5]Steps:  55%|█████▌    | 8300/15001 [5:18:44<3:13:48,  1.74s/it, loss=0.151, lr=1e-5]Steps:  55%|█████▌    | 8300/15001 [5:18:44<3:13:48,  1.74s/it, loss=0.183, lr=1e-5]Steps:  55%|█████▌    | 8301/15001 [5:18:46<3:32:35,  1.90s/it, loss=0.183, lr=1e-5]Steps:  55%|█████▌    | 8301/15001 [5:18:46<3:32:35,  1.90s/it, loss=0.119, lr=1e-5]Steps:  55%|█████▌    | 8302/15001 [5:18:48<3:32:05,  1.90s/it, loss=0.119, lr=1e-5]Steps:  55%|█████▌    | 8302/15001 [5:18:48<3:32:05,  1.90s/it, loss=0.16, lr=1e-5] Steps:  55%|█████▌    | 8303/15001 [5:18:50<3:31:24,  1.89s/it, loss=0.16, lr=1e-5]Steps:  55%|█████▌    | 8303/15001 [5:18:50<3:31:24,  1.89s/it, loss=0.235, lr=1e-5]Steps:  55%|█████▌    | 8304/15001 [5:18:52<3:29:26,  1.88s/it, loss=0.235, lr=1e-5]Steps:  55%|█████▌    | 8304/15001 [5:18:52<3:29:26,  1.88s/it, loss=0.147, lr=1e-5]Steps:  55%|█████▌    | 8305/15001 [5:18:54<3:41:02,  1.98s/it, loss=0.147, lr=1e-5]Steps:  55%|█████▌    | 8305/15001 [5:18:54<3:41:02,  1.98s/it, loss=0.15, lr=1e-5] Steps:  55%|█████▌    | 8306/15001 [5:18:56<3:43:10,  2.00s/it, loss=0.15, lr=1e-5]Steps:  55%|█████▌    | 8306/15001 [5:18:56<3:43:10,  2.00s/it, loss=0.239, lr=1e-5]Steps:  55%|█████▌    | 8307/15001 [5:18:58<3:32:29,  1.90s/it, loss=0.239, lr=1e-5]Steps:  55%|█████▌    | 8307/15001 [5:18:58<3:32:29,  1.90s/it, loss=0.104, lr=1e-5]Steps:  55%|█████▌    | 8308/15001 [5:19:00<3:31:02,  1.89s/it, loss=0.104, lr=1e-5]Steps:  55%|█████▌    | 8308/15001 [5:19:00<3:31:02,  1.89s/it, loss=0.241, lr=1e-5]Steps:  55%|█████▌    | 8309/15001 [5:19:02<3:37:56,  1.95s/it, loss=0.241, lr=1e-5]Steps:  55%|█████▌    | 8309/15001 [5:19:02<3:37:56,  1.95s/it, loss=0.0652, lr=1e-5]Steps:  55%|█████▌    | 8310/15001 [5:19:03<3:29:32,  1.88s/it, loss=0.0652, lr=1e-5]Steps:  55%|█████▌    | 8310/15001 [5:19:04<3:29:32,  1.88s/it, loss=0.17, lr=1e-5]  Steps:  55%|█████▌    | 8311/15001 [5:19:05<3:18:48,  1.78s/it, loss=0.17, lr=1e-5]Steps:  55%|█████▌    | 8311/15001 [5:19:05<3:18:48,  1.78s/it, loss=0.269, lr=1e-5]Steps:  55%|█████▌    | 8312/15001 [5:19:07<3:29:56,  1.88s/it, loss=0.269, lr=1e-5]Steps:  55%|█████▌    | 8312/15001 [5:19:07<3:29:56,  1.88s/it, loss=0.273, lr=1e-5]Steps:  55%|█████▌    | 8313/15001 [5:19:09<3:28:51,  1.87s/it, loss=0.273, lr=1e-5]Steps:  55%|█████▌    | 8313/15001 [5:19:09<3:28:51,  1.87s/it, loss=0.155, lr=1e-5]Steps:  55%|█████▌    | 8314/15001 [5:19:11<3:23:27,  1.83s/it, loss=0.155, lr=1e-5]Steps:  55%|█████▌    | 8314/15001 [5:19:11<3:23:27,  1.83s/it, loss=0.183, lr=1e-5]Steps:  55%|█████▌    | 8315/15001 [5:19:13<3:31:18,  1.90s/it, loss=0.183, lr=1e-5]Steps:  55%|█████▌    | 8315/15001 [5:19:13<3:31:18,  1.90s/it, loss=0.181, lr=1e-5]Steps:  55%|█████▌    | 8316/15001 [5:19:14<3:21:34,  1.81s/it, loss=0.181, lr=1e-5]Steps:  55%|█████▌    | 8316/15001 [5:19:14<3:21:34,  1.81s/it, loss=0.156, lr=1e-5]Steps:  55%|█████▌    | 8317/15001 [5:19:16<3:19:42,  1.79s/it, loss=0.156, lr=1e-5]Steps:  55%|█████▌    | 8317/15001 [5:19:16<3:19:42,  1.79s/it, loss=0.23, lr=1e-5] Steps:  55%|█████▌    | 8318/15001 [5:19:18<3:25:35,  1.85s/it, loss=0.23, lr=1e-5]Steps:  55%|█████▌    | 8318/15001 [5:19:18<3:25:35,  1.85s/it, loss=0.19, lr=1e-5]Steps:  55%|█████▌    | 8319/15001 [5:19:20<3:20:27,  1.80s/it, loss=0.19, lr=1e-5]Steps:  55%|█████▌    | 8319/15001 [5:19:20<3:20:27,  1.80s/it, loss=0.108, lr=1e-5]Steps:  55%|█████▌    | 8320/15001 [5:19:21<3:17:54,  1.78s/it, loss=0.108, lr=1e-5]Steps:  55%|█████▌    | 8320/15001 [5:19:22<3:17:54,  1.78s/it, loss=0.143, lr=1e-5]Steps:  55%|█████▌    | 8321/15001 [5:19:23<3:21:14,  1.81s/it, loss=0.143, lr=1e-5]Steps:  55%|█████▌    | 8321/15001 [5:19:23<3:21:14,  1.81s/it, loss=0.0799, lr=1e-5]Steps:  55%|█████▌    | 8322/15001 [5:19:25<3:20:10,  1.80s/it, loss=0.0799, lr=1e-5]Steps:  55%|█████▌    | 8322/15001 [5:19:25<3:20:10,  1.80s/it, loss=0.213, lr=1e-5] Steps:  55%|█████▌    | 8323/15001 [5:19:27<3:22:21,  1.82s/it, loss=0.213, lr=1e-5]Steps:  55%|█████▌    | 8323/15001 [5:19:27<3:22:21,  1.82s/it, loss=0.156, lr=1e-5]Steps:  55%|█████▌    | 8324/15001 [5:19:29<3:17:30,  1.77s/it, loss=0.156, lr=1e-5]Steps:  55%|█████▌    | 8324/15001 [5:19:29<3:17:30,  1.77s/it, loss=0.237, lr=1e-5]Steps:  55%|█████▌    | 8325/15001 [5:19:31<3:34:45,  1.93s/it, loss=0.237, lr=1e-5]Steps:  55%|█████▌    | 8325/15001 [5:19:31<3:34:45,  1.93s/it, loss=0.107, lr=1e-5]Steps:  56%|█████▌    | 8326/15001 [5:19:33<3:39:19,  1.97s/it, loss=0.107, lr=1e-5]Steps:  56%|█████▌    | 8326/15001 [5:19:33<3:39:19,  1.97s/it, loss=0.249, lr=1e-5]Steps:  56%|█████▌    | 8327/15001 [5:19:35<3:42:53,  2.00s/it, loss=0.249, lr=1e-5]Steps:  56%|█████▌    | 8327/15001 [5:19:35<3:42:53,  2.00s/it, loss=0.169, lr=1e-5]Steps:  56%|█████▌    | 8328/15001 [5:19:37<3:41:05,  1.99s/it, loss=0.169, lr=1e-5]Steps:  56%|█████▌    | 8328/15001 [5:19:37<3:41:05,  1.99s/it, loss=0.26, lr=1e-5] Steps:  56%|█████▌    | 8329/15001 [5:19:39<3:27:43,  1.87s/it, loss=0.26, lr=1e-5]Steps:  56%|█████▌    | 8329/15001 [5:19:39<3:27:43,  1.87s/it, loss=0.236, lr=1e-5]Steps:  56%|█████▌    | 8330/15001 [5:19:41<3:34:26,  1.93s/it, loss=0.236, lr=1e-5]Steps:  56%|█████▌    | 8330/15001 [5:19:41<3:34:26,  1.93s/it, loss=0.273, lr=1e-5]Steps:  56%|█████▌    | 8331/15001 [5:19:42<3:31:27,  1.90s/it, loss=0.273, lr=1e-5]Steps:  56%|█████▌    | 8331/15001 [5:19:43<3:31:27,  1.90s/it, loss=0.13, lr=1e-5] Steps:  56%|█████▌    | 8332/15001 [5:19:44<3:26:23,  1.86s/it, loss=0.13, lr=1e-5]Steps:  56%|█████▌    | 8332/15001 [5:19:45<3:26:23,  1.86s/it, loss=0.312, lr=1e-5]Steps:  56%|█████▌    | 8333/15001 [5:19:46<3:30:08,  1.89s/it, loss=0.312, lr=1e-5]Steps:  56%|█████▌    | 8333/15001 [5:19:46<3:30:08,  1.89s/it, loss=0.244, lr=1e-5]Steps:  56%|█████▌    | 8334/15001 [5:19:48<3:21:35,  1.81s/it, loss=0.244, lr=1e-5]Steps:  56%|█████▌    | 8334/15001 [5:19:48<3:21:35,  1.81s/it, loss=0.234, lr=1e-5]Steps:  56%|█████▌    | 8335/15001 [5:19:50<3:31:07,  1.90s/it, loss=0.234, lr=1e-5]Steps:  56%|█████▌    | 8335/15001 [5:19:50<3:31:07,  1.90s/it, loss=0.162, lr=1e-5]Steps:  56%|█████▌    | 8336/15001 [5:19:52<3:27:23,  1.87s/it, loss=0.162, lr=1e-5]Steps:  56%|█████▌    | 8336/15001 [5:19:52<3:27:23,  1.87s/it, loss=0.374, lr=1e-5]Steps:  56%|█████▌    | 8337/15001 [5:19:54<3:31:55,  1.91s/it, loss=0.374, lr=1e-5]Steps:  56%|█████▌    | 8337/15001 [5:19:54<3:31:55,  1.91s/it, loss=0.0809, lr=1e-5]Steps:  56%|█████▌    | 8338/15001 [5:19:56<3:27:17,  1.87s/it, loss=0.0809, lr=1e-5]Steps:  56%|█████▌    | 8338/15001 [5:19:56<3:27:17,  1.87s/it, loss=0.182, lr=1e-5] Steps:  56%|█████▌    | 8339/15001 [5:19:57<3:24:13,  1.84s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8339/15001 [5:19:57<3:24:13,  1.84s/it, loss=0.176, lr=1e-5]Steps:  56%|█████▌    | 8340/15001 [5:19:59<3:16:56,  1.77s/it, loss=0.176, lr=1e-5]Steps:  56%|█████▌    | 8340/15001 [5:19:59<3:16:56,  1.77s/it, loss=0.162, lr=1e-5]Steps:  56%|█████▌    | 8341/15001 [5:20:01<3:24:44,  1.84s/it, loss=0.162, lr=1e-5]Steps:  56%|█████▌    | 8341/15001 [5:20:01<3:24:44,  1.84s/it, loss=0.34, lr=1e-5] Steps:  56%|█████▌    | 8342/15001 [5:20:03<3:22:14,  1.82s/it, loss=0.34, lr=1e-5]Steps:  56%|█████▌    | 8342/15001 [5:20:03<3:22:14,  1.82s/it, loss=0.265, lr=1e-5]Steps:  56%|█████▌    | 8343/15001 [5:20:04<3:20:32,  1.81s/it, loss=0.265, lr=1e-5]Steps:  56%|█████▌    | 8343/15001 [5:20:05<3:20:32,  1.81s/it, loss=0.0669, lr=1e-5]Steps:  56%|█████▌    | 8344/15001 [5:20:06<3:23:15,  1.83s/it, loss=0.0669, lr=1e-5]Steps:  56%|█████▌    | 8344/15001 [5:20:07<3:23:15,  1.83s/it, loss=0.105, lr=1e-5] Steps:  56%|█████▌    | 8345/15001 [5:20:08<3:21:55,  1.82s/it, loss=0.105, lr=1e-5]Steps:  56%|█████▌    | 8345/15001 [5:20:08<3:21:55,  1.82s/it, loss=0.113, lr=1e-5]Steps:  56%|█████▌    | 8346/15001 [5:20:10<3:22:43,  1.83s/it, loss=0.113, lr=1e-5]Steps:  56%|█████▌    | 8346/15001 [5:20:10<3:22:43,  1.83s/it, loss=0.264, lr=1e-5]Steps:  56%|█████▌    | 8347/15001 [5:20:12<3:21:34,  1.82s/it, loss=0.264, lr=1e-5]Steps:  56%|█████▌    | 8347/15001 [5:20:12<3:21:34,  1.82s/it, loss=0.222, lr=1e-5]Steps:  56%|█████▌    | 8348/15001 [5:20:14<3:45:17,  2.03s/it, loss=0.222, lr=1e-5]Steps:  56%|█████▌    | 8348/15001 [5:20:15<3:45:17,  2.03s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8349/15001 [5:20:16<3:46:10,  2.04s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8349/15001 [5:20:16<3:46:10,  2.04s/it, loss=0.0232, lr=1e-5]Steps:  56%|█████▌    | 8350/15001 [5:20:18<3:32:06,  1.91s/it, loss=0.0232, lr=1e-5]Steps:  56%|█████▌    | 8350/15001 [5:20:18<3:32:06,  1.91s/it, loss=0.298, lr=1e-5] Steps:  56%|█████▌    | 8351/15001 [5:20:20<3:43:50,  2.02s/it, loss=0.298, lr=1e-5]Steps:  56%|█████▌    | 8351/15001 [5:20:20<3:43:50,  2.02s/it, loss=0.119, lr=1e-5]Steps:  56%|█████▌    | 8352/15001 [5:20:22<3:40:07,  1.99s/it, loss=0.119, lr=1e-5]Steps:  56%|█████▌    | 8352/15001 [5:20:22<3:40:07,  1.99s/it, loss=0.412, lr=1e-5]Steps:  56%|█████▌    | 8353/15001 [5:20:24<3:37:11,  1.96s/it, loss=0.412, lr=1e-5]Steps:  56%|█████▌    | 8353/15001 [5:20:24<3:37:11,  1.96s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8354/15001 [5:20:26<3:23:15,  1.83s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8354/15001 [5:20:26<3:23:15,  1.83s/it, loss=0.189, lr=1e-5]Steps:  56%|█████▌    | 8355/15001 [5:20:27<3:17:16,  1.78s/it, loss=0.189, lr=1e-5]Steps:  56%|█████▌    | 8355/15001 [5:20:28<3:17:16,  1.78s/it, loss=0.363, lr=1e-5]Steps:  56%|█████▌    | 8356/15001 [5:20:29<3:29:45,  1.89s/it, loss=0.363, lr=1e-5]Steps:  56%|█████▌    | 8356/15001 [5:20:30<3:29:45,  1.89s/it, loss=0.0308, lr=1e-5]Steps:  56%|█████▌    | 8357/15001 [5:20:31<3:26:45,  1.87s/it, loss=0.0308, lr=1e-5]Steps:  56%|█████▌    | 8357/15001 [5:20:31<3:26:45,  1.87s/it, loss=0.226, lr=1e-5] Steps:  56%|█████▌    | 8358/15001 [5:20:33<3:17:16,  1.78s/it, loss=0.226, lr=1e-5]Steps:  56%|█████▌    | 8358/15001 [5:20:33<3:17:16,  1.78s/it, loss=0.023, lr=1e-5]Steps:  56%|█████▌    | 8359/15001 [5:20:35<3:23:20,  1.84s/it, loss=0.023, lr=1e-5]Steps:  56%|█████▌    | 8359/15001 [5:20:35<3:23:20,  1.84s/it, loss=0.0472, lr=1e-5]Steps:  56%|█████▌    | 8360/15001 [5:20:36<3:18:24,  1.79s/it, loss=0.0472, lr=1e-5]Steps:  56%|█████▌    | 8360/15001 [5:20:37<3:18:24,  1.79s/it, loss=0.234, lr=1e-5] Steps:  56%|█████▌    | 8361/15001 [5:20:38<3:16:46,  1.78s/it, loss=0.234, lr=1e-5]Steps:  56%|█████▌    | 8361/15001 [5:20:38<3:16:46,  1.78s/it, loss=0.321, lr=1e-5]Steps:  56%|█████▌    | 8362/15001 [5:20:40<3:18:57,  1.80s/it, loss=0.321, lr=1e-5]Steps:  56%|█████▌    | 8362/15001 [5:20:40<3:18:57,  1.80s/it, loss=0.0926, lr=1e-5]Steps:  56%|█████▌    | 8363/15001 [5:20:42<3:25:35,  1.86s/it, loss=0.0926, lr=1e-5]Steps:  56%|█████▌    | 8363/15001 [5:20:42<3:25:35,  1.86s/it, loss=0.107, lr=1e-5] Steps:  56%|█████▌    | 8364/15001 [5:20:44<3:20:27,  1.81s/it, loss=0.107, lr=1e-5]Steps:  56%|█████▌    | 8364/15001 [5:20:44<3:20:27,  1.81s/it, loss=0.341, lr=1e-5]Steps:  56%|█████▌    | 8365/15001 [5:20:45<3:15:15,  1.77s/it, loss=0.341, lr=1e-5]Steps:  56%|█████▌    | 8365/15001 [5:20:46<3:15:15,  1.77s/it, loss=0.093, lr=1e-5]Steps:  56%|█████▌    | 8366/15001 [5:20:47<3:15:21,  1.77s/it, loss=0.093, lr=1e-5]Steps:  56%|█████▌    | 8366/15001 [5:20:48<3:15:21,  1.77s/it, loss=0.0729, lr=1e-5]Steps:  56%|█████▌    | 8367/15001 [5:20:49<3:20:21,  1.81s/it, loss=0.0729, lr=1e-5]Steps:  56%|█████▌    | 8367/15001 [5:20:49<3:20:21,  1.81s/it, loss=0.176, lr=1e-5] Steps:  56%|█████▌    | 8368/15001 [5:20:51<3:27:48,  1.88s/it, loss=0.176, lr=1e-5]Steps:  56%|█████▌    | 8368/15001 [5:20:51<3:27:48,  1.88s/it, loss=0.149, lr=1e-5]Steps:  56%|█████▌    | 8369/15001 [5:20:53<3:23:52,  1.84s/it, loss=0.149, lr=1e-5]Steps:  56%|█████▌    | 8369/15001 [5:20:53<3:23:52,  1.84s/it, loss=0.294, lr=1e-5]Steps:  56%|█████▌    | 8370/15001 [5:20:55<3:23:59,  1.85s/it, loss=0.294, lr=1e-5]Steps:  56%|█████▌    | 8370/15001 [5:20:55<3:23:59,  1.85s/it, loss=0.119, lr=1e-5]Steps:  56%|█████▌    | 8371/15001 [5:20:57<3:33:36,  1.93s/it, loss=0.119, lr=1e-5]Steps:  56%|█████▌    | 8371/15001 [5:20:57<3:33:36,  1.93s/it, loss=0.0559, lr=1e-5]Steps:  56%|█████▌    | 8372/15001 [5:20:59<3:32:05,  1.92s/it, loss=0.0559, lr=1e-5]Steps:  56%|█████▌    | 8372/15001 [5:20:59<3:32:05,  1.92s/it, loss=0.182, lr=1e-5] Steps:  56%|█████▌    | 8373/15001 [5:21:01<3:32:51,  1.93s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8373/15001 [5:21:01<3:32:51,  1.93s/it, loss=0.111, lr=1e-5]Steps:  56%|█████▌    | 8374/15001 [5:21:03<3:38:59,  1.98s/it, loss=0.111, lr=1e-5]Steps:  56%|█████▌    | 8374/15001 [5:21:03<3:38:59,  1.98s/it, loss=0.157, lr=1e-5]Steps:  56%|█████▌    | 8375/15001 [5:21:05<3:43:52,  2.03s/it, loss=0.157, lr=1e-5]Steps:  56%|█████▌    | 8375/15001 [5:21:05<3:43:52,  2.03s/it, loss=0.0589, lr=1e-5]Steps:  56%|█████▌    | 8376/15001 [5:21:07<3:32:13,  1.92s/it, loss=0.0589, lr=1e-5]Steps:  56%|█████▌    | 8376/15001 [5:21:07<3:32:13,  1.92s/it, loss=0.228, lr=1e-5] Steps:  56%|█████▌    | 8377/15001 [5:21:09<3:36:32,  1.96s/it, loss=0.228, lr=1e-5]Steps:  56%|█████▌    | 8377/15001 [5:21:09<3:36:32,  1.96s/it, loss=0.224, lr=1e-5]Steps:  56%|█████▌    | 8378/15001 [5:21:10<3:24:56,  1.86s/it, loss=0.224, lr=1e-5]Steps:  56%|█████▌    | 8378/15001 [5:21:11<3:24:56,  1.86s/it, loss=0.184, lr=1e-5]Steps:  56%|█████▌    | 8379/15001 [5:21:12<3:32:44,  1.93s/it, loss=0.184, lr=1e-5]Steps:  56%|█████▌    | 8379/15001 [5:21:12<3:32:44,  1.93s/it, loss=0.192, lr=1e-5]Steps:  56%|█████▌    | 8380/15001 [5:21:14<3:20:44,  1.82s/it, loss=0.192, lr=1e-5]Steps:  56%|█████▌    | 8380/15001 [5:21:14<3:20:44,  1.82s/it, loss=0.378, lr=1e-5]Steps:  56%|█��███▌    | 8381/15001 [5:21:16<3:24:03,  1.85s/it, loss=0.378, lr=1e-5]Steps:  56%|█████▌    | 8381/15001 [5:21:16<3:24:03,  1.85s/it, loss=0.216, lr=1e-5]Steps:  56%|█████▌    | 8382/15001 [5:21:18<3:21:11,  1.82s/it, loss=0.216, lr=1e-5]Steps:  56%|█████▌    | 8382/15001 [5:21:18<3:21:11,  1.82s/it, loss=0.021, lr=1e-5]Steps:  56%|█████▌    | 8383/15001 [5:21:20<3:32:18,  1.92s/it, loss=0.021, lr=1e-5]Steps:  56%|█████▌    | 8383/15001 [5:21:20<3:32:18,  1.92s/it, loss=0.238, lr=1e-5]Steps:  56%|█████▌    | 8384/15001 [5:21:21<3:19:32,  1.81s/it, loss=0.238, lr=1e-5]Steps:  56%|█████▌    | 8384/15001 [5:21:22<3:19:32,  1.81s/it, loss=0.0644, lr=1e-5]Steps:  56%|█████▌    | 8385/15001 [5:21:23<3:23:33,  1.85s/it, loss=0.0644, lr=1e-5]Steps:  56%|█████▌    | 8385/15001 [5:21:23<3:23:33,  1.85s/it, loss=0.32, lr=1e-5]  Steps:  56%|█████▌    | 8386/15001 [5:21:25<3:22:12,  1.83s/it, loss=0.32, lr=1e-5]Steps:  56%|█████▌    | 8386/15001 [5:21:25<3:22:12,  1.83s/it, loss=0.161, lr=1e-5]Steps:  56%|█████▌    | 8387/15001 [5:21:27<3:22:34,  1.84s/it, loss=0.161, lr=1e-5]Steps:  56%|█████▌    | 8387/15001 [5:21:27<3:22:34,  1.84s/it, loss=0.15, lr=1e-5] Steps:  56%|█████▌    | 8388/15001 [5:21:29<3:13:47,  1.76s/it, loss=0.15, lr=1e-5]Steps:  56%|█████▌    | 8388/15001 [5:21:29<3:13:47,  1.76s/it, loss=0.179, lr=1e-5]Steps:  56%|█████▌    | 8389/15001 [5:21:31<3:23:58,  1.85s/it, loss=0.179, lr=1e-5]Steps:  56%|█████▌    | 8389/15001 [5:21:31<3:23:58,  1.85s/it, loss=0.0745, lr=1e-5]Steps:  56%|█████▌    | 8390/15001 [5:21:32<3:16:39,  1.78s/it, loss=0.0745, lr=1e-5]Steps:  56%|█████▌    | 8390/15001 [5:21:32<3:16:39,  1.78s/it, loss=0.261, lr=1e-5] Steps:  56%|█████▌    | 8391/15001 [5:21:34<3:17:53,  1.80s/it, loss=0.261, lr=1e-5]Steps:  56%|█████▌    | 8391/15001 [5:21:34<3:17:53,  1.80s/it, loss=0.0774, lr=1e-5]Steps:  56%|█████▌    | 8392/15001 [5:21:36<3:20:46,  1.82s/it, loss=0.0774, lr=1e-5]Steps:  56%|█████▌    | 8392/15001 [5:21:36<3:20:46,  1.82s/it, loss=0.181, lr=1e-5] Steps:  56%|█████▌    | 8393/15001 [5:21:38<3:30:24,  1.91s/it, loss=0.181, lr=1e-5]Steps:  56%|█████▌    | 8393/15001 [5:21:38<3:30:24,  1.91s/it, loss=0.109, lr=1e-5]Steps:  56%|█████▌    | 8394/15001 [5:21:40<3:34:37,  1.95s/it, loss=0.109, lr=1e-5]Steps:  56%|█████▌    | 8394/15001 [5:21:40<3:34:37,  1.95s/it, loss=0.175, lr=1e-5]Steps:  56%|█████▌    | 8395/15001 [5:21:42<3:28:08,  1.89s/it, loss=0.175, lr=1e-5]Steps:  56%|█████▌    | 8395/15001 [5:21:42<3:28:08,  1.89s/it, loss=0.263, lr=1e-5]Steps:  56%|█████▌    | 8396/15001 [5:21:44<3:40:54,  2.01s/it, loss=0.263, lr=1e-5]Steps:  56%|█████▌    | 8396/15001 [5:21:44<3:40:54,  2.01s/it, loss=0.0525, lr=1e-5]Steps:  56%|█████▌    | 8397/15001 [5:21:46<3:35:30,  1.96s/it, loss=0.0525, lr=1e-5]Steps:  56%|█████▌    | 8397/15001 [5:21:46<3:35:30,  1.96s/it, loss=0.278, lr=1e-5] Steps:  56%|█████▌    | 8398/15001 [5:21:48<3:38:24,  1.98s/it, loss=0.278, lr=1e-5]Steps:  56%|█████▌    | 8398/15001 [5:21:48<3:38:24,  1.98s/it, loss=0.0861, lr=1e-5]Steps:  56%|█████▌    | 8399/15001 [5:21:50<3:29:00,  1.90s/it, loss=0.0861, lr=1e-5]Steps:  56%|█████▌    | 8399/15001 [5:21:50<3:29:00,  1.90s/it, loss=0.218, lr=1e-5] Steps:  56%|█████▌    | 8400/15001 [5:21:51<3:25:02,  1.86s/it, loss=0.218, lr=1e-5]Steps:  56%|█████▌    | 8400/15001 [5:21:52<3:25:02,  1.86s/it, loss=0.077, lr=1e-5]Steps:  56%|█████▌    | 8401/15001 [5:21:53<3:25:57,  1.87s/it, loss=0.077, lr=1e-5]Steps:  56%|█████▌    | 8401/15001 [5:21:53<3:25:57,  1.87s/it, loss=0.351, lr=1e-5]Steps:  56%|█████▌    | 8402/15001 [5:21:55<3:18:18,  1.80s/it, loss=0.351, lr=1e-5]Steps:  56%|█████▌    | 8402/15001 [5:21:55<3:18:18,  1.80s/it, loss=0.276, lr=1e-5]Steps:  56%|█████▌    | 8403/15001 [5:21:57<3:23:55,  1.85s/it, loss=0.276, lr=1e-5]Steps:  56%|█████▌    | 8403/15001 [5:21:57<3:23:55,  1.85s/it, loss=0.0471, lr=1e-5]Steps:  56%|█████▌    | 8404/15001 [5:21:59<3:18:50,  1.81s/it, loss=0.0471, lr=1e-5]Steps:  56%|█████▌    | 8404/15001 [5:21:59<3:18:50,  1.81s/it, loss=0.0501, lr=1e-5]Steps:  56%|█████▌    | 8405/15001 [5:22:00<3:18:43,  1.81s/it, loss=0.0501, lr=1e-5]Steps:  56%|█████▌    | 8405/15001 [5:22:01<3:18:43,  1.81s/it, loss=0.218, lr=1e-5] Steps:  56%|█████▌    | 8406/15001 [5:22:02<3:16:13,  1.79s/it, loss=0.218, lr=1e-5]Steps:  56%|█████▌    | 8406/15001 [5:22:02<3:16:13,  1.79s/it, loss=0.193, lr=1e-5]Steps:  56%|█████▌    | 8407/15001 [5:22:04<3:18:18,  1.80s/it, loss=0.193, lr=1e-5]Steps:  56%|█████▌    | 8407/15001 [5:22:04<3:18:18,  1.80s/it, loss=0.067, lr=1e-5]Steps:  56%|█████▌    | 8408/15001 [5:22:06<3:23:26,  1.85s/it, loss=0.067, lr=1e-5]Steps:  56%|█████▌    | 8408/15001 [5:22:06<3:23:26,  1.85s/it, loss=0.265, lr=1e-5]Steps:  56%|█████▌    | 8409/15001 [5:22:07<3:11:00,  1.74s/it, loss=0.265, lr=1e-5]Steps:  56%|█████▌    | 8409/15001 [5:22:08<3:11:00,  1.74s/it, loss=0.241, lr=1e-5]Steps:  56%|█████▌    | 8410/15001 [5:22:10<3:22:36,  1.84s/it, loss=0.241, lr=1e-5]Steps:  56%|█████▌    | 8410/15001 [5:22:10<3:22:36,  1.84s/it, loss=0.0657, lr=1e-5]Steps:  56%|█████▌    | 8411/15001 [5:22:11<3:19:22,  1.82s/it, loss=0.0657, lr=1e-5]Steps:  56%|█████▌    | 8411/15001 [5:22:12<3:19:22,  1.82s/it, loss=0.0408, lr=1e-5]Steps:  56%|█████▌    | 8412/15001 [5:22:13<3:28:45,  1.90s/it, loss=0.0408, lr=1e-5]Steps:  56%|█████▌    | 8412/15001 [5:22:14<3:28:45,  1.90s/it, loss=0.0382, lr=1e-5]Steps:  56%|█████▌    | 8413/15001 [5:22:15<3:27:15,  1.89s/it, loss=0.0382, lr=1e-5]Steps:  56%|█████▌    | 8413/15001 [5:22:15<3:27:15,  1.89s/it, loss=0.219, lr=1e-5] Steps:  56%|█████▌    | 8414/15001 [5:22:17<3:25:16,  1.87s/it, loss=0.219, lr=1e-5]Steps:  56%|█████▌    | 8414/15001 [5:22:17<3:25:16,  1.87s/it, loss=0.131, lr=1e-5]Steps:  56%|█████▌    | 8415/15001 [5:22:19<3:15:44,  1.78s/it, loss=0.131, lr=1e-5]Steps:  56%|█████▌    | 8415/15001 [5:22:19<3:15:44,  1.78s/it, loss=0.101, lr=1e-5]Steps:  56%|█████▌    | 8416/15001 [5:22:21<3:30:23,  1.92s/it, loss=0.101, lr=1e-5]Steps:  56%|█████▌    | 8416/15001 [5:22:21<3:30:23,  1.92s/it, loss=0.204, lr=1e-5]Steps:  56%|█████▌    | 8417/15001 [5:22:23<3:24:14,  1.86s/it, loss=0.204, lr=1e-5]Steps:  56%|█████▌    | 8417/15001 [5:22:23<3:24:14,  1.86s/it, loss=0.066, lr=1e-5]Steps:  56%|█████▌    | 8418/15001 [5:22:25<3:33:38,  1.95s/it, loss=0.066, lr=1e-5]Steps:  56%|█████▌    | 8418/15001 [5:22:25<3:33:38,  1.95s/it, loss=0.222, lr=1e-5]Steps:  56%|█████▌    | 8419/15001 [5:22:27<3:33:55,  1.95s/it, loss=0.222, lr=1e-5]Steps:  56%|█████▌    | 8419/15001 [5:22:27<3:33:55,  1.95s/it, loss=0.316, lr=1e-5]Steps:  56%|█████▌    | 8420/15001 [5:22:29<3:28:37,  1.90s/it, loss=0.316, lr=1e-5]Steps:  56%|█████▌    | 8420/15001 [5:22:29<3:28:37,  1.90s/it, loss=0.152, lr=1e-5]Steps:  56%|█████▌    | 8421/15001 [5:22:31<3:38:01,  1.99s/it, loss=0.152, lr=1e-5]Steps:  56%|█████▌    | 8421/15001 [5:22:31<3:38:01,  1.99s/it, loss=0.0829, lr=1e-5]Steps:  56%|█████▌    | 8422/15001 [5:22:33<3:36:44,  1.98s/it, loss=0.0829, lr=1e-5]Steps:  56%|█████▌    | 8422/15001 [5:22:33<3:36:44,  1.98s/it, loss=0.174, lr=1e-5] Steps:  56%|█████▌    | 8423/15001 [5:22:35<3:30:59,  1.92s/it, loss=0.174, lr=1e-5]Steps:  56%|█████▌    | 8423/15001 [5:22:35<3:30:59,  1.92s/it, loss=0.0492, lr=1e-5]Steps:  56%|█████▌    | 8424/15001 [5:22:36<3:20:57,  1.83s/it, loss=0.0492, lr=1e-5]Steps:  56%|█████▌    | 8424/15001 [5:22:36<3:20:57,  1.83s/it, loss=0.114, lr=1e-5] Steps:  56%|█████▌    | 8425/15001 [5:22:38<3:27:34,  1.89s/it, loss=0.114, lr=1e-5]Steps:  56%|█████▌    | 8425/15001 [5:22:38<3:27:34,  1.89s/it, loss=0.159, lr=1e-5]Steps:  56%|█████▌    | 8426/15001 [5:22:40<3:20:56,  1.83s/it, loss=0.159, lr=1e-5]Steps:  56%|█████▌    | 8426/15001 [5:22:40<3:20:56,  1.83s/it, loss=0.156, lr=1e-5]Steps:  56%|█████▌    | 8427/15001 [5:22:42<3:23:13,  1.85s/it, loss=0.156, lr=1e-5]Steps:  56%|█████▌    | 8427/15001 [5:22:42<3:23:13,  1.85s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8428/15001 [5:22:44<3:22:00,  1.84s/it, loss=0.182, lr=1e-5]Steps:  56%|█████▌    | 8428/15001 [5:22:44<3:22:00,  1.84s/it, loss=0.0663, lr=1e-5]Steps:  56%|█████▌    | 8429/15001 [5:22:45<3:17:07,  1.80s/it, loss=0.0663, lr=1e-5]Steps:  56%|█████▌    | 8429/15001 [5:22:46<3:17:07,  1.80s/it, loss=0.0388, lr=1e-5]Steps:  56%|█████▌    | 8430/15001 [5:22:47<3:20:27,  1.83s/it, loss=0.0388, lr=1e-5]Steps:  56%|█████▌    | 8430/15001 [5:22:47<3:20:27,  1.83s/it, loss=0.158, lr=1e-5] Steps:  56%|█████▌    | 8431/15001 [5:22:49<3:22:07,  1.85s/it, loss=0.158, lr=1e-5]Steps:  56%|█████▌    | 8431/15001 [5:22:49<3:22:07,  1.85s/it, loss=0.203, lr=1e-5]Steps:  56%|█████▌    | 8432/15001 [5:22:51<3:24:12,  1.87s/it, loss=0.203, lr=1e-5]Steps:  56%|█████▌    | 8432/15001 [5:22:51<3:24:12,  1.87s/it, loss=0.255, lr=1e-5]Steps:  56%|█████▌    | 8433/15001 [5:22:53<3:25:42,  1.88s/it, loss=0.255, lr=1e-5]Steps:  56%|█████▌    | 8433/15001 [5:22:53<3:25:42,  1.88s/it, loss=0.0137, lr=1e-5]Steps:  56%|█████▌    | 8434/15001 [5:22:54<3:13:28,  1.77s/it, loss=0.0137, lr=1e-5]Steps:  56%|█████▌    | 8434/15001 [5:22:55<3:13:28,  1.77s/it, loss=0.0686, lr=1e-5]Steps:  56%|█████▌    | 8435/15001 [5:22:56<3:22:07,  1.85s/it, loss=0.0686, lr=1e-5]Steps:  56%|█████▌    | 8435/15001 [5:22:57<3:22:07,  1.85s/it, loss=0.269, lr=1e-5] Steps:  56%|█████▌    | 8436/15001 [5:22:58<3:15:12,  1.78s/it, loss=0.269, lr=1e-5]Steps:  56%|█████▌    | 8436/15001 [5:22:58<3:15:12,  1.78s/it, loss=0.024, lr=1e-5]Steps:  56%|█████▌    | 8437/15001 [5:23:00<3:22:44,  1.85s/it, loss=0.024, lr=1e-5]Steps:  56%|█████▌    | 8437/15001 [5:23:00<3:22:44,  1.85s/it, loss=0.163, lr=1e-5]Steps:  56%|█████▌    | 8438/15001 [5:23:02<3:18:57,  1.82s/it, loss=0.163, lr=1e-5]Steps:  56%|█████▌    | 8438/15001 [5:23:02<3:18:57,  1.82s/it, loss=0.115, lr=1e-5]Steps:  56%|█████▋    | 8439/15001 [5:23:04<3:26:10,  1.89s/it, loss=0.115, lr=1e-5]Steps:  56%|█████▋    | 8439/15001 [5:23:04<3:26:10,  1.89s/it, loss=0.128, lr=1e-5]Steps:  56%|█████▋    | 8440/15001 [5:23:06<3:27:23,  1.90s/it, loss=0.128, lr=1e-5]Steps:  56%|█████▋    | 8440/15001 [5:23:06<3:27:23,  1.90s/it, loss=0.141, lr=1e-5]Steps:  56%|█████▋    | 8441/15001 [5:23:08<3:36:34,  1.98s/it, loss=0.141, lr=1e-5]Steps:  56%|█████▋    | 8441/15001 [5:23:08<3:36:34,  1.98s/it, loss=0.129, lr=1e-5]Steps:  56%|█████▋    | 8442/15001 [5:23:10<3:37:53,  1.99s/it, loss=0.129, lr=1e-5]Steps:  56%|█████▋    | 8442/15001 [5:23:10<3:37:53,  1.99s/it, loss=0.224, lr=1e-5]Steps:  56%|█████▋    | 8443/15001 [5:23:12<3:31:40,  1.94s/it, loss=0.224, lr=1e-5]Steps:  56%|█████▋    | 8443/15001 [5:23:12<3:31:40,  1.94s/it, loss=0.171, lr=1e-5]Steps:  56%|█████▋    | 8444/15001 [5:23:14<3:47:43,  2.08s/it, loss=0.171, lr=1e-5]Steps:  56%|█████▋    | 8444/15001 [5:23:14<3:47:43,  2.08s/it, loss=0.052, lr=1e-5]Steps:  56%|█████▋    | 8445/15001 [5:23:16<3:39:51,  2.01s/it, loss=0.052, lr=1e-5]Steps:  56%|█████▋    | 8445/15001 [5:23:16<3:39:51,  2.01s/it, loss=0.231, lr=1e-5]Steps:  56%|█████▋    | 8446/15001 [5:23:18<3:26:48,  1.89s/it, loss=0.231, lr=1e-5]Steps:  56%|█████▋    | 8446/15001 [5:23:18<3:26:48,  1.89s/it, loss=0.375, lr=1e-5]Steps:  56%|█████▋    | 8447/15001 [5:23:20<3:27:45,  1.90s/it, loss=0.375, lr=1e-5]Steps:  56%|█████▋    | 8447/15001 [5:23:20<3:27:45,  1.90s/it, loss=0.081, lr=1e-5]Steps:  56%|█████▋    | 8448/15001 [5:23:21<3:19:51,  1.83s/it, loss=0.081, lr=1e-5]Steps:  56%|█████▋    | 8448/15001 [5:23:21<3:19:51,  1.83s/it, loss=0.278, lr=1e-5]Steps:  56%|█████▋    | 8449/15001 [5:23:23<3:15:55,  1.79s/it, loss=0.278, lr=1e-5]Steps:  56%|█████▋    | 8449/15001 [5:23:23<3:15:55,  1.79s/it, loss=0.283, lr=1e-5]Steps:  56%|█████▋    | 8450/15001 [5:23:25<3:25:45,  1.88s/it, loss=0.283, lr=1e-5]Steps:  56%|█████▋    | 8450/15001 [5:23:25<3:25:45,  1.88s/it, loss=0.164, lr=1e-5]Steps:  56%|█████▋    | 8451/15001 [5:23:27<3:21:26,  1.85s/it, loss=0.164, lr=1e-5]Steps:  56%|█████▋    | 8451/15001 [5:23:27<3:21:26,  1.85s/it, loss=0.184, lr=1e-5]Steps:  56%|█████▋    | 8452/15001 [5:23:29<3:20:21,  1.84s/it, loss=0.184, lr=1e-5]Steps:  56%|█████▋    | 8452/15001 [5:23:29<3:20:21,  1.84s/it, loss=0.131, lr=1e-5]Steps:  56%|█████▋    | 8453/15001 [5:23:30<3:17:14,  1.81s/it, loss=0.131, lr=1e-5]Steps:  56%|█████▋    | 8453/15001 [5:23:30<3:17:14,  1.81s/it, loss=0.144, lr=1e-5]Steps:  56%|█████▋    | 8454/15001 [5:23:32<3:16:49,  1.80s/it, loss=0.144, lr=1e-5]Steps:  56%|█████▋    | 8454/15001 [5:23:32<3:16:49,  1.80s/it, loss=0.331, lr=1e-5]Steps:  56%|█████▋    | 8455/15001 [5:23:34<3:20:28,  1.84s/it, loss=0.331, lr=1e-5]Steps:  56%|█████▋    | 8455/15001 [5:23:34<3:20:28,  1.84s/it, loss=0.104, lr=1e-5]Steps:  56%|█████▋    | 8456/15001 [5:23:36<3:17:53,  1.81s/it, loss=0.104, lr=1e-5]Steps:  56%|█████▋    | 8456/15001 [5:23:36<3:17:53,  1.81s/it, loss=0.23, lr=1e-5] Steps:  56%|█████▋    | 8457/15001 [5:23:38<3:17:23,  1.81s/it, loss=0.23, lr=1e-5]Steps:  56%|█████▋    | 8457/15001 [5:23:38<3:17:23,  1.81s/it, loss=0.116, lr=1e-5]Steps:  56%|█████▋    | 8458/15001 [5:23:39<3:16:16,  1.80s/it, loss=0.116, lr=1e-5]Steps:  56%|█████▋    | 8458/15001 [5:23:39<3:16:16,  1.80s/it, loss=0.243, lr=1e-5]Steps:  56%|█████▋    | 8459/15001 [5:23:41<3:16:18,  1.80s/it, loss=0.243, lr=1e-5]Steps:  56%|█████▋    | 8459/15001 [5:23:41<3:16:18,  1.80s/it, loss=0.163, lr=1e-5]Steps:  56%|█████▋    | 8460/15001 [5:23:43<3:15:31,  1.79s/it, loss=0.163, lr=1e-5]Steps:  56%|█████▋    | 8460/15001 [5:23:43<3:15:31,  1.79s/it, loss=0.284, lr=1e-5]Steps:  56%|█████▋    | 8461/15001 [5:23:45<3:11:36,  1.76s/it, loss=0.284, lr=1e-5]Steps:  56%|█████▋    | 8461/15001 [5:23:45<3:11:36,  1.76s/it, loss=0.105, lr=1e-5]Steps:  56%|█████▋    | 8462/15001 [5:23:46<3:13:26,  1.78s/it, loss=0.105, lr=1e-5]Steps:  56%|█████▋    | 8462/15001 [5:23:48<3:13:26,  1.78s/it, loss=0.318, lr=1e-5]Steps:  56%|█████▋    | 8463/15001 [5:23:50<4:11:02,  2.30s/it, loss=0.318, lr=1e-5]Steps:  56%|█████▋    | 8463/15001 [5:23:50<4:11:02,  2.30s/it, loss=0.0882, lr=1e-5]Steps:  56%|█████▋    | 8464/15001 [5:23:52<3:57:44,  2.18s/it, loss=0.0882, lr=1e-5]Steps:  56%|█████▋    | 8464/15001 [5:23:52<3:57:44,  2.18s/it, loss=0.169, lr=1e-5] Steps:  56%|█████▋    | 8465/15001 [5:23:54<3:52:33,  2.13s/it, loss=0.169, lr=1e-5]Steps:  56%|█████▋    | 8465/15001 [5:23:54<3:52:33,  2.13s/it, loss=0.27, lr=1e-5] Steps:  56%|█████▋    | 8466/15001 [5:23:56<3:49:28,  2.11s/it, loss=0.27, lr=1e-5]Steps:  56%|█████▋    | 8466/15001 [5:23:56<3:49:28,  2.11s/it, loss=0.0454, lr=1e-5]Steps:  56%|█████▋    | 8467/15001 [5:23:58<3:35:15,  1.98s/it, loss=0.0454, lr=1e-5]Steps:  56%|█████▋    | 8467/15001 [5:23:58<3:35:15,  1.98s/it, loss=0.255, lr=1e-5] Steps:  56%|█████▋    | 8468/15001 [5:24:00<3:38:29,  2.01s/it, loss=0.255, lr=1e-5]Steps:  56%|█████▋    | 8468/15001 [5:24:00<3:38:29,  2.01s/it, loss=0.176, lr=1e-5]Steps:  56%|█████▋    | 8469/15001 [5:24:02<3:33:07,  1.96s/it, loss=0.176, lr=1e-5]Steps:  56%|█████▋    | 8469/15001 [5:24:02<3:33:07,  1.96s/it, loss=0.107, lr=1e-5]Steps:  56%|█████▋    | 8470/15001 [5:24:03<3:30:21,  1.93s/it, loss=0.107, lr=1e-5]Steps:  56%|█████▋    | 8470/15001 [5:24:04<3:30:21,  1.93s/it, loss=0.0773, lr=1e-5]Steps:  56%|█████▋    | 8471/15001 [5:24:05<3:31:41,  1.95s/it, loss=0.0773, lr=1e-5]Steps:  56%|█████▋    | 8471/15001 [5:24:06<3:31:41,  1.95s/it, loss=0.0667, lr=1e-5]Steps:  56%|█████▋    | 8472/15001 [5:24:07<3:18:43,  1.83s/it, loss=0.0667, lr=1e-5]Steps:  56%|█████▋    | 8472/15001 [5:24:07<3:18:43,  1.83s/it, loss=0.266, lr=1e-5] Steps:  56%|█████▋    | 8473/15001 [5:24:09<3:24:14,  1.88s/it, loss=0.266, lr=1e-5]Steps:  56%|█████▋    | 8473/15001 [5:24:09<3:24:14,  1.88s/it, loss=0.266, lr=1e-5]Steps:  56%|█████▋    | 8474/15001 [5:24:11<3:23:37,  1.87s/it, loss=0.266, lr=1e-5]Steps:  56%|█████▋    | 8474/15001 [5:24:11<3:23:37,  1.87s/it, loss=0.235, lr=1e-5]Steps:  56%|█████▋    | 8475/15001 [5:24:13<3:20:40,  1.85s/it, loss=0.235, lr=1e-5]Steps:  56%|█████▋    | 8475/15001 [5:24:13<3:20:40,  1.85s/it, loss=0.175, lr=1e-5]Steps:  57%|█████▋    | 8476/15001 [5:24:14<3:14:41,  1.79s/it, loss=0.175, lr=1e-5]Steps:  57%|█████▋    | 8476/15001 [5:24:15<3:14:41,  1.79s/it, loss=0.266, lr=1e-5]Steps:  57%|█████▋    | 8477/15001 [5:24:16<3:19:01,  1.83s/it, loss=0.266, lr=1e-5]Steps:  57%|█████▋    | 8477/15001 [5:24:16<3:19:01,  1.83s/it, loss=0.114, lr=1e-5]Steps:  57%|█████▋    | 8478/15001 [5:24:18<3:17:27,  1.82s/it, loss=0.114, lr=1e-5]Steps:  57%|█████▋    | 8478/15001 [5:24:18<3:17:27,  1.82s/it, loss=0.158, lr=1e-5]Steps:  57%|█████▋    | 8479/15001 [5:24:20<3:18:14,  1.82s/it, loss=0.158, lr=1e-5]Steps:  57%|█████▋    | 8479/15001 [5:24:20<3:18:14,  1.82s/it, loss=0.31, lr=1e-5] Steps:  57%|█████▋    | 8480/15001 [5:24:22<3:15:36,  1.80s/it, loss=0.31, lr=1e-5]Steps:  57%|█████▋    | 8480/15001 [5:24:22<3:15:36,  1.80s/it, loss=0.341, lr=1e-5]Steps:  57%|█████▋    | 8481/15001 [5:24:23<3:12:34,  1.77s/it, loss=0.341, lr=1e-5]Steps:  57%|█████▋    | 8481/15001 [5:24:24<3:12:34,  1.77s/it, loss=0.184, lr=1e-5]Steps:  57%|█████▋    | 8482/15001 [5:24:25<3:16:48,  1.81s/it, loss=0.184, lr=1e-5]Steps:  57%|█████▋    | 8482/15001 [5:24:25<3:16:48,  1.81s/it, loss=0.259, lr=1e-5]Steps:  57%|█████▋    | 8483/15001 [5:24:27<3:19:34,  1.84s/it, loss=0.259, lr=1e-5]Steps:  57%|█████▋    | 8483/15001 [5:24:27<3:19:34,  1.84s/it, loss=0.175, lr=1e-5]Steps:  57%|█████▋    | 8484/15001 [5:24:29<3:22:45,  1.87s/it, loss=0.175, lr=1e-5]Steps:  57%|█████▋    | 8484/15001 [5:24:29<3:22:45,  1.87s/it, loss=0.138, lr=1e-5]Steps:  57%|█████▋    | 8485/15001 [5:24:31<3:23:55,  1.88s/it, loss=0.138, lr=1e-5]Steps:  57%|█████▋    | 8485/15001 [5:24:31<3:23:55,  1.88s/it, loss=0.344, lr=1e-5]Steps:  57%|█████▋    | 8486/15001 [5:24:33<3:22:43,  1.87s/it, loss=0.344, lr=1e-5]Steps:  57%|█████▋    | 8486/15001 [5:24:33<3:22:43,  1.87s/it, loss=0.118, lr=1e-5]Steps:  57%|█████▋    | 8487/15001 [5:24:35<3:31:04,  1.94s/it, loss=0.118, lr=1e-5]Steps:  57%|█████▋    | 8487/15001 [5:24:35<3:31:04,  1.94s/it, loss=0.0889, lr=1e-5]Steps:  57%|█████▋    | 8488/15001 [5:24:37<3:33:58,  1.97s/it, loss=0.0889, lr=1e-5]Steps:  57%|█████▋    | 8488/15001 [5:24:37<3:33:58,  1.97s/it, loss=0.216, lr=1e-5] Steps:  57%|█████▋    | 8489/15001 [5:24:39<3:24:15,  1.88s/it, loss=0.216, lr=1e-5]Steps:  57%|█████▋    | 8489/15001 [5:24:39<3:24:15,  1.88s/it, loss=0.14, lr=1e-5] Steps:  57%|█████▋    | 8490/15001 [5:24:41<3:25:39,  1.90s/it, loss=0.14, lr=1e-5]Steps:  57%|█████▋    | 8490/15001 [5:24:41<3:25:39,  1.90s/it, loss=0.208, lr=1e-5]Steps:  57%|█████▋    | 8491/15001 [5:24:42<3:27:25,  1.91s/it, loss=0.208, lr=1e-5]Steps:  57%|█████▋    | 8491/15001 [5:24:43<3:27:25,  1.91s/it, loss=0.0271, lr=1e-5]Steps:  57%|█████▋    | 8492/15001 [5:24:44<3:23:28,  1.88s/it, loss=0.0271, lr=1e-5]Steps:  57%|█████▋    | 8492/15001 [5:24:44<3:23:28,  1.88s/it, loss=0.195, lr=1e-5] Steps:  57%|█████▋    | 8493/15001 [5:24:46<3:23:06,  1.87s/it, loss=0.195, lr=1e-5]Steps:  57%|█████▋    | 8493/15001 [5:24:46<3:23:06,  1.87s/it, loss=0.32, lr=1e-5] Steps:  57%|█████▋    | 8494/15001 [5:24:48<3:19:18,  1.84s/it, loss=0.32, lr=1e-5]Steps:  57%|█████▋    | 8494/15001 [5:24:48<3:19:18,  1.84s/it, loss=0.321, lr=1e-5]Steps:  57%|█████▋    | 8495/15001 [5:24:50<3:23:17,  1.87s/it, loss=0.321, lr=1e-5]Steps:  57%|█████▋    | 8495/15001 [5:24:50<3:23:17,  1.87s/it, loss=0.159, lr=1e-5]Steps:  57%|█████▋    | 8496/15001 [5:24:52<3:17:49,  1.82s/it, loss=0.159, lr=1e-5]Steps:  57%|█████▋    | 8496/15001 [5:24:52<3:17:49,  1.82s/it, loss=0.221, lr=1e-5]Steps:  57%|█████▋    | 8497/15001 [5:24:53<3:09:51,  1.75s/it, loss=0.221, lr=1e-5]Steps:  57%|█████▋    | 8497/15001 [5:24:54<3:09:51,  1.75s/it, loss=0.227, lr=1e-5]Steps:  57%|█████▋    | 8498/15001 [5:24:55<3:14:12,  1.79s/it, loss=0.227, lr=1e-5]Steps:  57%|█████▋    | 8498/15001 [5:24:55<3:14:12,  1.79s/it, loss=0.207, lr=1e-5]Steps:  57%|█████▋    | 8499/15001 [5:24:57<3:23:57,  1.88s/it, loss=0.207, lr=1e-5]Steps:  57%|█████▋    | 8499/15001 [5:24:57<3:23:57,  1.88s/it, loss=0.232, lr=1e-5]Steps:  57%|█████▋    | 8500/15001 [5:24:59<3:19:04,  1.84s/it, loss=0.232, lr=1e-5]02/04/2024 18:27:18 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1663.09it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  57%|█████▋    | 8500/15001 [5:28:38<3:19:04,  1.84s/it, loss=0.108, lr=1e-5]Steps:  57%|█████▋    | 8501/15001 [5:28:40<122:02:31, 67.59s/it, loss=0.108, lr=1e-5]Steps:  57%|█████▋    | 8501/15001 [5:28:40<122:02:31, 67.59s/it, loss=0.244, lr=1e-5]Steps:  57%|█████▋    | 8502/15001 [5:28:41<86:16:25, 47.79s/it, loss=0.244, lr=1e-5] Steps:  57%|█████▋    | 8502/15001 [5:28:42<86:16:25, 47.79s/it, loss=0.24, lr=1e-5] Steps:  57%|█████▋    | 8503/15001 [5:28:43<61:29:21, 34.07s/it, loss=0.24, lr=1e-5]Steps:  57%|█████▋    | 8503/15001 [5:28:44<61:29:21, 34.07s/it, loss=0.402, lr=1e-5]Steps:  57%|█████▋    | 8504/15001 [5:28:45<44:04:01, 24.42s/it, loss=0.402, lr=1e-5]Steps:  57%|█████▋    | 8504/15001 [5:28:46<44:04:01, 24.42s/it, loss=0.117, lr=1e-5]Steps:  57%|█████▋    | 8505/15001 [5:28:47<31:46:57, 17.61s/it, loss=0.117, lr=1e-5]Steps:  57%|█████▋    | 8505/15001 [5:28:47<31:46:57, 17.61s/it, loss=0.167, lr=1e-5]Steps:  57%|█████▋    | 8506/15001 [5:28:49<23:17:51, 12.91s/it, loss=0.167, lr=1e-5]Steps:  57%|█████▋    | 8506/15001 [5:28:49<23:17:51, 12.91s/it, loss=0.228, lr=1e-5]Steps:  57%|█████▋    | 8507/15001 [5:28:51<17:13:26,  9.55s/it, loss=0.228, lr=1e-5]Steps:  57%|█████▋    | 8507/15001 [5:28:51<17:13:26,  9.55s/it, loss=0.17, lr=1e-5] Steps:  57%|█████▋    | 8508/15001 [5:28:53<13:08:48,  7.29s/it, loss=0.17, lr=1e-5]Steps:  57%|█████▋    | 8508/15001 [5:28:53<13:08:48,  7.29s/it, loss=0.107, lr=1e-5]Steps:  57%|█████▋    | 8509/15001 [5:28:54<10:04:42,  5.59s/it, loss=0.107, lr=1e-5]Steps:  57%|█████▋    | 8509/15001 [5:28:55<10:04:42,  5.59s/it, loss=0.276, lr=1e-5]Steps:  57%|█████▋    | 8510/15001 [5:28:56<8:08:17,  4.51s/it, loss=0.276, lr=1e-5] Steps:  57%|█████▋    | 8510/15001 [5:28:56<8:08:17,  4.51s/it, loss=0.3, lr=1e-5]  Steps:  57%|█████▋    | 8511/15001 [5:28:58<6:35:36,  3.66s/it, loss=0.3, lr=1e-5]Steps:  57%|█████▋    | 8511/15001 [5:28:58<6:35:36,  3.66s/it, loss=0.226, lr=1e-5]Steps:  57%|█████▋    | 8512/15001 [5:29:00<5:29:46,  3.05s/it, loss=0.226, lr=1e-5]Steps:  57%|█████▋    | 8512/15001 [5:29:00<5:29:46,  3.05s/it, loss=0.0597, lr=1e-5]Steps:  57%|█████▋    | 8513/15001 [5:29:02<4:58:46,  2.76s/it, loss=0.0597, lr=1e-5]Steps:  57%|█████▋    | 8513/15001 [5:29:02<4:58:46,  2.76s/it, loss=0.13, lr=1e-5]  Steps:  57%|█████▋    | 8514/15001 [5:29:04<4:31:42,  2.51s/it, loss=0.13, lr=1e-5]Steps:  57%|█████▋    | 8514/15001 [5:29:04<4:31:42,  2.51s/it, loss=0.336, lr=1e-5]Steps:  57%|█████▋    | 8515/15001 [5:29:06<4:16:59,  2.38s/it, loss=0.336, lr=1e-5]Steps:  57%|█████▋    | 8515/15001 [5:29:06<4:16:59,  2.38s/it, loss=0.0921, lr=1e-5]Steps:  57%|█████▋    | 8516/15001 [5:29:08<4:05:04,  2.27s/it, loss=0.0921, lr=1e-5]Steps:  57%|█████▋    | 8516/15001 [5:29:08<4:05:04,  2.27s/it, loss=0.373, lr=1e-5] Steps:  57%|█████▋    | 8517/15001 [5:29:10<3:49:28,  2.12s/it, loss=0.373, lr=1e-5]Steps:  57%|█████▋    | 8517/15001 [5:29:10<3:49:28,  2.12s/it, loss=0.0283, lr=1e-5]Steps:  57%|█████▋    | 8518/15001 [5:29:12<3:49:47,  2.13s/it, loss=0.0283, lr=1e-5]Steps:  57%|█████▋    | 8518/15001 [5:29:12<3:49:47,  2.13s/it, loss=0.152, lr=1e-5] Steps:  57%|█████▋    | 8519/15001 [5:29:14<3:47:12,  2.10s/it, loss=0.152, lr=1e-5]Steps:  57%|█████▋    | 8519/15001 [5:29:14<3:47:12,  2.10s/it, loss=0.0693, lr=1e-5]Steps:  57%|█████▋    | 8520/15001 [5:29:16<3:43:54,  2.07s/it, loss=0.0693, lr=1e-5]Steps:  57%|█████▋    | 8520/15001 [5:29:16<3:43:54,  2.07s/it, loss=0.302, lr=1e-5] Steps:  57%|█████▋    | 8521/15001 [5:29:17<3:27:06,  1.92s/it, loss=0.302, lr=1e-5]Steps:  57%|█████▋    | 8521/15001 [5:29:18<3:27:06,  1.92s/it, loss=0.0736, lr=1e-5]Steps:  57%|█████▋    | 8522/15001 [5:29:19<3:25:06,  1.90s/it, loss=0.0736, lr=1e-5]Steps:  57%|█████▋    | 8522/15001 [5:29:19<3:25:06,  1.90s/it, loss=0.15, lr=1e-5]  Steps:  57%|█████▋    | 8523/15001 [5:29:21<3:19:53,  1.85s/it, loss=0.15, lr=1e-5]Steps:  57%|█████▋    | 8523/15001 [5:29:21<3:19:53,  1.85s/it, loss=0.226, lr=1e-5]Steps:  57%|█████▋    | 8524/15001 [5:29:23<3:18:57,  1.84s/it, loss=0.226, lr=1e-5]Steps:  57%|█████▋    | 8524/15001 [5:29:23<3:18:57,  1.84s/it, loss=0.223, lr=1e-5]Steps:  57%|█████▋    | 8525/15001 [5:29:25<3:20:37,  1.86s/it, loss=0.223, lr=1e-5]Steps:  57%|█████▋    | 8525/15001 [5:29:25<3:20:37,  1.86s/it, loss=0.0771, lr=1e-5]Steps:  57%|█████▋    | 8526/15001 [5:29:26<3:18:51,  1.84s/it, loss=0.0771, lr=1e-5]Steps:  57%|█████▋    | 8526/15001 [5:29:27<3:18:51,  1.84s/it, loss=0.146, lr=1e-5] Steps:  57%|█████▋    | 8527/15001 [5:29:28<3:17:33,  1.83s/it, loss=0.146, lr=1e-5]Steps:  57%|█████▋    | 8527/15001 [5:29:28<3:17:33,  1.83s/it, loss=0.282, lr=1e-5]Steps:  57%|█████▋    | 8528/15001 [5:29:30<3:20:03,  1.85s/it, loss=0.282, lr=1e-5]Steps:  57%|█████▋    | 8528/15001 [5:29:30<3:20:03,  1.85s/it, loss=0.134, lr=1e-5]Steps:  57%|█████▋    | 8529/15001 [5:29:32<3:21:36,  1.87s/it, loss=0.134, lr=1e-5]Steps:  57%|█████▋    | 8529/15001 [5:29:32<3:21:36,  1.87s/it, loss=0.215, lr=1e-5]Steps:  57%|█████▋    | 8530/15001 [5:29:34<3:17:53,  1.83s/it, loss=0.215, lr=1e-5]Steps:  57%|█████▋    | 8530/15001 [5:29:34<3:17:53,  1.83s/it, loss=0.317, lr=1e-5]Steps:  57%|█████▋    | 8531/15001 [5:29:35<3:12:24,  1.78s/it, loss=0.317, lr=1e-5]Steps:  57%|█████▋    | 8531/15001 [5:29:36<3:12:24,  1.78s/it, loss=0.1, lr=1e-5]  Steps:  57%|█████▋    | 8532/15001 [5:29:38<3:21:09,  1.87s/it, loss=0.1, lr=1e-5]Steps:  57%|█████▋    | 8532/15001 [5:29:38<3:21:09,  1.87s/it, loss=0.183, lr=1e-5]Steps:  57%|█████▋    | 8533/15001 [5:29:39<3:18:13,  1.84s/it, loss=0.183, lr=1e-5]Steps:  57%|███��█▋    | 8533/15001 [5:29:39<3:18:13,  1.84s/it, loss=0.405, lr=1e-5]Steps:  57%|█████▋    | 8534/15001 [5:29:41<3:17:16,  1.83s/it, loss=0.405, lr=1e-5]Steps:  57%|█████▋    | 8534/15001 [5:29:41<3:17:16,  1.83s/it, loss=0.092, lr=1e-5]Steps:  57%|█████▋    | 8535/15001 [5:29:43<3:12:46,  1.79s/it, loss=0.092, lr=1e-5]Steps:  57%|█████▋    | 8535/15001 [5:29:43<3:12:46,  1.79s/it, loss=0.252, lr=1e-5]Steps:  57%|█████▋    | 8536/15001 [5:29:45<3:12:26,  1.79s/it, loss=0.252, lr=1e-5]Steps:  57%|█████▋    | 8536/15001 [5:29:45<3:12:26,  1.79s/it, loss=0.16, lr=1e-5] Steps:  57%|█████▋    | 8537/15001 [5:29:47<3:17:44,  1.84s/it, loss=0.16, lr=1e-5]Steps:  57%|█████▋    | 8537/15001 [5:29:47<3:17:44,  1.84s/it, loss=0.198, lr=1e-5]Steps:  57%|█████▋    | 8538/15001 [5:29:49<3:23:33,  1.89s/it, loss=0.198, lr=1e-5]Steps:  57%|█████▋    | 8538/15001 [5:29:49<3:23:33,  1.89s/it, loss=0.0906, lr=1e-5]Steps:  57%|█████▋    | 8539/15001 [5:29:50<3:23:56,  1.89s/it, loss=0.0906, lr=1e-5]Steps:  57%|█████▋    | 8539/15001 [5:29:51<3:23:56,  1.89s/it, loss=0.0982, lr=1e-5]Steps:  57%|█████▋    | 8540/15001 [5:29:52<3:26:22,  1.92s/it, loss=0.0982, lr=1e-5]Steps:  57%|█████▋    | 8540/15001 [5:29:53<3:26:22,  1.92s/it, loss=0.123, lr=1e-5] Steps:  57%|█████▋    | 8541/15001 [5:29:54<3:22:48,  1.88s/it, loss=0.123, lr=1e-5]Steps:  57%|█████▋    | 8541/15001 [5:29:55<3:22:48,  1.88s/it, loss=0.0829, lr=1e-5]Steps:  57%|█████▋    | 8542/15001 [5:29:56<3:25:54,  1.91s/it, loss=0.0829, lr=1e-5]Steps:  57%|█████▋    | 8542/15001 [5:29:57<3:25:54,  1.91s/it, loss=0.216, lr=1e-5] Steps:  57%|█████▋    | 8543/15001 [5:29:58<3:34:48,  2.00s/it, loss=0.216, lr=1e-5]Steps:  57%|█████▋    | 8543/15001 [5:29:58<3:34:48,  2.00s/it, loss=0.152, lr=1e-5]Steps:  57%|█████▋    | 8544/15001 [5:30:00<3:29:34,  1.95s/it, loss=0.152, lr=1e-5]Steps:  57%|█████▋    | 8544/15001 [5:30:00<3:29:34,  1.95s/it, loss=0.192, lr=1e-5]Steps:  57%|█████▋    | 8545/15001 [5:30:02<3:18:51,  1.85s/it, loss=0.192, lr=1e-5]Steps:  57%|█████▋    | 8545/15001 [5:30:02<3:18:51,  1.85s/it, loss=0.153, lr=1e-5]Steps:  57%|█████▋    | 8546/15001 [5:30:04<3:24:23,  1.90s/it, loss=0.153, lr=1e-5]Steps:  57%|█████▋    | 8546/15001 [5:30:04<3:24:23,  1.90s/it, loss=0.095, lr=1e-5]Steps:  57%|█████▋    | 8547/15001 [5:30:05<3:11:56,  1.78s/it, loss=0.095, lr=1e-5]Steps:  57%|█████▋    | 8547/15001 [5:30:06<3:11:56,  1.78s/it, loss=0.122, lr=1e-5]Steps:  57%|█████▋    | 8548/15001 [5:30:07<3:20:41,  1.87s/it, loss=0.122, lr=1e-5]Steps:  57%|█████▋    | 8548/15001 [5:30:08<3:20:41,  1.87s/it, loss=0.138, lr=1e-5]Steps:  57%|█████▋    | 8549/15001 [5:30:09<3:14:56,  1.81s/it, loss=0.138, lr=1e-5]Steps:  57%|█████▋    | 8549/15001 [5:30:09<3:14:56,  1.81s/it, loss=0.298, lr=1e-5]Steps:  57%|█████▋    | 8550/15001 [5:30:11<3:18:17,  1.84s/it, loss=0.298, lr=1e-5]Steps:  57%|█████▋    | 8550/15001 [5:30:11<3:18:17,  1.84s/it, loss=0.125, lr=1e-5]Steps:  57%|█████▋    | 8551/15001 [5:30:13<3:19:54,  1.86s/it, loss=0.125, lr=1e-5]Steps:  57%|█████▋    | 8551/15001 [5:30:13<3:19:54,  1.86s/it, loss=0.23, lr=1e-5] Steps:  57%|█████▋    | 8552/15001 [5:30:15<3:13:33,  1.80s/it, loss=0.23, lr=1e-5]Steps:  57%|█████▋    | 8552/15001 [5:30:15<3:13:33,  1.80s/it, loss=0.161, lr=1e-5]Steps:  57%|█████▋    | 8553/15001 [5:30:17<3:17:07,  1.83s/it, loss=0.161, lr=1e-5]Steps:  57%|█████▋    | 8553/15001 [5:30:17<3:17:07,  1.83s/it, loss=0.128, lr=1e-5]Steps:  57%|█████▋    | 8554/15001 [5:30:18<3:10:26,  1.77s/it, loss=0.128, lr=1e-5]Steps:  57%|█████▋    | 8554/15001 [5:30:19<3:10:26,  1.77s/it, loss=0.157, lr=1e-5]Steps:  57%|█████▋    | 8555/15001 [5:30:20<3:14:49,  1.81s/it, loss=0.157, lr=1e-5]Steps:  57%|█████▋    | 8555/15001 [5:30:20<3:14:49,  1.81s/it, loss=0.225, lr=1e-5]Steps:  57%|█████▋    | 8556/15001 [5:30:22<3:18:00,  1.84s/it, loss=0.225, lr=1e-5]Steps:  57%|█████▋    | 8556/15001 [5:30:22<3:18:00,  1.84s/it, loss=0.302, lr=1e-5]Steps:  57%|█████▋    | 8557/15001 [5:30:24<3:13:33,  1.80s/it, loss=0.302, lr=1e-5]Steps:  57%|█████▋    | 8557/15001 [5:30:24<3:13:33,  1.80s/it, loss=0.208, lr=1e-5]Steps:  57%|█████▋    | 8558/15001 [5:30:25<3:12:24,  1.79s/it, loss=0.208, lr=1e-5]Steps:  57%|█████▋    | 8558/15001 [5:30:26<3:12:24,  1.79s/it, loss=0.121, lr=1e-5]Steps:  57%|█████▋    | 8559/15001 [5:30:27<3:16:57,  1.83s/it, loss=0.121, lr=1e-5]Steps:  57%|█████▋    | 8559/15001 [5:30:27<3:16:57,  1.83s/it, loss=0.0806, lr=1e-5]Steps:  57%|█████▋    | 8560/15001 [5:30:29<3:09:22,  1.76s/it, loss=0.0806, lr=1e-5]Steps:  57%|█████▋    | 8560/15001 [5:30:29<3:09:22,  1.76s/it, loss=0.221, lr=1e-5] Steps:  57%|█████▋    | 8561/15001 [5:30:31<3:18:11,  1.85s/it, loss=0.221, lr=1e-5]Steps:  57%|█████▋    | 8561/15001 [5:30:31<3:18:11,  1.85s/it, loss=0.035, lr=1e-5]Steps:  57%|█████▋    | 8562/15001 [5:30:33<3:26:40,  1.93s/it, loss=0.035, lr=1e-5]Steps:  57%|█████▋    | 8562/15001 [5:30:33<3:26:40,  1.93s/it, loss=0.201, lr=1e-5]Steps:  57%|█████▋    | 8563/15001 [5:30:35<3:28:57,  1.95s/it, loss=0.201, lr=1e-5]Steps:  57%|█████▋    | 8563/15001 [5:30:35<3:28:57,  1.95s/it, loss=0.0757, lr=1e-5]Steps:  57%|█████▋    | 8564/15001 [5:30:37<3:23:51,  1.90s/it, loss=0.0757, lr=1e-5]Steps:  57%|█████▋    | 8564/15001 [5:30:37<3:23:51,  1.90s/it, loss=0.043, lr=1e-5] Steps:  57%|█████▋    | 8565/15001 [5:30:39<3:38:35,  2.04s/it, loss=0.043, lr=1e-5]Steps:  57%|█████▋    | 8565/15001 [5:30:39<3:38:35,  2.04s/it, loss=0.444, lr=1e-5]Steps:  57%|█████▋    | 8566/15001 [5:30:41<3:28:25,  1.94s/it, loss=0.444, lr=1e-5]Steps:  57%|█████▋    | 8566/15001 [5:30:41<3:28:25,  1.94s/it, loss=0.139, lr=1e-5]Steps:  57%|█████▋    | 8567/15001 [5:30:43<3:25:18,  1.91s/it, loss=0.139, lr=1e-5]Steps:  57%|█████▋    | 8567/15001 [5:30:43<3:25:18,  1.91s/it, loss=0.0823, lr=1e-5]Steps:  57%|█████▋    | 8568/15001 [5:30:45<3:26:23,  1.92s/it, loss=0.0823, lr=1e-5]Steps:  57%|█████▋    | 8568/15001 [5:30:45<3:26:23,  1.92s/it, loss=0.235, lr=1e-5] Steps:  57%|█████▋    | 8569/15001 [5:30:47<3:33:24,  1.99s/it, loss=0.235, lr=1e-5]Steps:  57%|█████▋    | 8569/15001 [5:30:47<3:33:24,  1.99s/it, loss=0.315, lr=1e-5]Steps:  57%|█████▋    | 8570/15001 [5:30:49<3:21:48,  1.88s/it, loss=0.315, lr=1e-5]Steps:  57%|█████▋    | 8570/15001 [5:30:49<3:21:48,  1.88s/it, loss=0.17, lr=1e-5] Steps:  57%|█████▋    | 8571/15001 [5:30:50<3:17:49,  1.85s/it, loss=0.17, lr=1e-5]Steps:  57%|█████▋    | 8571/15001 [5:30:51<3:17:49,  1.85s/it, loss=0.204, lr=1e-5]Steps:  57%|█████▋    | 8572/15001 [5:30:52<3:19:35,  1.86s/it, loss=0.204, lr=1e-5]Steps:  57%|█████▋    | 8572/15001 [5:30:52<3:19:35,  1.86s/it, loss=0.253, lr=1e-5]Steps:  57%|█████▋    | 8573/15001 [5:30:54<3:12:56,  1.80s/it, loss=0.253, lr=1e-5]Steps:  57%|█████▋    | 8573/15001 [5:30:54<3:12:56,  1.80s/it, loss=0.212, lr=1e-5]Steps:  57%|█████▋    | 8574/15001 [5:30:56<3:11:56,  1.79s/it, loss=0.212, lr=1e-5]Steps:  57%|█████▋    | 8574/15001 [5:30:56<3:11:56,  1.79s/it, loss=0.201, lr=1e-5]Steps:  57%|█████▋    | 8575/15001 [5:30:57<3:11:28,  1.79s/it, loss=0.201, lr=1e-5]Steps:  57%|█████▋    | 8575/15001 [5:30:58<3:11:28,  1.79s/it, loss=0.197, lr=1e-5]Steps:  57%|█████▋    | 8576/15001 [5:30:59<3:12:21,  1.80s/it, loss=0.197, lr=1e-5]Steps:  57%|█████▋    | 8576/15001 [5:30:59<3:12:21,  1.80s/it, loss=0.157, lr=1e-5]Steps:  57%|█████▋    | 8577/15001 [5:31:01<3:15:32,  1.83s/it, loss=0.157, lr=1e-5]Steps:  57%|█████▋    | 8577/15001 [5:31:01<3:15:32,  1.83s/it, loss=0.381, lr=1e-5]Steps:  57%|█████▋    | 8578/15001 [5:31:03<3:12:16,  1.80s/it, loss=0.381, lr=1e-5]Steps:  57%|█████▋    | 8578/15001 [5:31:03<3:12:16,  1.80s/it, loss=0.154, lr=1e-5]Steps:  57%|█████▋    | 8579/15001 [5:31:05<3:12:15,  1.80s/it, loss=0.154, lr=1e-5]Steps:  57%|█████▋    | 8579/15001 [5:31:05<3:12:15,  1.80s/it, loss=0.0261, lr=1e-5]Steps:  57%|█████▋    | 8580/15001 [5:31:07<3:15:01,  1.82s/it, loss=0.0261, lr=1e-5]Steps:  57%|█████▋    | 8580/15001 [5:31:07<3:15:01,  1.82s/it, loss=0.0791, lr=1e-5]Steps:  57%|█████▋    | 8581/15001 [5:31:08<3:05:27,  1.73s/it, loss=0.0791, lr=1e-5]Steps:  57%|█████▋    | 8581/15001 [5:31:08<3:05:27,  1.73s/it, loss=0.239, lr=1e-5] Steps:  57%|█████▋    | 8582/15001 [5:31:10<3:14:17,  1.82s/it, loss=0.239, lr=1e-5]Steps:  57%|█████▋    | 8582/15001 [5:31:10<3:14:17,  1.82s/it, loss=0.216, lr=1e-5]Steps:  57%|█████▋    | 8583/15001 [5:31:12<3:10:09,  1.78s/it, loss=0.216, lr=1e-5]Steps:  57%|█████▋    | 8583/15001 [5:31:12<3:10:09,  1.78s/it, loss=0.154, lr=1e-5]Steps:  57%|█████▋    | 8584/15001 [5:31:14<3:18:07,  1.85s/it, loss=0.154, lr=1e-5]Steps:  57%|█████▋    | 8584/15001 [5:31:14<3:18:07,  1.85s/it, loss=0.164, lr=1e-5]Steps:  57%|█████▋    | 8585/15001 [5:31:16<3:25:24,  1.92s/it, loss=0.164, lr=1e-5]Steps:  57%|█████▋    | 8585/15001 [5:31:16<3:25:24,  1.92s/it, loss=0.123, lr=1e-5]Steps:  57%|█████▋    | 8586/15001 [5:31:18<3:37:47,  2.04s/it, loss=0.123, lr=1e-5]Steps:  57%|█████▋    | 8586/15001 [5:31:18<3:37:47,  2.04s/it, loss=0.126, lr=1e-5]Steps:  57%|█████▋    | 8587/15001 [5:31:20<3:28:45,  1.95s/it, loss=0.126, lr=1e-5]Steps:  57%|█████▋    | 8587/15001 [5:31:20<3:28:45,  1.95s/it, loss=0.23, lr=1e-5] Steps:  57%|█████▋    | 8588/15001 [5:31:22<3:40:31,  2.06s/it, loss=0.23, lr=1e-5]Steps:  57%|█████▋    | 8588/15001 [5:31:22<3:40:31,  2.06s/it, loss=0.311, lr=1e-5]Steps:  57%|█████▋    | 8589/15001 [5:31:24<3:28:28,  1.95s/it, loss=0.311, lr=1e-5]Steps:  57%|█████▋    | 8589/15001 [5:31:24<3:28:28,  1.95s/it, loss=0.504, lr=1e-5]Steps:  57%|█████▋    | 8590/15001 [5:31:26<3:31:12,  1.98s/it, loss=0.504, lr=1e-5]Steps:  57%|█████▋    | 8590/15001 [5:31:26<3:31:12,  1.98s/it, loss=0.15, lr=1e-5] Steps:  57%|█████▋    | 8591/15001 [5:31:28<3:23:31,  1.91s/it, loss=0.15, lr=1e-5]Steps:  57%|█████▋    | 8591/15001 [5:31:28<3:23:31,  1.91s/it, loss=0.186, lr=1e-5]Steps:  57%|█████▋    | 8592/15001 [5:31:29<3:18:02,  1.85s/it, loss=0.186, lr=1e-5]Steps:  57%|█████▋    | 8592/15001 [5:31:30<3:18:02,  1.85s/it, loss=0.155, lr=1e-5]Steps:  57%|█████▋    | 8593/15001 [5:31:31<3:18:50,  1.86s/it, loss=0.155, lr=1e-5]Steps:  57%|█████▋    | 8593/15001 [5:31:31<3:18:50,  1.86s/it, loss=0.0561, lr=1e-5]Steps:  57%|█████▋    | 8594/15001 [5:31:33<3:12:21,  1.80s/it, loss=0.0561, lr=1e-5]Steps:  57%|█████▋    | 8594/15001 [5:31:33<3:12:21,  1.80s/it, loss=0.19, lr=1e-5]  Steps:  57%|█████▋    | 8595/15001 [5:31:35<3:20:54,  1.88s/it, loss=0.19, lr=1e-5]Steps:  57%|█████▋    | 8595/15001 [5:31:35<3:20:54,  1.88s/it, loss=0.0485, lr=1e-5]Steps:  57%|█████▋    | 8596/15001 [5:31:37<3:17:02,  1.85s/it, loss=0.0485, lr=1e-5]Steps:  57%|█████▋    | 8596/15001 [5:31:37<3:17:02,  1.85s/it, loss=0.263, lr=1e-5] Steps:  57%|█████▋    | 8597/15001 [5:31:39<3:14:50,  1.83s/it, loss=0.263, lr=1e-5]Steps:  57%|█████▋    | 8597/15001 [5:31:39<3:14:50,  1.83s/it, loss=0.09, lr=1e-5] Steps:  57%|█████▋    | 8598/15001 [5:31:40<3:16:07,  1.84s/it, loss=0.09, lr=1e-5]Steps:  57%|█████▋    | 8598/15001 [5:31:41<3:16:07,  1.84s/it, loss=0.126, lr=1e-5]Steps:  57%|█████▋    | 8599/15001 [5:31:42<3:15:17,  1.83s/it, loss=0.126, lr=1e-5]Steps:  57%|█████▋    | 8599/15001 [5:31:42<3:15:17,  1.83s/it, loss=0.274, lr=1e-5]Steps:  57%|█████▋    | 8600/15001 [5:31:44<3:15:43,  1.83s/it, loss=0.274, lr=1e-5]Steps:  57%|█████▋    | 8600/15001 [5:31:44<3:15:43,  1.83s/it, loss=0.1, lr=1e-5]  Steps:  57%|█████▋    | 8601/15001 [5:31:46<3:13:25,  1.81s/it, loss=0.1, lr=1e-5]Steps:  57%|█████▋    | 8601/15001 [5:31:46<3:13:25,  1.81s/it, loss=0.045, lr=1e-5]Steps:  57%|█████▋    | 8602/15001 [5:31:48<3:13:45,  1.82s/it, loss=0.045, lr=1e-5]Steps:  57%|█████▋    | 8602/15001 [5:31:48<3:13:45,  1.82s/it, loss=0.231, lr=1e-5]Steps:  57%|█████▋    | 8603/15001 [5:31:50<3:12:55,  1.81s/it, loss=0.231, lr=1e-5]Steps:  57%|█████▋    | 8603/15001 [5:31:50<3:12:55,  1.81s/it, loss=0.115, lr=1e-5]Steps:  57%|█████▋    | 8604/15001 [5:31:51<3:14:07,  1.82s/it, loss=0.115, lr=1e-5]Steps:  57%|█████▋    | 8604/15001 [5:31:51<3:14:07,  1.82s/it, loss=0.215, lr=1e-5]Steps:  57%|█████▋    | 8605/15001 [5:31:53<3:01:07,  1.70s/it, loss=0.215, lr=1e-5]Steps:  57%|█████▋    | 8605/15001 [5:31:53<3:01:07,  1.70s/it, loss=0.0825, lr=1e-5]Steps:  57%|█████▋    | 8606/15001 [5:31:55<3:16:16,  1.84s/it, loss=0.0825, lr=1e-5]Steps:  57%|█████▋    | 8606/15001 [5:31:55<3:16:16,  1.84s/it, loss=0.178, lr=1e-5] Steps:  57%|█████▋    | 8607/15001 [5:31:57<3:20:43,  1.88s/it, loss=0.178, lr=1e-5]Steps:  57%|█████▋    | 8607/15001 [5:31:57<3:20:43,  1.88s/it, loss=0.421, lr=1e-5]Steps:  57%|█████▋    | 8608/15001 [5:31:59<3:21:47,  1.89s/it, loss=0.421, lr=1e-5]Steps:  57%|█████▋    | 8608/15001 [5:31:59<3:21:47,  1.89s/it, loss=0.288, lr=1e-5]Steps:  57%|█████▋    | 8609/15001 [5:32:01<3:18:21,  1.86s/it, loss=0.288, lr=1e-5]Steps:  57%|█████▋    | 8609/15001 [5:32:01<3:18:21,  1.86s/it, loss=0.122, lr=1e-5]Steps:  57%|█████▋    | 8610/15001 [5:32:03<3:28:12,  1.95s/it, loss=0.122, lr=1e-5]Steps:  57%|█████▋    | 8610/15001 [5:32:03<3:28:12,  1.95s/it, loss=0.0673, lr=1e-5]Steps:  57%|█████▋    | 8611/15001 [5:32:05<3:32:08,  1.99s/it, loss=0.0673, lr=1e-5]Steps:  57%|█████▋    | 8611/15001 [5:32:05<3:32:08,  1.99s/it, loss=0.34, lr=1e-5]  Steps:  57%|█████▋    | 8612/15001 [5:32:07<3:24:07,  1.92s/it, loss=0.34, lr=1e-5]Steps:  57%|█████▋    | 8612/15001 [5:32:07<3:24:07,  1.92s/it, loss=0.036, lr=1e-5]Steps:  57%|█████▋    | 8613/15001 [5:32:09<3:25:20,  1.93s/it, loss=0.036, lr=1e-5]Steps:  57%|█████▋    | 8613/15001 [5:32:09<3:25:20,  1.93s/it, loss=0.0497, lr=1e-5]Steps:  57%|█████▋    | 8614/15001 [5:32:10<3:18:35,  1.87s/it, loss=0.0497, lr=1e-5]Steps:  57%|█████▋    | 8614/15001 [5:32:11<3:18:35,  1.87s/it, loss=0.17, lr=1e-5]  Steps:  57%|█████▋    | 8615/15001 [5:32:12<3:18:43,  1.87s/it, loss=0.17, lr=1e-5]Steps:  57%|█████▋    | 8615/15001 [5:32:12<3:18:43,  1.87s/it, loss=0.0903, lr=1e-5]Steps:  57%|█████▋    | 8616/15001 [5:32:14<3:10:35,  1.79s/it, loss=0.0903, lr=1e-5]Steps:  57%|█████▋    | 8616/15001 [5:32:14<3:10:35,  1.79s/it, loss=0.0275, lr=1e-5]Steps:  57%|█████▋    | 8617/15001 [5:32:16<3:17:08,  1.85s/it, loss=0.0275, lr=1e-5]Steps:  57%|█████▋    | 8617/15001 [5:32:16<3:17:08,  1.85s/it, loss=0.12, lr=1e-5]  Steps:  57%|█████▋    | 8618/15001 [5:32:18<3:15:10,  1.83s/it, loss=0.12, lr=1e-5]Steps:  57%|█████▋    | 8618/15001 [5:32:18<3:15:10,  1.83s/it, loss=0.358, lr=1e-5]Steps:  57%|█████▋    | 8619/15001 [5:32:19<3:09:34,  1.78s/it, loss=0.358, lr=1e-5]Steps:  57%|█████▋    | 8619/15001 [5:32:20<3:09:34,  1.78s/it, loss=0.36, lr=1e-5] Steps:  57%|█████▋    | 8620/15001 [5:32:21<3:13:32,  1.82s/it, loss=0.36, lr=1e-5]Steps:  57%|█████▋    | 8620/15001 [5:32:21<3:13:32,  1.82s/it, loss=0.0736, lr=1e-5]Steps:  57%|█████▋    | 8621/15001 [5:32:23<3:14:32,  1.83s/it, loss=0.0736, lr=1e-5]Steps:  57%|█████▋    | 8621/15001 [5:32:23<3:14:32,  1.83s/it, loss=0.372, lr=1e-5] Steps:  57%|█████▋    | 8622/15001 [5:32:25<3:20:57,  1.89s/it, loss=0.372, lr=1e-5]Steps:  57%|█████▋    | 8622/15001 [5:32:25<3:20:57,  1.89s/it, loss=0.0985, lr=1e-5]Steps:  57%|█████▋    | 8623/15001 [5:32:27<3:15:30,  1.84s/it, loss=0.0985, lr=1e-5]Steps:  57%|█████▋    | 8623/15001 [5:32:27<3:15:30,  1.84s/it, loss=0.0702, lr=1e-5]Steps:  57%|█████▋    | 8624/15001 [5:32:28<3:11:49,  1.80s/it, loss=0.0702, lr=1e-5]Steps:  57%|█████▋    | 8624/15001 [5:32:29<3:11:49,  1.80s/it, loss=0.124, lr=1e-5] Steps:  57%|█████▋    | 8625/15001 [5:32:30<3:04:22,  1.74s/it, loss=0.124, lr=1e-5]Steps:  57%|█████▋    | 8625/15001 [5:32:30<3:04:22,  1.74s/it, loss=0.15, lr=1e-5] Steps:  58%|█████▊    | 8626/15001 [5:32:32<3:18:06,  1.86s/it, loss=0.15, lr=1e-5]Steps:  58%|█████▊    | 8626/15001 [5:32:32<3:18:06,  1.86s/it, loss=0.139, lr=1e-5]Steps:  58%|█████▊    | 8627/15001 [5:32:34<3:06:11,  1.75s/it, loss=0.139, lr=1e-5]Steps:  58%|█████▊    | 8627/15001 [5:32:34<3:06:11,  1.75s/it, loss=0.0979, lr=1e-5]Steps:  58%|█████▊    | 8628/15001 [5:32:36<3:18:53,  1.87s/it, loss=0.0979, lr=1e-5]Steps:  58%|█████▊    | 8628/15001 [5:32:36<3:18:53,  1.87s/it, loss=0.0692, lr=1e-5]Steps:  58%|█████▊    | 8629/15001 [5:32:38<3:14:13,  1.83s/it, loss=0.0692, lr=1e-5]Steps:  58%|█████▊    | 8629/15001 [5:32:38<3:14:13,  1.83s/it, loss=0.184, lr=1e-5] Steps:  58%|█████▊    | 8630/15001 [5:32:40<3:22:22,  1.91s/it, loss=0.184, lr=1e-5]Steps:  58%|█████▊    | 8630/15001 [5:32:40<3:22:22,  1.91s/it, loss=0.189, lr=1e-5]Steps:  58%|█████▊    | 8631/15001 [5:32:41<3:15:14,  1.84s/it, loss=0.189, lr=1e-5]Steps:  58%|█████▊    | 8631/15001 [5:32:42<3:15:14,  1.84s/it, loss=0.224, lr=1e-5]Steps:  58%|█████▊    | 8632/15001 [5:32:44<3:29:24,  1.97s/it, loss=0.224, lr=1e-5]Steps:  58%|█████▊    | 8632/15001 [5:32:44<3:29:24,  1.97s/it, loss=0.0901, lr=1e-5]Steps:  58%|█████▊    | 8633/15001 [5:32:46<3:40:00,  2.07s/it, loss=0.0901, lr=1e-5]Steps:  58%|█████▊    | 8633/15001 [5:32:46<3:40:00,  2.07s/it, loss=0.223, lr=1e-5] Steps:  58%|█████▊    | 8634/15001 [5:32:48<3:30:06,  1.98s/it, loss=0.223, lr=1e-5]Steps:  58%|█████▊    | 8634/15001 [5:32:48<3:30:06,  1.98s/it, loss=0.0748, lr=1e-5]Steps:  58%|█████▊    | 8635/15001 [5:32:50<3:27:00,  1.95s/it, loss=0.0748, lr=1e-5]Steps:  58%|█████▊    | 8635/15001 [5:32:50<3:27:00,  1.95s/it, loss=0.325, lr=1e-5] Steps:  58%|█████▊    | 8636/15001 [5:32:52<3:27:58,  1.96s/it, loss=0.325, lr=1e-5]Steps:  58%|█████▊    | 8636/15001 [5:32:52<3:27:58,  1.96s/it, loss=0.153, lr=1e-5]Steps:  58%|█████▊    | 8637/15001 [5:32:53<3:25:53,  1.94s/it, loss=0.153, lr=1e-5]Steps:  58%|█████▊    | 8637/15001 [5:32:54<3:25:53,  1.94s/it, loss=0.0544, lr=1e-5]Steps:  58%|█████▊    | 8638/15001 [5:32:55<3:17:39,  1.86s/it, loss=0.0544, lr=1e-5]Steps:  58%|█████▊    | 8638/15001 [5:32:55<3:17:39,  1.86s/it, loss=0.0502, lr=1e-5]Steps:  58%|█████▊    | 8639/15001 [5:32:57<3:13:49,  1.83s/it, loss=0.0502, lr=1e-5]Steps:  58%|█████▊    | 8639/15001 [5:32:57<3:13:49,  1.83s/it, loss=0.172, lr=1e-5] Steps:  58%|█████▊    | 8640/15001 [5:32:59<3:19:02,  1.88s/it, loss=0.172, lr=1e-5]Steps:  58%|█████▊    | 8640/15001 [5:32:59<3:19:02,  1.88s/it, loss=0.139, lr=1e-5]Steps:  58%|█████▊    | 8641/15001 [5:33:01<3:15:20,  1.84s/it, loss=0.139, lr=1e-5]Steps:  58%|█████▊    | 8641/15001 [5:33:01<3:15:20,  1.84s/it, loss=0.234, lr=1e-5]Steps:  58%|█████▊    | 8642/15001 [5:33:02<3:09:40,  1.79s/it, loss=0.234, lr=1e-5]Steps:  58%|█████▊    | 8642/15001 [5:33:03<3:09:40,  1.79s/it, loss=0.108, lr=1e-5]Steps:  58%|█████▊    | 8643/15001 [5:33:04<3:03:47,  1.73s/it, loss=0.108, lr=1e-5]Steps:  58%|█████▊    | 8643/15001 [5:33:05<3:03:47,  1.73s/it, loss=0.114, lr=1e-5]Steps:  58%|█████▊    | 8644/15001 [5:33:06<3:19:52,  1.89s/it, loss=0.114, lr=1e-5]Steps:  58%|█████▊    | 8644/15001 [5:33:06<3:19:52,  1.89s/it, loss=0.154, lr=1e-5]Steps:  58%|█████▊    | 8645/15001 [5:33:08<3:05:04,  1.75s/it, loss=0.154, lr=1e-5]Steps:  58%|█████▊    | 8645/15001 [5:33:08<3:05:04,  1.75s/it, loss=0.181, lr=1e-5]Steps:  58%|█████▊    | 8646/15001 [5:33:10<3:12:37,  1.82s/it, loss=0.181, lr=1e-5]Steps:  58%|█████▊    | 8646/15001 [5:33:10<3:12:37,  1.82s/it, loss=0.245, lr=1e-5]Steps:  58%|█████▊    | 8647/15001 [5:33:12<3:18:25,  1.87s/it, loss=0.245, lr=1e-5]Steps:  58%|█████▊    | 8647/15001 [5:33:12<3:18:25,  1.87s/it, loss=0.22, lr=1e-5] Steps:  58%|█████▊    | 8648/15001 [5:33:13<3:14:42,  1.84s/it, loss=0.22, lr=1e-5]Steps:  58%|█████▊    | 8648/15001 [5:33:14<3:14:42,  1.84s/it, loss=0.0903, lr=1e-5]Steps:  58%|█████▊    | 8649/15001 [5:33:15<3:13:04,  1.82s/it, loss=0.0903, lr=1e-5]Steps:  58%|█████▊    | 8649/15001 [5:33:15<3:13:04,  1.82s/it, loss=0.215, lr=1e-5] Steps:  58%|█████▊    | 8650/15001 [5:33:17<3:15:23,  1.85s/it, loss=0.215, lr=1e-5]Steps:  58%|█████▊    | 8650/15001 [5:33:17<3:15:23,  1.85s/it, loss=0.193, lr=1e-5]Steps:  58%|█████▊    | 8651/15001 [5:33:19<3:13:39,  1.83s/it, loss=0.193, lr=1e-5]Steps:  58%|█████▊    | 8651/15001 [5:33:19<3:13:39,  1.83s/it, loss=0.224, lr=1e-5]Steps:  58%|█████▊    | 8652/15001 [5:33:21<3:19:50,  1.89s/it, loss=0.224, lr=1e-5]Steps:  58%|█████▊    | 8652/15001 [5:33:21<3:19:50,  1.89s/it, loss=0.0278, lr=1e-5]Steps:  58%|█████▊    | 8653/15001 [5:33:23<3:20:18,  1.89s/it, loss=0.0278, lr=1e-5]Steps:  58%|█████▊    | 8653/15001 [5:33:23<3:20:18,  1.89s/it, loss=0.237, lr=1e-5] Steps:  58%|█████▊    | 8654/15001 [5:33:25<3:22:33,  1.91s/it, loss=0.237, lr=1e-5]Steps:  58%|█████▊    | 8654/15001 [5:33:25<3:22:33,  1.91s/it, loss=0.253, lr=1e-5]Steps:  58%|█████▊    | 8655/15001 [5:33:27<3:22:19,  1.91s/it, loss=0.253, lr=1e-5]Steps:  58%|█████▊    | 8655/15001 [5:33:27<3:22:19,  1.91s/it, loss=0.333, lr=1e-5]Steps:  58%|█████▊    | 8656/15001 [5:33:29<3:26:26,  1.95s/it, loss=0.333, lr=1e-5]Steps:  58%|█████▊    | 8656/15001 [5:33:29<3:26:26,  1.95s/it, loss=0.271, lr=1e-5]Steps:  58%|█████▊    | 8657/15001 [5:33:31<3:39:49,  2.08s/it, loss=0.271, lr=1e-5]Steps:  58%|█████▊    | 8657/15001 [5:33:31<3:39:49,  2.08s/it, loss=0.179, lr=1e-5]Steps:  58%|█████▊    | 8658/15001 [5:33:33<3:33:49,  2.02s/it, loss=0.179, lr=1e-5]Steps:  58%|█████▊    | 8658/15001 [5:33:33<3:33:49,  2.02s/it, loss=0.171, lr=1e-5]Steps:  58%|█████▊    | 8659/15001 [5:33:35<3:28:20,  1.97s/it, loss=0.171, lr=1e-5]Steps:  58%|█████▊    | 8659/15001 [5:33:35<3:28:20,  1.97s/it, loss=0.226, lr=1e-5]Steps:  58%|█████▊    | 8660/15001 [5:33:37<3:20:30,  1.90s/it, loss=0.226, lr=1e-5]Steps:  58%|█████▊    | 8660/15001 [5:33:37<3:20:30,  1.90s/it, loss=0.258, lr=1e-5]Steps:  58%|█████▊    | 8661/15001 [5:33:38<3:19:53,  1.89s/it, loss=0.258, lr=1e-5]Steps:  58%|█████▊    | 8661/15001 [5:33:38<3:19:53,  1.89s/it, loss=0.196, lr=1e-5]Steps:  58%|█████▊    | 8662/15001 [5:33:40<3:09:04,  1.79s/it, loss=0.196, lr=1e-5]Steps:  58%|█████▊    | 8662/15001 [5:33:40<3:09:04,  1.79s/it, loss=0.254, lr=1e-5]Steps:  58%|█████▊    | 8663/15001 [5:33:42<3:16:48,  1.86s/it, loss=0.254, lr=1e-5]Steps:  58%|█████▊    | 8663/15001 [5:33:42<3:16:48,  1.86s/it, loss=0.146, lr=1e-5]Steps:  58%|█████▊    | 8664/15001 [5:33:44<3:09:50,  1.80s/it, loss=0.146, lr=1e-5]Steps:  58%|█████▊    | 8664/15001 [5:33:44<3:09:50,  1.80s/it, loss=0.125, lr=1e-5]Steps:  58%|█████▊    | 8665/15001 [5:33:46<3:13:57,  1.84s/it, loss=0.125, lr=1e-5]Steps:  58%|█████▊    | 8665/15001 [5:33:46<3:13:57,  1.84s/it, loss=0.238, lr=1e-5]Steps:  58%|█████▊    | 8666/15001 [5:33:47<3:09:33,  1.80s/it, loss=0.238, lr=1e-5]Steps:  58%|█████▊    | 8666/15001 [5:33:47<3:09:33,  1.80s/it, loss=0.112, lr=1e-5]Steps:  58%|█████▊    | 8667/15001 [5:33:49<3:06:44,  1.77s/it, loss=0.112, lr=1e-5]Steps:  58%|█████▊    | 8667/15001 [5:33:49<3:06:44,  1.77s/it, loss=0.173, lr=1e-5]Steps:  58%|█████▊    | 8668/15001 [5:33:51<3:14:39,  1.84s/it, loss=0.173, lr=1e-5]Steps:  58%|█████▊    | 8668/15001 [5:33:51<3:14:39,  1.84s/it, loss=0.15, lr=1e-5] Steps:  58%|█████▊    | 8669/15001 [5:33:53<3:07:39,  1.78s/it, loss=0.15, lr=1e-5]Steps:  58%|█████▊    | 8669/15001 [5:33:53<3:07:39,  1.78s/it, loss=0.135, lr=1e-5]Steps:  58%|█████▊    | 8670/15001 [5:33:54<3:09:22,  1.79s/it, loss=0.135, lr=1e-5]Steps:  58%|█████▊    | 8670/15001 [5:33:55<3:09:22,  1.79s/it, loss=0.134, lr=1e-5]Steps:  58%|█████▊    | 8671/15001 [5:33:56<3:15:03,  1.85s/it, loss=0.134, lr=1e-5]Steps:  58%|█████▊    | 8671/15001 [5:33:57<3:15:03,  1.85s/it, loss=0.1, lr=1e-5]  Steps:  58%|█████▊    | 8672/15001 [5:33:58<3:17:18,  1.87s/it, loss=0.1, lr=1e-5]Steps:  58%|█████▊    | 8672/15001 [5:33:58<3:17:18,  1.87s/it, loss=0.121, lr=1e-5]Steps:  58%|█████▊    | 8673/15001 [5:34:00<3:11:55,  1.82s/it, loss=0.121, lr=1e-5]Steps:  58%|█████▊    | 8673/15001 [5:34:00<3:11:55,  1.82s/it, loss=0.177, lr=1e-5]Steps:  58%|█████▊    | 8674/15001 [5:34:02<3:11:15,  1.81s/it, loss=0.177, lr=1e-5]Steps:  58%|█████▊    | 8674/15001 [5:34:02<3:11:15,  1.81s/it, loss=0.0742, lr=1e-5]Steps:  58%|█████▊    | 8675/15001 [5:34:03<3:06:13,  1.77s/it, loss=0.0742, lr=1e-5]Steps:  58%|█████▊    | 8675/15001 [5:34:04<3:06:13,  1.77s/it, loss=0.198, lr=1e-5] Steps:  58%|█████▊    | 8676/15001 [5:34:05<3:09:58,  1.80s/it, loss=0.198, lr=1e-5]Steps:  58%|█████▊    | 8676/15001 [5:34:06<3:09:58,  1.80s/it, loss=0.187, lr=1e-5]Steps:  58%|█████▊    | 8677/15001 [5:34:08<3:23:53,  1.93s/it, loss=0.187, lr=1e-5]Steps:  58%|█████▊    | 8677/15001 [5:34:08<3:23:53,  1.93s/it, loss=0.143, lr=1e-5]Steps:  58%|█████▊    | 8678/15001 [5:34:09<3:17:05,  1.87s/it, loss=0.143, lr=1e-5]Steps:  58%|█████▊    | 8678/15001 [5:34:10<3:17:05,  1.87s/it, loss=0.339, lr=1e-5]Steps:  58%|█████▊    | 8679/15001 [5:34:11<3:24:58,  1.95s/it, loss=0.339, lr=1e-5]Steps:  58%|█████▊    | 8679/15001 [5:34:12<3:24:58,  1.95s/it, loss=0.157, lr=1e-5]Steps:  58%|█████▊    | 8680/15001 [5:34:13<3:24:20,  1.94s/it, loss=0.157, lr=1e-5]Steps:  58%|█████▊    | 8680/15001 [5:34:14<3:24:20,  1.94s/it, loss=0.0793, lr=1e-5]Steps:  58%|█████▊    | 8681/15001 [5:34:15<3:26:48,  1.96s/it, loss=0.0793, lr=1e-5]Steps:  58%|█████▊    | 8681/15001 [5:34:16<3:26:48,  1.96s/it, loss=0.234, lr=1e-5] Steps:  58%|█████▊    | 8682/15001 [5:34:17<3:24:34,  1.94s/it, loss=0.234, lr=1e-5]Steps:  58%|█████▊    | 8682/15001 [5:34:17<3:24:34,  1.94s/it, loss=0.0595, lr=1e-5]Steps:  58%|█████▊    | 8683/15001 [5:34:19<3:19:13,  1.89s/it, loss=0.0595, lr=1e-5]Steps:  58%|█████▊    | 8683/15001 [5:34:19<3:19:13,  1.89s/it, loss=0.128, lr=1e-5] Steps:  58%|█████▊    | 8684/15001 [5:34:21<3:18:15,  1.88s/it, loss=0.128, lr=1e-5]Steps:  58%|█████▊    | 8684/15001 [5:34:21<3:18:15,  1.88s/it, loss=0.149, lr=1e-5]Steps:  58%|█████▊    | 8685/15001 [5:34:23<3:17:19,  1.87s/it, loss=0.149, lr=1e-5]Steps:  58%|█████▊    | 8685/15001 [5:34:23<3:17:19,  1.87s/it, loss=0.0675, lr=1e-5]Steps:  58%|█████▊    | 8686/15001 [5:34:25<3:18:56,  1.89s/it, loss=0.0675, lr=1e-5]Steps:  58%|█████▊    | 8686/15001 [5:34:25<3:18:56,  1.89s/it, loss=0.15, lr=1e-5]  Steps:  58%|█████▊    | 8687/15001 [5:34:26<3:13:21,  1.84s/it, loss=0.15, lr=1e-5]Steps:  58%|█████▊    | 8687/15001 [5:34:27<3:13:21,  1.84s/it, loss=0.323, lr=1e-5]Steps:  58%|█████▊    | 8688/15001 [5:34:28<3:07:29,  1.78s/it, loss=0.323, lr=1e-5]Steps:  58%|█████▊    | 8688/15001 [5:34:28<3:07:29,  1.78s/it, loss=0.0746, lr=1e-5]Steps:  58%|█████▊    | 8689/15001 [5:34:30<3:10:15,  1.81s/it, loss=0.0746, lr=1e-5]Steps:  58%|█████▊    | 8689/15001 [5:34:30<3:10:15,  1.81s/it, loss=0.0422, lr=1e-5]Steps:  58%|█████▊    | 8690/15001 [5:34:32<3:09:18,  1.80s/it, loss=0.0422, lr=1e-5]Steps:  58%|█████▊    | 8690/15001 [5:34:32<3:09:18,  1.80s/it, loss=0.0712, lr=1e-5]Steps:  58%|█████▊    | 8691/15001 [5:34:34<3:14:09,  1.85s/it, loss=0.0712, lr=1e-5]Steps:  58%|██��██▊    | 8691/15001 [5:34:34<3:14:09,  1.85s/it, loss=0.124, lr=1e-5] Steps:  58%|█████▊    | 8692/15001 [5:34:36<3:18:25,  1.89s/it, loss=0.124, lr=1e-5]Steps:  58%|█████▊    | 8692/15001 [5:34:36<3:18:25,  1.89s/it, loss=0.163, lr=1e-5]Steps:  58%|█████▊    | 8693/15001 [5:34:37<3:09:32,  1.80s/it, loss=0.163, lr=1e-5]Steps:  58%|█████▊    | 8693/15001 [5:34:38<3:09:32,  1.80s/it, loss=0.193, lr=1e-5]Steps:  58%|█████▊    | 8694/15001 [5:34:39<3:12:27,  1.83s/it, loss=0.193, lr=1e-5]Steps:  58%|█████▊    | 8694/15001 [5:34:39<3:12:27,  1.83s/it, loss=0.256, lr=1e-5]Steps:  58%|█████▊    | 8695/15001 [5:34:41<3:11:06,  1.82s/it, loss=0.256, lr=1e-5]Steps:  58%|█████▊    | 8695/15001 [5:34:41<3:11:06,  1.82s/it, loss=0.199, lr=1e-5]Steps:  58%|█████▊    | 8696/15001 [5:34:43<3:14:16,  1.85s/it, loss=0.199, lr=1e-5]Steps:  58%|█████▊    | 8696/15001 [5:34:43<3:14:16,  1.85s/it, loss=0.244, lr=1e-5]Steps:  58%|█████▊    | 8697/15001 [5:34:45<3:15:21,  1.86s/it, loss=0.244, lr=1e-5]Steps:  58%|█████▊    | 8697/15001 [5:34:45<3:15:21,  1.86s/it, loss=0.233, lr=1e-5]Steps:  58%|█████▊    | 8698/15001 [5:34:47<3:23:00,  1.93s/it, loss=0.233, lr=1e-5]Steps:  58%|█████▊    | 8698/15001 [5:34:47<3:23:00,  1.93s/it, loss=0.151, lr=1e-5]Steps:  58%|█████▊    | 8699/15001 [5:34:49<3:22:57,  1.93s/it, loss=0.151, lr=1e-5]Steps:  58%|█████▊    | 8699/15001 [5:34:49<3:22:57,  1.93s/it, loss=0.0944, lr=1e-5]Steps:  58%|█████▊    | 8700/15001 [5:34:51<3:22:45,  1.93s/it, loss=0.0944, lr=1e-5]Steps:  58%|█████▊    | 8700/15001 [5:34:51<3:22:45,  1.93s/it, loss=0.302, lr=1e-5] Steps:  58%|█████▊    | 8701/15001 [5:34:53<3:20:33,  1.91s/it, loss=0.302, lr=1e-5]Steps:  58%|█████▊    | 8701/15001 [5:34:53<3:20:33,  1.91s/it, loss=0.142, lr=1e-5]Steps:  58%|█████▊    | 8702/15001 [5:34:55<3:26:14,  1.96s/it, loss=0.142, lr=1e-5]Steps:  58%|█████▊    | 8702/15001 [5:34:55<3:26:14,  1.96s/it, loss=0.401, lr=1e-5]Steps:  58%|█████▊    | 8703/15001 [5:34:57<3:31:33,  2.02s/it, loss=0.401, lr=1e-5]Steps:  58%|█████▊    | 8703/15001 [5:34:57<3:31:33,  2.02s/it, loss=0.144, lr=1e-5]Steps:  58%|█████▊    | 8704/15001 [5:34:58<3:17:27,  1.88s/it, loss=0.144, lr=1e-5]Steps:  58%|█████▊    | 8704/15001 [5:34:59<3:17:27,  1.88s/it, loss=0.289, lr=1e-5]Steps:  58%|█████▊    | 8705/15001 [5:35:01<3:26:00,  1.96s/it, loss=0.289, lr=1e-5]Steps:  58%|█████▊    | 8705/15001 [5:35:01<3:26:00,  1.96s/it, loss=0.147, lr=1e-5]Steps:  58%|█████▊    | 8706/15001 [5:35:02<3:16:04,  1.87s/it, loss=0.147, lr=1e-5]Steps:  58%|█████▊    | 8706/15001 [5:35:03<3:16:04,  1.87s/it, loss=0.209, lr=1e-5]Steps:  58%|█████▊    | 8707/15001 [5:35:04<3:20:45,  1.91s/it, loss=0.209, lr=1e-5]Steps:  58%|█████▊    | 8707/15001 [5:35:05<3:20:45,  1.91s/it, loss=0.369, lr=1e-5]Steps:  58%|█████▊    | 8708/15001 [5:35:06<3:30:00,  2.00s/it, loss=0.369, lr=1e-5]Steps:  58%|█████▊    | 8708/15001 [5:35:06<3:30:00,  2.00s/it, loss=0.205, lr=1e-5]Steps:  58%|█████▊    | 8709/15001 [5:35:08<3:23:37,  1.94s/it, loss=0.205, lr=1e-5]Steps:  58%|█████▊    | 8709/15001 [5:35:08<3:23:37,  1.94s/it, loss=0.152, lr=1e-5]Steps:  58%|█████▊    | 8710/15001 [5:35:10<3:16:56,  1.88s/it, loss=0.152, lr=1e-5]Steps:  58%|█████▊    | 8710/15001 [5:35:10<3:16:56,  1.88s/it, loss=0.207, lr=1e-5]Steps:  58%|█████▊    | 8711/15001 [5:35:12<3:17:41,  1.89s/it, loss=0.207, lr=1e-5]Steps:  58%|█████▊    | 8711/15001 [5:35:12<3:17:41,  1.89s/it, loss=0.159, lr=1e-5]Steps:  58%|█████▊    | 8712/15001 [5:35:14<3:16:46,  1.88s/it, loss=0.159, lr=1e-5]Steps:  58%|█████▊    | 8712/15001 [5:35:14<3:16:46,  1.88s/it, loss=0.133, lr=1e-5]Steps:  58%|█████▊    | 8713/15001 [5:35:15<3:07:19,  1.79s/it, loss=0.133, lr=1e-5]Steps:  58%|█████▊    | 8713/15001 [5:35:16<3:07:19,  1.79s/it, loss=0.169, lr=1e-5]Steps:  58%|█████▊    | 8714/15001 [5:35:17<3:08:31,  1.80s/it, loss=0.169, lr=1e-5]Steps:  58%|█████▊    | 8714/15001 [5:35:17<3:08:31,  1.80s/it, loss=0.16, lr=1e-5] Steps:  58%|█████▊    | 8715/15001 [5:35:19<3:13:37,  1.85s/it, loss=0.16, lr=1e-5]Steps:  58%|█████▊    | 8715/15001 [5:35:19<3:13:37,  1.85s/it, loss=0.101, lr=1e-5]Steps:  58%|█████▊    | 8716/15001 [5:35:21<3:11:59,  1.83s/it, loss=0.101, lr=1e-5]Steps:  58%|█████▊    | 8716/15001 [5:35:21<3:11:59,  1.83s/it, loss=0.0718, lr=1e-5]Steps:  58%|█████▊    | 8717/15001 [5:35:22<3:03:16,  1.75s/it, loss=0.0718, lr=1e-5]Steps:  58%|█████▊    | 8717/15001 [5:35:23<3:03:16,  1.75s/it, loss=0.131, lr=1e-5] Steps:  58%|█████▊    | 8718/15001 [5:35:24<3:05:37,  1.77s/it, loss=0.131, lr=1e-5]Steps:  58%|█████▊    | 8718/15001 [5:35:25<3:05:37,  1.77s/it, loss=0.261, lr=1e-5]Steps:  58%|█████▊    | 8719/15001 [5:35:26<3:16:03,  1.87s/it, loss=0.261, lr=1e-5]Steps:  58%|█████▊    | 8719/15001 [5:35:26<3:16:03,  1.87s/it, loss=0.0553, lr=1e-5]Steps:  58%|█████▊    | 8720/15001 [5:35:28<3:09:56,  1.81s/it, loss=0.0553, lr=1e-5]Steps:  58%|█████▊    | 8720/15001 [5:35:28<3:09:56,  1.81s/it, loss=0.233, lr=1e-5] Steps:  58%|█████▊    | 8721/15001 [5:35:30<3:13:41,  1.85s/it, loss=0.233, lr=1e-5]Steps:  58%|█████▊    | 8721/15001 [5:35:30<3:13:41,  1.85s/it, loss=0.214, lr=1e-5]Steps:  58%|█████▊    | 8722/15001 [5:35:32<3:19:29,  1.91s/it, loss=0.214, lr=1e-5]Steps:  58%|█████▊    | 8722/15001 [5:35:32<3:19:29,  1.91s/it, loss=0.144, lr=1e-5]Steps:  58%|█████▊    | 8723/15001 [5:35:34<3:17:18,  1.89s/it, loss=0.144, lr=1e-5]Steps:  58%|█████▊    | 8723/15001 [5:35:34<3:17:18,  1.89s/it, loss=0.247, lr=1e-5]Steps:  58%|█████▊    | 8724/15001 [5:35:36<3:21:06,  1.92s/it, loss=0.247, lr=1e-5]Steps:  58%|█████▊    | 8724/15001 [5:35:36<3:21:06,  1.92s/it, loss=0.24, lr=1e-5] Steps:  58%|█████▊    | 8725/15001 [5:35:38<3:23:04,  1.94s/it, loss=0.24, lr=1e-5]Steps:  58%|█████▊    | 8725/15001 [5:35:38<3:23:04,  1.94s/it, loss=0.216, lr=1e-5]Steps:  58%|█████▊    | 8726/15001 [5:35:40<3:26:28,  1.97s/it, loss=0.216, lr=1e-5]Steps:  58%|█████▊    | 8726/15001 [5:35:40<3:26:28,  1.97s/it, loss=0.156, lr=1e-5]Steps:  58%|█████▊    | 8727/15001 [5:35:42<3:24:10,  1.95s/it, loss=0.156, lr=1e-5]Steps:  58%|█████▊    | 8727/15001 [5:35:42<3:24:10,  1.95s/it, loss=0.194, lr=1e-5]Steps:  58%|█████▊    | 8728/15001 [5:35:43<3:06:29,  1.78s/it, loss=0.194, lr=1e-5]Steps:  58%|█████▊    | 8728/15001 [5:35:44<3:06:29,  1.78s/it, loss=0.176, lr=1e-5]Steps:  58%|█████▊    | 8729/15001 [5:35:45<3:23:00,  1.94s/it, loss=0.176, lr=1e-5]Steps:  58%|█████▊    | 8729/15001 [5:35:46<3:23:00,  1.94s/it, loss=0.184, lr=1e-5]Steps:  58%|█████▊    | 8730/15001 [5:35:47<3:14:23,  1.86s/it, loss=0.184, lr=1e-5]Steps:  58%|█████▊    | 8730/15001 [5:35:47<3:14:23,  1.86s/it, loss=0.301, lr=1e-5]Steps:  58%|█████▊    | 8731/15001 [5:35:49<3:14:19,  1.86s/it, loss=0.301, lr=1e-5]Steps:  58%|█████▊    | 8731/15001 [5:35:49<3:14:19,  1.86s/it, loss=0.176, lr=1e-5]Steps:  58%|█████▊    | 8732/15001 [5:35:51<3:17:42,  1.89s/it, loss=0.176, lr=1e-5]Steps:  58%|█████▊    | 8732/15001 [5:35:51<3:17:42,  1.89s/it, loss=0.114, lr=1e-5]Steps:  58%|█████▊    | 8733/15001 [5:35:53<3:07:07,  1.79s/it, loss=0.114, lr=1e-5]Steps:  58%|█████▊    | 8733/15001 [5:35:53<3:07:07,  1.79s/it, loss=0.234, lr=1e-5]Steps:  58%|█████▊    | 8734/15001 [5:35:54<3:11:56,  1.84s/it, loss=0.234, lr=1e-5]Steps:  58%|█████▊    | 8734/15001 [5:35:55<3:11:56,  1.84s/it, loss=0.42, lr=1e-5] Steps:  58%|█████▊    | 8735/15001 [5:35:56<3:14:11,  1.86s/it, loss=0.42, lr=1e-5]Steps:  58%|█████▊    | 8735/15001 [5:35:57<3:14:11,  1.86s/it, loss=0.125, lr=1e-5]Steps:  58%|█████▊    | 8736/15001 [5:35:58<3:16:50,  1.89s/it, loss=0.125, lr=1e-5]Steps:  58%|█████▊    | 8736/15001 [5:35:59<3:16:50,  1.89s/it, loss=0.0955, lr=1e-5]Steps:  58%|█████▊    | 8737/15001 [5:36:00<3:12:38,  1.85s/it, loss=0.0955, lr=1e-5]Steps:  58%|█████▊    | 8737/15001 [5:36:00<3:12:38,  1.85s/it, loss=0.209, lr=1e-5] Steps:  58%|█████▊    | 8738/15001 [5:36:02<3:11:49,  1.84s/it, loss=0.209, lr=1e-5]Steps:  58%|█████▊    | 8738/15001 [5:36:02<3:11:49,  1.84s/it, loss=0.103, lr=1e-5]Steps:  58%|█████▊    | 8739/15001 [5:36:04<3:05:18,  1.78s/it, loss=0.103, lr=1e-5]Steps:  58%|█████▊    | 8739/15001 [5:36:04<3:05:18,  1.78s/it, loss=0.176, lr=1e-5]Steps:  58%|█████▊    | 8740/15001 [5:36:05<3:04:00,  1.76s/it, loss=0.176, lr=1e-5]Steps:  58%|█████▊    | 8740/15001 [5:36:06<3:04:00,  1.76s/it, loss=0.276, lr=1e-5]Steps:  58%|█████▊    | 8741/15001 [5:36:07<3:16:49,  1.89s/it, loss=0.276, lr=1e-5]Steps:  58%|█████▊    | 8741/15001 [5:36:08<3:16:49,  1.89s/it, loss=0.212, lr=1e-5]Steps:  58%|█████▊    | 8742/15001 [5:36:09<3:14:52,  1.87s/it, loss=0.212, lr=1e-5]Steps:  58%|█████▊    | 8742/15001 [5:36:09<3:14:52,  1.87s/it, loss=0.246, lr=1e-5]Steps:  58%|█████▊    | 8743/15001 [5:36:11<2:59:50,  1.72s/it, loss=0.246, lr=1e-5]Steps:  58%|█████▊    | 8743/15001 [5:36:11<2:59:50,  1.72s/it, loss=0.0924, lr=1e-5]Steps:  58%|█████▊    | 8744/15001 [5:36:13<3:21:12,  1.93s/it, loss=0.0924, lr=1e-5]Steps:  58%|█████▊    | 8744/15001 [5:36:13<3:21:12,  1.93s/it, loss=0.13, lr=1e-5]  Steps:  58%|█████▊    | 8745/15001 [5:36:15<3:21:31,  1.93s/it, loss=0.13, lr=1e-5]Steps:  58%|█████▊    | 8745/15001 [5:36:15<3:21:31,  1.93s/it, loss=0.199, lr=1e-5]Steps:  58%|█████▊    | 8746/15001 [5:36:17<3:30:05,  2.02s/it, loss=0.199, lr=1e-5]Steps:  58%|█████▊    | 8746/15001 [5:36:17<3:30:05,  2.02s/it, loss=0.229, lr=1e-5]Steps:  58%|█████▊    | 8747/15001 [5:36:19<3:24:34,  1.96s/it, loss=0.229, lr=1e-5]Steps:  58%|█████▊    | 8747/15001 [5:36:19<3:24:34,  1.96s/it, loss=0.0718, lr=1e-5]Steps:  58%|█████▊    | 8748/15001 [5:36:21<3:27:04,  1.99s/it, loss=0.0718, lr=1e-5]Steps:  58%|█████▊    | 8748/15001 [5:36:21<3:27:04,  1.99s/it, loss=0.181, lr=1e-5] Steps:  58%|█████▊    | 8749/15001 [5:36:23<3:31:29,  2.03s/it, loss=0.181, lr=1e-5]Steps:  58%|█████▊    | 8749/15001 [5:36:23<3:31:29,  2.03s/it, loss=0.286, lr=1e-5]Steps:  58%|█████▊    | 8750/15001 [5:36:25<3:30:18,  2.02s/it, loss=0.286, lr=1e-5]Steps:  58%|█████▊    | 8750/15001 [5:36:25<3:30:18,  2.02s/it, loss=0.0644, lr=1e-5]Steps:  58%|█████▊    | 8751/15001 [5:36:27<3:21:53,  1.94s/it, loss=0.0644, lr=1e-5]Steps:  58%|█████▊    | 8751/15001 [5:36:27<3:21:53,  1.94s/it, loss=0.168, lr=1e-5] Steps:  58%|█████▊    | 8752/15001 [5:36:29<3:16:51,  1.89s/it, loss=0.168, lr=1e-5]Steps:  58%|█████▊    | 8752/15001 [5:36:29<3:16:51,  1.89s/it, loss=0.0709, lr=1e-5]Steps:  58%|█████▊    | 8753/15001 [5:36:30<3:07:51,  1.80s/it, loss=0.0709, lr=1e-5]Steps:  58%|█████▊    | 8753/15001 [5:36:31<3:07:51,  1.80s/it, loss=0.0828, lr=1e-5]Steps:  58%|█████▊    | 8754/15001 [5:36:32<3:12:25,  1.85s/it, loss=0.0828, lr=1e-5]Steps:  58%|█████▊    | 8754/15001 [5:36:32<3:12:25,  1.85s/it, loss=0.0513, lr=1e-5]Steps:  58%|█████▊    | 8755/15001 [5:36:34<3:16:39,  1.89s/it, loss=0.0513, lr=1e-5]Steps:  58%|█████▊    | 8755/15001 [5:36:34<3:16:39,  1.89s/it, loss=0.0711, lr=1e-5]Steps:  58%|█████▊    | 8756/15001 [5:36:36<3:09:10,  1.82s/it, loss=0.0711, lr=1e-5]Steps:  58%|█████▊    | 8756/15001 [5:36:36<3:09:10,  1.82s/it, loss=0.0517, lr=1e-5]Steps:  58%|█████▊    | 8757/15001 [5:36:38<3:06:26,  1.79s/it, loss=0.0517, lr=1e-5]Steps:  58%|█████▊    | 8757/15001 [5:36:38<3:06:26,  1.79s/it, loss=0.197, lr=1e-5] Steps:  58%|█████▊    | 8758/15001 [5:36:40<3:12:56,  1.85s/it, loss=0.197, lr=1e-5]Steps:  58%|█████▊    | 8758/15001 [5:36:40<3:12:56,  1.85s/it, loss=0.299, lr=1e-5]Steps:  58%|█████▊    | 8759/15001 [5:36:41<3:07:08,  1.80s/it, loss=0.299, lr=1e-5]Steps:  58%|█████▊    | 8759/15001 [5:36:42<3:07:08,  1.80s/it, loss=0.204, lr=1e-5]Steps:  58%|█████▊    | 8760/15001 [5:36:43<3:15:00,  1.87s/it, loss=0.204, lr=1e-5]Steps:  58%|█████▊    | 8760/15001 [5:36:43<3:15:00,  1.87s/it, loss=0.225, lr=1e-5]Steps:  58%|█████▊    | 8761/15001 [5:36:45<3:07:01,  1.80s/it, loss=0.225, lr=1e-5]Steps:  58%|█████▊    | 8761/15001 [5:36:45<3:07:01,  1.80s/it, loss=0.0474, lr=1e-5]Steps:  58%|█████▊    | 8762/15001 [5:36:47<3:08:35,  1.81s/it, loss=0.0474, lr=1e-5]Steps:  58%|█████▊    | 8762/15001 [5:36:47<3:08:35,  1.81s/it, loss=0.0549, lr=1e-5]Steps:  58%|█████▊    | 8763/15001 [5:36:49<3:10:58,  1.84s/it, loss=0.0549, lr=1e-5]Steps:  58%|█████▊    | 8763/15001 [5:36:49<3:10:58,  1.84s/it, loss=0.145, lr=1e-5] Steps:  58%|█████▊    | 8764/15001 [5:36:51<3:09:43,  1.83s/it, loss=0.145, lr=1e-5]Steps:  58%|█████▊    | 8764/15001 [5:36:51<3:09:43,  1.83s/it, loss=0.0482, lr=1e-5]Steps:  58%|█████▊    | 8765/15001 [5:36:52<3:01:25,  1.75s/it, loss=0.0482, lr=1e-5]Steps:  58%|█████▊    | 8765/15001 [5:36:52<3:01:25,  1.75s/it, loss=0.148, lr=1e-5] Steps:  58%|█████▊    | 8766/15001 [5:36:54<3:11:00,  1.84s/it, loss=0.148, lr=1e-5]Steps:  58%|█████▊    | 8766/15001 [5:36:54<3:11:00,  1.84s/it, loss=0.208, lr=1e-5]Steps:  58%|█████▊    | 8767/15001 [5:36:56<3:16:04,  1.89s/it, loss=0.208, lr=1e-5]Steps:  58%|█████▊    | 8767/15001 [5:36:56<3:16:04,  1.89s/it, loss=0.0804, lr=1e-5]Steps:  58%|█████▊    | 8768/15001 [5:36:58<3:12:36,  1.85s/it, loss=0.0804, lr=1e-5]Steps:  58%|█████▊    | 8768/15001 [5:36:58<3:12:36,  1.85s/it, loss=0.145, lr=1e-5] Steps:  58%|█████▊    | 8769/15001 [5:37:00<3:18:21,  1.91s/it, loss=0.145, lr=1e-5]Steps:  58%|█████▊    | 8769/15001 [5:37:00<3:18:21,  1.91s/it, loss=0.114, lr=1e-5]Steps:  58%|█████▊    | 8770/15001 [5:37:02<3:25:54,  1.98s/it, loss=0.114, lr=1e-5]Steps:  58%|��████▊    | 8770/15001 [5:37:02<3:25:54,  1.98s/it, loss=0.227, lr=1e-5]Steps:  58%|█████▊    | 8771/15001 [5:37:04<3:31:23,  2.04s/it, loss=0.227, lr=1e-5]Steps:  58%|█████▊    | 8771/15001 [5:37:04<3:31:23,  2.04s/it, loss=0.103, lr=1e-5]Steps:  58%|█████▊    | 8772/15001 [5:37:06<3:18:57,  1.92s/it, loss=0.103, lr=1e-5]Steps:  58%|█████▊    | 8772/15001 [5:37:06<3:18:57,  1.92s/it, loss=0.0827, lr=1e-5]Steps:  58%|█████▊    | 8773/15001 [5:37:08<3:22:27,  1.95s/it, loss=0.0827, lr=1e-5]Steps:  58%|█████▊    | 8773/15001 [5:37:08<3:22:27,  1.95s/it, loss=0.234, lr=1e-5] Steps:  58%|█████▊    | 8774/15001 [5:37:10<3:23:22,  1.96s/it, loss=0.234, lr=1e-5]Steps:  58%|█████▊    | 8774/15001 [5:37:10<3:23:22,  1.96s/it, loss=0.0711, lr=1e-5]Steps:  58%|█████▊    | 8775/15001 [5:37:12<3:18:00,  1.91s/it, loss=0.0711, lr=1e-5]Steps:  58%|█████▊    | 8775/15001 [5:37:12<3:18:00,  1.91s/it, loss=0.138, lr=1e-5] Steps:  59%|█████▊    | 8776/15001 [5:37:13<3:09:11,  1.82s/it, loss=0.138, lr=1e-5]Steps:  59%|█████▊    | 8776/15001 [5:37:14<3:09:11,  1.82s/it, loss=0.28, lr=1e-5] Steps:  59%|█████▊    | 8777/15001 [5:37:15<3:04:57,  1.78s/it, loss=0.28, lr=1e-5]Steps:  59%|█████▊    | 8777/15001 [5:37:16<3:04:57,  1.78s/it, loss=0.0126, lr=1e-5]Steps:  59%|█████▊    | 8778/15001 [5:37:17<3:10:09,  1.83s/it, loss=0.0126, lr=1e-5]Steps:  59%|█████▊    | 8778/15001 [5:37:17<3:10:09,  1.83s/it, loss=0.441, lr=1e-5] Steps:  59%|█████▊    | 8779/15001 [5:37:19<3:17:46,  1.91s/it, loss=0.441, lr=1e-5]Steps:  59%|█████▊    | 8779/15001 [5:37:19<3:17:46,  1.91s/it, loss=0.179, lr=1e-5]Steps:  59%|█████▊    | 8780/15001 [5:37:21<3:09:31,  1.83s/it, loss=0.179, lr=1e-5]Steps:  59%|█████▊    | 8780/15001 [5:37:21<3:09:31,  1.83s/it, loss=0.274, lr=1e-5]Steps:  59%|█████▊    | 8781/15001 [5:37:22<3:03:02,  1.77s/it, loss=0.274, lr=1e-5]Steps:  59%|█████▊    | 8781/15001 [5:37:23<3:03:02,  1.77s/it, loss=0.153, lr=1e-5]Steps:  59%|█████▊    | 8782/15001 [5:37:24<3:10:16,  1.84s/it, loss=0.153, lr=1e-5]Steps:  59%|█████▊    | 8782/15001 [5:37:25<3:10:16,  1.84s/it, loss=0.305, lr=1e-5]Steps:  59%|█████▊    | 8783/15001 [5:37:26<3:07:52,  1.81s/it, loss=0.305, lr=1e-5]Steps:  59%|█████▊    | 8783/15001 [5:37:26<3:07:52,  1.81s/it, loss=0.0833, lr=1e-5]Steps:  59%|█████▊    | 8784/15001 [5:37:28<3:12:56,  1.86s/it, loss=0.0833, lr=1e-5]Steps:  59%|█████▊    | 8784/15001 [5:37:28<3:12:56,  1.86s/it, loss=0.211, lr=1e-5] Steps:  59%|█████▊    | 8785/15001 [5:37:30<3:05:16,  1.79s/it, loss=0.211, lr=1e-5]Steps:  59%|█████▊    | 8785/15001 [5:37:30<3:05:16,  1.79s/it, loss=0.0384, lr=1e-5]Steps:  59%|█████▊    | 8786/15001 [5:37:32<3:05:39,  1.79s/it, loss=0.0384, lr=1e-5]Steps:  59%|█████▊    | 8786/15001 [5:37:32<3:05:39,  1.79s/it, loss=0.0192, lr=1e-5]Steps:  59%|█████▊    | 8787/15001 [5:37:33<3:06:39,  1.80s/it, loss=0.0192, lr=1e-5]Steps:  59%|█████▊    | 8787/15001 [5:37:34<3:06:39,  1.80s/it, loss=0.295, lr=1e-5] Steps:  59%|█████▊    | 8788/15001 [5:37:35<3:10:41,  1.84s/it, loss=0.295, lr=1e-5]Steps:  59%|█████▊    | 8788/15001 [5:37:35<3:10:41,  1.84s/it, loss=0.346, lr=1e-5]Steps:  59%|█████▊    | 8789/15001 [5:37:37<3:12:10,  1.86s/it, loss=0.346, lr=1e-5]Steps:  59%|█████▊    | 8789/15001 [5:37:37<3:12:10,  1.86s/it, loss=0.275, lr=1e-5]Steps:  59%|█████▊    | 8790/15001 [5:37:39<3:07:41,  1.81s/it, loss=0.275, lr=1e-5]Steps:  59%|█████▊    | 8790/15001 [5:37:39<3:07:41,  1.81s/it, loss=0.18, lr=1e-5] Steps:  59%|█████▊    | 8791/15001 [5:37:41<3:25:13,  1.98s/it, loss=0.18, lr=1e-5]Steps:  59%|█████▊    | 8791/15001 [5:37:41<3:25:13,  1.98s/it, loss=0.0396, lr=1e-5]Steps:  59%|█████▊    | 8792/15001 [5:37:43<3:23:26,  1.97s/it, loss=0.0396, lr=1e-5]Steps:  59%|█████▊    | 8792/15001 [5:37:43<3:23:26,  1.97s/it, loss=0.169, lr=1e-5] Steps:  59%|█████▊    | 8793/15001 [5:37:45<3:23:23,  1.97s/it, loss=0.169, lr=1e-5]Steps:  59%|█████▊    | 8793/15001 [5:37:45<3:23:23,  1.97s/it, loss=0.0533, lr=1e-5]Steps:  59%|█████▊    | 8794/15001 [5:37:47<3:24:32,  1.98s/it, loss=0.0533, lr=1e-5]Steps:  59%|█████▊    | 8794/15001 [5:37:47<3:24:32,  1.98s/it, loss=0.435, lr=1e-5] Steps:  59%|█████▊    | 8795/15001 [5:37:49<3:20:56,  1.94s/it, loss=0.435, lr=1e-5]Steps:  59%|█████▊    | 8795/15001 [5:37:49<3:20:56,  1.94s/it, loss=0.197, lr=1e-5]Steps:  59%|█████▊    | 8796/15001 [5:37:52<3:50:28,  2.23s/it, loss=0.197, lr=1e-5]Steps:  59%|█████▊    | 8796/15001 [5:37:52<3:50:28,  2.23s/it, loss=0.106, lr=1e-5]Steps:  59%|█████▊    | 8797/15001 [5:37:53<3:30:39,  2.04s/it, loss=0.106, lr=1e-5]Steps:  59%|█████▊    | 8797/15001 [5:37:54<3:30:39,  2.04s/it, loss=0.0445, lr=1e-5]Steps:  59%|█████▊    | 8798/15001 [5:37:55<3:20:09,  1.94s/it, loss=0.0445, lr=1e-5]Steps:  59%|█████▊    | 8798/15001 [5:37:55<3:20:09,  1.94s/it, loss=0.418, lr=1e-5] Steps:  59%|█████▊    | 8799/15001 [5:37:57<3:12:16,  1.86s/it, loss=0.418, lr=1e-5]Steps:  59%|█████▊    | 8799/15001 [5:37:57<3:12:16,  1.86s/it, loss=0.253, lr=1e-5]Steps:  59%|█████▊    | 8800/15001 [5:37:59<3:08:08,  1.82s/it, loss=0.253, lr=1e-5]Steps:  59%|█████▊    | 8800/15001 [5:37:59<3:08:08,  1.82s/it, loss=0.182, lr=1e-5]Steps:  59%|█████▊    | 8801/15001 [5:38:01<3:15:03,  1.89s/it, loss=0.182, lr=1e-5]Steps:  59%|█████▊    | 8801/15001 [5:38:01<3:15:03,  1.89s/it, loss=0.316, lr=1e-5]Steps:  59%|█████▊    | 8802/15001 [5:38:02<3:04:11,  1.78s/it, loss=0.316, lr=1e-5]Steps:  59%|█████▊    | 8802/15001 [5:38:02<3:04:11,  1.78s/it, loss=0.153, lr=1e-5]Steps:  59%|█████▊    | 8803/15001 [5:38:04<3:05:30,  1.80s/it, loss=0.153, lr=1e-5]Steps:  59%|█████▊    | 8803/15001 [5:38:04<3:05:30,  1.80s/it, loss=0.0559, lr=1e-5]Steps:  59%|█████▊    | 8804/15001 [5:38:06<3:07:41,  1.82s/it, loss=0.0559, lr=1e-5]Steps:  59%|█████▊    | 8804/15001 [5:38:06<3:07:41,  1.82s/it, loss=0.154, lr=1e-5] Steps:  59%|█████▊    | 8805/15001 [5:38:08<3:12:33,  1.86s/it, loss=0.154, lr=1e-5]Steps:  59%|█████▊    | 8805/15001 [5:38:08<3:12:33,  1.86s/it, loss=0.126, lr=1e-5]Steps:  59%|█████▊    | 8806/15001 [5:38:10<3:08:07,  1.82s/it, loss=0.126, lr=1e-5]Steps:  59%|█████▊    | 8806/15001 [5:38:10<3:08:07,  1.82s/it, loss=0.151, lr=1e-5]Steps:  59%|█████▊    | 8807/15001 [5:38:11<3:05:51,  1.80s/it, loss=0.151, lr=1e-5]Steps:  59%|█████▊    | 8807/15001 [5:38:12<3:05:51,  1.80s/it, loss=0.152, lr=1e-5]Steps:  59%|█████▊    | 8808/15001 [5:38:13<3:06:01,  1.80s/it, loss=0.152, lr=1e-5]Steps:  59%|█████▊    | 8808/15001 [5:38:13<3:06:01,  1.80s/it, loss=0.123, lr=1e-5]Steps:  59%|█████▊    | 8809/15001 [5:38:15<3:04:54,  1.79s/it, loss=0.123, lr=1e-5]Steps:  59%|█████▊    | 8809/15001 [5:38:15<3:04:54,  1.79s/it, loss=0.196, lr=1e-5]Steps:  59%|█████▊    | 8810/15001 [5:38:17<3:06:08,  1.80s/it, loss=0.196, lr=1e-5]Steps:  59%|█████▊    | 8810/15001 [5:38:17<3:06:08,  1.80s/it, loss=0.0992, lr=1e-5]Steps:  59%|█████▊    | 8811/15001 [5:38:19<3:09:52,  1.84s/it, loss=0.0992, lr=1e-5]Steps:  59%|█████▊    | 8811/15001 [5:38:19<3:09:52,  1.84s/it, loss=0.144, lr=1e-5] Steps:  59%|█████▊    | 8812/15001 [5:38:21<3:12:06,  1.86s/it, loss=0.144, lr=1e-5]Steps:  59%|█████▊    | 8812/15001 [5:38:21<3:12:06,  1.86s/it, loss=0.2, lr=1e-5]  Steps:  59%|█████▊    | 8813/15001 [5:38:23<3:14:06,  1.88s/it, loss=0.2, lr=1e-5]Steps:  59%|█████▊    | 8813/15001 [5:38:23<3:14:06,  1.88s/it, loss=0.0859, lr=1e-5]Steps:  59%|█████▉    | 8814/15001 [5:38:25<3:21:59,  1.96s/it, loss=0.0859, lr=1e-5]Steps:  59%|█████▉    | 8814/15001 [5:38:25<3:21:59,  1.96s/it, loss=0.164, lr=1e-5] Steps:  59%|█████▉    | 8815/15001 [5:38:27<3:23:18,  1.97s/it, loss=0.164, lr=1e-5]Steps:  59%|█████▉    | 8815/15001 [5:38:27<3:23:18,  1.97s/it, loss=0.124, lr=1e-5]Steps:  59%|█████▉    | 8816/15001 [5:38:29<3:22:07,  1.96s/it, loss=0.124, lr=1e-5]Steps:  59%|█████▉    | 8816/15001 [5:38:29<3:22:07,  1.96s/it, loss=0.21, lr=1e-5] Steps:  59%|█████▉    | 8817/15001 [5:38:30<3:19:44,  1.94s/it, loss=0.21, lr=1e-5]Steps:  59%|█████▉    | 8817/15001 [5:38:31<3:19:44,  1.94s/it, loss=0.0491, lr=1e-5]Steps:  59%|█████▉    | 8818/15001 [5:38:32<3:18:20,  1.92s/it, loss=0.0491, lr=1e-5]Steps:  59%|█████▉    | 8818/15001 [5:38:33<3:18:20,  1.92s/it, loss=0.0502, lr=1e-5]Steps:  59%|█████▉    | 8819/15001 [5:38:34<3:22:27,  1.96s/it, loss=0.0502, lr=1e-5]Steps:  59%|█████▉    | 8819/15001 [5:38:35<3:22:27,  1.96s/it, loss=0.385, lr=1e-5] Steps:  59%|█████▉    | 8820/15001 [5:38:36<3:18:51,  1.93s/it, loss=0.385, lr=1e-5]Steps:  59%|█████▉    | 8820/15001 [5:38:36<3:18:51,  1.93s/it, loss=0.111, lr=1e-5]Steps:  59%|█████▉    | 8821/15001 [5:38:38<3:05:19,  1.80s/it, loss=0.111, lr=1e-5]Steps:  59%|█████▉    | 8821/15001 [5:38:38<3:05:19,  1.80s/it, loss=0.0566, lr=1e-5]Steps:  59%|█████▉    | 8822/15001 [5:38:40<3:15:33,  1.90s/it, loss=0.0566, lr=1e-5]Steps:  59%|█████▉    | 8822/15001 [5:38:40<3:15:33,  1.90s/it, loss=0.0785, lr=1e-5]Steps:  59%|█████▉    | 8823/15001 [5:38:41<3:03:54,  1.79s/it, loss=0.0785, lr=1e-5]Steps:  59%|█████▉    | 8823/15001 [5:38:42<3:03:54,  1.79s/it, loss=0.305, lr=1e-5] Steps:  59%|█████▉    | 8824/15001 [5:38:43<3:06:12,  1.81s/it, loss=0.305, lr=1e-5]Steps:  59%|█████▉    | 8824/15001 [5:38:44<3:06:12,  1.81s/it, loss=0.202, lr=1e-5]Steps:  59%|█████▉    | 8825/15001 [5:38:45<3:09:23,  1.84s/it, loss=0.202, lr=1e-5]Steps:  59%|█████▉    | 8825/15001 [5:38:46<3:09:23,  1.84s/it, loss=0.113, lr=1e-5]Steps:  59%|█████▉    | 8826/15001 [5:38:47<3:15:03,  1.90s/it, loss=0.113, lr=1e-5]Steps:  59%|█████▉    | 8826/15001 [5:38:47<3:15:03,  1.90s/it, loss=0.151, lr=1e-5]Steps:  59%|█████▉    | 8827/15001 [5:38:49<3:07:12,  1.82s/it, loss=0.151, lr=1e-5]Steps:  59%|█████▉    | 8827/15001 [5:38:49<3:07:12,  1.82s/it, loss=0.373, lr=1e-5]Steps:  59%|█████▉    | 8828/15001 [5:38:51<3:09:18,  1.84s/it, loss=0.373, lr=1e-5]Steps:  59%|█████▉    | 8828/15001 [5:38:51<3:09:18,  1.84s/it, loss=0.104, lr=1e-5]Steps:  59%|█████▉    | 8829/15001 [5:38:52<3:03:49,  1.79s/it, loss=0.104, lr=1e-5]Steps:  59%|█████▉    | 8829/15001 [5:38:53<3:03:49,  1.79s/it, loss=0.295, lr=1e-5]Steps:  59%|█████▉    | 8830/15001 [5:38:54<3:09:14,  1.84s/it, loss=0.295, lr=1e-5]Steps:  59%|█████▉    | 8830/15001 [5:38:55<3:09:14,  1.84s/it, loss=0.0759, lr=1e-5]Steps:  59%|█████▉    | 8831/15001 [5:38:56<3:06:39,  1.82s/it, loss=0.0759, lr=1e-5]Steps:  59%|█████▉    | 8831/15001 [5:38:56<3:06:39,  1.82s/it, loss=0.19, lr=1e-5]  Steps:  59%|█████▉    | 8832/15001 [5:38:58<3:07:26,  1.82s/it, loss=0.19, lr=1e-5]Steps:  59%|█████▉    | 8832/15001 [5:38:58<3:07:26,  1.82s/it, loss=0.0956, lr=1e-5]Steps:  59%|█████▉    | 8833/15001 [5:39:00<3:14:00,  1.89s/it, loss=0.0956, lr=1e-5]Steps:  59%|█████▉    | 8833/15001 [5:39:00<3:14:00,  1.89s/it, loss=0.098, lr=1e-5] Steps:  59%|█████▉    | 8834/15001 [5:39:02<3:07:07,  1.82s/it, loss=0.098, lr=1e-5]Steps:  59%|█████▉    | 8834/15001 [5:39:02<3:07:07,  1.82s/it, loss=0.256, lr=1e-5]Steps:  59%|█████▉    | 8835/15001 [5:39:04<3:09:59,  1.85s/it, loss=0.256, lr=1e-5]Steps:  59%|█████▉    | 8835/15001 [5:39:04<3:09:59,  1.85s/it, loss=0.172, lr=1e-5]Steps:  59%|█████▉    | 8836/15001 [5:39:06<3:16:10,  1.91s/it, loss=0.172, lr=1e-5]Steps:  59%|█████▉    | 8836/15001 [5:39:06<3:16:10,  1.91s/it, loss=0.185, lr=1e-5]Steps:  59%|█████▉    | 8837/15001 [5:39:08<3:24:26,  1.99s/it, loss=0.185, lr=1e-5]Steps:  59%|█████▉    | 8837/15001 [5:39:08<3:24:26,  1.99s/it, loss=0.0712, lr=1e-5]Steps:  59%|█████▉    | 8838/15001 [5:39:10<3:22:43,  1.97s/it, loss=0.0712, lr=1e-5]Steps:  59%|█████▉    | 8838/15001 [5:39:10<3:22:43,  1.97s/it, loss=0.11, lr=1e-5]  Steps:  59%|█████▉    | 8839/15001 [5:39:12<3:26:22,  2.01s/it, loss=0.11, lr=1e-5]Steps:  59%|█████▉    | 8839/15001 [5:39:12<3:26:22,  2.01s/it, loss=0.127, lr=1e-5]Steps:  59%|█████▉    | 8840/15001 [5:39:14<3:24:24,  1.99s/it, loss=0.127, lr=1e-5]Steps:  59%|█████▉    | 8840/15001 [5:39:14<3:24:24,  1.99s/it, loss=0.144, lr=1e-5]Steps:  59%|█████▉    | 8841/15001 [5:39:16<3:17:14,  1.92s/it, loss=0.144, lr=1e-5]Steps:  59%|█████▉    | 8841/15001 [5:39:16<3:17:14,  1.92s/it, loss=0.0901, lr=1e-5]Steps:  59%|█████▉    | 8842/15001 [5:39:17<3:07:47,  1.83s/it, loss=0.0901, lr=1e-5]Steps:  59%|█████▉    | 8842/15001 [5:39:17<3:07:47,  1.83s/it, loss=0.237, lr=1e-5] Steps:  59%|█████▉    | 8843/15001 [5:39:19<3:11:10,  1.86s/it, loss=0.237, lr=1e-5]Steps:  59%|█████▉    | 8843/15001 [5:39:19<3:11:10,  1.86s/it, loss=0.147, lr=1e-5]Steps:  59%|█████▉    | 8844/15001 [5:39:21<3:06:48,  1.82s/it, loss=0.147, lr=1e-5]Steps:  59%|█████▉    | 8844/15001 [5:39:21<3:06:48,  1.82s/it, loss=0.101, lr=1e-5]Steps:  59%|█████▉    | 8845/15001 [5:39:23<3:13:31,  1.89s/it, loss=0.101, lr=1e-5]Steps:  59%|█████▉    | 8845/15001 [5:39:23<3:13:31,  1.89s/it, loss=0.14, lr=1e-5] Steps:  59%|█████▉    | 8846/15001 [5:39:25<3:12:21,  1.88s/it, loss=0.14, lr=1e-5]Steps:  59%|█████▉    | 8846/15001 [5:39:25<3:12:21,  1.88s/it, loss=0.0994, lr=1e-5]Steps:  59%|█████▉    | 8847/15001 [5:39:27<3:11:05,  1.86s/it, loss=0.0994, lr=1e-5]Steps:  59%|█████▉    | 8847/15001 [5:39:27<3:11:05,  1.86s/it, loss=0.181, lr=1e-5] Steps:  59%|█████▉    | 8848/15001 [5:39:28<3:11:41,  1.87s/it, loss=0.181, lr=1e-5]Steps:  59%|█████▉    | 8848/15001 [5:39:29<3:11:41,  1.87s/it, loss=0.114, lr=1e-5]Steps:  59%|█████▉    | 8849/15001 [5:39:30<3:02:04,  1.78s/it, loss=0.114, lr=1e-5]Steps:  59%|█████▉    | 8849/15001 [5:39:30<3:02:04,  1.78s/it, loss=0.391, lr=1e-5]Steps:  59%|█████▉    | 8850/15001 [5:39:32<3:04:55,  1.80s/it, loss=0.391, lr=1e-5]Steps:  59%|█████▉    | 8850/15001 [5:39:32<3:04:55,  1.80s/it, loss=0.0785, lr=1e-5]Steps:  59%|█████▉    | 8851/15001 [5:39:34<3:01:32,  1.77s/it, loss=0.0785, lr=1e-5]Steps:  59%|█████▉    | 8851/15001 [5:39:34<3:01:32,  1.77s/it, loss=0.0998, lr=1e-5]Steps:  59%|█████▉    | 8852/15001 [5:39:36<3:15:34,  1.91s/it, loss=0.0998, lr=1e-5]Steps:  59%|█████▉    | 8852/15001 [5:39:36<3:15:34,  1.91s/it, loss=0.173, lr=1e-5] Steps:  59%|█████▉    | 8853/15001 [5:39:38<3:15:17,  1.91s/it, loss=0.173, lr=1e-5]Steps:  59%|█████▉    | 8853/15001 [5:39:38<3:15:17,  1.91s/it, loss=0.245, lr=1e-5]Steps:  59%|█████▉    | 8854/15001 [5:39:40<3:13:58,  1.89s/it, loss=0.245, lr=1e-5]Steps:  59%|█████▉    | 8854/15001 [5:39:40<3:13:58,  1.89s/it, loss=0.132, lr=1e-5]Steps:  59%|█████▉    | 8855/15001 [5:39:42<3:17:04,  1.92s/it, loss=0.132, lr=1e-5]Steps:  59%|█████▉    | 8855/15001 [5:39:42<3:17:04,  1.92s/it, loss=0.217, lr=1e-5]Steps:  59%|█████▉    | 8856/15001 [5:39:43<3:12:12,  1.88s/it, loss=0.217, lr=1e-5]Steps:  59%|█████▉    | 8856/15001 [5:39:43<3:12:12,  1.88s/it, loss=0.173, lr=1e-5]Steps:  59%|█████▉    | 8857/15001 [5:39:45<3:13:51,  1.89s/it, loss=0.173, lr=1e-5]Steps:  59%|█████▉    | 8857/15001 [5:39:45<3:13:51,  1.89s/it, loss=0.425, lr=1e-5]Steps:  59%|█████▉    | 8858/15001 [5:39:47<3:14:57,  1.90s/it, loss=0.425, lr=1e-5]Steps:  59%|█████▉    | 8858/15001 [5:39:47<3:14:57,  1.90s/it, loss=0.202, lr=1e-5]Steps:  59%|█████▉    | 8859/15001 [5:39:49<3:17:39,  1.93s/it, loss=0.202, lr=1e-5]Steps:  59%|█████▉    | 8859/15001 [5:39:49<3:17:39,  1.93s/it, loss=0.115, lr=1e-5]Steps:  59%|█████▉    | 8860/15001 [5:39:51<3:06:28,  1.82s/it, loss=0.115, lr=1e-5]Steps:  59%|█████▉    | 8860/15001 [5:39:51<3:06:28,  1.82s/it, loss=0.162, lr=1e-5]Steps:  59%|█████▉    | 8861/15001 [5:39:53<3:19:56,  1.95s/it, loss=0.162, lr=1e-5]Steps:  59%|█████▉    | 8861/15001 [5:39:53<3:19:56,  1.95s/it, loss=0.0756, lr=1e-5]Steps:  59%|█████▉    | 8862/15001 [5:39:55<3:15:55,  1.91s/it, loss=0.0756, lr=1e-5]Steps:  59%|█████▉    | 8862/15001 [5:39:55<3:15:55,  1.91s/it, loss=0.0598, lr=1e-5]Steps:  59%|█████▉    | 8863/15001 [5:39:57<3:19:26,  1.95s/it, loss=0.0598, lr=1e-5]Steps:  59%|█████▉    | 8863/15001 [5:39:57<3:19:26,  1.95s/it, loss=0.24, lr=1e-5]  Steps:  59%|█████▉    | 8864/15001 [5:39:58<3:09:43,  1.85s/it, loss=0.24, lr=1e-5]Steps:  59%|█████▉    | 8864/15001 [5:39:59<3:09:43,  1.85s/it, loss=0.169, lr=1e-5]Steps:  59%|█████▉    | 8865/15001 [5:40:00<3:10:08,  1.86s/it, loss=0.169, lr=1e-5]Steps:  59%|█████▉    | 8865/15001 [5:40:01<3:10:08,  1.86s/it, loss=0.31, lr=1e-5] Steps:  59%|█████▉    | 8866/15001 [5:40:02<3:13:57,  1.90s/it, loss=0.31, lr=1e-5]Steps:  59%|█████▉    | 8866/15001 [5:40:02<3:13:57,  1.90s/it, loss=0.0542, lr=1e-5]Steps:  59%|█████▉    | 8867/15001 [5:40:04<3:09:55,  1.86s/it, loss=0.0542, lr=1e-5]Steps:  59%|█████▉    | 8867/15001 [5:40:04<3:09:55,  1.86s/it, loss=0.126, lr=1e-5] Steps:  59%|█████▉    | 8868/15001 [5:40:06<3:08:24,  1.84s/it, loss=0.126, lr=1e-5]Steps:  59%|█████▉    | 8868/15001 [5:40:06<3:08:24,  1.84s/it, loss=0.114, lr=1e-5]Steps:  59%|█████▉    | 8869/15001 [5:40:08<3:06:22,  1.82s/it, loss=0.114, lr=1e-5]Steps:  59%|█████▉    | 8869/15001 [5:40:08<3:06:22,  1.82s/it, loss=0.0953, lr=1e-5]Steps:  59%|█████▉    | 8870/15001 [5:40:10<3:11:46,  1.88s/it, loss=0.0953, lr=1e-5]Steps:  59%|█████▉    | 8870/15001 [5:40:10<3:11:46,  1.88s/it, loss=0.0967, lr=1e-5]Steps:  59%|█████▉    | 8871/15001 [5:40:12<3:13:08,  1.89s/it, loss=0.0967, lr=1e-5]Steps:  59%|█████▉    | 8871/15001 [5:40:12<3:13:08,  1.89s/it, loss=0.179, lr=1e-5] Steps:  59%|█████▉    | 8872/15001 [5:40:13<3:09:47,  1.86s/it, loss=0.179, lr=1e-5]Steps:  59%|█████▉    | 8872/15001 [5:40:14<3:09:47,  1.86s/it, loss=0.285, lr=1e-5]Steps:  59%|█████▉    | 8873/15001 [5:40:15<3:12:09,  1.88s/it, loss=0.285, lr=1e-5]Steps:  59%|█████▉    | 8873/15001 [5:40:15<3:12:09,  1.88s/it, loss=0.267, lr=1e-5]Steps:  59%|█████▉    | 8874/15001 [5:40:17<3:01:30,  1.78s/it, loss=0.267, lr=1e-5]Steps:  59%|█████▉    | 8874/15001 [5:40:17<3:01:30,  1.78s/it, loss=0.163, lr=1e-5]Steps:  59%|█████▉    | 8875/15001 [5:40:19<3:12:20,  1.88s/it, loss=0.163, lr=1e-5]Steps:  59%|█████▉    | 8875/15001 [5:40:19<3:12:20,  1.88s/it, loss=0.117, lr=1e-5]Steps:  59%|█████▉    | 8876/15001 [5:40:21<3:17:00,  1.93s/it, loss=0.117, lr=1e-5]Steps:  59%|█████▉    | 8876/15001 [5:40:21<3:17:00,  1.93s/it, loss=0.195, lr=1e-5]Steps:  59%|█████▉    | 8877/15001 [5:40:23<3:14:04,  1.90s/it, loss=0.195, lr=1e-5]Steps:  59%|█████▉    | 8877/15001 [5:40:23<3:14:04,  1.90s/it, loss=0.263, lr=1e-5]Steps:  59%|█████▉    | 8878/15001 [5:40:24<3:03:13,  1.80s/it, loss=0.263, lr=1e-5]Steps:  59%|█████▉    | 8878/15001 [5:40:25<3:03:13,  1.80s/it, loss=0.0688, lr=1e-5]Steps:  59%|█████▉    | 8879/15001 [5:40:26<3:08:04,  1.84s/it, loss=0.0688, lr=1e-5]Steps:  59%|█████▉    | 8879/15001 [5:40:27<3:08:04,  1.84s/it, loss=0.189, lr=1e-5] Steps:  59%|█████▉    | 8880/15001 [5:40:28<3:15:43,  1.92s/it, loss=0.189, lr=1e-5]Steps:  59%|█████▉    | 8880/15001 [5:40:29<3:15:43,  1.92s/it, loss=0.0975, lr=1e-5]Steps:  59%|█████▉    | 8881/15001 [5:40:30<3:08:07,  1.84s/it, loss=0.0975, lr=1e-5]Steps:  59%|█████▉    | 8881/15001 [5:40:31<3:08:07,  1.84s/it, loss=0.238, lr=1e-5] Steps:  59%|█████▉    | 8882/15001 [5:40:33<3:25:09,  2.01s/it, loss=0.238, lr=1e-5]Steps:  59%|█████▉    | 8882/15001 [5:40:33<3:25:09,  2.01s/it, loss=0.0931, lr=1e-5]Steps:  59%|█████▉    | 8883/15001 [5:40:35<3:25:21,  2.01s/it, loss=0.0931, lr=1e-5]Steps:  59%|█████▉    | 8883/15001 [5:40:35<3:25:21,  2.01s/it, loss=0.12, lr=1e-5]  Steps:  59%|█████▉    | 8884/15001 [5:40:37<3:23:34,  2.00s/it, loss=0.12, lr=1e-5]Steps:  59%|█████▉    | 8884/15001 [5:40:37<3:23:34,  2.00s/it, loss=0.153, lr=1e-5]Steps:  59%|█████▉    | 8885/15001 [5:40:39<3:23:41,  2.00s/it, loss=0.153, lr=1e-5]Steps:  59%|█████▉    | 8885/15001 [5:40:39<3:23:41,  2.00s/it, loss=0.19, lr=1e-5] Steps:  59%|█████▉    | 8886/15001 [5:40:40<3:14:45,  1.91s/it, loss=0.19, lr=1e-5]Steps:  59%|█████▉    | 8886/15001 [5:40:40<3:14:45,  1.91s/it, loss=0.0975, lr=1e-5]Steps:  59%|█████▉    | 8887/15001 [5:40:42<3:07:55,  1.84s/it, loss=0.0975, lr=1e-5]Steps:  59%|█████▉    | 8887/15001 [5:40:42<3:07:55,  1.84s/it, loss=0.107, lr=1e-5] Steps:  59%|█████▉    | 8888/15001 [5:40:44<3:08:36,  1.85s/it, loss=0.107, lr=1e-5]Steps:  59%|█████▉    | 8888/15001 [5:40:44<3:08:36,  1.85s/it, loss=0.1, lr=1e-5]  Steps:  59%|█████▉    | 8889/15001 [5:40:46<3:14:27,  1.91s/it, loss=0.1, lr=1e-5]Steps:  59%|█████▉    | 8889/15001 [5:40:46<3:14:27,  1.91s/it, loss=0.31, lr=1e-5]Steps:  59%|█████▉    | 8890/15001 [5:40:48<3:13:24,  1.90s/it, loss=0.31, lr=1e-5]Steps:  59%|█████▉    | 8890/15001 [5:40:48<3:13:24,  1.90s/it, loss=0.0425, lr=1e-5]Steps:  59%|█████▉    | 8891/15001 [5:40:50<3:10:46,  1.87s/it, loss=0.0425, lr=1e-5]Steps:  59%|█████▉    | 8891/15001 [5:40:50<3:10:46,  1.87s/it, loss=0.142, lr=1e-5] Steps:  59%|█████▉    | 8892/15001 [5:40:51<3:04:21,  1.81s/it, loss=0.142, lr=1e-5]Steps:  59%|█████▉    | 8892/15001 [5:40:51<3:04:21,  1.81s/it, loss=0.0488, lr=1e-5]Steps:  59%|█████▉    | 8893/15001 [5:40:53<3:07:21,  1.84s/it, loss=0.0488, lr=1e-5]Steps:  59%|█████▉    | 8893/15001 [5:40:53<3:07:21,  1.84s/it, loss=0.151, lr=1e-5] Steps:  59%|█████▉    | 8894/15001 [5:40:55<3:00:03,  1.77s/it, loss=0.151, lr=1e-5]Steps:  59%|█████▉    | 8894/15001 [5:40:55<3:00:03,  1.77s/it, loss=0.242, lr=1e-5]Steps:  59%|█████▉    | 8895/15001 [5:40:57<3:09:03,  1.86s/it, loss=0.242, lr=1e-5]Steps:  59%|█████▉    | 8895/15001 [5:40:57<3:09:03,  1.86s/it, loss=0.166, lr=1e-5]Steps:  59%|█████▉    | 8896/15001 [5:40:59<3:10:10,  1.87s/it, loss=0.166, lr=1e-5]Steps:  59%|█████▉    | 8896/15001 [5:40:59<3:10:10,  1.87s/it, loss=0.0526, lr=1e-5]Steps:  59%|█████▉    | 8897/15001 [5:41:00<3:05:08,  1.82s/it, loss=0.0526, lr=1e-5]Steps:  59%|█████▉    | 8897/15001 [5:41:00<3:05:08,  1.82s/it, loss=0.248, lr=1e-5] Steps:  59%|█████▉    | 8898/15001 [5:41:02<3:06:03,  1.83s/it, loss=0.248, lr=1e-5]Steps:  59%|█████▉    | 8898/15001 [5:41:02<3:06:03,  1.83s/it, loss=0.0658, lr=1e-5]Steps:  59%|█████▉    | 8899/15001 [5:41:04<3:00:47,  1.78s/it, loss=0.0658, lr=1e-5]Steps:  59%|█████▉    | 8899/15001 [5:41:04<3:00:47,  1.78s/it, loss=0.274, lr=1e-5] Steps:  59%|█████▉    | 8900/15001 [5:41:06<3:10:13,  1.87s/it, loss=0.274, lr=1e-5]Steps:  59%|█████▉    | 8900/15001 [5:41:06<3:10:13,  1.87s/it, loss=0.0787, lr=1e-5]Steps:  59%|█████▉    | 8901/15001 [5:41:08<3:03:49,  1.81s/it, loss=0.0787, lr=1e-5]Steps:  59%|█████▉    | 8901/15001 [5:41:08<3:03:49,  1.81s/it, loss=0.22, lr=1e-5]  Steps:  59%|��████▉    | 8902/15001 [5:41:10<3:09:58,  1.87s/it, loss=0.22, lr=1e-5]Steps:  59%|█████▉    | 8902/15001 [5:41:10<3:09:58,  1.87s/it, loss=0.11, lr=1e-5]Steps:  59%|█████▉    | 8903/15001 [5:41:12<3:16:53,  1.94s/it, loss=0.11, lr=1e-5]Steps:  59%|█████▉    | 8903/15001 [5:41:12<3:16:53,  1.94s/it, loss=0.15, lr=1e-5]Steps:  59%|█████▉    | 8904/15001 [5:41:14<3:19:16,  1.96s/it, loss=0.15, lr=1e-5]Steps:  59%|█████▉    | 8904/15001 [5:41:14<3:19:16,  1.96s/it, loss=0.496, lr=1e-5]Steps:  59%|█████▉    | 8905/15001 [5:41:16<3:14:26,  1.91s/it, loss=0.496, lr=1e-5]Steps:  59%|█████▉    | 8905/15001 [5:41:16<3:14:26,  1.91s/it, loss=0.0558, lr=1e-5]Steps:  59%|█████▉    | 8906/15001 [5:41:17<3:12:57,  1.90s/it, loss=0.0558, lr=1e-5]Steps:  59%|█████▉    | 8906/15001 [5:41:18<3:12:57,  1.90s/it, loss=0.116, lr=1e-5] Steps:  59%|█████▉    | 8907/15001 [5:41:20<3:20:49,  1.98s/it, loss=0.116, lr=1e-5]Steps:  59%|█████▉    | 8907/15001 [5:41:20<3:20:49,  1.98s/it, loss=0.247, lr=1e-5]Steps:  59%|█████▉    | 8908/15001 [5:41:22<3:22:26,  1.99s/it, loss=0.247, lr=1e-5]Steps:  59%|█████▉    | 8908/15001 [5:41:22<3:22:26,  1.99s/it, loss=0.0924, lr=1e-5]Steps:  59%|█████▉    | 8909/15001 [5:41:23<3:07:00,  1.84s/it, loss=0.0924, lr=1e-5]Steps:  59%|█████▉    | 8909/15001 [5:41:23<3:07:00,  1.84s/it, loss=0.33, lr=1e-5]  Steps:  59%|█████▉    | 8910/15001 [5:41:25<3:08:28,  1.86s/it, loss=0.33, lr=1e-5]Steps:  59%|█████▉    | 8910/15001 [5:41:25<3:08:28,  1.86s/it, loss=0.131, lr=1e-5]Steps:  59%|█████▉    | 8911/15001 [5:41:27<3:07:46,  1.85s/it, loss=0.131, lr=1e-5]Steps:  59%|█████▉    | 8911/15001 [5:41:27<3:07:46,  1.85s/it, loss=0.147, lr=1e-5]Steps:  59%|█████▉    | 8912/15001 [5:41:29<3:03:27,  1.81s/it, loss=0.147, lr=1e-5]Steps:  59%|█████▉    | 8912/15001 [5:41:29<3:03:27,  1.81s/it, loss=0.479, lr=1e-5]Steps:  59%|█████▉    | 8913/15001 [5:41:30<3:04:28,  1.82s/it, loss=0.479, lr=1e-5]Steps:  59%|█████▉    | 8913/15001 [5:41:31<3:04:28,  1.82s/it, loss=0.169, lr=1e-5]Steps:  59%|█████▉    | 8914/15001 [5:41:32<3:05:05,  1.82s/it, loss=0.169, lr=1e-5]Steps:  59%|█████▉    | 8914/15001 [5:41:33<3:05:05,  1.82s/it, loss=0.235, lr=1e-5]Steps:  59%|█████▉    | 8915/15001 [5:41:34<3:07:43,  1.85s/it, loss=0.235, lr=1e-5]Steps:  59%|█████▉    | 8915/15001 [5:41:34<3:07:43,  1.85s/it, loss=0.0861, lr=1e-5]Steps:  59%|█████▉    | 8916/15001 [5:41:36<3:04:32,  1.82s/it, loss=0.0861, lr=1e-5]Steps:  59%|█████▉    | 8916/15001 [5:41:36<3:04:32,  1.82s/it, loss=0.155, lr=1e-5] Steps:  59%|█████▉    | 8917/15001 [5:41:38<3:06:10,  1.84s/it, loss=0.155, lr=1e-5]Steps:  59%|█████▉    | 8917/15001 [5:41:38<3:06:10,  1.84s/it, loss=0.0911, lr=1e-5]Steps:  59%|█████▉    | 8918/15001 [5:41:40<3:13:13,  1.91s/it, loss=0.0911, lr=1e-5]Steps:  59%|█████▉    | 8918/15001 [5:41:40<3:13:13,  1.91s/it, loss=0.0158, lr=1e-5]Steps:  59%|█████▉    | 8919/15001 [5:41:42<3:12:29,  1.90s/it, loss=0.0158, lr=1e-5]Steps:  59%|█████▉    | 8919/15001 [5:41:42<3:12:29,  1.90s/it, loss=0.204, lr=1e-5] Steps:  59%|█████▉    | 8920/15001 [5:41:43<3:06:23,  1.84s/it, loss=0.204, lr=1e-5]Steps:  59%|█████▉    | 8920/15001 [5:41:44<3:06:23,  1.84s/it, loss=0.079, lr=1e-5]Steps:  59%|█████▉    | 8921/15001 [5:41:45<3:07:26,  1.85s/it, loss=0.079, lr=1e-5]Steps:  59%|█████▉    | 8921/15001 [5:41:45<3:07:26,  1.85s/it, loss=0.27, lr=1e-5] Steps:  59%|█████▉    | 8922/15001 [5:41:47<3:04:40,  1.82s/it, loss=0.27, lr=1e-5]Steps:  59%|█████▉    | 8922/15001 [5:41:47<3:04:40,  1.82s/it, loss=0.0843, lr=1e-5]Steps:  59%|█████▉    | 8923/15001 [5:41:49<3:02:09,  1.80s/it, loss=0.0843, lr=1e-5]Steps:  59%|█████▉    | 8923/15001 [5:41:49<3:02:09,  1.80s/it, loss=0.193, lr=1e-5] Steps:  59%|█████▉    | 8924/15001 [5:41:50<2:59:33,  1.77s/it, loss=0.193, lr=1e-5]Steps:  59%|█████▉    | 8924/15001 [5:41:51<2:59:33,  1.77s/it, loss=0.207, lr=1e-5]Steps:  59%|█████▉    | 8925/15001 [5:41:52<3:04:36,  1.82s/it, loss=0.207, lr=1e-5]Steps:  59%|█████▉    | 8925/15001 [5:41:53<3:04:36,  1.82s/it, loss=0.245, lr=1e-5]Steps:  60%|█████▉    | 8926/15001 [5:41:54<3:11:40,  1.89s/it, loss=0.245, lr=1e-5]Steps:  60%|█████▉    | 8926/15001 [5:41:55<3:11:40,  1.89s/it, loss=0.0375, lr=1e-5]Steps:  60%|█████▉    | 8927/15001 [5:41:56<3:12:46,  1.90s/it, loss=0.0375, lr=1e-5]Steps:  60%|█████▉    | 8927/15001 [5:41:57<3:12:46,  1.90s/it, loss=0.175, lr=1e-5] Steps:  60%|█████▉    | 8928/15001 [5:41:58<3:16:43,  1.94s/it, loss=0.175, lr=1e-5]Steps:  60%|█████▉    | 8928/15001 [5:41:59<3:16:43,  1.94s/it, loss=0.165, lr=1e-5]Steps:  60%|█████▉    | 8929/15001 [5:42:00<3:14:19,  1.92s/it, loss=0.165, lr=1e-5]Steps:  60%|█████▉    | 8929/15001 [5:42:01<3:14:19,  1.92s/it, loss=0.0833, lr=1e-5]Steps:  60%|█████▉    | 8930/15001 [5:42:03<3:23:20,  2.01s/it, loss=0.0833, lr=1e-5]Steps:  60%|█████▉    | 8930/15001 [5:42:03<3:23:20,  2.01s/it, loss=0.202, lr=1e-5] Steps:  60%|█████▉    | 8931/15001 [5:42:05<3:24:20,  2.02s/it, loss=0.202, lr=1e-5]Steps:  60%|█████▉    | 8931/15001 [5:42:05<3:24:20,  2.02s/it, loss=0.249, lr=1e-5]Steps:  60%|█████▉    | 8932/15001 [5:42:07<3:31:21,  2.09s/it, loss=0.249, lr=1e-5]Steps:  60%|█████▉    | 8932/15001 [5:42:07<3:31:21,  2.09s/it, loss=0.127, lr=1e-5]Steps:  60%|█████▉    | 8933/15001 [5:42:09<3:21:19,  1.99s/it, loss=0.127, lr=1e-5]Steps:  60%|█████▉    | 8933/15001 [5:42:09<3:21:19,  1.99s/it, loss=0.0313, lr=1e-5]Steps:  60%|█████▉    | 8934/15001 [5:42:10<3:10:40,  1.89s/it, loss=0.0313, lr=1e-5]Steps:  60%|█████▉    | 8934/15001 [5:42:11<3:10:40,  1.89s/it, loss=0.195, lr=1e-5] Steps:  60%|█████▉    | 8935/15001 [5:42:12<3:12:23,  1.90s/it, loss=0.195, lr=1e-5]Steps:  60%|█████▉    | 8935/15001 [5:42:12<3:12:23,  1.90s/it, loss=0.24, lr=1e-5] Steps:  60%|█████▉    | 8936/15001 [5:42:14<3:15:38,  1.94s/it, loss=0.24, lr=1e-5]Steps:  60%|█████▉    | 8936/15001 [5:42:14<3:15:38,  1.94s/it, loss=0.0609, lr=1e-5]Steps:  60%|█████▉    | 8937/15001 [5:42:16<3:09:25,  1.87s/it, loss=0.0609, lr=1e-5]Steps:  60%|█████▉    | 8937/15001 [5:42:16<3:09:25,  1.87s/it, loss=0.178, lr=1e-5] Steps:  60%|█████▉    | 8938/15001 [5:42:18<3:08:50,  1.87s/it, loss=0.178, lr=1e-5]Steps:  60%|█████▉    | 8938/15001 [5:42:18<3:08:50,  1.87s/it, loss=0.262, lr=1e-5]Steps:  60%|█████▉    | 8939/15001 [5:42:19<3:04:28,  1.83s/it, loss=0.262, lr=1e-5]Steps:  60%|█████▉    | 8939/15001 [5:42:20<3:04:28,  1.83s/it, loss=0.271, lr=1e-5]Steps:  60%|█████▉    | 8940/15001 [5:42:21<3:05:41,  1.84s/it, loss=0.271, lr=1e-5]Steps:  60%|█████▉    | 8940/15001 [5:42:21<3:05:41,  1.84s/it, loss=0.238, lr=1e-5]Steps:  60%|█████▉    | 8941/15001 [5:42:23<3:02:41,  1.81s/it, loss=0.238, lr=1e-5]Steps:  60%|█████▉    | 8941/15001 [5:42:23<3:02:41,  1.81s/it, loss=0.219, lr=1e-5]Steps:  60%|█████▉    | 8942/15001 [5:42:25<3:02:09,  1.80s/it, loss=0.219, lr=1e-5]Steps:  60%|█████▉    | 8942/15001 [5:42:25<3:02:09,  1.80s/it, loss=0.234, lr=1e-5]Steps:  60%|█████▉    | 8943/15001 [5:42:27<3:03:38,  1.82s/it, loss=0.234, lr=1e-5]Steps:  60%|█████▉    | 8943/15001 [5:42:27<3:03:38,  1.82s/it, loss=0.149, lr=1e-5]Steps:  60%|█████▉    | 8944/15001 [5:42:28<2:57:41,  1.76s/it, loss=0.149, lr=1e-5]Steps:  60%|█████▉    | 8944/15001 [5:42:29<2:57:41,  1.76s/it, loss=0.0937, lr=1e-5]Steps:  60%|█████▉    | 8945/15001 [5:42:30<3:00:21,  1.79s/it, loss=0.0937, lr=1e-5]Steps:  60%|█████▉    | 8945/15001 [5:42:31<3:00:21,  1.79s/it, loss=0.255, lr=1e-5] Steps:  60%|█████▉    | 8946/15001 [5:42:32<3:10:26,  1.89s/it, loss=0.255, lr=1e-5]Steps:  60%|█████▉    | 8946/15001 [5:42:32<3:10:26,  1.89s/it, loss=0.153, lr=1e-5]Steps:  60%|█████▉    | 8947/15001 [5:42:34<3:01:54,  1.80s/it, loss=0.153, lr=1e-5]Steps:  60%|█████▉    | 8947/15001 [5:42:34<3:01:54,  1.80s/it, loss=0.221, lr=1e-5]Steps:  60%|█████▉    | 8948/15001 [5:42:36<3:00:21,  1.79s/it, loss=0.221, lr=1e-5]Steps:  60%|█████▉    | 8948/15001 [5:42:36<3:00:21,  1.79s/it, loss=0.36, lr=1e-5] Steps:  60%|█████▉    | 8949/15001 [5:42:38<3:12:46,  1.91s/it, loss=0.36, lr=1e-5]Steps:  60%|█████▉    | 8949/15001 [5:42:38<3:12:46,  1.91s/it, loss=0.216, lr=1e-5]Steps:  60%|█████▉    | 8950/15001 [5:42:40<3:17:20,  1.96s/it, loss=0.216, lr=1e-5]Steps:  60%|█████▉    | 8950/15001 [5:42:40<3:17:20,  1.96s/it, loss=0.274, lr=1e-5]Steps:  60%|█████▉    | 8951/15001 [5:42:42<3:17:10,  1.96s/it, loss=0.274, lr=1e-5]Steps:  60%|█████▉    | 8951/15001 [5:42:42<3:17:10,  1.96s/it, loss=0.246, lr=1e-5]Steps:  60%|█████▉    | 8952/15001 [5:42:44<3:15:50,  1.94s/it, loss=0.246, lr=1e-5]Steps:  60%|█████▉    | 8952/15001 [5:42:44<3:15:50,  1.94s/it, loss=0.376, lr=1e-5]Steps:  60%|█████▉    | 8953/15001 [5:42:46<3:18:56,  1.97s/it, loss=0.376, lr=1e-5]Steps:  60%|█████▉    | 8953/15001 [5:42:46<3:18:56,  1.97s/it, loss=0.0409, lr=1e-5]Steps:  60%|█████▉    | 8954/15001 [5:42:48<3:15:05,  1.94s/it, loss=0.0409, lr=1e-5]Steps:  60%|█████▉    | 8954/15001 [5:42:48<3:15:05,  1.94s/it, loss=0.289, lr=1e-5] Steps:  60%|█████▉    | 8955/15001 [5:42:49<3:05:44,  1.84s/it, loss=0.289, lr=1e-5]Steps:  60%|█████▉    | 8955/15001 [5:42:50<3:05:44,  1.84s/it, loss=0.284, lr=1e-5]Steps:  60%|█████▉    | 8956/15001 [5:42:51<3:06:53,  1.85s/it, loss=0.284, lr=1e-5]Steps:  60%|█████▉    | 8956/15001 [5:42:52<3:06:53,  1.85s/it, loss=0.0809, lr=1e-5]Steps:  60%|█████▉    | 8957/15001 [5:42:53<3:08:49,  1.87s/it, loss=0.0809, lr=1e-5]Steps:  60%|█████▉    | 8957/15001 [5:42:53<3:08:49,  1.87s/it, loss=0.265, lr=1e-5] Steps:  60%|█████▉    | 8958/15001 [5:42:55<3:06:45,  1.85s/it, loss=0.265, lr=1e-5]Steps:  60%|█████▉    | 8958/15001 [5:42:55<3:06:45,  1.85s/it, loss=0.0186, lr=1e-5]Steps:  60%|█████▉    | 8959/15001 [5:42:57<3:04:15,  1.83s/it, loss=0.0186, lr=1e-5]Steps:  60%|█████▉    | 8959/15001 [5:42:57<3:04:15,  1.83s/it, loss=0.07, lr=1e-5]  Steps:  60%|█████▉    | 8960/15001 [5:42:59<3:04:26,  1.83s/it, loss=0.07, lr=1e-5]Steps:  60%|█████▉    | 8960/15001 [5:42:59<3:04:26,  1.83s/it, loss=0.21, lr=1e-5]Steps:  60%|█████▉    | 8961/15001 [5:43:00<2:58:19,  1.77s/it, loss=0.21, lr=1e-5]Steps:  60%|█████▉    | 8961/15001 [5:43:00<2:58:19,  1.77s/it, loss=0.0757, lr=1e-5]Steps:  60%|█████▉    | 8962/15001 [5:43:02<2:59:07,  1.78s/it, loss=0.0757, lr=1e-5]Steps:  60%|█████▉    | 8962/15001 [5:43:02<2:59:07,  1.78s/it, loss=0.0348, lr=1e-5]Steps:  60%|█████▉    | 8963/15001 [5:43:04<3:05:42,  1.85s/it, loss=0.0348, lr=1e-5]Steps:  60%|█████▉    | 8963/15001 [5:43:04<3:05:42,  1.85s/it, loss=0.203, lr=1e-5] Steps:  60%|█████▉    | 8964/15001 [5:43:06<3:04:09,  1.83s/it, loss=0.203, lr=1e-5]Steps:  60%|█████▉    | 8964/15001 [5:43:06<3:04:09,  1.83s/it, loss=0.126, lr=1e-5]Steps:  60%|█████▉    | 8965/15001 [5:43:07<2:56:39,  1.76s/it, loss=0.126, lr=1e-5]Steps:  60%|█████▉    | 8965/15001 [5:43:08<2:56:39,  1.76s/it, loss=0.155, lr=1e-5]Steps:  60%|█████▉    | 8966/15001 [5:43:09<2:57:03,  1.76s/it, loss=0.155, lr=1e-5]Steps:  60%|█████▉    | 8966/15001 [5:43:09<2:57:03,  1.76s/it, loss=0.122, lr=1e-5]Steps:  60%|█████▉    | 8967/15001 [5:43:11<2:55:25,  1.74s/it, loss=0.122, lr=1e-5]Steps:  60%|█████▉    | 8967/15001 [5:43:11<2:55:25,  1.74s/it, loss=0.343, lr=1e-5]Steps:  60%|█████▉    | 8968/15001 [5:43:13<3:01:30,  1.81s/it, loss=0.343, lr=1e-5]Steps:  60%|█████▉    | 8968/15001 [5:43:13<3:01:30,  1.81s/it, loss=0.079, lr=1e-5]Steps:  60%|█████▉    | 8969/15001 [5:43:15<3:11:34,  1.91s/it, loss=0.079, lr=1e-5]Steps:  60%|█████▉    | 8969/15001 [5:43:15<3:11:34,  1.91s/it, loss=0.0751, lr=1e-5]Steps:  60%|█████▉    | 8970/15001 [5:43:17<3:05:50,  1.85s/it, loss=0.0751, lr=1e-5]Steps:  60%|█████▉    | 8970/15001 [5:43:17<3:05:50,  1.85s/it, loss=0.184, lr=1e-5] Steps:  60%|█████▉    | 8971/15001 [5:43:18<3:03:51,  1.83s/it, loss=0.184, lr=1e-5]Steps:  60%|█████▉    | 8971/15001 [5:43:19<3:03:51,  1.83s/it, loss=0.0686, lr=1e-5]Steps:  60%|█████▉    | 8972/15001 [5:43:21<3:12:29,  1.92s/it, loss=0.0686, lr=1e-5]Steps:  60%|█████▉    | 8972/15001 [5:43:21<3:12:29,  1.92s/it, loss=0.0673, lr=1e-5]Steps:  60%|█████▉    | 8973/15001 [5:43:22<3:12:13,  1.91s/it, loss=0.0673, lr=1e-5]Steps:  60%|█████▉    | 8973/15001 [5:43:23<3:12:13,  1.91s/it, loss=0.228, lr=1e-5] Steps:  60%|█████▉    | 8974/15001 [5:43:24<3:15:04,  1.94s/it, loss=0.228, lr=1e-5]Steps:  60%|█████▉    | 8974/15001 [5:43:25<3:15:04,  1.94s/it, loss=0.167, lr=1e-5]Steps:  60%|█████▉    | 8975/15001 [5:43:26<3:07:58,  1.87s/it, loss=0.167, lr=1e-5]Steps:  60%|█████▉    | 8975/15001 [5:43:27<3:07:58,  1.87s/it, loss=0.0747, lr=1e-5]Steps:  60%|█████▉    | 8976/15001 [5:43:28<3:16:07,  1.95s/it, loss=0.0747, lr=1e-5]Steps:  60%|█████▉    | 8976/15001 [5:43:29<3:16:07,  1.95s/it, loss=0.0827, lr=1e-5]Steps:  60%|█████▉    | 8977/15001 [5:43:30<3:20:59,  2.00s/it, loss=0.0827, lr=1e-5]Steps:  60%|█████▉    | 8977/15001 [5:43:31<3:20:59,  2.00s/it, loss=0.0166, lr=1e-5]Steps:  60%|█████▉    | 8978/15001 [5:43:32<3:13:10,  1.92s/it, loss=0.0166, lr=1e-5]Steps:  60%|█████▉    | 8978/15001 [5:43:32<3:13:10,  1.92s/it, loss=0.191, lr=1e-5] Steps:  60%|█████▉    | 8979/15001 [5:43:34<3:02:44,  1.82s/it, loss=0.191, lr=1e-5]Steps:  60%|█████▉    | 8979/15001 [5:43:34<3:02:44,  1.82s/it, loss=0.105, lr=1e-5]Steps:  60%|█████▉    | 8980/15001 [5:43:36<3:06:02,  1.85s/it, loss=0.105, lr=1e-5]Steps:  60%|█████▉    | 8980/15001 [5:43:36<3:06:02,  1.85s/it, loss=0.175, lr=1e-5]Steps:  60%|█████▉    | 8981/15001 [5:43:38<3:13:49,  1.93s/it, loss=0.175, lr=1e-5]Steps:  60%|█████▉    | 8981/15001 [5:43:38<3:13:49,  1.93s/it, loss=0.165, lr=1e-5]Steps:  60%|█████▉    | 8982/15001 [5:43:40<3:11:10,  1.91s/it, loss=0.165, lr=1e-5]Steps:  60%|█████▉    | 8982/15001 [5:43:40<3:11:10,  1.91s/it, loss=0.176, lr=1e-5]Steps:  60%|█████▉    | 8983/15001 [5:43:41<2:59:21,  1.79s/it, loss=0.176, lr=1e-5]Steps:  60%|█████▉    | 8983/15001 [5:43:41<2:59:21,  1.79s/it, loss=0.178, lr=1e-5]Steps:  60%|█████▉    | 8984/15001 [5:43:43<3:06:40,  1.86s/it, loss=0.178, lr=1e-5]Steps:  60%|█████▉    | 8984/15001 [5:43:43<3:06:40,  1.86s/it, loss=0.0392, lr=1e-5]Steps:  60%|█████▉    | 8985/15001 [5:43:45<3:03:25,  1.83s/it, loss=0.0392, lr=1e-5]Steps:  60%|█████▉    | 8985/15001 [5:43:45<3:03:25,  1.83s/it, loss=0.0264, lr=1e-5]Steps:  60%|█████▉    | 8986/15001 [5:43:47<3:01:52,  1.81s/it, loss=0.0264, lr=1e-5]Steps:  60%|█████▉    | 8986/15001 [5:43:47<3:01:52,  1.81s/it, loss=0.15, lr=1e-5]  Steps:  60%|█████▉    | 8987/15001 [5:43:49<3:08:12,  1.88s/it, loss=0.15, lr=1e-5]Steps:  60%|█████▉    | 8987/15001 [5:43:49<3:08:12,  1.88s/it, loss=0.166, lr=1e-5]Steps:  60%|█████▉    | 8988/15001 [5:43:50<3:01:04,  1.81s/it, loss=0.166, lr=1e-5]Steps:  60%|█████▉    | 8988/15001 [5:43:51<3:01:04,  1.81s/it, loss=0.178, lr=1e-5]Steps:  60%|█████▉    | 8989/15001 [5:43:52<3:03:30,  1.83s/it, loss=0.178, lr=1e-5]Steps:  60%|█████▉    | 8989/15001 [5:43:53<3:03:30,  1.83s/it, loss=0.16, lr=1e-5] Steps:  60%|█████▉    | 8990/15001 [5:43:54<3:06:57,  1.87s/it, loss=0.16, lr=1e-5]Steps:  60%|█████▉    | 8990/15001 [5:43:54<3:06:57,  1.87s/it, loss=0.354, lr=1e-5]Steps:  60%|█████▉    | 8991/15001 [5:43:56<3:02:08,  1.82s/it, loss=0.354, lr=1e-5]Steps:  60%|█████▉    | 8991/15001 [5:43:56<3:02:08,  1.82s/it, loss=0.159, lr=1e-5]Steps:  60%|█████▉    | 8992/15001 [5:43:57<2:53:36,  1.73s/it, loss=0.159, lr=1e-5]Steps:  60%|█████▉    | 8992/15001 [5:43:58<2:53:36,  1.73s/it, loss=0.199, lr=1e-5]Steps:  60%|█████▉    | 8993/15001 [5:43:59<2:56:15,  1.76s/it, loss=0.199, lr=1e-5]Steps:  60%|█████▉    | 8993/15001 [5:44:00<2:56:15,  1.76s/it, loss=0.116, lr=1e-5]Steps:  60%|█████▉    | 8994/15001 [5:44:01<3:06:26,  1.86s/it, loss=0.116, lr=1e-5]Steps:  60%|█████▉    | 8994/15001 [5:44:02<3:06:26,  1.86s/it, loss=0.165, lr=1e-5]Steps:  60%|█████▉    | 8995/15001 [5:44:03<3:10:17,  1.90s/it, loss=0.165, lr=1e-5]Steps:  60%|█████▉    | 8995/15001 [5:44:04<3:10:17,  1.90s/it, loss=0.089, lr=1e-5]Steps:  60%|█████▉    | 8996/15001 [5:44:06<3:18:24,  1.98s/it, loss=0.089, lr=1e-5]Steps:  60%|█████▉    | 8996/15001 [5:44:06<3:18:24,  1.98s/it, loss=0.245, lr=1e-5]Steps:  60%|█████▉    | 8997/15001 [5:44:07<3:09:08,  1.89s/it, loss=0.245, lr=1e-5]Steps:  60%|█████▉    | 8997/15001 [5:44:08<3:09:08,  1.89s/it, loss=0.169, lr=1e-5]Steps:  60%|█████▉    | 8998/15001 [5:44:09<3:18:41,  1.99s/it, loss=0.169, lr=1e-5]Steps:  60%|█████▉    | 8998/15001 [5:44:10<3:18:41,  1.99s/it, loss=0.0609, lr=1e-5]Steps:  60%|█████▉    | 8999/15001 [5:44:12<3:24:48,  2.05s/it, loss=0.0609, lr=1e-5]Steps:  60%|█████▉    | 8999/15001 [5:44:12<3:24:48,  2.05s/it, loss=0.029, lr=1e-5] Steps:  60%|█████▉    | 9000/15001 [5:44:14<3:21:59,  2.02s/it, loss=0.029, lr=1e-5]02/04/2024 18:46:33 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1777.37it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  60%|█████▉    | 9000/15001 [5:47:52<3:21:59,  2.02s/it, loss=0.0894, lr=1e-5]Steps:  60%|██████    | 9001/15001 [5:47:54<112:19:26, 67.39s/it, loss=0.0894, lr=1e-5]Steps:  60%|██████    | 9001/15001 [5:47:54<112:19:26, 67.39s/it, loss=0.198, lr=1e-5] Steps:  60%|██████    | 9002/15001 [5:47:55<79:27:17, 47.68s/it, loss=0.198, lr=1e-5] Steps:  60%|██████    | 9002/15001 [5:47:56<79:27:17, 47.68s/it, loss=0.294, lr=1e-5]Steps:  60%|██████    | 9003/15001 [5:47:57<56:33:37, 33.95s/it, loss=0.294, lr=1e-5]Steps:  60%|██████    | 9003/15001 [5:47:57<56:33:37, 33.95s/it, loss=0.1, lr=1e-5]  wandb: Network error (TransientError), entering retry loop.
+Steps:  60%|██████    | 9004/15001 [5:47:59<40:38:20, 24.40s/it, loss=0.1, lr=1e-5]Steps:  60%|██████    | 9004/15001 [5:47:59<40:38:20, 24.40s/it, loss=0.24, lr=1e-5]Steps:  60%|██████    | 9005/15001 [5:48:01<29:27:04, 17.68s/it, loss=0.24, lr=1e-5]Steps:  60%|██████    | 9005/15001 [5:48:01<29:27:04, 17.68s/it, loss=0.143, lr=1e-5]Steps:  60%|██████    | 9006/15001 [5:48:03<21:38:35, 13.00s/it, loss=0.143, lr=1e-5]Steps:  60%|██████    | 9006/15001 [5:48:03<21:38:35, 13.00s/it, loss=0.337, lr=1e-5]Steps:  60%|██████    | 9007/15001 [5:48:05<16:11:22,  9.72s/it, loss=0.337, lr=1e-5]Steps:  60%|██████    | 9007/15001 [5:48:05<16:11:22,  9.72s/it, loss=0.161, lr=1e-5]Steps:  60%|██████    | 9008/15001 [5:48:07<12:17:27,  7.38s/it, loss=0.161, lr=1e-5]Steps:  60%|██████    | 9008/15001 [5:48:07<12:17:27,  7.38s/it, loss=0.0668, lr=1e-5]Steps:  60%|██████    | 9009/15001 [5:48:09<9:35:10,  5.76s/it, loss=0.0668, lr=1e-5] Steps:  60%|██████    | 9009/15001 [5:48:10<9:35:10,  5.76s/it, loss=0.144, lr=1e-5] Steps:  60%|██████    | 9010/15001 [5:48:11<7:43:33,  4.64s/it, loss=0.144, lr=1e-5]Steps:  60%|██████    | 9010/15001 [5:48:11<7:43:33,  4.64s/it, loss=0.103, lr=1e-5]Steps:  60%|██████    | 9011/15001 [5:48:13<6:17:36,  3.78s/it, loss=0.103, lr=1e-5]Steps:  60%|██████    | 9011/15001 [5:48:13<6:17:36,  3.78s/it, loss=0.201, lr=1e-5]Steps:  60%|██████    | 9012/15001 [5:48:15<5:22:02,  3.23s/it, loss=0.201, lr=1e-5]Steps:  60%|██████    | 9012/15001 [5:48:15<5:22:02,  3.23s/it, loss=0.186, lr=1e-5]Steps:  60%|██████    | 9013/15001 [5:48:17<4:41:02,  2.82s/it, loss=0.186, lr=1e-5]Steps:  60%|██████    | 9013/15001 [5:48:17<4:41:02,  2.82s/it, loss=0.16, lr=1e-5] Steps:  60%|██████    | 9014/15001 [5:48:19<4:05:41,  2.46s/it, loss=0.16, lr=1e-5]Steps:  60%|██████    | 9014/15001 [5:48:19<4:05:41,  2.46s/it, loss=0.18, lr=1e-5]Steps:  60%|██████    | 9015/15001 [5:48:21<3:52:34,  2.33s/it, loss=0.18, lr=1e-5]Steps:  60%|██████    | 9015/15001 [5:48:21<3:52:34,  2.33s/it, loss=0.288, lr=1e-5]Steps:  60%|██████    | 9016/15001 [5:48:22<3:37:02,  2.18s/it, loss=0.288, lr=1e-5]Steps:  60%|██████    | 9016/15001 [5:48:22<3:37:02,  2.18s/it, loss=0.156, lr=1e-5]Steps:  60%|██████    | 9017/15001 [5:48:24<3:22:13,  2.03s/it, loss=0.156, lr=1e-5]Steps:  60%|██████    | 9017/15001 [5:48:24<3:22:13,  2.03s/it, loss=0.15, lr=1e-5] Steps:  60%|██████    | 9018/15001 [5:48:26<3:17:29,  1.98s/it, loss=0.15, lr=1e-5]Steps:  60%|██████    | 9018/15001 [5:48:26<3:17:29,  1.98s/it, loss=0.202, lr=1e-5]Steps:  60%|██████    | 9019/15001 [5:48:28<3:12:33,  1.93s/it, loss=0.202, lr=1e-5]Steps:  60%|██████    | 9019/15001 [5:48:28<3:12:33,  1.93s/it, loss=0.0385, lr=1e-5]Steps:  60%|██████    | 9020/15001 [5:48:29<3:07:50,  1.88s/it, loss=0.0385, lr=1e-5]Steps:  60%|██████    | 9020/15001 [5:48:30<3:07:50,  1.88s/it, loss=0.251, lr=1e-5] Steps:  60%|██████    | 9021/15001 [5:48:31<3:06:50,  1.87s/it, loss=0.251, lr=1e-5]Steps:  60%|██████    | 9021/15001 [5:48:32<3:06:50,  1.87s/it, loss=0.169, lr=1e-5]Steps:  60%|██████    | 9022/15001 [5:48:33<3:03:05,  1.84s/it, loss=0.169, lr=1e-5]Steps:  60%|██████    | 9022/15001 [5:48:33<3:03:05,  1.84s/it, loss=0.392, lr=1e-5]Steps:  60%|██████    | 9023/15001 [5:48:35<3:02:00,  1.83s/it, loss=0.392, lr=1e-5]Steps:  60%|██████    | 9023/15001 [5:48:35<3:02:00,  1.83s/it, loss=0.362, lr=1e-5]Steps:  60%|██████    | 9024/15001 [5:48:37<3:08:15,  1.89s/it, loss=0.362, lr=1e-5]Steps:  60%|██████    | 9024/15001 [5:48:37<3:08:15,  1.89s/it, loss=0.236, lr=1e-5]Steps:  60%|██████    | 9025/15001 [5:48:39<3:05:28,  1.86s/it, loss=0.236, lr=1e-5]Steps:  60%|██████    | 9025/15001 [5:48:39<3:05:28,  1.86s/it, loss=0.205, lr=1e-5]Steps:  60%|██████    | 9026/15001 [5:48:41<3:05:12,  1.86s/it, loss=0.205, lr=1e-5]Steps:  60%|██████    | 9026/15001 [5:48:41<3:05:12,  1.86s/it, loss=0.00914, lr=1e-5]Steps:  60%|██████    | 9027/15001 [5:48:43<3:14:12,  1.95s/it, loss=0.00914, lr=1e-5]Steps:  60%|██████    | 9027/15001 [5:48:43<3:14:12,  1.95s/it, loss=0.316, lr=1e-5]  Steps:  60%|██████    | 9028/15001 [5:48:45<3:15:37,  1.97s/it, loss=0.316, lr=1e-5]Steps:  60%|██████    | 9028/15001 [5:48:45<3:15:37,  1.97s/it, loss=0.138, lr=1e-5]Steps:  60%|██████    | 9029/15001 [5:48:47<3:18:09,  1.99s/it, loss=0.138, lr=1e-5]Steps:  60%|██████    | 9029/15001 [5:48:47<3:18:09,  1.99s/it, loss=0.14, lr=1e-5] Steps:  60%|██████    | 9030/15001 [5:48:48<3:08:32,  1.89s/it, loss=0.14, lr=1e-5]Steps:  60%|██████    | 9030/15001 [5:48:49<3:08:32,  1.89s/it, loss=0.0864, lr=1e-5]Steps:  60%|██████    | 9031/15001 [5:48:51<3:16:31,  1.98s/it, loss=0.0864, lr=1e-5]Steps:  60%|██████    | 9031/15001 [5:48:51<3:16:31,  1.98s/it, loss=0.129, lr=1e-5] Steps:  60%|██████    | 9032/15001 [5:48:53<3:23:40,  2.05s/it, loss=0.129, lr=1e-5]Steps:  60%|██████    | 9032/15001 [5:48:53<3:23:40,  2.05s/it, loss=0.228, lr=1e-5]Steps:  60%|██████    | 9033/15001 [5:48:54<3:08:45,  1.90s/it, loss=0.228, lr=1e-5]Steps:  60%|██████    | 9033/15001 [5:48:55<3:08:45,  1.90s/it, loss=0.0762, lr=1e-5]Steps:  60%|██████    | 9034/15001 [5:48:56<3:13:25,  1.95s/it, loss=0.0762, lr=1e-5]Steps:  60%|██████    | 9034/15001 [5:48:57<3:13:25,  1.95s/it, loss=0.268, lr=1e-5] Steps:  60%|██████    | 9035/15001 [5:48:59<3:16:33,  1.98s/it, loss=0.268, lr=1e-5]Steps:  60%|██████    | 9035/15001 [5:48:59<3:16:33,  1.98s/it, loss=0.196, lr=1e-5]Steps:  60%|██████    | 9036/15001 [5:49:00<3:03:46,  1.85s/it, loss=0.196, lr=1e-5]Steps:  60%|██████    | 9036/15001 [5:49:00<3:03:46,  1.85s/it, loss=0.102, lr=1e-5]Steps:  60%|██████    | 9037/15001 [5:49:02<3:04:50,  1.86s/it, loss=0.102, lr=1e-5]Steps:  60%|██████    | 9037/15001 [5:49:02<3:04:50,  1.86s/it, loss=0.314, lr=1e-5]Steps:  60%|██████    | 9038/15001 [5:49:04<3:01:30,  1.83s/it, loss=0.314, lr=1e-5]Steps:  60%|██████    | 9038/15001 [5:49:04<3:01:30,  1.83s/it, loss=0.0589, lr=1e-5]Steps:  60%|██████    | 9039/15001 [5:49:06<3:06:01,  1.87s/it, loss=0.0589, lr=1e-5]Steps:  60%|██████    | 9039/15001 [5:49:06<3:06:01,  1.87s/it, loss=0.399, lr=1e-5] Steps:  60%|██████    | 9040/15001 [5:49:08<3:06:58,  1.88s/it, loss=0.399, lr=1e-5]Steps:  60%|██████    | 9040/15001 [5:49:08<3:06:58,  1.88s/it, loss=0.156, lr=1e-5]Steps:  60%|██████    | 9041/15001 [5:49:09<3:07:20,  1.89s/it, loss=0.156, lr=1e-5]Steps:  60%|██████    | 9041/15001 [5:49:10<3:07:20,  1.89s/it, loss=0.0436, lr=1e-5]Steps:  60%|██████    | 9042/15001 [5:49:11<3:07:25,  1.89s/it, loss=0.0436, lr=1e-5]Steps:  60%|██████    | 9042/15001 [5:49:12<3:07:25,  1.89s/it, loss=0.331, lr=1e-5] Steps:  60%|██████    | 9043/15001 [5:49:13<3:07:00,  1.88s/it, loss=0.331, lr=1e-5]Steps:  60%|██████    | 9043/15001 [5:49:13<3:07:00,  1.88s/it, loss=0.345, lr=1e-5]Steps:  60%|██████    | 9044/15001 [5:49:15<3:04:52,  1.86s/it, loss=0.345, lr=1e-5]Steps:  60%|██████    | 9044/15001 [5:49:15<3:04:52,  1.86s/it, loss=0.087, lr=1e-5]Steps:  60%|██████    | 9045/15001 [5:49:17<3:05:11,  1.87s/it, loss=0.087, lr=1e-5]Steps:  60%|██████    | 9045/15001 [5:49:17<3:05:11,  1.87s/it, loss=0.0359, lr=1e-5]Steps:  60%|██████    | 9046/15001 [5:49:19<2:57:55,  1.79s/it, loss=0.0359, lr=1e-5]Steps:  60%|██████    | 9046/15001 [5:49:19<2:57:55,  1.79s/it, loss=0.0648, lr=1e-5]Steps:  60%|██████    | 9047/15001 [5:49:21<3:04:32,  1.86s/it, loss=0.0648, lr=1e-5]Steps:  60%|██████    | 9047/15001 [5:49:21<3:04:32,  1.86s/it, loss=0.0659, lr=1e-5]Steps:  60%|██████    | 9048/15001 [5:49:22<2:57:54,  1.79s/it, loss=0.0659, lr=1e-5]Steps:  60%|██████    | 9048/15001 [5:49:23<2:57:54,  1.79s/it, loss=0.0968, lr=1e-5]Steps:  60%|██████    | 9049/15001 [5:49:24<3:03:32,  1.85s/it, loss=0.0968, lr=1e-5]Steps:  60%|██████    | 9049/15001 [5:49:24<3:03:32,  1.85s/it, loss=0.107, lr=1e-5] Steps:  60%|██████    | 9050/15001 [5:49:26<3:09:57,  1.92s/it, loss=0.107, lr=1e-5]Steps:  60%|██████    | 9050/15001 [5:49:26<3:09:57,  1.92s/it, loss=0.129, lr=1e-5]Steps:  60%|██████    | 9051/15001 [5:49:28<3:04:14,  1.86s/it, loss=0.129, lr=1e-5]Steps:  60%|██████    | 9051/15001 [5:49:28<3:04:14,  1.86s/it, loss=0.3, lr=1e-5]  Steps:  60%|██████    | 9052/15001 [5:49:30<3:17:40,  1.99s/it, loss=0.3, lr=1e-5]Steps:  60%|██████    | 9052/15001 [5:49:30<3:17:40,  1.99s/it, loss=0.413, lr=1e-5]Steps:  60%|██████    | 9053/15001 [5:49:32<3:13:25,  1.95s/it, loss=0.413, lr=1e-5]Steps:  60%|██████    | 9053/15001 [5:49:32<3:13:25,  1.95s/it, loss=0.286, lr=1e-5]Steps:  60%|██████    | 9054/15001 [5:49:34<3:20:29,  2.02s/it, loss=0.286, lr=1e-5]Steps:  60%|██████    | 9054/15001 [5:49:34<3:20:29,  2.02s/it, loss=0.158, lr=1e-5]Steps:  60%|██████    | 9055/15001 [5:49:36<3:20:05,  2.02s/it, loss=0.158, lr=1e-5]Steps:  60%|██████    | 9055/15001 [5:49:36<3:20:05,  2.02s/it, loss=0.285, lr=1e-5]Steps:  60%|██████    | 9056/15001 [5:49:38<3:09:35,  1.91s/it, loss=0.285, lr=1e-5]Steps:  60%|██████    | 9056/15001 [5:49:38<3:09:35,  1.91s/it, loss=0.0417, lr=1e-5]Steps:  60%|██████    | 9057/15001 [5:49:40<3:02:56,  1.85s/it, loss=0.0417, lr=1e-5]Steps:  60%|██████    | 9057/15001 [5:49:40<3:02:56,  1.85s/it, loss=0.206, lr=1e-5] Steps:  60%|██████    | 9058/15001 [5:49:41<2:55:51,  1.78s/it, loss=0.206, lr=1e-5]Steps:  60%|██████    | 9058/15001 [5:49:42<2:55:51,  1.78s/it, loss=0.059, lr=1e-5]Steps:  60%|██████    | 9059/15001 [5:49:43<3:05:03,  1.87s/it, loss=0.059, lr=1e-5]Steps:  60%|██████    | 9059/15001 [5:49:43<3:05:03,  1.87s/it, loss=0.126, lr=1e-5]Steps:  60%|██████    | 9060/15001 [5:49:45<2:59:06,  1.81s/it, loss=0.126, lr=1e-5]Steps:  60%|██████    | 9060/15001 [5:49:45<2:59:06,  1.81s/it, loss=0.169, lr=1e-5]Steps:  60%|██████    | 9061/15001 [5:49:47<2:53:51,  1.76s/it, loss=0.169, lr=1e-5]Steps:  60%|██████    | 9061/15001 [5:49:47<2:53:51,  1.76s/it, loss=0.0758, lr=1e-5]Steps:  60%|██████    | 9062/15001 [5:49:48<2:52:14,  1.74s/it, loss=0.0758, lr=1e-5]Steps:  60%|██████    | 9062/15001 [5:49:49<2:52:14,  1.74s/it, loss=0.154, lr=1e-5] Steps:  60%|██████    | 9063/15001 [5:49:50<2:59:28,  1.81s/it, loss=0.154, lr=1e-5]Steps:  60%|██████    | 9063/15001 [5:49:51<2:59:28,  1.81s/it, loss=0.325, lr=1e-5]Steps:  60%|██████    | 9064/15001 [5:49:52<2:55:18,  1.77s/it, loss=0.325, lr=1e-5]Steps:  60%|██████    | 9064/15001 [5:49:52<2:55:18,  1.77s/it, loss=0.0619, lr=1e-5]Steps:  60%|██████    | 9065/15001 [5:49:54<3:00:12,  1.82s/it, loss=0.0619, lr=1e-5]Steps:  60%|██████    | 9065/15001 [5:49:54<3:00:12,  1.82s/it, loss=0.104, lr=1e-5] Steps:  60%|██████    | 9066/15001 [5:49:56<3:03:17,  1.85s/it, loss=0.104, lr=1e-5]Steps:  60%|██████    | 9066/15001 [5:49:56<3:03:17,  1.85s/it, loss=0.0921, lr=1e-5]Steps:  60%|██████    | 9067/15001 [5:49:58<3:08:34,  1.91s/it, loss=0.0921, lr=1e-5]Steps:  60%|██████    | 9067/15001 [5:49:58<3:08:34,  1.91s/it, loss=0.147, lr=1e-5] Steps:  60%|██████    | 9068/15001 [5:50:00<3:02:18,  1.84s/it, loss=0.147, lr=1e-5]Steps:  60%|██████    | 9068/15001 [5:50:00<3:02:18,  1.84s/it, loss=0.135, lr=1e-5]Steps:  60%|██████    | 9069/15001 [5:50:01<2:57:20,  1.79s/it, loss=0.135, lr=1e-5]Steps:  60%|██████    | 9069/15001 [5:50:02<2:57:20,  1.79s/it, loss=0.133, lr=1e-5]Steps:  60%|██████    | 9070/15001 [5:50:03<3:03:20,  1.85s/it, loss=0.133, lr=1e-5]Steps:  60%|██████    | 9070/15001 [5:50:03<3:03:20,  1.85s/it, loss=0.298, lr=1e-5]Steps:  60%|██████    | 9071/15001 [5:50:05<3:02:36,  1.85s/it, loss=0.298, lr=1e-5]Steps:  60%|██████    | 9071/15001 [5:50:05<3:02:36,  1.85s/it, loss=0.131, lr=1e-5]Steps:  60%|██████    | 9072/15001 [5:50:07<2:59:59,  1.82s/it, loss=0.131, lr=1e-5]Steps:  60%|██████    | 9072/15001 [5:50:07<2:59:59,  1.82s/it, loss=0.207, lr=1e-5]Steps:  60%|██████    | 9073/15001 [5:50:09<3:07:25,  1.90s/it, loss=0.207, lr=1e-5]Steps:  60%|██████    | 9073/15001 [5:50:09<3:07:25,  1.90s/it, loss=0.0771, lr=1e-5]Steps:  60%|██████    | 9074/15001 [5:50:11<3:17:49,  2.00s/it, loss=0.0771, lr=1e-5]Steps:  60%|██████    | 9074/15001 [5:50:11<3:17:49,  2.00s/it, loss=0.0672, lr=1e-5]Steps:  60%|██████    | 9075/15001 [5:50:13<3:18:33,  2.01s/it, loss=0.0672, lr=1e-5]Steps:  60%|██████    | 9075/15001 [5:50:13<3:18:33,  2.01s/it, loss=0.136, lr=1e-5] Steps:  61%|██████    | 9076/15001 [5:50:15<3:15:35,  1.98s/it, loss=0.136, lr=1e-5]Steps:  61%|██████    | 9076/15001 [5:50:15<3:15:35,  1.98s/it, loss=0.0831, lr=1e-5]Steps:  61%|██████    | 9077/15001 [5:50:17<3:12:34,  1.95s/it, loss=0.0831, lr=1e-5]Steps:  61%|██████    | 9077/15001 [5:50:17<3:12:34,  1.95s/it, loss=0.16, lr=1e-5]  Steps:  61%|██████    | 9078/15001 [5:50:19<3:15:35,  1.98s/it, loss=0.16, lr=1e-5]Steps:  61%|██████    | 9078/15001 [5:50:19<3:15:35,  1.98s/it, loss=0.0754, lr=1e-5]Steps:  61%|██████    | 9079/15001 [5:50:21<3:20:26,  2.03s/it, loss=0.0754, lr=1e-5]Steps:  61%|██████    | 9079/15001 [5:50:21<3:20:26,  2.03s/it, loss=0.361, lr=1e-5] Steps:  61%|██████    | 9080/15001 [5:50:23<3:14:51,  1.97s/it, loss=0.361, lr=1e-5]Steps:  61%|██████    | 9080/15001 [5:50:23<3:14:51,  1.97s/it, loss=0.0929, lr=1e-5]Steps:  61%|██████    | 9081/15001 [5:50:25<3:02:34,  1.85s/it, loss=0.0929, lr=1e-5]Steps:  61%|██████    | 9081/15001 [5:50:25<3:02:34,  1.85s/it, loss=0.43, lr=1e-5]  Steps:  61%|██████    | 9082/15001 [5:50:27<3:03:19,  1.86s/it, loss=0.43, lr=1e-5]Steps:  61%|██████    | 9082/15001 [5:50:27<3:03:19,  1.86s/it, loss=0.154, lr=1e-5]Steps:  61%|██████    | 9083/15001 [5:50:28<3:03:34,  1.86s/it, loss=0.154, lr=1e-5]Steps:  61%|██████    | 9083/15001 [5:50:29<3:03:34,  1.86s/it, loss=0.202, lr=1e-5]Steps:  61%|██████    | 9084/15001 [5:50:31<3:10:38,  1.93s/it, loss=0.202, lr=1e-5]Steps:  61%|██████    | 9084/15001 [5:50:31<3:10:38,  1.93s/it, loss=0.116, lr=1e-5]Steps:  61%|██████    | 9085/15001 [5:50:32<3:01:35,  1.84s/it, loss=0.116, lr=1e-5]Steps:  61%|██████    | 9085/15001 [5:50:32<3:01:35,  1.84s/it, loss=0.0429, lr=1e-5]Steps:  61%|██████    | 9086/15001 [5:50:34<3:05:30,  1.88s/it, loss=0.0429, lr=1e-5]Steps:  61%|██████    | 9086/15001 [5:50:34<3:05:30,  1.88s/it, loss=0.277, lr=1e-5] Steps:  61%|██████    | 9087/15001 [5:50:36<3:06:19,  1.89s/it, loss=0.277, lr=1e-5]Steps:  61%|██████    | 9087/15001 [5:50:36<3:06:19,  1.89s/it, loss=0.247, lr=1e-5]Steps:  61%|██████    | 9088/15001 [5:50:38<3:04:24,  1.87s/it, loss=0.247, lr=1e-5]Steps:  61%|██████    | 9088/15001 [5:50:38<3:04:24,  1.87s/it, loss=0.147, lr=1e-5]Steps:  61%|██████    | 9089/15001 [5:50:40<3:03:24,  1.86s/it, loss=0.147, lr=1e-5]Steps:  61%|██████    | 9089/15001 [5:50:40<3:03:24,  1.86s/it, loss=0.0343, lr=1e-5]Steps:  61%|██████    | 9090/15001 [5:50:41<2:58:34,  1.81s/it, loss=0.0343, lr=1e-5]Steps:  61%|██████    | 9090/15001 [5:50:42<2:58:34,  1.81s/it, loss=0.0941, lr=1e-5]Steps:  61%|██████    | 9091/15001 [5:50:43<2:52:00,  1.75s/it, loss=0.0941, lr=1e-5]Steps:  61%|██████    | 9091/15001 [5:50:43<2:52:00,  1.75s/it, loss=0.253, lr=1e-5] Steps:  61%|██████    | 9092/15001 [5:50:45<3:08:22,  1.91s/it, loss=0.253, lr=1e-5]Steps:  61%|██████    | 9092/15001 [5:50:45<3:08:22,  1.91s/it, loss=0.0769, lr=1e-5]Steps:  61%|██████    | 9093/15001 [5:50:47<3:01:26,  1.84s/it, loss=0.0769, lr=1e-5]Steps:  61%|██████    | 9093/15001 [5:50:47<3:01:26,  1.84s/it, loss=0.163, lr=1e-5] Steps:  61%|██████    | 9094/15001 [5:50:49<3:00:20,  1.83s/it, loss=0.163, lr=1e-5]Steps:  61%|██████    | 9094/15001 [5:50:49<3:00:20,  1.83s/it, loss=0.374, lr=1e-5]Steps:  61%|██████    | 9095/15001 [5:50:50<2:51:47,  1.75s/it, loss=0.374, lr=1e-5]Steps:  61%|██████    | 9095/15001 [5:50:51<2:51:47,  1.75s/it, loss=0.092, lr=1e-5]Steps:  61%|██████    | 9096/15001 [5:50:53<3:07:11,  1.90s/it, loss=0.092, lr=1e-5]Steps:  61%|██████    | 9096/15001 [5:50:53<3:07:11,  1.90s/it, loss=0.108, lr=1e-5]Steps:  61%|██████    | 9097/15001 [5:50:55<3:28:16,  2.12s/it, loss=0.108, lr=1e-5]Steps:  61%|██████    | 9097/15001 [5:50:55<3:28:16,  2.12s/it, loss=0.38, lr=1e-5] Steps:  61%|██████    | 9098/15001 [5:50:57<3:15:32,  1.99s/it, loss=0.38, lr=1e-5]Steps:  61%|██████    | 9098/15001 [5:50:57<3:15:32,  1.99s/it, loss=0.148, lr=1e-5]Steps:  61%|██████    | 9099/15001 [5:50:59<3:24:04,  2.07s/it, loss=0.148, lr=1e-5]Steps:  61%|██████    | 9099/15001 [5:50:59<3:24:04,  2.07s/it, loss=0.183, lr=1e-5]Steps:  61%|██████    | 9100/15001 [5:51:01<3:17:40,  2.01s/it, loss=0.183, lr=1e-5]Steps:  61%|██████    | 9100/15001 [5:51:01<3:17:40,  2.01s/it, loss=0.152, lr=1e-5]Steps:  61%|██████    | 9101/15001 [5:51:03<3:05:08,  1.88s/it, loss=0.152, lr=1e-5]Steps:  61%|██████    | 9101/15001 [5:51:03<3:05:08,  1.88s/it, loss=0.278, lr=1e-5]Steps:  61%|██████    | 9102/15001 [5:51:05<3:09:08,  1.92s/it, loss=0.278, lr=1e-5]Steps:  61%|██████    | 9102/15001 [5:51:05<3:09:08,  1.92s/it, loss=0.251, lr=1e-5]Steps:  61%|██████    | 9103/15001 [5:51:06<2:59:59,  1.83s/it, loss=0.251, lr=1e-5]Steps:  61%|██████    | 9103/15001 [5:51:07<2:59:59,  1.83s/it, loss=0.187, lr=1e-5]Steps:  61%|██████    | 9104/15001 [5:51:08<3:02:00,  1.85s/it, loss=0.187, lr=1e-5]Steps:  61%|██████    | 9104/15001 [5:51:08<3:02:00,  1.85s/it, loss=0.114, lr=1e-5]Steps:  61%|██████    | 9105/15001 [5:51:10<3:03:33,  1.87s/it, loss=0.114, lr=1e-5]Steps:  61%|██████    | 9105/15001 [5:51:10<3:03:33,  1.87s/it, loss=0.0876, lr=1e-5]Steps:  61%|██████    | 9106/15001 [5:51:12<3:02:20,  1.86s/it, loss=0.0876, lr=1e-5]Steps:  61%|██████    | 9106/15001 [5:51:12<3:02:20,  1.86s/it, loss=0.233, lr=1e-5] Steps:  61%|██████    | 9107/15001 [5:51:14<3:08:22,  1.92s/it, loss=0.233, lr=1e-5]Steps:  61%|██████    | 9107/15001 [5:51:14<3:08:22,  1.92s/it, loss=0.0915, lr=1e-5]Steps:  61%|██████    | 9108/15001 [5:51:16<3:10:08,  1.94s/it, loss=0.0915, lr=1e-5]Steps:  61%|██████    | 9108/15001 [5:51:16<3:10:08,  1.94s/it, loss=0.247, lr=1e-5] Steps:  61%|██████    | 9109/15001 [5:51:18<3:04:52,  1.88s/it, loss=0.247, lr=1e-5]Steps:  61%|██████    | 9109/15001 [5:51:18<3:04:52,  1.88s/it, loss=0.236, lr=1e-5]Steps:  61%|██████    | 9110/15001 [5:51:20<3:04:52,  1.88s/it, loss=0.236, lr=1e-5]Steps:  61%|██████    | 9110/15001 [5:51:20<3:04:52,  1.88s/it, loss=0.167, lr=1e-5]Steps:  61%|██████    | 9111/15001 [5:51:21<3:01:47,  1.85s/it, loss=0.167, lr=1e-5]Steps:  61%|██████    | 9111/15001 [5:51:21<3:01:47,  1.85s/it, loss=0.179, lr=1e-5]Steps:  61%|██████    | 9112/15001 [5:51:23<3:01:49,  1.85s/it, loss=0.179, lr=1e-5]Steps:  61%|██████    | 9112/15001 [5:51:23<3:01:49,  1.85s/it, loss=0.118, lr=1e-5]Steps:  61%|██████    | 9113/15001 [5:51:25<3:02:03,  1.86s/it, loss=0.118, lr=1e-5]Steps:  61%|██████    | 9113/15001 [5:51:25<3:02:03,  1.86s/it, loss=0.302, lr=1e-5]Steps:  61%|██████    | 9114/15001 [5:51:27<2:58:44,  1.82s/it, loss=0.302, lr=1e-5]Steps:  61%|██████    | 9114/15001 [5:51:27<2:58:44,  1.82s/it, loss=0.315, lr=1e-5]Steps:  61%|██████    | 9115/15001 [5:51:29<3:00:00,  1.83s/it, loss=0.315, lr=1e-5]Steps:  61%|██████    | 9115/15001 [5:51:29<3:00:00,  1.83s/it, loss=0.297, lr=1e-5]Steps:  61%|██████    | 9116/15001 [5:51:30<2:59:50,  1.83s/it, loss=0.297, lr=1e-5]Steps:  61%|██████    | 9116/15001 [5:51:31<2:59:50,  1.83s/it, loss=0.209, lr=1e-5]Steps:  61%|██████    | 9117/15001 [5:51:32<3:03:47,  1.87s/it, loss=0.209, lr=1e-5]Steps:  61%|██████    | 9117/15001 [5:51:33<3:03:47,  1.87s/it, loss=0.405, lr=1e-5]Steps:  61%|██████    | 9118/15001 [5:51:34<3:07:31,  1.91s/it, loss=0.405, lr=1e-5]Steps:  61%|██████    | 9118/15001 [5:51:35<3:07:31,  1.91s/it, loss=0.0652, lr=1e-5]Steps:  61%|██████    | 9119/15001 [5:51:36<3:06:53,  1.91s/it, loss=0.0652, lr=1e-5]Steps:  61%|██████    | 9119/15001 [5:51:37<3:06:53,  1.91s/it, loss=0.186, lr=1e-5] Steps:  61%|██████    | 9120/15001 [5:51:38<3:09:51,  1.94s/it, loss=0.186, lr=1e-5]Steps:  61%|██████    | 9120/15001 [5:51:39<3:09:51,  1.94s/it, loss=0.221, lr=1e-5]Steps:  61%|██████    | 9121/15001 [5:51:40<3:10:23,  1.94s/it, loss=0.221, lr=1e-5]Steps:  61%|██████    | 9121/15001 [5:51:41<3:10:23,  1.94s/it, loss=0.112, lr=1e-5]Steps:  61%|██████    | 9122/15001 [5:51:43<3:17:44,  2.02s/it, loss=0.112, lr=1e-5]Steps:  61%|██████    | 9122/15001 [5:51:43<3:17:44,  2.02s/it, loss=0.179, lr=1e-5]Steps:  61%|██████    | 9123/15001 [5:51:44<3:11:20,  1.95s/it, loss=0.179, lr=1e-5]Steps:  61%|██████    | 9123/15001 [5:51:44<3:11:20,  1.95s/it, loss=0.0535, lr=1e-5]Steps:  61%|██████    | 9124/15001 [5:51:46<3:06:27,  1.90s/it, loss=0.0535, lr=1e-5]Steps:  61%|██████    | 9124/15001 [5:51:46<3:06:27,  1.90s/it, loss=0.101, lr=1e-5] Steps:  61%|██████    | 9125/15001 [5:51:48<3:01:53,  1.86s/it, loss=0.101, lr=1e-5]Steps:  61%|██████    | 9125/15001 [5:51:48<3:01:53,  1.86s/it, loss=0.0503, lr=1e-5]Steps:  61%|██████    | 9126/15001 [5:51:50<2:58:57,  1.83s/it, loss=0.0503, lr=1e-5]Steps:  61%|██████    | 9126/15001 [5:51:50<2:58:57,  1.83s/it, loss=0.257, lr=1e-5] Steps:  61%|██████    | 9127/15001 [5:51:51<2:55:48,  1.80s/it, loss=0.257, lr=1e-5]Steps:  61%|██████    | 9127/15001 [5:51:52<2:55:48,  1.80s/it, loss=0.487, lr=1e-5]Steps:  61%|██████    | 9128/15001 [5:51:53<2:56:34,  1.80s/it, loss=0.487, lr=1e-5]Steps:  61%|██████    | 9128/15001 [5:51:53<2:56:34,  1.80s/it, loss=0.129, lr=1e-5]Steps:  61%|██████    | 9129/15001 [5:51:55<2:59:19,  1.83s/it, loss=0.129, lr=1e-5]Steps:  61%|██████    | 9129/15001 [5:51:55<2:59:19,  1.83s/it, loss=0.297, lr=1e-5]Steps:  61%|██████    | 9130/15001 [5:51:57<2:53:54,  1.78s/it, loss=0.297, lr=1e-5]Steps:  61%|██████    | 9130/15001 [5:51:57<2:53:54,  1.78s/it, loss=0.121, lr=1e-5]Steps:  61%|██████    | 9131/15001 [5:51:59<2:59:18,  1.83s/it, loss=0.121, lr=1e-5]Steps:  61%|██████    | 9131/15001 [5:51:59<2:59:18,  1.83s/it, loss=0.0851, lr=1e-5]Steps:  61%|██████    | 9132/15001 [5:52:00<2:56:23,  1.80s/it, loss=0.0851, lr=1e-5]Steps:  61%|██████    | 9132/15001 [5:52:01<2:56:23,  1.80s/it, loss=0.173, lr=1e-5] Steps:  61%|███��██    | 9133/15001 [5:52:02<3:03:08,  1.87s/it, loss=0.173, lr=1e-5]Steps:  61%|██████    | 9133/15001 [5:52:02<3:03:08,  1.87s/it, loss=0.123, lr=1e-5]Steps:  61%|██████    | 9134/15001 [5:52:04<2:56:50,  1.81s/it, loss=0.123, lr=1e-5]Steps:  61%|██████    | 9134/15001 [5:52:04<2:56:50,  1.81s/it, loss=0.0789, lr=1e-5]Steps:  61%|██████    | 9135/15001 [5:52:06<3:01:21,  1.86s/it, loss=0.0789, lr=1e-5]Steps:  61%|██████    | 9135/15001 [5:52:06<3:01:21,  1.86s/it, loss=0.209, lr=1e-5] Steps:  61%|██████    | 9136/15001 [5:52:08<3:00:51,  1.85s/it, loss=0.209, lr=1e-5]Steps:  61%|██████    | 9136/15001 [5:52:08<3:00:51,  1.85s/it, loss=0.161, lr=1e-5]Steps:  61%|██████    | 9137/15001 [5:52:10<2:56:46,  1.81s/it, loss=0.161, lr=1e-5]Steps:  61%|██████    | 9137/15001 [5:52:10<2:56:46,  1.81s/it, loss=0.0929, lr=1e-5]Steps:  61%|██████    | 9138/15001 [5:52:11<2:56:41,  1.81s/it, loss=0.0929, lr=1e-5]Steps:  61%|██████    | 9138/15001 [5:52:12<2:56:41,  1.81s/it, loss=0.226, lr=1e-5] Steps:  61%|██████    | 9139/15001 [5:52:13<3:02:36,  1.87s/it, loss=0.226, lr=1e-5]Steps:  61%|██████    | 9139/15001 [5:52:13<3:02:36,  1.87s/it, loss=0.157, lr=1e-5]Steps:  61%|██████    | 9140/15001 [5:52:15<3:00:04,  1.84s/it, loss=0.157, lr=1e-5]Steps:  61%|██████    | 9140/15001 [5:52:15<3:00:04,  1.84s/it, loss=0.413, lr=1e-5]Steps:  61%|██████    | 9141/15001 [5:52:17<2:59:32,  1.84s/it, loss=0.413, lr=1e-5]Steps:  61%|██████    | 9141/15001 [5:52:17<2:59:32,  1.84s/it, loss=0.156, lr=1e-5]Steps:  61%|██████    | 9142/15001 [5:52:19<3:13:04,  1.98s/it, loss=0.156, lr=1e-5]Steps:  61%|██████    | 9142/15001 [5:52:19<3:13:04,  1.98s/it, loss=0.407, lr=1e-5]Steps:  61%|██████    | 9143/15001 [5:52:21<3:12:04,  1.97s/it, loss=0.407, lr=1e-5]Steps:  61%|██████    | 9143/15001 [5:52:21<3:12:04,  1.97s/it, loss=0.068, lr=1e-5]Steps:  61%|██████    | 9144/15001 [5:52:23<3:12:08,  1.97s/it, loss=0.068, lr=1e-5]Steps:  61%|██████    | 9144/15001 [5:52:23<3:12:08,  1.97s/it, loss=0.119, lr=1e-5]Steps:  61%|██████    | 9145/15001 [5:52:25<3:11:00,  1.96s/it, loss=0.119, lr=1e-5]Steps:  61%|██████    | 9145/15001 [5:52:25<3:11:00,  1.96s/it, loss=0.186, lr=1e-5]Steps:  61%|██████    | 9146/15001 [5:52:27<3:13:13,  1.98s/it, loss=0.186, lr=1e-5]Steps:  61%|██████    | 9146/15001 [5:52:27<3:13:13,  1.98s/it, loss=0.172, lr=1e-5]Steps:  61%|██████    | 9147/15001 [5:52:29<3:03:38,  1.88s/it, loss=0.172, lr=1e-5]Steps:  61%|██████    | 9147/15001 [5:52:29<3:03:38,  1.88s/it, loss=0.341, lr=1e-5]Steps:  61%|██████    | 9148/15001 [5:52:31<3:06:24,  1.91s/it, loss=0.341, lr=1e-5]Steps:  61%|██████    | 9148/15001 [5:52:31<3:06:24,  1.91s/it, loss=0.162, lr=1e-5]Steps:  61%|██████    | 9149/15001 [5:52:33<3:02:38,  1.87s/it, loss=0.162, lr=1e-5]Steps:  61%|██████    | 9149/15001 [5:52:33<3:02:38,  1.87s/it, loss=0.193, lr=1e-5]Steps:  61%|██████    | 9150/15001 [5:52:34<2:53:43,  1.78s/it, loss=0.193, lr=1e-5]Steps:  61%|██████    | 9150/15001 [5:52:34<2:53:43,  1.78s/it, loss=0.153, lr=1e-5]Steps:  61%|██████    | 9151/15001 [5:52:36<3:02:16,  1.87s/it, loss=0.153, lr=1e-5]Steps:  61%|██████    | 9151/15001 [5:52:37<3:02:16,  1.87s/it, loss=0.34, lr=1e-5] Steps:  61%|██████    | 9152/15001 [5:52:38<3:04:10,  1.89s/it, loss=0.34, lr=1e-5]Steps:  61%|██████    | 9152/15001 [5:52:38<3:04:10,  1.89s/it, loss=0.2, lr=1e-5] Steps:  61%|██████    | 9153/15001 [5:52:40<3:00:58,  1.86s/it, loss=0.2, lr=1e-5]Steps:  61%|██████    | 9153/15001 [5:52:40<3:00:58,  1.86s/it, loss=0.0539, lr=1e-5]Steps:  61%|██████    | 9154/15001 [5:52:42<3:00:24,  1.85s/it, loss=0.0539, lr=1e-5]Steps:  61%|██████    | 9154/15001 [5:52:42<3:00:24,  1.85s/it, loss=0.315, lr=1e-5] Steps:  61%|██████    | 9155/15001 [5:52:44<3:04:04,  1.89s/it, loss=0.315, lr=1e-5]Steps:  61%|██████    | 9155/15001 [5:52:44<3:04:04,  1.89s/it, loss=0.138, lr=1e-5]Steps:  61%|██████    | 9156/15001 [5:52:46<3:01:31,  1.86s/it, loss=0.138, lr=1e-5]Steps:  61%|██████    | 9156/15001 [5:52:46<3:01:31,  1.86s/it, loss=0.152, lr=1e-5]Steps:  61%|██████    | 9157/15001 [5:52:47<2:56:57,  1.82s/it, loss=0.152, lr=1e-5]Steps:  61%|██████    | 9157/15001 [5:52:47<2:56:57,  1.82s/it, loss=0.0647, lr=1e-5]Steps:  61%|██████    | 9158/15001 [5:52:49<2:58:09,  1.83s/it, loss=0.0647, lr=1e-5]Steps:  61%|██████    | 9158/15001 [5:52:49<2:58:09,  1.83s/it, loss=0.159, lr=1e-5] Steps:  61%|██████    | 9159/15001 [5:52:51<2:55:15,  1.80s/it, loss=0.159, lr=1e-5]Steps:  61%|██████    | 9159/15001 [5:52:51<2:55:15,  1.80s/it, loss=0.308, lr=1e-5]Steps:  61%|██████    | 9160/15001 [5:52:52<2:47:29,  1.72s/it, loss=0.308, lr=1e-5]Steps:  61%|██████    | 9160/15001 [5:52:53<2:47:29,  1.72s/it, loss=0.212, lr=1e-5]Steps:  61%|██████    | 9161/15001 [5:52:54<2:50:40,  1.75s/it, loss=0.212, lr=1e-5]Steps:  61%|██████    | 9161/15001 [5:52:54<2:50:40,  1.75s/it, loss=0.162, lr=1e-5]Steps:  61%|██████    | 9162/15001 [5:52:56<2:54:22,  1.79s/it, loss=0.162, lr=1e-5]Steps:  61%|██████    | 9162/15001 [5:52:56<2:54:22,  1.79s/it, loss=0.0801, lr=1e-5]Steps:  61%|██████    | 9163/15001 [5:52:58<2:55:49,  1.81s/it, loss=0.0801, lr=1e-5]Steps:  61%|██████    | 9163/15001 [5:52:58<2:55:49,  1.81s/it, loss=0.148, lr=1e-5] Steps:  61%|██████    | 9164/15001 [5:53:00<3:07:59,  1.93s/it, loss=0.148, lr=1e-5]Steps:  61%|██████    | 9164/15001 [5:53:00<3:07:59,  1.93s/it, loss=0.148, lr=1e-5]Steps:  61%|██████    | 9165/15001 [5:53:02<3:07:04,  1.92s/it, loss=0.148, lr=1e-5]Steps:  61%|██████    | 9165/15001 [5:53:02<3:07:04,  1.92s/it, loss=0.144, lr=1e-5]Steps:  61%|██████    | 9166/15001 [5:53:04<3:06:02,  1.91s/it, loss=0.144, lr=1e-5]Steps:  61%|██████    | 9166/15001 [5:53:04<3:06:02,  1.91s/it, loss=0.155, lr=1e-5]Steps:  61%|██████    | 9167/15001 [5:53:06<3:11:26,  1.97s/it, loss=0.155, lr=1e-5]Steps:  61%|██████    | 9167/15001 [5:53:06<3:11:26,  1.97s/it, loss=0.292, lr=1e-5]Steps:  61%|██████    | 9168/15001 [5:53:08<3:11:58,  1.97s/it, loss=0.292, lr=1e-5]Steps:  61%|██████    | 9168/15001 [5:53:08<3:11:58,  1.97s/it, loss=0.199, lr=1e-5]Steps:  61%|██████    | 9169/15001 [5:53:10<3:01:34,  1.87s/it, loss=0.199, lr=1e-5]Steps:  61%|██████    | 9169/15001 [5:53:10<3:01:34,  1.87s/it, loss=0.173, lr=1e-5]Steps:  61%|██████    | 9170/15001 [5:53:12<2:59:47,  1.85s/it, loss=0.173, lr=1e-5]Steps:  61%|██████    | 9170/15001 [5:53:12<2:59:47,  1.85s/it, loss=0.0598, lr=1e-5]Steps:  61%|██████    | 9171/15001 [5:53:14<3:07:33,  1.93s/it, loss=0.0598, lr=1e-5]Steps:  61%|██████    | 9171/15001 [5:53:14<3:07:33,  1.93s/it, loss=0.123, lr=1e-5] Steps:  61%|██████    | 9172/15001 [5:53:15<3:03:41,  1.89s/it, loss=0.123, lr=1e-5]Steps:  61%|██████    | 9172/15001 [5:53:16<3:03:41,  1.89s/it, loss=0.169, lr=1e-5]Steps:  61%|██████    | 9173/15001 [5:53:17<2:57:38,  1.83s/it, loss=0.169, lr=1e-5]Steps:  61%|██████    | 9173/15001 [5:53:17<2:57:38,  1.83s/it, loss=0.243, lr=1e-5]Steps:  61%|██████    | 9174/15001 [5:53:19<2:50:36,  1.76s/it, loss=0.243, lr=1e-5]Steps:  61%|██████    | 9174/15001 [5:53:19<2:50:36,  1.76s/it, loss=0.259, lr=1e-5]Steps:  61%|██████    | 9175/15001 [5:53:21<2:52:19,  1.77s/it, loss=0.259, lr=1e-5]Steps:  61%|██████    | 9175/15001 [5:53:21<2:52:19,  1.77s/it, loss=0.0796, lr=1e-5]Steps:  61%|██████    | 9176/15001 [5:53:22<2:57:42,  1.83s/it, loss=0.0796, lr=1e-5]Steps:  61%|██████    | 9176/15001 [5:53:23<2:57:42,  1.83s/it, loss=0.105, lr=1e-5] Steps:  61%|██████    | 9177/15001 [5:53:24<2:56:33,  1.82s/it, loss=0.105, lr=1e-5]Steps:  61%|██████    | 9177/15001 [5:53:25<2:56:33,  1.82s/it, loss=0.236, lr=1e-5]Steps:  61%|██████    | 9178/15001 [5:53:26<3:00:26,  1.86s/it, loss=0.236, lr=1e-5]Steps:  61%|██████    | 9178/15001 [5:53:26<3:00:26,  1.86s/it, loss=0.206, lr=1e-5]Steps:  61%|██████    | 9179/15001 [5:53:28<3:02:56,  1.89s/it, loss=0.206, lr=1e-5]Steps:  61%|██████    | 9179/15001 [5:53:28<3:02:56,  1.89s/it, loss=0.288, lr=1e-5]Steps:  61%|██████    | 9180/15001 [5:53:30<3:00:01,  1.86s/it, loss=0.288, lr=1e-5]Steps:  61%|██████    | 9180/15001 [5:53:30<3:00:01,  1.86s/it, loss=0.0664, lr=1e-5]Steps:  61%|██████    | 9181/15001 [5:53:32<2:59:17,  1.85s/it, loss=0.0664, lr=1e-5]Steps:  61%|██████    | 9181/15001 [5:53:32<2:59:17,  1.85s/it, loss=0.0632, lr=1e-5]Steps:  61%|██████    | 9182/15001 [5:53:34<3:02:44,  1.88s/it, loss=0.0632, lr=1e-5]Steps:  61%|██████    | 9182/15001 [5:53:34<3:02:44,  1.88s/it, loss=0.0519, lr=1e-5]Steps:  61%|██████    | 9183/15001 [5:53:36<3:01:57,  1.88s/it, loss=0.0519, lr=1e-5]Steps:  61%|██████    | 9183/15001 [5:53:36<3:01:57,  1.88s/it, loss=0.122, lr=1e-5] Steps:  61%|██████    | 9184/15001 [5:53:37<3:01:35,  1.87s/it, loss=0.122, lr=1e-5]Steps:  61%|██████    | 9184/15001 [5:53:38<3:01:35,  1.87s/it, loss=0.108, lr=1e-5]Steps:  61%|██████    | 9185/15001 [5:53:39<2:55:15,  1.81s/it, loss=0.108, lr=1e-5]Steps:  61%|██████    | 9185/15001 [5:53:39<2:55:15,  1.81s/it, loss=0.131, lr=1e-5]Steps:  61%|██████    | 9186/15001 [5:53:41<3:02:15,  1.88s/it, loss=0.131, lr=1e-5]Steps:  61%|██████    | 9186/15001 [5:53:41<3:02:15,  1.88s/it, loss=0.194, lr=1e-5]Steps:  61%|██████    | 9187/15001 [5:53:43<2:55:34,  1.81s/it, loss=0.194, lr=1e-5]Steps:  61%|██████    | 9187/15001 [5:53:43<2:55:34,  1.81s/it, loss=0.21, lr=1e-5] Steps:  61%|██████    | 9188/15001 [5:53:45<3:09:26,  1.96s/it, loss=0.21, lr=1e-5]Steps:  61%|██████    | 9188/15001 [5:53:45<3:09:26,  1.96s/it, loss=0.188, lr=1e-5]Steps:  61%|██████▏   | 9189/15001 [5:53:47<3:10:00,  1.96s/it, loss=0.188, lr=1e-5]Steps:  61%|██████▏   | 9189/15001 [5:53:47<3:10:00,  1.96s/it, loss=0.12, lr=1e-5] Steps:  61%|██████▏   | 9190/15001 [5:53:49<3:16:06,  2.02s/it, loss=0.12, lr=1e-5]Steps:  61%|██████▏   | 9190/15001 [5:53:49<3:16:06,  2.02s/it, loss=0.259, lr=1e-5]Steps:  61%|██████▏   | 9191/15001 [5:53:51<3:14:43,  2.01s/it, loss=0.259, lr=1e-5]Steps:  61%|██████▏   | 9191/15001 [5:53:51<3:14:43,  2.01s/it, loss=0.151, lr=1e-5]Steps:  61%|██████▏   | 9192/15001 [5:53:53<3:00:36,  1.87s/it, loss=0.151, lr=1e-5]Steps:  61%|██████▏   | 9192/15001 [5:53:53<3:00:36,  1.87s/it, loss=0.215, lr=1e-5]Steps:  61%|██████▏   | 9193/15001 [5:53:55<3:11:29,  1.98s/it, loss=0.215, lr=1e-5]Steps:  61%|██████▏   | 9193/15001 [5:53:55<3:11:29,  1.98s/it, loss=0.161, lr=1e-5]Steps:  61%|██████▏   | 9194/15001 [5:53:57<3:08:26,  1.95s/it, loss=0.161, lr=1e-5]Steps:  61%|██████▏   | 9194/15001 [5:53:57<3:08:26,  1.95s/it, loss=0.375, lr=1e-5]Steps:  61%|██████▏   | 9195/15001 [5:53:59<3:04:17,  1.90s/it, loss=0.375, lr=1e-5]Steps:  61%|██████▏   | 9195/15001 [5:53:59<3:04:17,  1.90s/it, loss=0.0785, lr=1e-5]Steps:  61%|██████▏   | 9196/15001 [5:54:00<2:59:10,  1.85s/it, loss=0.0785, lr=1e-5]Steps:  61%|██████▏   | 9196/15001 [5:54:01<2:59:10,  1.85s/it, loss=0.21, lr=1e-5]  Steps:  61%|██████▏   | 9197/15001 [5:54:02<3:02:36,  1.89s/it, loss=0.21, lr=1e-5]Steps:  61%|██████▏   | 9197/15001 [5:54:02<3:02:36,  1.89s/it, loss=0.0717, lr=1e-5]Steps:  61%|██████▏   | 9198/15001 [5:54:04<2:52:01,  1.78s/it, loss=0.0717, lr=1e-5]Steps:  61%|██████▏   | 9198/15001 [5:54:04<2:52:01,  1.78s/it, loss=0.0837, lr=1e-5]Steps:  61%|██████▏   | 9199/15001 [5:54:06<3:00:32,  1.87s/it, loss=0.0837, lr=1e-5]Steps:  61%|██████▏   | 9199/15001 [5:54:06<3:00:32,  1.87s/it, loss=0.184, lr=1e-5] Steps:  61%|██████▏   | 9200/15001 [5:54:08<2:50:57,  1.77s/it, loss=0.184, lr=1e-5]Steps:  61%|██████▏   | 9200/15001 [5:54:08<2:50:57,  1.77s/it, loss=0.207, lr=1e-5]Steps:  61%|██████▏   | 9201/15001 [5:54:09<2:56:07,  1.82s/it, loss=0.207, lr=1e-5]Steps:  61%|██████▏   | 9201/15001 [5:54:10<2:56:07,  1.82s/it, loss=0.178, lr=1e-5]Steps:  61%|██████▏   | 9202/15001 [5:54:11<2:59:19,  1.86s/it, loss=0.178, lr=1e-5]Steps:  61%|██████▏   | 9202/15001 [5:54:11<2:59:19,  1.86s/it, loss=0.127, lr=1e-5]Steps:  61%|██████▏   | 9203/15001 [5:54:13<2:56:41,  1.83s/it, loss=0.127, lr=1e-5]Steps:  61%|██████▏   | 9203/15001 [5:54:13<2:56:41,  1.83s/it, loss=0.193, lr=1e-5]Steps:  61%|██████▏   | 9204/15001 [5:54:15<2:52:47,  1.79s/it, loss=0.193, lr=1e-5]Steps:  61%|██████▏   | 9204/15001 [5:54:15<2:52:47,  1.79s/it, loss=0.27, lr=1e-5] Steps:  61%|██████▏   | 9205/15001 [5:54:17<2:57:49,  1.84s/it, loss=0.27, lr=1e-5]Steps:  61%|██████▏   | 9205/15001 [5:54:17<2:57:49,  1.84s/it, loss=0.16, lr=1e-5]Steps:  61%|██████▏   | 9206/15001 [5:54:19<2:54:24,  1.81s/it, loss=0.16, lr=1e-5]Steps:  61%|██████▏   | 9206/15001 [5:54:19<2:54:24,  1.81s/it, loss=0.132, lr=1e-5]Steps:  61%|██████▏   | 9207/15001 [5:54:21<3:01:11,  1.88s/it, loss=0.132, lr=1e-5]Steps:  61%|██████▏   | 9207/15001 [5:54:21<3:01:11,  1.88s/it, loss=0.0754, lr=1e-5]Steps:  61%|██████▏   | 9208/15001 [5:54:22<2:52:58,  1.79s/it, loss=0.0754, lr=1e-5]Steps:  61%|██████▏   | 9208/15001 [5:54:23<2:52:58,  1.79s/it, loss=0.138, lr=1e-5] Steps:  61%|██████▏   | 9209/15001 [5:54:24<3:07:22,  1.94s/it, loss=0.138, lr=1e-5]Steps:  61%|██████▏   | 9209/15001 [5:54:25<3:07:22,  1.94s/it, loss=0.237, lr=1e-5]Steps:  61%|██████▏   | 9210/15001 [5:54:26<3:02:32,  1.89s/it, loss=0.237, lr=1e-5]Steps:  61%|██████▏   | 9210/15001 [5:54:27<3:02:32,  1.89s/it, loss=0.17, lr=1e-5] Steps:  61%|██████▏   | 9211/15001 [5:54:28<3:11:09,  1.98s/it, loss=0.17, lr=1e-5]Steps:  61%|██████▏   | 9211/15001 [5:54:29<3:11:09,  1.98s/it, loss=0.126, lr=1e-5]Steps:  61%|██████▏   | 9212/15001 [5:54:30<3:09:55,  1.97s/it, loss=0.126, lr=1e-5]Steps:  61%|██████▏   | 9212/15001 [5:54:31<3:09:55,  1.97s/it, loss=0.0863, lr=1e-5]Steps:  61%|██████▏   | 9213/15001 [5:54:33<3:17:04,  2.04s/it, loss=0.0863, lr=1e-5]Steps:  61%|██████▏   | 9213/15001 [5:54:33<3:17:04,  2.04s/it, loss=0.341, lr=1e-5] Steps:  61%|██████▏   | 9214/15001 [5:54:34<3:09:56,  1.97s/it, loss=0.341, lr=1e-5]Steps:  61%|██████▏   | 9214/15001 [5:54:35<3:09:56,  1.97s/it, loss=0.251, lr=1e-5]Steps:  61%|██████▏   | 9215/15001 [5:54:36<3:12:07,  1.99s/it, loss=0.251, lr=1e-5]Steps:  61%|██████▏   | 9215/15001 [5:54:37<3:12:07,  1.99s/it, loss=0.138, lr=1e-5]Steps:  61%|██████▏   | 9216/15001 [5:54:38<3:01:43,  1.88s/it, loss=0.138, lr=1e-5]Steps:  61%|██████▏   | 9216/15001 [5:54:38<3:01:43,  1.88s/it, loss=0.108, lr=1e-5]Steps:  61%|██████▏   | 9217/15001 [5:54:40<3:07:01,  1.94s/it, loss=0.108, lr=1e-5]Steps:  61%|██████▏   | 9217/15001 [5:54:40<3:07:01,  1.94s/it, loss=0.355, lr=1e-5]Steps:  61%|██████▏   | 9218/15001 [5:54:42<2:57:23,  1.84s/it, loss=0.355, lr=1e-5]Steps:  61%|██████▏   | 9218/15001 [5:54:42<2:57:23,  1.84s/it, loss=0.313, lr=1e-5]Steps:  61%|██████▏   | 9219/15001 [5:54:44<3:03:09,  1.90s/it, loss=0.313, lr=1e-5]Steps:  61%|██████▏   | 9219/15001 [5:54:44<3:03:09,  1.90s/it, loss=0.0681, lr=1e-5]Steps:  61%|██████▏   | 9220/15001 [5:54:46<2:59:06,  1.86s/it, loss=0.0681, lr=1e-5]Steps:  61%|██████▏   | 9220/15001 [5:54:46<2:59:06,  1.86s/it, loss=0.074, lr=1e-5] Steps:  61%|██████▏   | 9221/15001 [5:54:47<2:58:36,  1.85s/it, loss=0.074, lr=1e-5]Steps:  61%|██████▏   | 9221/15001 [5:54:47<2:58:36,  1.85s/it, loss=0.0511, lr=1e-5]Steps:  61%|██████▏   | 9222/15001 [5:54:49<2:57:57,  1.85s/it, loss=0.0511, lr=1e-5]Steps:  61%|██████▏   | 9222/15001 [5:54:49<2:57:57,  1.85s/it, loss=0.119, lr=1e-5] Steps:  61%|██████▏   | 9223/15001 [5:54:51<2:57:49,  1.85s/it, loss=0.119, lr=1e-5]Steps:  61%|██████▏   | 9223/15001 [5:54:51<2:57:49,  1.85s/it, loss=0.153, lr=1e-5]Steps:  61%|██████▏   | 9224/15001 [5:54:53<2:54:14,  1.81s/it, loss=0.153, lr=1e-5]Steps:  61%|██████▏   | 9224/15001 [5:54:53<2:54:14,  1.81s/it, loss=0.256, lr=1e-5]Steps:  61%|██████▏   | 9225/15001 [5:54:55<2:59:09,  1.86s/it, loss=0.256, lr=1e-5]Steps:  61%|██████▏   | 9225/15001 [5:54:55<2:59:09,  1.86s/it, loss=0.158, lr=1e-5]Steps:  62%|██████▏   | 9226/15001 [5:54:56<2:54:12,  1.81s/it, loss=0.158, lr=1e-5]Steps:  62%|██████▏   | 9226/15001 [5:54:57<2:54:12,  1.81s/it, loss=0.35, lr=1e-5] Steps:  62%|██████▏   | 9227/15001 [5:54:58<2:51:30,  1.78s/it, loss=0.35, lr=1e-5]Steps:  62%|██████▏   | 9227/15001 [5:54:58<2:51:30,  1.78s/it, loss=0.125, lr=1e-5]Steps:  62%|██████▏   | 9228/15001 [5:55:00<2:51:03,  1.78s/it, loss=0.125, lr=1e-5]Steps:  62%|██████▏   | 9228/15001 [5:55:00<2:51:03,  1.78s/it, loss=0.0887, lr=1e-5]Steps:  62%|██████▏   | 9229/15001 [5:55:02<2:49:35,  1.76s/it, loss=0.0887, lr=1e-5]Steps:  62%|██████▏   | 9229/15001 [5:55:02<2:49:35,  1.76s/it, loss=0.369, lr=1e-5] Steps:  62%|██████▏   | 9230/15001 [5:55:04<2:52:32,  1.79s/it, loss=0.369, lr=1e-5]Steps:  62%|██████▏   | 9230/15001 [5:55:04<2:52:32,  1.79s/it, loss=0.0211, lr=1e-5]Steps:  62%|██████▏   | 9231/15001 [5:55:05<2:52:40,  1.80s/it, loss=0.0211, lr=1e-5]Steps:  62%|██████▏   | 9231/15001 [5:55:06<2:52:40,  1.80s/it, loss=0.152, lr=1e-5] Steps:  62%|██████▏   | 9232/15001 [5:55:07<3:00:36,  1.88s/it, loss=0.152, lr=1e-5]Steps:  62%|██████▏   | 9232/15001 [5:55:08<3:00:36,  1.88s/it, loss=0.165, lr=1e-5]Steps:  62%|██████▏   | 9233/15001 [5:55:09<3:01:43,  1.89s/it, loss=0.165, lr=1e-5]Steps:  62%|██████▏   | 9233/15001 [5:55:10<3:01:43,  1.89s/it, loss=0.0856, lr=1e-5]Steps:  62%|██████▏   | 9234/15001 [5:55:12<3:09:46,  1.97s/it, loss=0.0856, lr=1e-5]Steps:  62%|██████▏   | 9234/15001 [5:55:12<3:09:46,  1.97s/it, loss=0.155, lr=1e-5] Steps:  62%|██████▏   | 9235/15001 [5:55:13<3:06:08,  1.94s/it, loss=0.155, lr=1e-5]Steps:  62%|██████▏   | 9235/15001 [5:55:14<3:06:08,  1.94s/it, loss=0.307, lr=1e-5]Steps:  62%|██████▏   | 9236/15001 [5:55:15<3:10:34,  1.98s/it, loss=0.307, lr=1e-5]Steps:  62%|██████▏   | 9236/15001 [5:55:16<3:10:34,  1.98s/it, loss=0.0203, lr=1e-5]Steps:  62%|██████▏   | 9237/15001 [5:55:17<3:05:54,  1.94s/it, loss=0.0203, lr=1e-5]Steps:  62%|██████▏   | 9237/15001 [5:55:18<3:05:54,  1.94s/it, loss=0.122, lr=1e-5] Steps:  62%|██████▏   | 9238/15001 [5:55:19<3:05:04,  1.93s/it, loss=0.122, lr=1e-5]Steps:  62%|██████▏   | 9238/15001 [5:55:19<3:05:04,  1.93s/it, loss=0.459, lr=1e-5]Steps:  62%|██████▏   | 9239/15001 [5:55:21<3:01:16,  1.89s/it, loss=0.459, lr=1e-5]Steps:  62%|██████▏   | 9239/15001 [5:55:21<3:01:16,  1.89s/it, loss=0.215, lr=1e-5]Steps:  62%|██████▏   | 9240/15001 [5:55:23<2:58:45,  1.86s/it, loss=0.215, lr=1e-5]Steps:  62%|██████▏   | 9240/15001 [5:55:23<2:58:45,  1.86s/it, loss=0.235, lr=1e-5]Steps:  62%|██████▏   | 9241/15001 [5:55:25<3:01:22,  1.89s/it, loss=0.235, lr=1e-5]Steps:  62%|██████▏   | 9241/15001 [5:55:25<3:01:22,  1.89s/it, loss=0.108, lr=1e-5]Steps:  62%|██████▏   | 9242/15001 [5:55:27<3:03:06,  1.91s/it, loss=0.108, lr=1e-5]Steps:  62%|██████▏   | 9242/15001 [5:55:27<3:03:06,  1.91s/it, loss=0.161, lr=1e-5]Steps:  62%|██████▏   | 9243/15001 [5:55:28<2:55:18,  1.83s/it, loss=0.161, lr=1e-5]Steps:  62%|██████▏   | 9243/15001 [5:55:28<2:55:18,  1.83s/it, loss=0.241, lr=1e-5]Steps:  62%|██████▏   | 9244/15001 [5:55:30<2:51:22,  1.79s/it, loss=0.241, lr=1e-5]Steps:  62%|██████▏   | 9244/15001 [5:55:30<2:51:22,  1.79s/it, loss=0.146, lr=1e-5]Steps:  62%|██████▏   | 9245/15001 [5:55:32<2:48:55,  1.76s/it, loss=0.146, lr=1e-5]Steps:  62%|██████▏   | 9245/15001 [5:55:32<2:48:55,  1.76s/it, loss=0.0546, lr=1e-5]Steps:  62%|██████▏   | 9246/15001 [5:55:34<2:51:39,  1.79s/it, loss=0.0546, lr=1e-5]Steps:  62%|██████▏   | 9246/15001 [5:55:34<2:51:39,  1.79s/it, loss=0.246, lr=1e-5] Steps:  62%|██████▏   | 9247/15001 [5:55:35<2:48:36,  1.76s/it, loss=0.246, lr=1e-5]Steps:  62%|██████▏   | 9247/15001 [5:55:35<2:48:36,  1.76s/it, loss=0.159, lr=1e-5]Steps:  62%|██████▏   | 9248/15001 [5:55:37<2:45:59,  1.73s/it, loss=0.159, lr=1e-5]Steps:  62%|██████▏   | 9248/15001 [5:55:37<2:45:59,  1.73s/it, loss=0.195, lr=1e-5]Steps:  62%|██████▏   | 9249/15001 [5:55:39<2:48:48,  1.76s/it, loss=0.195, lr=1e-5]Steps:  62%|██████▏   | 9249/15001 [5:55:39<2:48:48,  1.76s/it, loss=0.125, lr=1e-5]Steps:  62%|██████▏   | 9250/15001 [5:55:41<2:48:14,  1.76s/it, loss=0.125, lr=1e-5]Steps:  62%|██████▏   | 9250/15001 [5:55:41<2:48:14,  1.76s/it, loss=0.128, lr=1e-5]Steps:  62%|██████▏   | 9251/15001 [5:55:42<2:53:33,  1.81s/it, loss=0.128, lr=1e-5]Steps:  62%|██████▏   | 9251/15001 [5:55:43<2:53:33,  1.81s/it, loss=0.0981, lr=1e-5]Steps:  62%|██████▏   | 9252/15001 [5:55:44<2:59:15,  1.87s/it, loss=0.0981, lr=1e-5]Steps:  62%|██████▏   | 9252/15001 [5:55:45<2:59:15,  1.87s/it, loss=0.0665, lr=1e-5]Steps:  62%|██████▏   | 9253/15001 [5:55:46<2:52:11,  1.80s/it, loss=0.0665, lr=1e-5]Steps:  62%|██████▏   | 9253/15001 [5:55:46<2:52:11,  1.80s/it, loss=0.266, lr=1e-5] Steps:  62%|██████▏   | 9254/15001 [5:55:48<2:48:54,  1.76s/it, loss=0.266, lr=1e-5]Steps:  62%|██████▏   | 9254/15001 [5:55:48<2:48:54,  1.76s/it, loss=0.211, lr=1e-5]Steps:  62%|██████▏   | 9255/15001 [5:55:50<3:04:26,  1.93s/it, loss=0.211, lr=1e-5]Steps:  62%|██████▏   | 9255/15001 [5:55:50<3:04:26,  1.93s/it, loss=0.0522, lr=1e-5]Steps:  62%|██████▏   | 9256/15001 [5:55:52<3:05:00,  1.93s/it, loss=0.0522, lr=1e-5]Steps:  62%|██████▏   | 9256/15001 [5:55:52<3:05:00,  1.93s/it, loss=0.196, lr=1e-5] Steps:  62%|██████▏   | 9257/15001 [5:55:54<3:10:09,  1.99s/it, loss=0.196, lr=1e-5]Steps:  62%|██████▏   | 9257/15001 [5:55:54<3:10:09,  1.99s/it, loss=0.0539, lr=1e-5]Steps:  62%|██████▏   | 9258/15001 [5:55:56<3:03:50,  1.92s/it, loss=0.0539, lr=1e-5]Steps:  62%|██████▏   | 9258/15001 [5:55:56<3:03:50,  1.92s/it, loss=0.0874, lr=1e-5]Steps:  62%|██████▏   | 9259/15001 [5:55:58<3:08:51,  1.97s/it, loss=0.0874, lr=1e-5]Steps:  62%|██████▏   | 9259/15001 [5:55:58<3:08:51,  1.97s/it, loss=0.223, lr=1e-5] Steps:  62%|██████▏   | 9260/15001 [5:56:00<3:14:56,  2.04s/it, loss=0.223, lr=1e-5]Steps:  62%|██████▏   | 9260/15001 [5:56:00<3:14:56,  2.04s/it, loss=0.0985, lr=1e-5]Steps:  62%|██████▏   | 9261/15001 [5:56:02<3:06:27,  1.95s/it, loss=0.0985, lr=1e-5]Steps:  62%|██████▏   | 9261/15001 [5:56:02<3:06:27,  1.95s/it, loss=0.197, lr=1e-5] Steps:  62%|██████▏   | 9262/15001 [5:56:04<3:04:05,  1.92s/it, loss=0.197, lr=1e-5]Steps:  62%|██████▏   | 9262/15001 [5:56:04<3:04:05,  1.92s/it, loss=0.267, lr=1e-5]Steps:  62%|██████▏   | 9263/15001 [5:56:05<2:54:27,  1.82s/it, loss=0.267, lr=1e-5]Steps:  62%|██████▏   | 9263/15001 [5:56:06<2:54:27,  1.82s/it, loss=0.305, lr=1e-5]Steps:  62%|██████▏   | 9264/15001 [5:56:08<3:03:58,  1.92s/it, loss=0.305, lr=1e-5]Steps:  62%|██████▏   | 9264/15001 [5:56:08<3:03:58,  1.92s/it, loss=0.12, lr=1e-5] Steps:  62%|██████▏   | 9265/15001 [5:56:09<2:52:16,  1.80s/it, loss=0.12, lr=1e-5]Steps:  62%|██████▏   | 9265/15001 [5:56:09<2:52:16,  1.80s/it, loss=0.163, lr=1e-5]Steps:  62%|██████▏   | 9266/15001 [5:56:11<2:54:06,  1.82s/it, loss=0.163, lr=1e-5]Steps:  62%|██████▏   | 9266/15001 [5:56:11<2:54:06,  1.82s/it, loss=0.0419, lr=1e-5]Steps:  62%|██████▏   | 9267/15001 [5:56:13<2:59:28,  1.88s/it, loss=0.0419, lr=1e-5]Steps:  62%|██████▏   | 9267/15001 [5:56:13<2:59:28,  1.88s/it, loss=0.15, lr=1e-5]  Steps:  62%|██████▏   | 9268/15001 [5:56:15<2:57:12,  1.85s/it, loss=0.15, lr=1e-5]Steps:  62%|██████▏   | 9268/15001 [5:56:15<2:57:12,  1.85s/it, loss=0.31, lr=1e-5]Steps:  62%|██████▏   | 9269/15001 [5:56:17<2:57:44,  1.86s/it, loss=0.31, lr=1e-5]Steps:  62%|██████▏   | 9269/15001 [5:56:17<2:57:44,  1.86s/it, loss=0.194, lr=1e-5]Steps:  62%|██████▏   | 9270/15001 [5:56:18<2:49:05,  1.77s/it, loss=0.194, lr=1e-5]Steps:  62%|██████▏   | 9270/15001 [5:56:19<2:49:05,  1.77s/it, loss=0.0575, lr=1e-5]Steps:  62%|██████▏   | 9271/15001 [5:56:20<2:51:54,  1.80s/it, loss=0.0575, lr=1e-5]Steps:  62%|██████▏   | 9271/15001 [5:56:20<2:51:54,  1.80s/it, loss=0.217, lr=1e-5] Steps:  62%|██████▏   | 9272/15001 [5:56:22<2:53:42,  1.82s/it, loss=0.217, lr=1e-5]Steps:  62%|██████▏   | 9272/15001 [5:56:22<2:53:42,  1.82s/it, loss=0.111, lr=1e-5]Steps:  62%|██████▏   | 9273/15001 [5:56:24<2:54:15,  1.83s/it, loss=0.111, lr=1e-5]Steps:  62%|██████▏   | 9273/15001 [5:56:24<2:54:15,  1.83s/it, loss=0.0885, lr=1e-5]Steps:  62%|██████▏   | 9274/15001 [5:56:26<2:59:35,  1.88s/it, loss=0.0885, lr=1e-5]Steps:  62%|██████▏   | 9274/15001 [5:56:26<2:59:35,  1.88s/it, loss=0.189, lr=1e-5] Steps:  62%|██████▏   | 9275/15001 [5:56:27<2:53:12,  1.81s/it, loss=0.189, lr=1e-5]Steps:  62%|██████▏   | 9275/15001 [5:56:28<2:53:12,  1.81s/it, loss=0.197, lr=1e-5]Steps:  62%|██████▏   | 9276/15001 [5:56:29<2:54:20,  1.83s/it, loss=0.197, lr=1e-5]Steps:  62%|██████▏   | 9276/15001 [5:56:29<2:54:20,  1.83s/it, loss=0.0461, lr=1e-5]Steps:  62%|██████▏   | 9277/15001 [5:56:31<2:53:06,  1.81s/it, loss=0.0461, lr=1e-5]Steps:  62%|██████▏   | 9277/15001 [5:56:31<2:53:06,  1.81s/it, loss=0.372, lr=1e-5] Steps:  62%|██████▏   | 9278/15001 [5:56:33<2:58:37,  1.87s/it, loss=0.372, lr=1e-5]Steps:  62%|██████▏   | 9278/15001 [5:56:33<2:58:37,  1.87s/it, loss=0.277, lr=1e-5]Steps:  62%|██████▏   | 9279/15001 [5:56:35<3:01:24,  1.90s/it, loss=0.277, lr=1e-5]Steps:  62%|██████▏   | 9279/15001 [5:56:35<3:01:24,  1.90s/it, loss=0.136, lr=1e-5]Steps:  62%|██████▏   | 9280/15001 [5:56:37<2:58:13,  1.87s/it, loss=0.136, lr=1e-5]Steps:  62%|██████▏   | 9280/15001 [5:56:37<2:58:13,  1.87s/it, loss=0.123, lr=1e-5]Steps:  62%|██████▏   | 9281/15001 [5:56:39<3:01:47,  1.91s/it, loss=0.123, lr=1e-5]Steps:  62%|██████▏   | 9281/15001 [5:56:39<3:01:47,  1.91s/it, loss=0.309, lr=1e-5]Steps:  62%|██████▏   | 9282/15001 [5:56:41<3:07:15,  1.96s/it, loss=0.309, lr=1e-5]Steps:  62%|██████▏   | 9282/15001 [5:56:41<3:07:15,  1.96s/it, loss=0.159, lr=1e-5]Steps:  62%|██████▏   | 9283/15001 [5:56:43<3:10:11,  2.00s/it, loss=0.159, lr=1e-5]Steps:  62%|██████▏   | 9283/15001 [5:56:43<3:10:11,  2.00s/it, loss=0.0352, lr=1e-5]Steps:  62%|██████▏   | 9284/15001 [5:56:45<3:00:07,  1.89s/it, loss=0.0352, lr=1e-5]Steps:  62%|██████▏   | 9284/15001 [5:56:45<3:00:07,  1.89s/it, loss=0.259, lr=1e-5] Steps:  62%|██████▏   | 9285/15001 [5:56:46<2:57:56,  1.87s/it, loss=0.259, lr=1e-5]Steps:  62%|██████▏   | 9285/15001 [5:56:47<2:57:56,  1.87s/it, loss=0.0703, lr=1e-5]Steps:  62%|██████▏   | 9286/15001 [5:56:48<2:52:50,  1.81s/it, loss=0.0703, lr=1e-5]Steps:  62%|██████▏   | 9286/15001 [5:56:49<2:52:50,  1.81s/it, loss=0.12, lr=1e-5]  Steps:  62%|██████▏   | 9287/15001 [5:56:50<3:03:15,  1.92s/it, loss=0.12, lr=1e-5]Steps:  62%|██████▏   | 9287/15001 [5:56:50<3:03:15,  1.92s/it, loss=0.31, lr=1e-5]Steps:  62%|██████▏   | 9288/15001 [5:56:52<2:54:43,  1.84s/it, loss=0.31, lr=1e-5]Steps:  62%|██████▏   | 9288/15001 [5:56:52<2:54:43,  1.84s/it, loss=0.238, lr=1e-5]Steps:  62%|██████▏   | 9289/15001 [5:56:54<2:54:40,  1.83s/it, loss=0.238, lr=1e-5]Steps:  62%|██████▏   | 9289/15001 [5:56:54<2:54:40,  1.83s/it, loss=0.0153, lr=1e-5]Steps:  62%|██████▏   | 9290/15001 [5:56:55<2:51:02,  1.80s/it, loss=0.0153, lr=1e-5]Steps:  62%|██████▏   | 9290/15001 [5:56:56<2:51:02,  1.80s/it, loss=0.206, lr=1e-5] Steps:  62%|██████▏   | 9291/15001 [5:56:58<2:57:17,  1.86s/it, loss=0.206, lr=1e-5]Steps:  62%|██████▏   | 9291/15001 [5:56:58<2:57:17,  1.86s/it, loss=0.0973, lr=1e-5]Steps:  62%|██████▏   | 9292/15001 [5:56:59<2:56:00,  1.85s/it, loss=0.0973, lr=1e-5]Steps:  62%|██████▏   | 9292/15001 [5:57:00<2:56:00,  1.85s/it, loss=0.275, lr=1e-5] Steps:  62%|██████▏   | 9293/15001 [5:57:01<2:58:05,  1.87s/it, loss=0.275, lr=1e-5]Steps:  62%|██████▏   | 9293/15001 [5:57:01<2:58:05,  1.87s/it, loss=0.14, lr=1e-5] Steps:  62%|██████▏   | 9294/15001 [5:57:03<2:58:55,  1.88s/it, loss=0.14, lr=1e-5]Steps:  62%|██████▏   | 9294/15001 [5:57:03<2:58:55,  1.88s/it, loss=0.22, lr=1e-5]Steps:  62%|██████▏   | 9295/15001 [5:57:05<2:56:46,  1.86s/it, loss=0.22, lr=1e-5]Steps:  62%|██████▏   | 9295/15001 [5:57:05<2:56:46,  1.86s/it, loss=0.0607, lr=1e-5]Steps:  62%|██████▏   | 9296/15001 [5:57:07<2:55:21,  1.84s/it, loss=0.0607, lr=1e-5]Steps:  62%|██████▏   | 9296/15001 [5:57:07<2:55:21,  1.84s/it, loss=0.172, lr=1e-5] Steps:  62%|██████▏   | 9297/15001 [5:57:09<2:54:51,  1.84s/it, loss=0.172, lr=1e-5]Steps:  62%|██████▏   | 9297/15001 [5:57:09<2:54:51,  1.84s/it, loss=0.184, lr=1e-5]Steps:  62%|██████▏   | 9298/15001 [5:57:10<2:53:05,  1.82s/it, loss=0.184, lr=1e-5]Steps:  62%|██████▏   | 9298/15001 [5:57:10<2:53:05,  1.82s/it, loss=0.117, lr=1e-5]Steps:  62%|██████▏   | 9299/15001 [5:57:12<2:52:58,  1.82s/it, loss=0.117, lr=1e-5]Steps:  62%|██████▏   | 9299/15001 [5:57:12<2:52:58,  1.82s/it, loss=0.0871, lr=1e-5]Steps:  62%|██████▏   | 9300/15001 [5:57:14<2:46:04,  1.75s/it, loss=0.0871, lr=1e-5]Steps:  62%|██████▏   | 9300/15001 [5:57:14<2:46:04,  1.75s/it, loss=0.0223, lr=1e-5]Steps:  62%|██████▏   | 9301/15001 [5:57:16<2:53:17,  1.82s/it, loss=0.0223, lr=1e-5]Steps:  62%|██████▏   | 9301/15001 [5:57:16<2:53:17,  1.82s/it, loss=0.148, lr=1e-5] Steps:  62%|██████▏   | 9302/15001 [5:57:18<2:59:02,  1.89s/it, loss=0.148, lr=1e-5]Steps:  62%|██████▏   | 9302/15001 [5:57:18<2:59:02,  1.89s/it, loss=0.17, lr=1e-5] Steps:  62%|██████▏   | 9303/15001 [5:57:20<3:00:58,  1.91s/it, loss=0.17, lr=1e-5]Steps:  62%|██████▏   | 9303/15001 [5:57:20<3:00:58,  1.91s/it, loss=0.123, lr=1e-5]Steps:  62%|██████▏   | 9304/15001 [5:57:22<3:08:27,  1.98s/it, loss=0.123, lr=1e-5]Steps:  62%|██████▏   | 9304/15001 [5:57:22<3:08:27,  1.98s/it, loss=0.0601, lr=1e-5]Steps:  62%|██████▏   | 9305/15001 [5:57:24<3:07:55,  1.98s/it, loss=0.0601, lr=1e-5]Steps:  62%|██████▏   | 9305/15001 [5:57:24<3:07:55,  1.98s/it, loss=0.294, lr=1e-5] Steps:  62%|██████▏   | 9306/15001 [5:57:26<3:12:08,  2.02s/it, loss=0.294, lr=1e-5]Steps:  62%|██████▏   | 9306/15001 [5:57:26<3:12:08,  2.02s/it, loss=0.311, lr=1e-5]Steps:  62%|██████▏   | 9307/15001 [5:57:28<3:06:17,  1.96s/it, loss=0.311, lr=1e-5]Steps:  62%|██████▏   | 9307/15001 [5:57:28<3:06:17,  1.96s/it, loss=0.202, lr=1e-5]Steps:  62%|██████▏   | 9308/15001 [5:57:29<2:56:11,  1.86s/it, loss=0.202, lr=1e-5]Steps:  62%|██████▏   | 9308/15001 [5:57:30<2:56:11,  1.86s/it, loss=0.102, lr=1e-5]Steps:  62%|██████▏   | 9309/15001 [5:57:32<3:02:33,  1.92s/it, loss=0.102, lr=1e-5]Steps:  62%|██████▏   | 9309/15001 [5:57:32<3:02:33,  1.92s/it, loss=0.062, lr=1e-5]Steps:  62%|██████▏   | 9310/15001 [5:57:33<2:57:54,  1.88s/it, loss=0.062, lr=1e-5]Steps:  62%|██████▏   | 9310/15001 [5:57:33<2:57:54,  1.88s/it, loss=0.146, lr=1e-5]Steps:  62%|██████▏   | 9311/15001 [5:57:35<2:49:02,  1.78s/it, loss=0.146, lr=1e-5]Steps:  62%|██████▏   | 9311/15001 [5:57:35<2:49:02,  1.78s/it, loss=0.0803, lr=1e-5]Steps:  62%|██████▏   | 9312/15001 [5:57:37<2:48:44,  1.78s/it, loss=0.0803, lr=1e-5]Steps:  62%|██████▏   | 9312/15001 [5:57:37<2:48:44,  1.78s/it, loss=0.291, lr=1e-5] Steps:  62%|██████▏   | 9313/15001 [5:57:38<2:49:20,  1.79s/it, loss=0.291, lr=1e-5]Steps:  62%|██████▏   | 9313/15001 [5:57:39<2:49:20,  1.79s/it, loss=0.283, lr=1e-5]Steps:  62%|██████▏   | 9314/15001 [5:57:40<2:54:37,  1.84s/it, loss=0.283, lr=1e-5]Steps:  62%|██████▏   | 9314/15001 [5:57:41<2:54:37,  1.84s/it, loss=0.157, lr=1e-5]Steps:  62%|██████▏   | 9315/15001 [5:57:42<2:50:49,  1.80s/it, loss=0.157, lr=1e-5]Steps:  62%|██████▏   | 9315/15001 [5:57:42<2:50:49,  1.80s/it, loss=0.0188, lr=1e-5]Steps:  62%|██████▏   | 9316/15001 [5:57:44<2:53:41,  1.83s/it, loss=0.0188, lr=1e-5]Steps:  62%|██████▏   | 9316/15001 [5:57:44<2:53:41,  1.83s/it, loss=0.152, lr=1e-5] Steps:  62%|██████▏   | 9317/15001 [5:57:46<2:48:49,  1.78s/it, loss=0.152, lr=1e-5]Steps:  62%|██████▏   | 9317/15001 [5:57:46<2:48:49,  1.78s/it, loss=0.136, lr=1e-5]Steps:  62%|██████▏   | 9318/15001 [5:57:48<2:50:40,  1.80s/it, loss=0.136, lr=1e-5]Steps:  62%|██████▏   | 9318/15001 [5:57:48<2:50:40,  1.80s/it, loss=0.0594, lr=1e-5]Steps:  62%|██████▏   | 9319/15001 [5:57:49<2:52:28,  1.82s/it, loss=0.0594, lr=1e-5]Steps:  62%|██████▏   | 9319/15001 [5:57:50<2:52:28,  1.82s/it, loss=0.183, lr=1e-5] Steps:  62%|██████▏   | 9320/15001 [5:57:51<2:50:12,  1.80s/it, loss=0.183, lr=1e-5]Steps:  62%|██████▏   | 9320/15001 [5:57:51<2:50:12,  1.80s/it, loss=0.364, lr=1e-5]Steps:  62%|██████▏   | 9321/15001 [5:57:53<2:46:58,  1.76s/it, loss=0.364, lr=1e-5]Steps:  62%|██████▏   | 9321/15001 [5:57:53<2:46:58,  1.76s/it, loss=0.126, lr=1e-5]Steps:  62%|██████▏   | 9322/15001 [5:57:55<2:51:11,  1.81s/it, loss=0.126, lr=1e-5]Steps:  62%|██████▏   | 9322/15001 [5:57:55<2:51:11,  1.81s/it, loss=0.225, lr=1e-5]Steps:  62%|██████▏   | 9323/15001 [5:57:57<2:53:30,  1.83s/it, loss=0.225, lr=1e-5]Steps:  62%|██████▏   | 9323/15001 [5:57:57<2:53:30,  1.83s/it, loss=0.0307, lr=1e-5]Steps:  62%|██████▏   | 9324/15001 [5:57:59<3:01:32,  1.92s/it, loss=0.0307, lr=1e-5]Steps:  62%|██████▏   | 9324/15001 [5:57:59<3:01:32,  1.92s/it, loss=0.182, lr=1e-5] Steps:  62%|██████▏   | 9325/15001 [5:58:01<3:08:07,  1.99s/it, loss=0.182, lr=1e-5]Steps:  62%|██████▏   | 9325/15001 [5:58:01<3:08:07,  1.99s/it, loss=0.204, lr=1e-5]Steps:  62%|██████▏   | 9326/15001 [5:58:03<3:09:10,  2.00s/it, loss=0.204, lr=1e-5]Steps:  62%|██████▏   | 9326/15001 [5:58:03<3:09:10,  2.00s/it, loss=0.386, lr=1e-5]Steps:  62%|██████▏   | 9327/15001 [5:58:05<3:06:46,  1.98s/it, loss=0.386, lr=1e-5]Steps:  62%|██████▏   | 9327/15001 [5:58:05<3:06:46,  1.98s/it, loss=0.17, lr=1e-5] Steps:  62%|██████▏   | 9328/15001 [5:58:07<3:06:22,  1.97s/it, loss=0.17, lr=1e-5]Steps:  62%|██████▏   | 9328/15001 [5:58:07<3:06:22,  1.97s/it, loss=0.106, lr=1e-5]Steps:  62%|██████▏   | 9329/15001 [5:58:09<3:08:22,  1.99s/it, loss=0.106, lr=1e-5]Steps:  62%|██████▏   | 9329/15001 [5:58:09<3:08:22,  1.99s/it, loss=0.0268, lr=1e-5]Steps:  62%|██████▏   | 9330/15001 [5:58:11<3:08:32,  1.99s/it, loss=0.0268, lr=1e-5]Steps:  62%|██████▏   | 9330/15001 [5:58:11<3:08:32,  1.99s/it, loss=0.00877, lr=1e-5]Steps:  62%|██████▏   | 9331/15001 [5:58:13<3:02:28,  1.93s/it, loss=0.00877, lr=1e-5]Steps:  62%|██████▏   | 9331/15001 [5:58:13<3:02:28,  1.93s/it, loss=0.219, lr=1e-5]  Steps:  62%|██████▏   | 9332/15001 [5:58:14<2:55:10,  1.85s/it, loss=0.219, lr=1e-5]Steps:  62%|██████▏   | 9332/15001 [5:58:15<2:55:10,  1.85s/it, loss=0.0539, lr=1e-5]Steps:  62%|██████▏   | 9333/15001 [5:58:16<2:53:48,  1.84s/it, loss=0.0539, lr=1e-5]Steps:  62%|██████▏   | 9333/15001 [5:58:16<2:53:48,  1.84s/it, loss=0.178, lr=1e-5] Steps:  62%|██████▏   | 9334/15001 [5:58:18<2:54:15,  1.84s/it, loss=0.178, lr=1e-5]Steps:  62%|██████▏   | 9334/15001 [5:58:18<2:54:15,  1.84s/it, loss=0.217, lr=1e-5]Steps:  62%|██████▏   | 9335/15001 [5:58:20<2:54:44,  1.85s/it, loss=0.217, lr=1e-5]Steps:  62%|██████▏   | 9335/15001 [5:58:20<2:54:44,  1.85s/it, loss=0.0722, lr=1e-5]Steps:  62%|██████▏   | 9336/15001 [5:58:22<2:49:38,  1.80s/it, loss=0.0722, lr=1e-5]Steps:  62%|██████▏   | 9336/15001 [5:58:22<2:49:38,  1.80s/it, loss=0.107, lr=1e-5] Steps:  62%|██████▏   | 9337/15001 [5:58:23<2:49:08,  1.79s/it, loss=0.107, lr=1e-5]Steps:  62%|██████▏   | 9337/15001 [5:58:24<2:49:08,  1.79s/it, loss=0.106, lr=1e-5]Steps:  62%|██████▏   | 9338/15001 [5:58:25<2:54:43,  1.85s/it, loss=0.106, lr=1e-5]Steps:  62%|██████▏   | 9338/15001 [5:58:25<2:54:43,  1.85s/it, loss=0.139, lr=1e-5]Steps:  62%|██████▏   | 9339/15001 [5:58:27<2:48:46,  1.79s/it, loss=0.139, lr=1e-5]Steps:  62%|██████▏   | 9339/15001 [5:58:27<2:48:46,  1.79s/it, loss=0.145, lr=1e-5]Steps:  62%|██████▏   | 9340/15001 [5:58:29<2:53:15,  1.84s/it, loss=0.145, lr=1e-5]Steps:  62%|██████▏   | 9340/15001 [5:58:29<2:53:15,  1.84s/it, loss=0.134, lr=1e-5]Steps:  62%|██████▏   | 9341/15001 [5:58:31<2:47:25,  1.77s/it, loss=0.134, lr=1e-5]Steps:  62%|██████▏   | 9341/15001 [5:58:31<2:47:25,  1.77s/it, loss=0.0753, lr=1e-5]Steps:  62%|██████▏   | 9342/15001 [5:58:33<3:00:29,  1.91s/it, loss=0.0753, lr=1e-5]Steps:  62%|██████▏   | 9342/15001 [5:58:33<3:00:29,  1.91s/it, loss=0.176, lr=1e-5] Steps:  62%|██████▏   | 9343/15001 [5:58:35<2:57:38,  1.88s/it, loss=0.176, lr=1e-5]Steps:  62%|██████▏   | 9343/15001 [5:58:35<2:57:38,  1.88s/it, loss=0.0773, lr=1e-5]Steps:  62%|██████▏   | 9344/15001 [5:58:36<2:49:20,  1.80s/it, loss=0.0773, lr=1e-5]Steps:  62%|██████▏   | 9344/15001 [5:58:36<2:49:20,  1.80s/it, loss=0.0932, lr=1e-5]Steps:  62%|██████▏   | 9345/15001 [5:58:38<2:50:57,  1.81s/it, loss=0.0932, lr=1e-5]Steps:  62%|██████▏   | 9345/15001 [5:58:38<2:50:57,  1.81s/it, loss=0.179, lr=1e-5] Steps:  62%|██████▏   | 9346/15001 [5:58:40<2:59:04,  1.90s/it, loss=0.179, lr=1e-5]Steps:  62%|██████▏   | 9346/15001 [5:58:40<2:59:04,  1.90s/it, loss=0.0892, lr=1e-5]Steps:  62%|██████▏   | 9347/15001 [5:58:42<2:58:58,  1.90s/it, loss=0.0892, lr=1e-5]Steps:  62%|██████▏   | 9347/15001 [5:58:42<2:58:58,  1.90s/it, loss=0.127, lr=1e-5] Steps:  62%|██████▏   | 9348/15001 [5:58:44<2:58:36,  1.90s/it, loss=0.127, lr=1e-5]Steps:  62%|██████▏   | 9348/15001 [5:58:44<2:58:36,  1.90s/it, loss=0.373, lr=1e-5]Steps:  62%|██████▏   | 9349/15001 [5:58:46<3:06:59,  1.99s/it, loss=0.373, lr=1e-5]Steps:  62%|██████▏   | 9349/15001 [5:58:46<3:06:59,  1.99s/it, loss=0.262, lr=1e-5]Steps:  62%|██████▏   | 9350/15001 [5:58:48<3:03:05,  1.94s/it, loss=0.262, lr=1e-5]Steps:  62%|██████▏   | 9350/15001 [5:58:48<3:03:05,  1.94s/it, loss=0.204, lr=1e-5]Steps:  62%|██████▏   | 9351/15001 [5:58:50<3:12:41,  2.05s/it, loss=0.204, lr=1e-5]Steps:  62%|██████▏   | 9351/15001 [5:58:50<3:12:41,  2.05s/it, loss=0.158, lr=1e-5]Steps:  62%|██████▏   | 9352/15001 [5:58:52<3:06:25,  1.98s/it, loss=0.158, lr=1e-5]Steps:  62%|██████▏   | 9352/15001 [5:58:52<3:06:25,  1.98s/it, loss=0.238, lr=1e-5]Steps:  62%|██████▏   | 9353/15001 [5:58:54<3:08:20,  2.00s/it, loss=0.238, lr=1e-5]Steps:  62%|██████▏   | 9353/15001 [5:58:54<3:08:20,  2.00s/it, loss=0.181, lr=1e-5]Steps:  62%|██████▏   | 9354/15001 [5:58:56<3:02:45,  1.94s/it, loss=0.181, lr=1e-5]Steps:  62%|██████▏   | 9354/15001 [5:58:56<3:02:45,  1.94s/it, loss=0.106, lr=1e-5]Steps:  62%|██████▏   | 9355/15001 [5:58:58<2:57:11,  1.88s/it, loss=0.106, lr=1e-5]Steps:  62%|██████▏   | 9355/15001 [5:58:58<2:57:11,  1.88s/it, loss=0.144, lr=1e-5]Steps:  62%|██████▏   | 9356/15001 [5:58:59<2:55:14,  1.86s/it, loss=0.144, lr=1e-5]Steps:  62%|██████▏   | 9356/15001 [5:59:00<2:55:14,  1.86s/it, loss=0.058, lr=1e-5]Steps:  62%|██████▏   | 9357/15001 [5:59:01<2:51:39,  1.82s/it, loss=0.058, lr=1e-5]Steps:  62%|██████▏   | 9357/15001 [5:59:01<2:51:39,  1.82s/it, loss=0.0429, lr=1e-5]Steps:  62%|██████▏   | 9358/15001 [5:59:03<2:57:17,  1.89s/it, loss=0.0429, lr=1e-5]Steps:  62%|██████▏   | 9358/15001 [5:59:03<2:57:17,  1.89s/it, loss=0.141, lr=1e-5] Steps:  62%|██████▏   | 9359/15001 [5:59:05<2:53:09,  1.84s/it, loss=0.141, lr=1e-5]Steps:  62%|██████▏   | 9359/15001 [5:59:05<2:53:09,  1.84s/it, loss=0.0872, lr=1e-5]Steps:  62%|██████▏   | 9360/15001 [5:59:07<2:50:05,  1.81s/it, loss=0.0872, lr=1e-5]Steps:  62%|██████▏   | 9360/15001 [5:59:07<2:50:05,  1.81s/it, loss=0.346, lr=1e-5] Steps:  62%|██████▏   | 9361/15001 [5:59:09<2:57:08,  1.88s/it, loss=0.346, lr=1e-5]Steps:  62%|██████▏   | 9361/15001 [5:59:09<2:57:08,  1.88s/it, loss=0.285, lr=1e-5]Steps:  62%|██████▏   | 9362/15001 [5:59:10<2:51:53,  1.83s/it, loss=0.285, lr=1e-5]Steps:  62%|██████▏   | 9362/15001 [5:59:11<2:51:53,  1.83s/it, loss=0.257, lr=1e-5]Steps:  62%|██████▏   | 9363/15001 [5:59:12<2:46:34,  1.77s/it, loss=0.257, lr=1e-5]Steps:  62%|██████▏   | 9363/15001 [5:59:12<2:46:34,  1.77s/it, loss=0.23, lr=1e-5] Steps:  62%|██████▏   | 9364/15001 [5:59:14<2:56:12,  1.88s/it, loss=0.23, lr=1e-5]Steps:  62%|██████▏   | 9364/15001 [5:59:14<2:56:12,  1.88s/it, loss=0.128, lr=1e-5]Steps:  62%|██████▏   | 9365/15001 [5:59:16<2:44:21,  1.75s/it, loss=0.128, lr=1e-5]Steps:  62%|██████▏   | 9365/15001 [5:59:16<2:44:21,  1.75s/it, loss=0.189, lr=1e-5]Steps:  62%|██████▏   | 9366/15001 [5:59:18<2:57:21,  1.89s/it, loss=0.189, lr=1e-5]Steps:  62%|██████▏   | 9366/15001 [5:59:18<2:57:21,  1.89s/it, loss=0.27, lr=1e-5] Steps:  62%|██████▏   | 9367/15001 [5:59:20<2:54:49,  1.86s/it, loss=0.27, lr=1e-5]Steps:  62%|██████▏   | 9367/15001 [5:59:20<2:54:49,  1.86s/it, loss=0.167, lr=1e-5]Steps:  62%|██████▏   | 9368/15001 [5:59:21<2:44:54,  1.76s/it, loss=0.167, lr=1e-5]Steps:  62%|██████▏   | 9368/15001 [5:59:22<2:44:54,  1.76s/it, loss=0.268, lr=1e-5]Steps:  62%|██████▏   | 9369/15001 [5:59:23<2:57:02,  1.89s/it, loss=0.268, lr=1e-5]Steps:  62%|██████▏   | 9369/15001 [5:59:24<2:57:02,  1.89s/it, loss=0.182, lr=1e-5]Steps:  62%|██████▏   | 9370/15001 [5:59:25<3:03:42,  1.96s/it, loss=0.182, lr=1e-5]Steps:  62%|██████▏   | 9370/15001 [5:59:26<3:03:42,  1.96s/it, loss=0.128, lr=1e-5]Steps:  62%|██████▏   | 9371/15001 [5:59:27<3:02:18,  1.94s/it, loss=0.128, lr=1e-5]Steps:  62%|██████▏   | 9371/15001 [5:59:28<3:02:18,  1.94s/it, loss=0.124, lr=1e-5]Steps:  62%|██████▏   | 9372/15001 [5:59:29<3:01:31,  1.93s/it, loss=0.124, lr=1e-5]Steps:  62%|██████▏   | 9372/15001 [5:59:29<3:01:31,  1.93s/it, loss=0.412, lr=1e-5]Steps:  62%|██████▏   | 9373/15001 [5:59:31<3:05:59,  1.98s/it, loss=0.412, lr=1e-5]Steps:  62%|██████▏   | 9373/15001 [5:59:32<3:05:59,  1.98s/it, loss=0.162, lr=1e-5]Steps:  62%|██████▏   | 9374/15001 [5:59:33<3:02:53,  1.95s/it, loss=0.162, lr=1e-5]Steps:  62%|██████▏   | 9374/15001 [5:59:34<3:02:53,  1.95s/it, loss=0.047, lr=1e-5]Steps:  62%|██████▏   | 9375/15001 [5:59:35<3:01:38,  1.94s/it, loss=0.047, lr=1e-5]Steps:  62%|██████▏   | 9375/15001 [5:59:35<3:01:38,  1.94s/it, loss=0.0791, lr=1e-5]Steps:  63%|██████▎   | 9376/15001 [5:59:37<2:58:34,  1.90s/it, loss=0.0791, lr=1e-5]Steps:  63%|██████▎   | 9376/15001 [5:59:37<2:58:34,  1.90s/it, loss=0.354, lr=1e-5] Steps:  63%|██████▎   | 9377/15001 [5:59:39<2:52:34,  1.84s/it, loss=0.354, lr=1e-5]Steps:  63%|██████▎   | 9377/15001 [5:59:39<2:52:34,  1.84s/it, loss=0.339, lr=1e-5]Steps:  63%|██████▎   | 9378/15001 [5:59:41<2:51:46,  1.83s/it, loss=0.339, lr=1e-5]Steps:  63%|██████▎   | 9378/15001 [5:59:41<2:51:46,  1.83s/it, loss=0.192, lr=1e-5]Steps:  63%|██████▎   | 9379/15001 [5:59:42<2:52:05,  1.84s/it, loss=0.192, lr=1e-5]Steps:  63%|██████▎   | 9379/15001 [5:59:43<2:52:05,  1.84s/it, loss=0.161, lr=1e-5]Steps:  63%|██████▎   | 9380/15001 [5:59:44<2:54:30,  1.86s/it, loss=0.161, lr=1e-5]Steps:  63%|██████▎   | 9380/15001 [5:59:44<2:54:30,  1.86s/it, loss=0.0746, lr=1e-5]Steps:  63%|██████▎   | 9381/15001 [5:59:46<2:54:05,  1.86s/it, loss=0.0746, lr=1e-5]Steps:  63%|██████▎   | 9381/15001 [5:59:46<2:54:05,  1.86s/it, loss=0.192, lr=1e-5] Steps:  63%|██████▎   | 9382/15001 [5:59:48<2:50:16,  1.82s/it, loss=0.192, lr=1e-5]Steps:  63%|██████▎   | 9382/15001 [5:59:48<2:50:16,  1.82s/it, loss=0.108, lr=1e-5]Steps:  63%|██████▎   | 9383/15001 [5:59:50<2:50:31,  1.82s/it, loss=0.108, lr=1e-5]Steps:  63%|██████▎   | 9383/15001 [5:59:50<2:50:31,  1.82s/it, loss=0.312, lr=1e-5]Steps:  63%|██████▎   | 9384/15001 [5:59:52<2:51:16,  1.83s/it, loss=0.312, lr=1e-5]Steps:  63%|██████▎   | 9384/15001 [5:59:52<2:51:16,  1.83s/it, loss=0.0758, lr=1e-5]Steps:  63%|██████▎   | 9385/15001 [5:59:53<2:41:14,  1.72s/it, loss=0.0758, lr=1e-5]Steps:  63%|██████▎   | 9385/15001 [5:59:53<2:41:14,  1.72s/it, loss=0.289, lr=1e-5] Steps:  63%|██████▎   | 9386/15001 [5:59:55<2:48:14,  1.80s/it, loss=0.289, lr=1e-5]Steps:  63%|██████▎   | 9386/15001 [5:59:55<2:48:14,  1.80s/it, loss=0.0522, lr=1e-5]Steps:  63%|██████▎   | 9387/15001 [5:59:57<2:53:28,  1.85s/it, loss=0.0522, lr=1e-5]Steps:  63%|██████▎   | 9387/15001 [5:59:57<2:53:28,  1.85s/it, loss=0.124, lr=1e-5] Steps:  63%|██████▎   | 9388/15001 [5:59:59<2:49:08,  1.81s/it, loss=0.124, lr=1e-5]Steps:  63%|██████▎   | 9388/15001 [5:59:59<2:49:08,  1.81s/it, loss=0.132, lr=1e-5]Steps:  63%|██████▎   | 9389/15001 [6:00:00<2:48:34,  1.80s/it, loss=0.132, lr=1e-5]Steps:  63%|██████▎   | 9389/15001 [6:00:01<2:48:34,  1.80s/it, loss=0.26, lr=1e-5] Steps:  63%|██████▎   | 9390/15001 [6:00:02<2:51:46,  1.84s/it, loss=0.26, lr=1e-5]Steps:  63%|██████▎   | 9390/15001 [6:00:02<2:51:46,  1.84s/it, loss=0.228, lr=1e-5]Steps:  63%|██████▎   | 9391/15001 [6:00:04<2:47:49,  1.79s/it, loss=0.228, lr=1e-5]Steps:  63%|██████▎   | 9391/15001 [6:00:04<2:47:49,  1.79s/it, loss=0.162, lr=1e-5]Steps:  63%|███��██▎   | 9392/15001 [6:00:06<2:52:30,  1.85s/it, loss=0.162, lr=1e-5]Steps:  63%|██████▎   | 9392/15001 [6:00:06<2:52:30,  1.85s/it, loss=0.271, lr=1e-5]Steps:  63%|██████▎   | 9393/15001 [6:00:08<2:50:36,  1.83s/it, loss=0.271, lr=1e-5]Steps:  63%|██████▎   | 9393/15001 [6:00:08<2:50:36,  1.83s/it, loss=0.35, lr=1e-5] Steps:  63%|██████▎   | 9394/15001 [6:00:10<3:03:49,  1.97s/it, loss=0.35, lr=1e-5]Steps:  63%|██████▎   | 9394/15001 [6:00:10<3:03:49,  1.97s/it, loss=0.236, lr=1e-5]Steps:  63%|██████▎   | 9395/15001 [6:00:12<3:05:26,  1.98s/it, loss=0.236, lr=1e-5]Steps:  63%|██████▎   | 9395/15001 [6:00:12<3:05:26,  1.98s/it, loss=0.251, lr=1e-5]Steps:  63%|██████▎   | 9396/15001 [6:00:14<3:06:10,  1.99s/it, loss=0.251, lr=1e-5]Steps:  63%|██████▎   | 9396/15001 [6:00:14<3:06:10,  1.99s/it, loss=0.33, lr=1e-5] Steps:  63%|██████▎   | 9397/15001 [6:00:16<3:03:37,  1.97s/it, loss=0.33, lr=1e-5]Steps:  63%|██████▎   | 9397/15001 [6:00:16<3:03:37,  1.97s/it, loss=0.379, lr=1e-5]Steps:  63%|██████▎   | 9398/15001 [6:00:18<3:05:17,  1.98s/it, loss=0.379, lr=1e-5]Steps:  63%|██████▎   | 9398/15001 [6:00:18<3:05:17,  1.98s/it, loss=0.452, lr=1e-5]Steps:  63%|██████▎   | 9399/15001 [6:00:20<3:00:16,  1.93s/it, loss=0.452, lr=1e-5]Steps:  63%|██████▎   | 9399/15001 [6:00:20<3:00:16,  1.93s/it, loss=0.257, lr=1e-5]Steps:  63%|██████▎   | 9400/15001 [6:00:22<2:54:29,  1.87s/it, loss=0.257, lr=1e-5]Steps:  63%|██████▎   | 9400/15001 [6:00:22<2:54:29,  1.87s/it, loss=0.0983, lr=1e-5]Steps:  63%|██████▎   | 9401/15001 [6:00:23<2:54:12,  1.87s/it, loss=0.0983, lr=1e-5]Steps:  63%|██████▎   | 9401/15001 [6:00:24<2:54:12,  1.87s/it, loss=0.152, lr=1e-5] Steps:  63%|██████▎   | 9402/15001 [6:00:25<2:51:59,  1.84s/it, loss=0.152, lr=1e-5]Steps:  63%|██████▎   | 9402/15001 [6:00:25<2:51:59,  1.84s/it, loss=0.108, lr=1e-5]Steps:  63%|██████▎   | 9403/15001 [6:00:27<2:40:04,  1.72s/it, loss=0.108, lr=1e-5]Steps:  63%|██████▎   | 9403/15001 [6:00:27<2:40:04,  1.72s/it, loss=0.167, lr=1e-5]Steps:  63%|██████▎   | 9404/15001 [6:00:29<2:47:11,  1.79s/it, loss=0.167, lr=1e-5]Steps:  63%|██████▎   | 9404/15001 [6:00:29<2:47:11,  1.79s/it, loss=0.0539, lr=1e-5]Steps:  63%|██████▎   | 9405/15001 [6:00:31<2:53:15,  1.86s/it, loss=0.0539, lr=1e-5]Steps:  63%|██████▎   | 9405/15001 [6:00:31<2:53:15,  1.86s/it, loss=0.244, lr=1e-5] Steps:  63%|██████▎   | 9406/15001 [6:00:33<2:52:39,  1.85s/it, loss=0.244, lr=1e-5]Steps:  63%|██████▎   | 9406/15001 [6:00:33<2:52:39,  1.85s/it, loss=0.169, lr=1e-5]Steps:  63%|██████▎   | 9407/15001 [6:00:34<2:46:53,  1.79s/it, loss=0.169, lr=1e-5]Steps:  63%|██████▎   | 9407/15001 [6:00:34<2:46:53,  1.79s/it, loss=0.193, lr=1e-5]Steps:  63%|██████▎   | 9408/15001 [6:00:36<2:49:02,  1.81s/it, loss=0.193, lr=1e-5]Steps:  63%|██████▎   | 9408/15001 [6:00:36<2:49:02,  1.81s/it, loss=0.234, lr=1e-5]Steps:  63%|██████▎   | 9409/15001 [6:00:38<2:50:09,  1.83s/it, loss=0.234, lr=1e-5]Steps:  63%|██████▎   | 9409/15001 [6:00:38<2:50:09,  1.83s/it, loss=0.126, lr=1e-5]Steps:  63%|██████▎   | 9410/15001 [6:00:40<2:56:06,  1.89s/it, loss=0.126, lr=1e-5]Steps:  63%|██████▎   | 9410/15001 [6:00:40<2:56:06,  1.89s/it, loss=0.105, lr=1e-5]Steps:  63%|██████▎   | 9411/15001 [6:00:42<2:55:26,  1.88s/it, loss=0.105, lr=1e-5]Steps:  63%|██████▎   | 9411/15001 [6:00:42<2:55:26,  1.88s/it, loss=0.0648, lr=1e-5]Steps:  63%|██████▎   | 9412/15001 [6:00:43<2:50:01,  1.83s/it, loss=0.0648, lr=1e-5]Steps:  63%|██████▎   | 9412/15001 [6:00:44<2:50:01,  1.83s/it, loss=0.189, lr=1e-5] Steps:  63%|██████▎   | 9413/15001 [6:00:45<2:47:33,  1.80s/it, loss=0.189, lr=1e-5]Steps:  63%|██████▎   | 9413/15001 [6:00:46<2:47:33,  1.80s/it, loss=0.138, lr=1e-5]Steps:  63%|██████▎   | 9414/15001 [6:00:47<2:54:19,  1.87s/it, loss=0.138, lr=1e-5]Steps:  63%|██████▎   | 9414/15001 [6:00:47<2:54:19,  1.87s/it, loss=0.175, lr=1e-5]Steps:  63%|██████▎   | 9415/15001 [6:00:49<2:59:08,  1.92s/it, loss=0.175, lr=1e-5]Steps:  63%|██████▎   | 9415/15001 [6:00:49<2:59:08,  1.92s/it, loss=0.0124, lr=1e-5]Steps:  63%|██████▎   | 9416/15001 [6:00:51<2:57:08,  1.90s/it, loss=0.0124, lr=1e-5]Steps:  63%|██████▎   | 9416/15001 [6:00:51<2:57:08,  1.90s/it, loss=0.278, lr=1e-5] Steps:  63%|██████▎   | 9417/15001 [6:00:53<2:58:32,  1.92s/it, loss=0.278, lr=1e-5]Steps:  63%|██████▎   | 9417/15001 [6:00:54<2:58:32,  1.92s/it, loss=0.122, lr=1e-5]Steps:  63%|██████▎   | 9418/15001 [6:00:55<3:03:26,  1.97s/it, loss=0.122, lr=1e-5]Steps:  63%|██████▎   | 9418/15001 [6:00:55<3:03:26,  1.97s/it, loss=0.0736, lr=1e-5]Steps:  63%|██████▎   | 9419/15001 [6:00:57<3:05:32,  1.99s/it, loss=0.0736, lr=1e-5]Steps:  63%|██████▎   | 9419/15001 [6:00:57<3:05:32,  1.99s/it, loss=0.233, lr=1e-5] Steps:  63%|██████▎   | 9420/15001 [6:00:59<3:07:46,  2.02s/it, loss=0.233, lr=1e-5]Steps:  63%|██████▎   | 9420/15001 [6:00:59<3:07:46,  2.02s/it, loss=0.123, lr=1e-5]Steps:  63%|██████▎   | 9421/15001 [6:01:01<2:55:26,  1.89s/it, loss=0.123, lr=1e-5]Steps:  63%|██████▎   | 9421/15001 [6:01:01<2:55:26,  1.89s/it, loss=0.123, lr=1e-5]Steps:  63%|██████▎   | 9422/15001 [6:01:03<2:57:55,  1.91s/it, loss=0.123, lr=1e-5]Steps:  63%|██████▎   | 9422/15001 [6:01:03<2:57:55,  1.91s/it, loss=0.21, lr=1e-5] Steps:  63%|██████▎   | 9423/15001 [6:01:05<3:00:55,  1.95s/it, loss=0.21, lr=1e-5]Steps:  63%|██████▎   | 9423/15001 [6:01:05<3:00:55,  1.95s/it, loss=0.185, lr=1e-5]Steps:  63%|██████▎   | 9424/15001 [6:01:07<2:52:56,  1.86s/it, loss=0.185, lr=1e-5]Steps:  63%|██████▎   | 9424/15001 [6:01:07<2:52:56,  1.86s/it, loss=0.268, lr=1e-5]Steps:  63%|██████▎   | 9425/15001 [6:01:08<2:53:40,  1.87s/it, loss=0.268, lr=1e-5]Steps:  63%|██████▎   | 9425/15001 [6:01:09<2:53:40,  1.87s/it, loss=0.0737, lr=1e-5]Steps:  63%|██████▎   | 9426/15001 [6:01:10<2:44:18,  1.77s/it, loss=0.0737, lr=1e-5]Steps:  63%|██████▎   | 9426/15001 [6:01:11<2:44:18,  1.77s/it, loss=0.163, lr=1e-5] Steps:  63%|██████▎   | 9427/15001 [6:01:12<2:59:26,  1.93s/it, loss=0.163, lr=1e-5]Steps:  63%|██████▎   | 9427/15001 [6:01:13<2:59:26,  1.93s/it, loss=0.153, lr=1e-5]Steps:  63%|██████▎   | 9428/15001 [6:01:14<2:56:38,  1.90s/it, loss=0.153, lr=1e-5]Steps:  63%|██████▎   | 9428/15001 [6:01:15<2:56:38,  1.90s/it, loss=0.171, lr=1e-5]Steps:  63%|██████▎   | 9429/15001 [6:01:16<2:57:04,  1.91s/it, loss=0.171, lr=1e-5]Steps:  63%|██████▎   | 9429/15001 [6:01:16<2:57:04,  1.91s/it, loss=0.106, lr=1e-5]Steps:  63%|██████▎   | 9430/15001 [6:01:18<2:58:43,  1.92s/it, loss=0.106, lr=1e-5]Steps:  63%|██████▎   | 9430/15001 [6:01:18<2:58:43,  1.92s/it, loss=0.0528, lr=1e-5]Steps:  63%|██████▎   | 9431/15001 [6:01:20<2:53:34,  1.87s/it, loss=0.0528, lr=1e-5]Steps:  63%|██████▎   | 9431/15001 [6:01:20<2:53:34,  1.87s/it, loss=0.145, lr=1e-5] Steps:  63%|██████▎   | 9432/15001 [6:01:22<2:51:43,  1.85s/it, loss=0.145, lr=1e-5]Steps:  63%|██████▎   | 9432/15001 [6:01:22<2:51:43,  1.85s/it, loss=0.218, lr=1e-5]Steps:  63%|██████▎   | 9433/15001 [6:01:23<2:50:49,  1.84s/it, loss=0.218, lr=1e-5]Steps:  63%|██████▎   | 9433/15001 [6:01:24<2:50:49,  1.84s/it, loss=0.169, lr=1e-5]Steps:  63%|██████▎   | 9434/15001 [6:01:25<2:53:12,  1.87s/it, loss=0.169, lr=1e-5]Steps:  63%|██████▎   | 9434/15001 [6:01:25<2:53:12,  1.87s/it, loss=0.284, lr=1e-5]Steps:  63%|██████▎   | 9435/15001 [6:01:27<2:49:55,  1.83s/it, loss=0.284, lr=1e-5]Steps:  63%|██████▎   | 9435/15001 [6:01:27<2:49:55,  1.83s/it, loss=0.201, lr=1e-5]Steps:  63%|██████▎   | 9436/15001 [6:01:29<2:52:29,  1.86s/it, loss=0.201, lr=1e-5]Steps:  63%|██████▎   | 9436/15001 [6:01:29<2:52:29,  1.86s/it, loss=0.179, lr=1e-5]Steps:  63%|██████▎   | 9437/15001 [6:01:30<2:42:39,  1.75s/it, loss=0.179, lr=1e-5]Steps:  63%|██████▎   | 9437/15001 [6:01:31<2:42:39,  1.75s/it, loss=0.0806, lr=1e-5]Steps:  63%|██████▎   | 9438/15001 [6:01:33<2:53:04,  1.87s/it, loss=0.0806, lr=1e-5]Steps:  63%|██████▎   | 9438/15001 [6:01:33<2:53:04,  1.87s/it, loss=0.091, lr=1e-5] Steps:  63%|██████▎   | 9439/15001 [6:01:35<3:03:19,  1.98s/it, loss=0.091, lr=1e-5]Steps:  63%|██████▎   | 9439/15001 [6:01:35<3:03:19,  1.98s/it, loss=0.0735, lr=1e-5]Steps:  63%|██████▎   | 9440/15001 [6:01:37<3:00:56,  1.95s/it, loss=0.0735, lr=1e-5]Steps:  63%|██████▎   | 9440/15001 [6:01:37<3:00:56,  1.95s/it, loss=0.244, lr=1e-5] Steps:  63%|██████▎   | 9441/15001 [6:01:39<3:03:51,  1.98s/it, loss=0.244, lr=1e-5]Steps:  63%|██████▎   | 9441/15001 [6:01:39<3:03:51,  1.98s/it, loss=0.253, lr=1e-5]Steps:  63%|██████▎   | 9442/15001 [6:01:41<3:00:33,  1.95s/it, loss=0.253, lr=1e-5]Steps:  63%|██████▎   | 9442/15001 [6:01:41<3:00:33,  1.95s/it, loss=0.259, lr=1e-5]Steps:  63%|██████▎   | 9443/15001 [6:01:43<3:00:00,  1.94s/it, loss=0.259, lr=1e-5]Steps:  63%|██████▎   | 9443/15001 [6:01:43<3:00:00,  1.94s/it, loss=0.249, lr=1e-5]Steps:  63%|██████▎   | 9444/15001 [6:01:44<2:57:16,  1.91s/it, loss=0.249, lr=1e-5]Steps:  63%|██████▎   | 9444/15001 [6:01:45<2:57:16,  1.91s/it, loss=0.166, lr=1e-5]Steps:  63%|██████▎   | 9445/15001 [6:01:46<2:58:53,  1.93s/it, loss=0.166, lr=1e-5]Steps:  63%|██████▎   | 9445/15001 [6:01:46<2:58:53,  1.93s/it, loss=0.122, lr=1e-5]Steps:  63%|██████▎   | 9446/15001 [6:01:48<2:46:07,  1.79s/it, loss=0.122, lr=1e-5]Steps:  63%|██████▎   | 9446/15001 [6:01:48<2:46:07,  1.79s/it, loss=0.201, lr=1e-5]Steps:  63%|██████▎   | 9447/15001 [6:01:50<2:56:19,  1.90s/it, loss=0.201, lr=1e-5]Steps:  63%|██████▎   | 9447/15001 [6:01:50<2:56:19,  1.90s/it, loss=0.313, lr=1e-5]Steps:  63%|██████▎   | 9448/15001 [6:01:52<2:45:00,  1.78s/it, loss=0.313, lr=1e-5]Steps:  63%|██████▎   | 9448/15001 [6:01:52<2:45:00,  1.78s/it, loss=0.0374, lr=1e-5]Steps:  63%|██████▎   | 9449/15001 [6:01:54<2:50:31,  1.84s/it, loss=0.0374, lr=1e-5]Steps:  63%|██████▎   | 9449/15001 [6:01:54<2:50:31,  1.84s/it, loss=0.127, lr=1e-5] Steps:  63%|██████▎   | 9450/15001 [6:01:55<2:52:03,  1.86s/it, loss=0.127, lr=1e-5]Steps:  63%|██████▎   | 9450/15001 [6:01:56<2:52:03,  1.86s/it, loss=0.103, lr=1e-5]Steps:  63%|██████▎   | 9451/15001 [6:01:57<2:49:49,  1.84s/it, loss=0.103, lr=1e-5]Steps:  63%|██████▎   | 9451/15001 [6:01:58<2:49:49,  1.84s/it, loss=0.118, lr=1e-5]Steps:  63%|██████▎   | 9452/15001 [6:01:59<2:53:18,  1.87s/it, loss=0.118, lr=1e-5]Steps:  63%|██████▎   | 9452/15001 [6:01:59<2:53:18,  1.87s/it, loss=0.246, lr=1e-5]Steps:  63%|██████▎   | 9453/15001 [6:02:01<2:45:02,  1.78s/it, loss=0.246, lr=1e-5]Steps:  63%|██████▎   | 9453/15001 [6:02:01<2:45:02,  1.78s/it, loss=0.286, lr=1e-5]Steps:  63%|██████▎   | 9454/15001 [6:02:03<2:56:34,  1.91s/it, loss=0.286, lr=1e-5]Steps:  63%|██████▎   | 9454/15001 [6:02:03<2:56:34,  1.91s/it, loss=0.14, lr=1e-5] Steps:  63%|██████▎   | 9455/15001 [6:02:05<2:55:13,  1.90s/it, loss=0.14, lr=1e-5]Steps:  63%|██████▎   | 9455/15001 [6:02:05<2:55:13,  1.90s/it, loss=0.222, lr=1e-5]Steps:  63%|██████▎   | 9456/15001 [6:02:06<2:45:50,  1.79s/it, loss=0.222, lr=1e-5]Steps:  63%|██████▎   | 9456/15001 [6:02:07<2:45:50,  1.79s/it, loss=0.163, lr=1e-5]Steps:  63%|██████▎   | 9457/15001 [6:02:08<2:48:00,  1.82s/it, loss=0.163, lr=1e-5]Steps:  63%|██████▎   | 9457/15001 [6:02:08<2:48:00,  1.82s/it, loss=0.112, lr=1e-5]Steps:  63%|██████▎   | 9458/15001 [6:02:10<2:51:50,  1.86s/it, loss=0.112, lr=1e-5]Steps:  63%|██████▎   | 9458/15001 [6:02:10<2:51:50,  1.86s/it, loss=0.297, lr=1e-5]Steps:  63%|██████▎   | 9459/15001 [6:02:12<2:40:03,  1.73s/it, loss=0.297, lr=1e-5]Steps:  63%|██████▎   | 9459/15001 [6:02:12<2:40:03,  1.73s/it, loss=0.0253, lr=1e-5]Steps:  63%|██████▎   | 9460/15001 [6:02:14<2:49:01,  1.83s/it, loss=0.0253, lr=1e-5]Steps:  63%|██████▎   | 9460/15001 [6:02:14<2:49:01,  1.83s/it, loss=0.301, lr=1e-5] Steps:  63%|██████▎   | 9461/15001 [6:02:16<2:49:40,  1.84s/it, loss=0.301, lr=1e-5]Steps:  63%|██████▎   | 9461/15001 [6:02:16<2:49:40,  1.84s/it, loss=0.269, lr=1e-5]Steps:  63%|██████▎   | 9462/15001 [6:02:18<2:58:23,  1.93s/it, loss=0.269, lr=1e-5]Steps:  63%|██████▎   | 9462/15001 [6:02:18<2:58:23,  1.93s/it, loss=0.181, lr=1e-5]Steps:  63%|██████▎   | 9463/15001 [6:02:20<2:59:58,  1.95s/it, loss=0.181, lr=1e-5]Steps:  63%|██████▎   | 9463/15001 [6:02:20<2:59:58,  1.95s/it, loss=0.138, lr=1e-5]Steps:  63%|██████▎   | 9464/15001 [6:02:22<2:58:34,  1.94s/it, loss=0.138, lr=1e-5]Steps:  63%|██████▎   | 9464/15001 [6:02:22<2:58:34,  1.94s/it, loss=0.288, lr=1e-5]Steps:  63%|██████▎   | 9465/15001 [6:02:24<2:59:40,  1.95s/it, loss=0.288, lr=1e-5]Steps:  63%|██████▎   | 9465/15001 [6:02:24<2:59:40,  1.95s/it, loss=0.155, lr=1e-5]Steps:  63%|██████▎   | 9466/15001 [6:02:26<2:58:53,  1.94s/it, loss=0.155, lr=1e-5]Steps:  63%|██████▎   | 9466/15001 [6:02:26<2:58:53,  1.94s/it, loss=0.0969, lr=1e-5]Steps:  63%|██████▎   | 9467/15001 [6:02:28<3:00:20,  1.96s/it, loss=0.0969, lr=1e-5]Steps:  63%|██████▎   | 9467/15001 [6:02:28<3:00:20,  1.96s/it, loss=0.161, lr=1e-5] Steps:  63%|██████▎   | 9468/15001 [6:02:29<2:48:56,  1.83s/it, loss=0.161, lr=1e-5]Steps:  63%|██████▎   | 9468/15001 [6:02:29<2:48:56,  1.83s/it, loss=0.24, lr=1e-5] Steps:  63%|██████▎   | 9469/15001 [6:02:31<2:46:48,  1.81s/it, loss=0.24, lr=1e-5]Steps:  63%|██████▎   | 9469/15001 [6:02:31<2:46:48,  1.81s/it, loss=0.304, lr=1e-5]Steps:  63%|██████▎   | 9470/15001 [6:02:33<2:51:42,  1.86s/it, loss=0.304, lr=1e-5]Steps:  63%|██████▎   | 9470/15001 [6:02:33<2:51:42,  1.86s/it, loss=0.241, lr=1e-5]Steps:  63%|██████▎   | 9471/15001 [6:02:35<2:54:45,  1.90s/it, loss=0.241, lr=1e-5]Steps:  63%|██████▎   | 9471/15001 [6:02:35<2:54:45,  1.90s/it, loss=0.0403, lr=1e-5]Steps:  63%|██████▎   | 9472/15001 [6:02:37<2:51:52,  1.87s/it, loss=0.0403, lr=1e-5]Steps:  63%|██████▎   | 9472/15001 [6:02:37<2:51:52,  1.87s/it, loss=0.149, lr=1e-5] Steps:  63%|██████▎   | 9473/15001 [6:02:39<2:54:00,  1.89s/it, loss=0.149, lr=1e-5]Steps:  63%|██████▎   | 9473/15001 [6:02:39<2:54:00,  1.89s/it, loss=0.209, lr=1e-5]Steps:  63%|██████▎   | 9474/15001 [6:02:40<2:53:07,  1.88s/it, loss=0.209, lr=1e-5]Steps:  63%|██████▎   | 9474/15001 [6:02:40<2:53:07,  1.88s/it, loss=0.243, lr=1e-5]Steps:  63%|██████▎   | 9475/15001 [6:02:42<2:48:42,  1.83s/it, loss=0.243, lr=1e-5]Steps:  63%|██████▎   | 9475/15001 [6:02:42<2:48:42,  1.83s/it, loss=0.134, lr=1e-5]Steps:  63%|██████▎   | 9476/15001 [6:02:44<2:53:59,  1.89s/it, loss=0.134, lr=1e-5]Steps:  63%|██████▎   | 9476/15001 [6:02:44<2:53:59,  1.89s/it, loss=0.166, lr=1e-5]Steps:  63%|██████▎   | 9477/15001 [6:02:46<2:50:06,  1.85s/it, loss=0.166, lr=1e-5]Steps:  63%|██████▎   | 9477/15001 [6:02:46<2:50:06,  1.85s/it, loss=0.194, lr=1e-5]Steps:  63%|██████▎   | 9478/15001 [6:02:48<2:45:06,  1.79s/it, loss=0.194, lr=1e-5]Steps:  63%|██████▎   | 9478/15001 [6:02:48<2:45:06,  1.79s/it, loss=0.101, lr=1e-5]Steps:  63%|██████▎   | 9479/15001 [6:02:49<2:43:25,  1.78s/it, loss=0.101, lr=1e-5]Steps:  63%|██████▎   | 9479/15001 [6:02:49<2:43:25,  1.78s/it, loss=0.0798, lr=1e-5]Steps:  63%|██████▎   | 9480/15001 [6:02:51<2:43:46,  1.78s/it, loss=0.0798, lr=1e-5]Steps:  63%|██████▎   | 9480/15001 [6:02:51<2:43:46,  1.78s/it, loss=0.205, lr=1e-5] Steps:  63%|██████▎   | 9481/15001 [6:02:53<2:45:09,  1.80s/it, loss=0.205, lr=1e-5]Steps:  63%|██████▎   | 9481/15001 [6:02:53<2:45:09,  1.80s/it, loss=0.134, lr=1e-5]Steps:  63%|██████▎   | 9482/15001 [6:02:55<2:42:39,  1.77s/it, loss=0.134, lr=1e-5]Steps:  63%|██████▎   | 9482/15001 [6:02:55<2:42:39,  1.77s/it, loss=0.0623, lr=1e-5]Steps:  63%|██████▎   | 9483/15001 [6:02:56<2:46:13,  1.81s/it, loss=0.0623, lr=1e-5]Steps:  63%|██████▎   | 9483/15001 [6:02:57<2:46:13,  1.81s/it, loss=0.276, lr=1e-5] Steps:  63%|██████▎   | 9484/15001 [6:02:59<2:54:32,  1.90s/it, loss=0.276, lr=1e-5]Steps:  63%|██████▎   | 9484/15001 [6:02:59<2:54:32,  1.90s/it, loss=0.108, lr=1e-5]Steps:  63%|██████▎   | 9485/15001 [6:03:01<2:58:49,  1.95s/it, loss=0.108, lr=1e-5]Steps:  63%|██████▎   | 9485/15001 [6:03:01<2:58:49,  1.95s/it, loss=0.384, lr=1e-5]Steps:  63%|██████▎   | 9486/15001 [6:03:03<2:58:39,  1.94s/it, loss=0.384, lr=1e-5]Steps:  63%|██████▎   | 9486/15001 [6:03:03<2:58:39,  1.94s/it, loss=0.229, lr=1e-5]Steps:  63%|██████▎   | 9487/15001 [6:03:05<3:00:47,  1.97s/it, loss=0.229, lr=1e-5]Steps:  63%|██████▎   | 9487/15001 [6:03:05<3:00:47,  1.97s/it, loss=0.0902, lr=1e-5]Steps:  63%|██████▎   | 9488/15001 [6:03:07<3:01:06,  1.97s/it, loss=0.0902, lr=1e-5]Steps:  63%|██████▎   | 9488/15001 [6:03:07<3:01:06,  1.97s/it, loss=0.136, lr=1e-5] Steps:  63%|██████▎   | 9489/15001 [6:03:09<3:01:56,  1.98s/it, loss=0.136, lr=1e-5]Steps:  63%|██████▎   | 9489/15001 [6:03:09<3:01:56,  1.98s/it, loss=0.144, lr=1e-5]Steps:  63%|██████▎   | 9490/15001 [6:03:10<2:57:08,  1.93s/it, loss=0.144, lr=1e-5]Steps:  63%|██████▎   | 9490/15001 [6:03:10<2:57:08,  1.93s/it, loss=0.319, lr=1e-5]Steps:  63%|██████▎   | 9491/15001 [6:03:12<2:48:42,  1.84s/it, loss=0.319, lr=1e-5]Steps:  63%|██████▎   | 9491/15001 [6:03:12<2:48:42,  1.84s/it, loss=0.221, lr=1e-5]Steps:  63%|██████▎   | 9492/15001 [6:03:14<2:41:17,  1.76s/it, loss=0.221, lr=1e-5]Steps:  63%|██████▎   | 9492/15001 [6:03:14<2:41:17,  1.76s/it, loss=0.353, lr=1e-5]Steps:  63%|██████▎   | 9493/15001 [6:03:16<2:48:11,  1.83s/it, loss=0.353, lr=1e-5]Steps:  63%|██████▎   | 9493/15001 [6:03:16<2:48:11,  1.83s/it, loss=0.0298, lr=1e-5]Steps:  63%|██████▎   | 9494/15001 [6:03:17<2:45:16,  1.80s/it, loss=0.0298, lr=1e-5]Steps:  63%|██████▎   | 9494/15001 [6:03:18<2:45:16,  1.80s/it, loss=0.269, lr=1e-5] Steps:  63%|██████▎   | 9495/15001 [6:03:20<2:55:40,  1.91s/it, loss=0.269, lr=1e-5]Steps:  63%|██████▎   | 9495/15001 [6:03:20<2:55:40,  1.91s/it, loss=0.366, lr=1e-5]Steps:  63%|██████▎   | 9496/15001 [6:03:21<2:52:25,  1.88s/it, loss=0.366, lr=1e-5]Steps:  63%|██████▎   | 9496/15001 [6:03:21<2:52:25,  1.88s/it, loss=0.152, lr=1e-5]Steps:  63%|██████▎   | 9497/15001 [6:03:23<2:49:37,  1.85s/it, loss=0.152, lr=1e-5]Steps:  63%|██████▎   | 9497/15001 [6:03:23<2:49:37,  1.85s/it, loss=0.337, lr=1e-5]Steps:  63%|██████▎   | 9498/15001 [6:03:25<2:49:36,  1.85s/it, loss=0.337, lr=1e-5]Steps:  63%|██████▎   | 9498/15001 [6:03:25<2:49:36,  1.85s/it, loss=0.0591, lr=1e-5]Steps:  63%|██████▎   | 9499/15001 [6:03:27<2:46:48,  1.82s/it, loss=0.0591, lr=1e-5]Steps:  63%|██████▎   | 9499/15001 [6:03:27<2:46:48,  1.82s/it, loss=0.0382, lr=1e-5]Steps:  63%|██████▎   | 9500/15001 [6:03:29<2:49:03,  1.84s/it, loss=0.0382, lr=1e-5]02/04/2024 19:05:48 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 317.50it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  63%|██████▎   | 9500/15001 [6:07:08<2:49:03,  1.84s/it, loss=0.265, lr=1e-5] Steps:  63%|██████▎   | 9501/15001 [6:07:10<103:16:49, 67.60s/it, loss=0.265, lr=1e-5]Steps:  63%|██████▎   | 9501/15001 [6:07:10<103:16:49, 67.60s/it, loss=0.0896, lr=1e-5]Steps:  63%|██████▎   | 9502/15001 [6:07:11<73:01:22, 47.81s/it, loss=0.0896, lr=1e-5] Steps:  63%|██████▎   | 9502/15001 [6:07:12<73:01:22, 47.81s/it, loss=0.173, lr=1e-5] Steps:  63%|██████▎   | 9503/15001 [6:07:13<51:54:36, 33.99s/it, loss=0.173, lr=1e-5]Steps:  63%|██████▎   | 9503/15001 [6:07:13<51:54:36, 33.99s/it, loss=0.16, lr=1e-5] Steps:  63%|██████▎   | 9504/15001 [6:07:15<37:10:22, 24.34s/it, loss=0.16, lr=1e-5]Steps:  63%|██████▎   | 9504/15001 [6:07:15<37:10:22, 24.34s/it, loss=0.0973, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  63%|██████▎   | 9505/15001 [6:07:17<26:56:39, 17.65s/it, loss=0.0973, lr=1e-5]Steps:  63%|██████▎   | 9505/15001 [6:07:17<26:56:39, 17.65s/it, loss=0.196, lr=1e-5] Steps:  63%|██████▎   | 9506/15001 [6:07:19<19:38:03, 12.86s/it, loss=0.196, lr=1e-5]Steps:  63%|██████▎   | 9506/15001 [6:07:19<19:38:03, 12.86s/it, loss=0.31, lr=1e-5] Steps:  63%|██████▎   | 9507/15001 [6:07:21<14:39:59,  9.61s/it, loss=0.31, lr=1e-5]Steps:  63%|██████▎   | 9507/15001 [6:07:21<14:39:59,  9.61s/it, loss=0.0766, lr=1e-5]Steps:  63%|██████▎   | 9508/15001 [6:07:22<11:04:44,  7.26s/it, loss=0.0766, lr=1e-5]Steps:  63%|██████▎   | 9508/15001 [6:07:22<11:04:44,  7.26s/it, loss=0.0926, lr=1e-5]Steps:  63%|██████▎   | 9509/15001 [6:07:24<8:27:58,  5.55s/it, loss=0.0926, lr=1e-5] Steps:  63%|██████▎   | 9509/15001 [6:07:24<8:27:58,  5.55s/it, loss=0.0967, lr=1e-5]Steps:  63%|██████▎   | 9510/15001 [6:07:26<6:52:40,  4.51s/it, loss=0.0967, lr=1e-5]Steps:  63%|██████▎   | 9510/15001 [6:07:26<6:52:40,  4.51s/it, loss=0.0599, lr=1e-5]Steps:  63%|██████▎   | 9511/15001 [6:07:28<5:35:18,  3.66s/it, loss=0.0599, lr=1e-5]Steps:  63%|██████▎   | 9511/15001 [6:07:28<5:35:18,  3.66s/it, loss=0.219, lr=1e-5] Steps:  63%|██████▎   | 9512/15001 [6:07:30<4:53:30,  3.21s/it, loss=0.219, lr=1e-5]Steps:  63%|██████▎   | 9512/15001 [6:07:30<4:53:30,  3.21s/it, loss=0.0445, lr=1e-5]Steps:  63%|██████▎   | 9513/15001 [6:07:32<4:15:29,  2.79s/it, loss=0.0445, lr=1e-5]Steps:  63%|██████▎   | 9513/15001 [6:07:32<4:15:29,  2.79s/it, loss=0.179, lr=1e-5] Steps:  63%|██████▎   | 9514/15001 [6:07:33<3:49:30,  2.51s/it, loss=0.179, lr=1e-5]Steps:  63%|██████▎   | 9514/15001 [6:07:34<3:49:30,  2.51s/it, loss=0.0841, lr=1e-5]Steps:  63%|██████▎   | 9515/15001 [6:07:35<3:35:20,  2.36s/it, loss=0.0841, lr=1e-5]Steps:  63%|██████▎   | 9515/15001 [6:07:36<3:35:20,  2.36s/it, loss=0.177, lr=1e-5] Steps:  63%|██████▎   | 9516/15001 [6:07:38<3:31:22,  2.31s/it, loss=0.177, lr=1e-5]Steps:  63%|██████▎   | 9516/15001 [6:07:38<3:31:22,  2.31s/it, loss=0.196, lr=1e-5]Steps:  63%|██████▎   | 9517/15001 [6:07:40<3:22:25,  2.21s/it, loss=0.196, lr=1e-5]Steps:  63%|██████▎   | 9517/15001 [6:07:40<3:22:25,  2.21s/it, loss=0.14, lr=1e-5] Steps:  63%|██████▎   | 9518/15001 [6:07:42<3:17:07,  2.16s/it, loss=0.14, lr=1e-5]Steps:  63%|██████▎   | 9518/15001 [6:07:42<3:17:07,  2.16s/it, loss=0.115, lr=1e-5]Steps:  63%|██████▎   | 9519/15001 [6:07:44<3:08:39,  2.06s/it, loss=0.115, lr=1e-5]Steps:  63%|██████▎   | 9519/15001 [6:07:44<3:08:39,  2.06s/it, loss=0.103, lr=1e-5]Steps:  63%|██████▎   | 9520/15001 [6:07:45<2:57:24,  1.94s/it, loss=0.103, lr=1e-5]Steps:  63%|██████▎   | 9520/15001 [6:07:46<2:57:24,  1.94s/it, loss=0.133, lr=1e-5]Steps:  63%|██████▎   | 9521/15001 [6:07:47<2:57:41,  1.95s/it, loss=0.133, lr=1e-5]Steps:  63%|██████▎   | 9521/15001 [6:07:47<2:57:41,  1.95s/it, loss=0.0756, lr=1e-5]Steps:  63%|██████▎   | 9522/15001 [6:07:49<2:56:44,  1.94s/it, loss=0.0756, lr=1e-5]Steps:  63%|██████▎   | 9522/15001 [6:07:49<2:56:44,  1.94s/it, loss=0.0874, lr=1e-5]Steps:  63%|██████▎   | 9523/15001 [6:07:51<2:53:47,  1.90s/it, loss=0.0874, lr=1e-5]Steps:  63%|██████▎   | 9523/15001 [6:07:51<2:53:47,  1.90s/it, loss=0.321, lr=1e-5] Steps:  63%|██████▎   | 9524/15001 [6:07:53<2:50:35,  1.87s/it, loss=0.321, lr=1e-5]Steps:  63%|██████▎   | 9524/15001 [6:07:53<2:50:35,  1.87s/it, loss=0.229, lr=1e-5]Steps:  63%|██████▎   | 9525/15001 [6:07:55<2:49:12,  1.85s/it, loss=0.229, lr=1e-5]Steps:  63%|██████▎   | 9525/15001 [6:07:55<2:49:12,  1.85s/it, loss=0.075, lr=1e-5]Steps:  64%|██████▎   | 9526/15001 [6:07:57<2:53:11,  1.90s/it, loss=0.075, lr=1e-5]Steps:  64%|██████▎   | 9526/15001 [6:07:57<2:53:11,  1.90s/it, loss=0.189, lr=1e-5]Steps:  64%|██████▎   | 9527/15001 [6:07:58<2:42:31,  1.78s/it, loss=0.189, lr=1e-5]Steps:  64%|██████▎   | 9527/15001 [6:07:58<2:42:31,  1.78s/it, loss=0.111, lr=1e-5]Steps:  64%|██████▎   | 9528/15001 [6:08:00<2:45:33,  1.81s/it, loss=0.111, lr=1e-5]Steps:  64%|██████▎   | 9528/15001 [6:08:00<2:45:33,  1.81s/it, loss=0.177, lr=1e-5]Steps:  64%|██████▎   | 9529/15001 [6:08:02<2:50:00,  1.86s/it, loss=0.177, lr=1e-5]Steps:  64%|██████▎   | 9529/15001 [6:08:02<2:50:00,  1.86s/it, loss=0.141, lr=1e-5]Steps:  64%|██████▎   | 9530/15001 [6:08:04<2:48:40,  1.85s/it, loss=0.141, lr=1e-5]Steps:  64%|██████▎   | 9530/15001 [6:08:04<2:48:40,  1.85s/it, loss=0.145, lr=1e-5]Steps:  64%|██████▎   | 9531/15001 [6:08:05<2:43:30,  1.79s/it, loss=0.145, lr=1e-5]Steps:  64%|██████▎   | 9531/15001 [6:08:06<2:43:30,  1.79s/it, loss=0.111, lr=1e-5]Steps:  64%|██████▎   | 9532/15001 [6:08:07<2:45:46,  1.82s/it, loss=0.111, lr=1e-5]Steps:  64%|██████▎   | 9532/15001 [6:08:07<2:45:46,  1.82s/it, loss=0.208, lr=1e-5]Steps:  64%|██████▎   | 9533/15001 [6:08:09<2:39:08,  1.75s/it, loss=0.208, lr=1e-5]Steps:  64%|██████▎   | 9533/15001 [6:08:09<2:39:08,  1.75s/it, loss=0.0337, lr=1e-5]Steps:  64%|██████▎   | 9534/15001 [6:08:11<2:44:18,  1.80s/it, loss=0.0337, lr=1e-5]Steps:  64%|██████▎   | 9534/15001 [6:08:11<2:44:18,  1.80s/it, loss=0.129, lr=1e-5] Steps:  64%|██████▎   | 9535/15001 [6:08:13<2:44:57,  1.81s/it, loss=0.129, lr=1e-5]Steps:  64%|██████▎   | 9535/15001 [6:08:13<2:44:57,  1.81s/it, loss=0.327, lr=1e-5]Steps:  64%|██████▎   | 9536/15001 [6:08:14<2:43:50,  1.80s/it, loss=0.327, lr=1e-5]Steps:  64%|██████▎   | 9536/15001 [6:08:15<2:43:50,  1.80s/it, loss=0.198, lr=1e-5]Steps:  64%|██████▎   | 9537/15001 [6:08:17<2:54:44,  1.92s/it, loss=0.198, lr=1e-5]Steps:  64%|██████▎   | 9537/15001 [6:08:17<2:54:44,  1.92s/it, loss=0.173, lr=1e-5]Steps:  64%|██████▎   | 9538/15001 [6:08:18<2:52:14,  1.89s/it, loss=0.173, lr=1e-5]Steps:  64%|██████▎   | 9538/15001 [6:08:19<2:52:14,  1.89s/it, loss=0.0206, lr=1e-5]Steps:  64%|██████▎   | 9539/15001 [6:08:21<2:58:07,  1.96s/it, loss=0.0206, lr=1e-5]Steps:  64%|██████▎   | 9539/15001 [6:08:21<2:58:07,  1.96s/it, loss=0.196, lr=1e-5] Steps:  64%|██████▎   | 9540/15001 [6:08:23<3:06:30,  2.05s/it, loss=0.196, lr=1e-5]Steps:  64%|██████▎   | 9540/15001 [6:08:23<3:06:30,  2.05s/it, loss=0.119, lr=1e-5]Steps:  64%|██████▎   | 9541/15001 [6:08:25<3:02:45,  2.01s/it, loss=0.119, lr=1e-5]Steps:  64%|██████▎   | 9541/15001 [6:08:25<3:02:45,  2.01s/it, loss=0.126, lr=1e-5]Steps:  64%|██████▎   | 9542/15001 [6:08:27<3:04:42,  2.03s/it, loss=0.126, lr=1e-5]Steps:  64%|██████▎   | 9542/15001 [6:08:27<3:04:42,  2.03s/it, loss=0.314, lr=1e-5]Steps:  64%|██████▎   | 9543/15001 [6:08:29<3:00:11,  1.98s/it, loss=0.314, lr=1e-5]Steps:  64%|██████▎   | 9543/15001 [6:08:29<3:00:11,  1.98s/it, loss=0.171, lr=1e-5]Steps:  64%|██████▎   | 9544/15001 [6:08:30<2:53:48,  1.91s/it, loss=0.171, lr=1e-5]Steps:  64%|██████▎   | 9544/15001 [6:08:31<2:53:48,  1.91s/it, loss=0.222, lr=1e-5]Steps:  64%|██████▎   | 9545/15001 [6:08:32<2:51:11,  1.88s/it, loss=0.222, lr=1e-5]Steps:  64%|██████▎   | 9545/15001 [6:08:33<2:51:11,  1.88s/it, loss=0.0945, lr=1e-5]Steps:  64%|██████▎   | 9546/15001 [6:08:34<2:55:29,  1.93s/it, loss=0.0945, lr=1e-5]Steps:  64%|██████▎   | 9546/15001 [6:08:35<2:55:29,  1.93s/it, loss=0.0552, lr=1e-5]Steps:  64%|██████▎   | 9547/15001 [6:08:36<2:54:13,  1.92s/it, loss=0.0552, lr=1e-5]Steps:  64%|██████▎   | 9547/15001 [6:08:36<2:54:13,  1.92s/it, loss=0.111, lr=1e-5] Steps:  64%|██████▎   | 9548/15001 [6:08:38<2:55:20,  1.93s/it, loss=0.111, lr=1e-5]Steps:  64%|██████▎   | 9548/15001 [6:08:38<2:55:20,  1.93s/it, loss=0.132, lr=1e-5]Steps:  64%|██████▎   | 9549/15001 [6:08:40<2:46:27,  1.83s/it, loss=0.132, lr=1e-5]Steps:  64%|██████▎   | 9549/15001 [6:08:40<2:46:27,  1.83s/it, loss=0.108, lr=1e-5]Steps:  64%|██████▎   | 9550/15001 [6:08:42<2:56:19,  1.94s/it, loss=0.108, lr=1e-5]Steps:  64%|██████▎   | 9550/15001 [6:08:42<2:56:19,  1.94s/it, loss=0.0228, lr=1e-5]Steps:  64%|██████▎   | 9551/15001 [6:08:44<2:49:34,  1.87s/it, loss=0.0228, lr=1e-5]Steps:  64%|██████▎   | 9551/15001 [6:08:44<2:49:34,  1.87s/it, loss=0.0655, lr=1e-5]Steps:  64%|██████▎   | 9552/15001 [6:08:46<2:52:23,  1.90s/it, loss=0.0655, lr=1e-5]Steps:  64%|██████▎   | 9552/15001 [6:08:46<2:52:23,  1.90s/it, loss=0.156, lr=1e-5] Steps:  64%|██████▎   | 9553/15001 [6:08:47<2:47:11,  1.84s/it, loss=0.156, lr=1e-5]Steps:  64%|██████▎   | 9553/15001 [6:08:48<2:47:11,  1.84s/it, loss=0.0859, lr=1e-5]Steps:  64%|██████▎   | 9554/15001 [6:08:49<2:56:21,  1.94s/it, loss=0.0859, lr=1e-5]Steps:  64%|██████▎   | 9554/15001 [6:08:50<2:56:21,  1.94s/it, loss=0.36, lr=1e-5]  Steps:  64%|██████▎   | 9555/15001 [6:08:51<2:49:35,  1.87s/it, loss=0.36, lr=1e-5]Steps:  64%|██████▎   | 9555/15001 [6:08:51<2:49:35,  1.87s/it, loss=0.121, lr=1e-5]Steps:  64%|██████▎   | 9556/15001 [6:08:53<2:48:47,  1.86s/it, loss=0.121, lr=1e-5]Steps:  64%|██████▎   | 9556/15001 [6:08:53<2:48:47,  1.86s/it, loss=0.368, lr=1e-5]Steps:  64%|██████▎   | 9557/15001 [6:08:55<2:52:42,  1.90s/it, loss=0.368, lr=1e-5]Steps:  64%|██████▎   | 9557/15001 [6:08:55<2:52:42,  1.90s/it, loss=0.213, lr=1e-5]Steps:  64%|██████▎   | 9558/15001 [6:08:57<2:48:01,  1.85s/it, loss=0.213, lr=1e-5]Steps:  64%|██████▎   | 9558/15001 [6:08:57<2:48:01,  1.85s/it, loss=0.443, lr=1e-5]Steps:  64%|██████▎   | 9559/15001 [6:08:59<2:52:54,  1.91s/it, loss=0.443, lr=1e-5]Steps:  64%|██████▎   | 9559/15001 [6:08:59<2:52:54,  1.91s/it, loss=0.159, lr=1e-5]Steps:  64%|██████▎   | 9560/15001 [6:09:01<2:51:57,  1.90s/it, loss=0.159, lr=1e-5]Steps:  64%|██████▎   | 9560/15001 [6:09:01<2:51:57,  1.90s/it, loss=0.0931, lr=1e-5]Steps:  64%|██████▎   | 9561/15001 [6:09:02<2:45:46,  1.83s/it, loss=0.0931, lr=1e-5]Steps:  64%|██████▎   | 9561/15001 [6:09:03<2:45:46,  1.83s/it, loss=0.135, lr=1e-5] Steps:  64%|██████▎   | 9562/15001 [6:09:04<2:56:07,  1.94s/it, loss=0.135, lr=1e-5]Steps:  64%|██████▎   | 9562/15001 [6:09:05<2:56:07,  1.94s/it, loss=0.0966, lr=1e-5]Steps:  64%|██████▎   | 9563/15001 [6:09:06<2:51:53,  1.90s/it, loss=0.0966, lr=1e-5]Steps:  64%|██████▎   | 9563/15001 [6:09:07<2:51:53,  1.90s/it, loss=0.262, lr=1e-5] Steps:  64%|██████▍   | 9564/15001 [6:09:08<2:54:29,  1.93s/it, loss=0.262, lr=1e-5]Steps:  64%|██████▍   | 9564/15001 [6:09:09<2:54:29,  1.93s/it, loss=0.192, lr=1e-5]Steps:  64%|██████▍   | 9565/15001 [6:09:10<2:58:59,  1.98s/it, loss=0.192, lr=1e-5]Steps:  64%|██████▍   | 9565/15001 [6:09:10<2:58:59,  1.98s/it, loss=0.0261, lr=1e-5]Steps:  64%|██████▍   | 9566/15001 [6:09:12<2:55:06,  1.93s/it, loss=0.0261, lr=1e-5]Steps:  64%|██████▍   | 9566/15001 [6:09:12<2:55:06,  1.93s/it, loss=0.133, lr=1e-5] Steps:  64%|██████▍   | 9567/15001 [6:09:14<2:50:27,  1.88s/it, loss=0.133, lr=1e-5]Steps:  64%|██████▍   | 9567/15001 [6:09:14<2:50:27,  1.88s/it, loss=0.236, lr=1e-5]Steps:  64%|██████▍   | 9568/15001 [6:09:16<2:41:57,  1.79s/it, loss=0.236, lr=1e-5]Steps:  64%|██████▍   | 9568/15001 [6:09:16<2:41:57,  1.79s/it, loss=0.236, lr=1e-5]Steps:  64%|██████▍   | 9569/15001 [6:09:18<2:47:38,  1.85s/it, loss=0.236, lr=1e-5]Steps:  64%|██████▍   | 9569/15001 [6:09:18<2:47:38,  1.85s/it, loss=0.0875, lr=1e-5]Steps:  64%|██████▍   | 9570/15001 [6:09:19<2:41:42,  1.79s/it, loss=0.0875, lr=1e-5]Steps:  64%|██████▍   | 9570/15001 [6:09:19<2:41:42,  1.79s/it, loss=0.328, lr=1e-5] Steps:  64%|██████▍   | 9571/15001 [6:09:21<2:49:39,  1.87s/it, loss=0.328, lr=1e-5]Steps:  64%|██████▍   | 9571/15001 [6:09:21<2:49:39,  1.87s/it, loss=0.128, lr=1e-5]Steps:  64%|██████▍   | 9572/15001 [6:09:23<2:47:03,  1.85s/it, loss=0.128, lr=1e-5]Steps:  64%|██████▍   | 9572/15001 [6:09:23<2:47:03,  1.85s/it, loss=0.219, lr=1e-5]Steps:  64%|██████▍   | 9573/15001 [6:09:25<2:46:05,  1.84s/it, loss=0.219, lr=1e-5]Steps:  64%|██████▍   | 9573/15001 [6:09:25<2:46:05,  1.84s/it, loss=0.127, lr=1e-5]Steps:  64%|██████▍   | 9574/15001 [6:09:27<2:44:17,  1.82s/it, loss=0.127, lr=1e-5]Steps:  64%|██████▍   | 9574/15001 [6:09:27<2:44:17,  1.82s/it, loss=0.205, lr=1e-5]Steps:  64%|██████▍   | 9575/15001 [6:09:29<2:49:24,  1.87s/it, loss=0.205, lr=1e-5]Steps:  64%|██████▍   | 9575/15001 [6:09:29<2:49:24,  1.87s/it, loss=0.261, lr=1e-5]Steps:  64%|██████▍   | 9576/15001 [6:09:31<2:49:59,  1.88s/it, loss=0.261, lr=1e-5]Steps:  64%|██████▍   | 9576/15001 [6:09:31<2:49:59,  1.88s/it, loss=0.241, lr=1e-5]Steps:  64%|██████▍   | 9577/15001 [6:09:32<2:43:37,  1.81s/it, loss=0.241, lr=1e-5]Steps:  64%|██████▍   | 9577/15001 [6:09:32<2:43:37,  1.81s/it, loss=0.122, lr=1e-5]Steps:  64%|██████▍   | 9578/15001 [6:09:34<2:46:53,  1.85s/it, loss=0.122, lr=1e-5]Steps:  64%|██████▍   | 9578/15001 [6:09:34<2:46:53,  1.85s/it, loss=0.271, lr=1e-5]Steps:  64%|██████▍   | 9579/15001 [6:09:36<2:41:34,  1.79s/it, loss=0.271, lr=1e-5]Steps:  64%|██████▍   | 9579/15001 [6:09:36<2:41:34,  1.79s/it, loss=0.332, lr=1e-5]Steps:  64%|██████▍   | 9580/15001 [6:09:38<2:47:25,  1.85s/it, loss=0.332, lr=1e-5]Steps:  64%|██████▍   | 9580/15001 [6:09:38<2:47:25,  1.85s/it, loss=0.208, lr=1e-5]Steps:  64%|██████▍   | 9581/15001 [6:09:40<2:48:18,  1.86s/it, loss=0.208, lr=1e-5]Steps:  64%|██████▍   | 9581/15001 [6:09:40<2:48:18,  1.86s/it, loss=0.187, lr=1e-5]Steps:  64%|██████▍   | 9582/15001 [6:09:41<2:45:05,  1.83s/it, loss=0.187, lr=1e-5]Steps:  64%|██████▍   | 9582/15001 [6:09:41<2:45:05,  1.83s/it, loss=0.0789, lr=1e-5]Steps:  64%|██████▍   | 9583/15001 [6:09:43<2:41:13,  1.79s/it, loss=0.0789, lr=1e-5]Steps:  64%|██████▍   | 9583/15001 [6:09:43<2:41:13,  1.79s/it, loss=0.233, lr=1e-5] Steps:  64%|██████▍   | 9584/15001 [6:09:45<2:48:15,  1.86s/it, loss=0.233, lr=1e-5]Steps:  64%|██████▍   | 9584/15001 [6:09:45<2:48:15,  1.86s/it, loss=0.2, lr=1e-5]  Steps:  64%|██████▍   | 9585/15001 [6:09:47<2:59:13,  1.99s/it, loss=0.2, lr=1e-5]Steps:  64%|██████▍   | 9585/15001 [6:09:47<2:59:13,  1.99s/it, loss=0.207, lr=1e-5]Steps:  64%|██████▍   | 9586/15001 [6:09:49<2:54:25,  1.93s/it, loss=0.207, lr=1e-5]Steps:  64%|██████▍   | 9586/15001 [6:09:49<2:54:25,  1.93s/it, loss=0.132, lr=1e-5]Steps:  64%|██████▍   | 9587/15001 [6:09:51<2:59:23,  1.99s/it, loss=0.132, lr=1e-5]Steps:  64%|██████▍   | 9587/15001 [6:09:51<2:59:23,  1.99s/it, loss=0.134, lr=1e-5]Steps:  64%|██████▍   | 9588/15001 [6:09:53<2:58:04,  1.97s/it, loss=0.134, lr=1e-5]Steps:  64%|██████▍   | 9588/15001 [6:09:53<2:58:04,  1.97s/it, loss=0.134, lr=1e-5]Steps:  64%|██████▍   | 9589/15001 [6:09:55<2:52:05,  1.91s/it, loss=0.134, lr=1e-5]Steps:  64%|██████▍   | 9589/15001 [6:09:55<2:52:05,  1.91s/it, loss=0.143, lr=1e-5]Steps:  64%|██████▍   | 9590/15001 [6:09:57<2:50:17,  1.89s/it, loss=0.143, lr=1e-5]Steps:  64%|██████▍   | 9590/15001 [6:09:57<2:50:17,  1.89s/it, loss=0.187, lr=1e-5]Steps:  64%|██████▍   | 9591/15001 [6:09:59<2:47:04,  1.85s/it, loss=0.187, lr=1e-5]Steps:  64%|██████▍   | 9591/15001 [6:09:59<2:47:04,  1.85s/it, loss=0.143, lr=1e-5]Steps:  64%|██████▍   | 9592/15001 [6:10:01<2:48:57,  1.87s/it, loss=0.143, lr=1e-5]Steps:  64%|██████▍   | 9592/15001 [6:10:01<2:48:57,  1.87s/it, loss=0.0835, lr=1e-5]Steps:  64%|██████▍   | 9593/15001 [6:10:02<2:45:06,  1.83s/it, loss=0.0835, lr=1e-5]Steps:  64%|██████▍   | 9593/15001 [6:10:02<2:45:06,  1.83s/it, loss=0.0867, lr=1e-5]Steps:  64%|██████▍   | 9594/15001 [6:10:04<2:39:48,  1.77s/it, loss=0.0867, lr=1e-5]Steps:  64%|██████▍   | 9594/15001 [6:10:04<2:39:48,  1.77s/it, loss=0.0999, lr=1e-5]Steps:  64%|██████▍   | 9595/15001 [6:10:06<2:46:08,  1.84s/it, loss=0.0999, lr=1e-5]Steps:  64%|██████▍   | 9595/15001 [6:10:06<2:46:08,  1.84s/it, loss=0.233, lr=1e-5] Steps:  64%|██████▍   | 9596/15001 [6:10:08<2:43:24,  1.81s/it, loss=0.233, lr=1e-5]Steps:  64%|██████▍   | 9596/15001 [6:10:08<2:43:24,  1.81s/it, loss=0.0831, lr=1e-5]Steps:  64%|██████▍   | 9597/15001 [6:10:09<2:41:13,  1.79s/it, loss=0.0831, lr=1e-5]Steps:  64%|██████▍   | 9597/15001 [6:10:10<2:41:13,  1.79s/it, loss=0.0469, lr=1e-5]Steps:  64%|██████▍   | 9598/15001 [6:10:11<2:43:06,  1.81s/it, loss=0.0469, lr=1e-5]Steps:  64%|██████▍   | 9598/15001 [6:10:11<2:43:06,  1.81s/it, loss=0.275, lr=1e-5] Steps:  64%|██████▍   | 9599/15001 [6:10:13<2:43:14,  1.81s/it, loss=0.275, lr=1e-5]Steps:  64%|██████▍   | 9599/15001 [6:10:13<2:43:14,  1.81s/it, loss=0.0437, lr=1e-5]Steps:  64%|██████▍   | 9600/15001 [6:10:15<2:43:10,  1.81s/it, loss=0.0437, lr=1e-5]Steps:  64%|██████▍   | 9600/15001 [6:10:15<2:43:10,  1.81s/it, loss=0.13, lr=1e-5]  Steps:  64%|██████▍   | 9601/15001 [6:10:16<2:37:02,  1.74s/it, loss=0.13, lr=1e-5]Steps:  64%|██████▍   | 9601/15001 [6:10:17<2:37:02,  1.74s/it, loss=0.168, lr=1e-5]Steps:  64%|██████▍   | 9602/15001 [6:10:19<2:48:47,  1.88s/it, loss=0.168, lr=1e-5]Steps:  64%|██████▍   | 9602/15001 [6:10:19<2:48:47,  1.88s/it, loss=0.113, lr=1e-5]Steps:  64%|██████▍   | 9603/15001 [6:10:20<2:42:56,  1.81s/it, loss=0.113, lr=1e-5]Steps:  64%|██████▍   | 9603/15001 [6:10:21<2:42:56,  1.81s/it, loss=0.173, lr=1e-5]Steps:  64%|██████▍   | 9604/15001 [6:10:22<2:38:47,  1.77s/it, loss=0.173, lr=1e-5]Steps:  64%|██████▍   | 9604/15001 [6:10:22<2:38:47,  1.77s/it, loss=0.283, lr=1e-5]Steps:  64%|██████▍   | 9605/15001 [6:10:24<2:50:37,  1.90s/it, loss=0.283, lr=1e-5]Steps:  64%|██████▍   | 9605/15001 [6:10:24<2:50:37,  1.90s/it, loss=0.137, lr=1e-5]Steps:  64%|██████▍   | 9606/15001 [6:10:26<2:50:31,  1.90s/it, loss=0.137, lr=1e-5]Steps:  64%|██████▍   | 9606/15001 [6:10:26<2:50:31,  1.90s/it, loss=0.23, lr=1e-5] Steps:  64%|██████▍   | 9607/15001 [6:10:28<2:47:23,  1.86s/it, loss=0.23, lr=1e-5]Steps:  64%|██████▍   | 9607/15001 [6:10:28<2:47:23,  1.86s/it, loss=0.0256, lr=1e-5]Steps:  64%|██████▍   | 9608/15001 [6:10:30<2:55:27,  1.95s/it, loss=0.0256, lr=1e-5]Steps:  64%|██████▍   | 9608/15001 [6:10:30<2:55:27,  1.95s/it, loss=0.103, lr=1e-5] Steps:  64%|██████▍   | 9609/15001 [6:10:32<2:53:45,  1.93s/it, loss=0.103, lr=1e-5]Steps:  64%|██████▍   | 9609/15001 [6:10:32<2:53:45,  1.93s/it, loss=0.0894, lr=1e-5]Steps:  64%|██████▍   | 9610/15001 [6:10:34<3:05:48,  2.07s/it, loss=0.0894, lr=1e-5]Steps:  64%|██████▍   | 9610/15001 [6:10:34<3:05:48,  2.07s/it, loss=0.26, lr=1e-5]  Steps:  64%|██████▍   | 9611/15001 [6:10:36<3:03:09,  2.04s/it, loss=0.26, lr=1e-5]Steps:  64%|██████▍   | 9611/15001 [6:10:36<3:03:09,  2.04s/it, loss=0.0392, lr=1e-5]Steps:  64%|██████▍   | 9612/15001 [6:10:38<2:57:31,  1.98s/it, loss=0.0392, lr=1e-5]Steps:  64%|██████▍   | 9612/15001 [6:10:38<2:57:31,  1.98s/it, loss=0.13, lr=1e-5]  Steps:  64%|██████▍   | 9613/15001 [6:10:40<2:53:06,  1.93s/it, loss=0.13, lr=1e-5]Steps:  64%|██████▍   | 9613/15001 [6:10:40<2:53:06,  1.93s/it, loss=0.0503, lr=1e-5]Steps:  64%|██████▍   | 9614/15001 [6:10:42<2:48:32,  1.88s/it, loss=0.0503, lr=1e-5]Steps:  64%|██████▍   | 9614/15001 [6:10:42<2:48:32,  1.88s/it, loss=0.12, lr=1e-5]  Steps:  64%|██████▍   | 9615/15001 [6:10:43<2:41:41,  1.80s/it, loss=0.12, lr=1e-5]Steps:  64%|██████▍   | 9615/15001 [6:10:44<2:41:41,  1.80s/it, loss=0.365, lr=1e-5]Steps:  64%|██████▍   | 9616/15001 [6:10:45<2:43:43,  1.82s/it, loss=0.365, lr=1e-5]Steps:  64%|██████▍   | 9616/15001 [6:10:46<2:43:43,  1.82s/it, loss=0.241, lr=1e-5]Steps:  64%|██████▍   | 9617/15001 [6:10:47<2:49:34,  1.89s/it, loss=0.241, lr=1e-5]Steps:  64%|██████▍   | 9617/15001 [6:10:47<2:49:34,  1.89s/it, loss=0.244, lr=1e-5]Steps:  64%|██████▍   | 9618/15001 [6:10:49<2:44:08,  1.83s/it, loss=0.244, lr=1e-5]Steps:  64%|██████▍   | 9618/15001 [6:10:49<2:44:08,  1.83s/it, loss=0.294, lr=1e-5]Steps:  64%|██████▍   | 9619/15001 [6:10:51<2:44:33,  1.83s/it, loss=0.294, lr=1e-5]Steps:  64%|██████▍   | 9619/15001 [6:10:51<2:44:33,  1.83s/it, loss=0.137, lr=1e-5]Steps:  64%|██████▍   | 9620/15001 [6:10:53<2:49:31,  1.89s/it, loss=0.137, lr=1e-5]Steps:  64%|██████▍   | 9620/15001 [6:10:53<2:49:31,  1.89s/it, loss=0.115, lr=1e-5]Steps:  64%|██████▍   | 9621/15001 [6:10:54<2:44:58,  1.84s/it, loss=0.115, lr=1e-5]Steps:  64%|██████▍   | 9621/15001 [6:10:55<2:44:58,  1.84s/it, loss=0.07, lr=1e-5] Steps:  64%|██████▍   | 9622/15001 [6:10:56<2:43:51,  1.83s/it, loss=0.07, lr=1e-5]Steps:  64%|██████▍   | 9622/15001 [6:10:56<2:43:51,  1.83s/it, loss=0.0477, lr=1e-5]Steps:  64%|██████▍   | 9623/15001 [6:10:58<2:38:44,  1.77s/it, loss=0.0477, lr=1e-5]Steps:  64%|██████▍   | 9623/15001 [6:10:58<2:38:44,  1.77s/it, loss=0.272, lr=1e-5] Steps:  64%|██████▍   | 9624/15001 [6:11:00<2:40:07,  1.79s/it, loss=0.272, lr=1e-5]Steps:  64%|██████▍   | 9624/15001 [6:11:00<2:40:07,  1.79s/it, loss=0.141, lr=1e-5]Steps:  64%|██████▍   | 9625/15001 [6:11:02<2:40:37,  1.79s/it, loss=0.141, lr=1e-5]Steps:  64%|██████▍   | 9625/15001 [6:11:02<2:40:37,  1.79s/it, loss=0.0628, lr=1e-5]Steps:  64%|██████▍   | 9626/15001 [6:11:04<2:45:59,  1.85s/it, loss=0.0628, lr=1e-5]Steps:  64%|██████▍   | 9626/15001 [6:11:04<2:45:59,  1.85s/it, loss=0.247, lr=1e-5] Steps:  64%|██████▍   | 9627/15001 [6:11:05<2:46:05,  1.85s/it, loss=0.247, lr=1e-5]Steps:  64%|██████▍   | 9627/15001 [6:11:05<2:46:05,  1.85s/it, loss=0.0953, lr=1e-5]Steps:  64%|██████▍   | 9628/15001 [6:11:07<2:41:08,  1.80s/it, loss=0.0953, lr=1e-5]Steps:  64%|██████▍   | 9628/15001 [6:11:07<2:41:08,  1.80s/it, loss=0.347, lr=1e-5] Steps:  64%|██████▍   | 9629/15001 [6:11:09<2:42:40,  1.82s/it, loss=0.347, lr=1e-5]Steps:  64%|██████▍   | 9629/15001 [6:11:09<2:42:40,  1.82s/it, loss=0.189, lr=1e-5]Steps:  64%|██████▍   | 9630/15001 [6:11:11<2:49:54,  1.90s/it, loss=0.189, lr=1e-5]Steps:  64%|██████▍   | 9630/15001 [6:11:11<2:49:54,  1.90s/it, loss=0.052, lr=1e-5]Steps:  64%|██████▍   | 9631/15001 [6:11:13<2:54:14,  1.95s/it, loss=0.052, lr=1e-5]Steps:  64%|██████▍   | 9631/15001 [6:11:13<2:54:14,  1.95s/it, loss=0.091, lr=1e-5]Steps:  64%|██████▍   | 9632/15001 [6:11:15<2:55:14,  1.96s/it, loss=0.091, lr=1e-5]Steps:  64%|██████▍   | 9632/15001 [6:11:15<2:55:14,  1.96s/it, loss=0.0175, lr=1e-5]Steps:  64%|██████▍   | 9633/15001 [6:11:17<2:53:10,  1.94s/it, loss=0.0175, lr=1e-5]Steps:  64%|██████▍   | 9633/15001 [6:11:17<2:53:10,  1.94s/it, loss=0.0855, lr=1e-5]Steps:  64%|██████▍   | 9634/15001 [6:11:19<2:57:26,  1.98s/it, loss=0.0855, lr=1e-5]Steps:  64%|██████▍   | 9634/15001 [6:11:19<2:57:26,  1.98s/it, loss=0.158, lr=1e-5] Steps:  64%|██████▍   | 9635/15001 [6:11:21<2:55:24,  1.96s/it, loss=0.158, lr=1e-5]Steps:  64%|██████▍   | 9635/15001 [6:11:21<2:55:24,  1.96s/it, loss=0.166, lr=1e-5]Steps:  64%|██████▍   | 9636/15001 [6:11:23<2:53:18,  1.94s/it, loss=0.166, lr=1e-5]Steps:  64%|██████▍   | 9636/15001 [6:11:23<2:53:18,  1.94s/it, loss=0.229, lr=1e-5]Steps:  64%|██████▍   | 9637/15001 [6:11:24<2:45:32,  1.85s/it, loss=0.229, lr=1e-5]Steps:  64%|██████▍   | 9637/15001 [6:11:25<2:45:32,  1.85s/it, loss=0.262, lr=1e-5]Steps:  64%|██████▍   | 9638/15001 [6:11:27<2:50:03,  1.90s/it, loss=0.262, lr=1e-5]Steps:  64%|██████▍   | 9638/15001 [6:11:27<2:50:03,  1.90s/it, loss=0.14, lr=1e-5] Steps:  64%|██████▍   | 9639/15001 [6:11:28<2:47:34,  1.88s/it, loss=0.14, lr=1e-5]Steps:  64%|██████▍   | 9639/15001 [6:11:28<2:47:34,  1.88s/it, loss=0.239, lr=1e-5]Steps:  64%|██████▍   | 9640/15001 [6:11:30<2:46:38,  1.87s/it, loss=0.239, lr=1e-5]Steps:  64%|██████▍   | 9640/15001 [6:11:30<2:46:38,  1.87s/it, loss=0.117, lr=1e-5]Steps:  64%|██████▍   | 9641/15001 [6:11:32<2:42:13,  1.82s/it, loss=0.117, lr=1e-5]Steps:  64%|██████▍   | 9641/15001 [6:11:32<2:42:13,  1.82s/it, loss=0.231, lr=1e-5]Steps:  64%|██████▍   | 9642/15001 [6:11:34<2:43:46,  1.83s/it, loss=0.231, lr=1e-5]Steps:  64%|██████▍   | 9642/15001 [6:11:34<2:43:46,  1.83s/it, loss=0.157, lr=1e-5]Steps:  64%|██████▍   | 9643/15001 [6:11:36<2:44:38,  1.84s/it, loss=0.157, lr=1e-5]Steps:  64%|██████▍   | 9643/15001 [6:11:36<2:44:38,  1.84s/it, loss=0.184, lr=1e-5]Steps:  64%|██████▍   | 9644/15001 [6:11:37<2:43:44,  1.83s/it, loss=0.184, lr=1e-5]Steps:  64%|██████▍   | 9644/15001 [6:11:37<2:43:44,  1.83s/it, loss=0.148, lr=1e-5]Steps:  64%|██████▍   | 9645/15001 [6:11:39<2:41:59,  1.81s/it, loss=0.148, lr=1e-5]Steps:  64%|██████▍   | 9645/15001 [6:11:39<2:41:59,  1.81s/it, loss=0.0784, lr=1e-5]Steps:  64%|██████▍   | 9646/15001 [6:11:41<2:45:13,  1.85s/it, loss=0.0784, lr=1e-5]Steps:  64%|██████▍   | 9646/15001 [6:11:41<2:45:13,  1.85s/it, loss=0.0823, lr=1e-5]Steps:  64%|██████▍   | 9647/15001 [6:11:43<2:47:41,  1.88s/it, loss=0.0823, lr=1e-5]Steps:  64%|██████▍   | 9647/15001 [6:11:43<2:47:41,  1.88s/it, loss=0.0287, lr=1e-5]Steps:  64%|██████▍   | 9648/15001 [6:11:45<2:42:59,  1.83s/it, loss=0.0287, lr=1e-5]Steps:  64%|██████▍   | 9648/15001 [6:11:45<2:42:59,  1.83s/it, loss=0.332, lr=1e-5] Steps:  64%|██████▍   | 9649/15001 [6:11:47<2:45:00,  1.85s/it, loss=0.332, lr=1e-5]Steps:  64%|██████▍   | 9649/15001 [6:11:47<2:45:00,  1.85s/it, loss=0.106, lr=1e-5]Steps:  64%|██████▍   | 9650/15001 [6:11:49<2:45:59,  1.86s/it, loss=0.106, lr=1e-5]Steps:  64%|██████▍   | 9650/15001 [6:11:49<2:45:59,  1.86s/it, loss=0.189, lr=1e-5]Steps:  64%|██████▍   | 9651/15001 [6:11:50<2:46:15,  1.86s/it, loss=0.189, lr=1e-5]Steps:  64%|██████▍   | 9651/15001 [6:11:51<2:46:15,  1.86s/it, loss=0.188, lr=1e-5]Steps:  64%|██████▍   | 9652/15001 [6:11:52<2:45:23,  1.86s/it, loss=0.188, lr=1e-5]Steps:  64%|██████▍   | 9652/15001 [6:11:52<2:45:23,  1.86s/it, loss=0.139, lr=1e-5]Steps:  64%|██████▍   | 9653/15001 [6:11:54<2:48:33,  1.89s/it, loss=0.139, lr=1e-5]Steps:  64%|██████▍   | 9653/15001 [6:11:54<2:48:33,  1.89s/it, loss=0.193, lr=1e-5]Steps:  64%|██████▍   | 9654/15001 [6:11:56<2:47:37,  1.88s/it, loss=0.193, lr=1e-5]Steps:  64%|██████▍   | 9654/15001 [6:11:56<2:47:37,  1.88s/it, loss=0.443, lr=1e-5]Steps:  64%|██████▍   | 9655/15001 [6:11:58<2:50:11,  1.91s/it, loss=0.443, lr=1e-5]Steps:  64%|██████▍   | 9655/15001 [6:11:58<2:50:11,  1.91s/it, loss=0.216, lr=1e-5]Steps:  64%|██████▍   | 9656/15001 [6:12:00<2:50:15,  1.91s/it, loss=0.216, lr=1e-5]Steps:  64%|██████▍   | 9656/15001 [6:12:00<2:50:15,  1.91s/it, loss=0.181, lr=1e-5]Steps:  64%|██████▍   | 9657/15001 [6:12:02<2:56:40,  1.98s/it, loss=0.181, lr=1e-5]Steps:  64%|██████▍   | 9657/15001 [6:12:02<2:56:40,  1.98s/it, loss=0.256, lr=1e-5]Steps:  64%|██████▍   | 9658/15001 [6:12:04<2:45:39,  1.86s/it, loss=0.256, lr=1e-5]Steps:  64%|██████▍   | 9658/15001 [6:12:04<2:45:39,  1.86s/it, loss=0.0857, lr=1e-5]Steps:  64%|██████▍   | 9659/15001 [6:12:06<2:52:20,  1.94s/it, loss=0.0857, lr=1e-5]Steps:  64%|██████▍   | 9659/15001 [6:12:06<2:52:20,  1.94s/it, loss=0.336, lr=1e-5] Steps:  64%|██████▍   | 9660/15001 [6:12:07<2:41:12,  1.81s/it, loss=0.336, lr=1e-5]Steps:  64%|██████▍   | 9660/15001 [6:12:08<2:41:12,  1.81s/it, loss=0.155, lr=1e-5]Steps:  64%|██████▍   | 9661/15001 [6:12:09<2:41:44,  1.82s/it, loss=0.155, lr=1e-5]Steps:  64%|██████▍   | 9661/15001 [6:12:10<2:41:44,  1.82s/it, loss=0.0469, lr=1e-5]Steps:  64%|██████▍   | 9662/15001 [6:12:11<2:45:54,  1.86s/it, loss=0.0469, lr=1e-5]Steps:  64%|██████▍   | 9662/15001 [6:12:11<2:45:54,  1.86s/it, loss=0.122, lr=1e-5] Steps:  64%|██████▍   | 9663/15001 [6:12:13<2:49:12,  1.90s/it, loss=0.122, lr=1e-5]Steps:  64%|██████▍   | 9663/15001 [6:12:13<2:49:12,  1.90s/it, loss=0.0947, lr=1e-5]Steps:  64%|██████▍   | 9664/15001 [6:12:15<2:46:35,  1.87s/it, loss=0.0947, lr=1e-5]Steps:  64%|██████▍   | 9664/15001 [6:12:15<2:46:35,  1.87s/it, loss=0.412, lr=1e-5] Steps:  64%|██████▍   | 9665/15001 [6:12:17<2:43:28,  1.84s/it, loss=0.412, lr=1e-5]Steps:  64%|██████▍   | 9665/15001 [6:12:17<2:43:28,  1.84s/it, loss=0.246, lr=1e-5]Steps:  64%|██████▍   | 9666/15001 [6:12:18<2:39:45,  1.80s/it, loss=0.246, lr=1e-5]Steps:  64%|██████▍   | 9666/15001 [6:12:19<2:39:45,  1.80s/it, loss=0.215, lr=1e-5]Steps:  64%|██████▍   | 9667/15001 [6:12:20<2:41:42,  1.82s/it, loss=0.215, lr=1e-5]Steps:  64%|██████▍   | 9667/15001 [6:12:20<2:41:42,  1.82s/it, loss=0.214, lr=1e-5]Steps:  64%|██████▍   | 9668/15001 [6:12:22<2:42:36,  1.83s/it, loss=0.214, lr=1e-5]Steps:  64%|██████▍   | 9668/15001 [6:12:22<2:42:36,  1.83s/it, loss=0.285, lr=1e-5]Steps:  64%|██████▍   | 9669/15001 [6:12:24<2:40:41,  1.81s/it, loss=0.285, lr=1e-5]Steps:  64%|██████▍   | 9669/15001 [6:12:24<2:40:41,  1.81s/it, loss=0.267, lr=1e-5]Steps:  64%|██��███▍   | 9670/15001 [6:12:26<2:42:55,  1.83s/it, loss=0.267, lr=1e-5]Steps:  64%|██████▍   | 9670/15001 [6:12:26<2:42:55,  1.83s/it, loss=0.284, lr=1e-5]Steps:  64%|██████▍   | 9671/15001 [6:12:28<2:41:50,  1.82s/it, loss=0.284, lr=1e-5]Steps:  64%|██████▍   | 9671/15001 [6:12:28<2:41:50,  1.82s/it, loss=0.0847, lr=1e-5]Steps:  64%|██████▍   | 9672/15001 [6:12:29<2:39:47,  1.80s/it, loss=0.0847, lr=1e-5]Steps:  64%|██████▍   | 9672/15001 [6:12:30<2:39:47,  1.80s/it, loss=0.0929, lr=1e-5]Steps:  64%|██████▍   | 9673/15001 [6:12:31<2:40:27,  1.81s/it, loss=0.0929, lr=1e-5]Steps:  64%|██████▍   | 9673/15001 [6:12:31<2:40:27,  1.81s/it, loss=0.385, lr=1e-5] Steps:  64%|██████▍   | 9674/15001 [6:12:33<2:44:28,  1.85s/it, loss=0.385, lr=1e-5]Steps:  64%|██████▍   | 9674/15001 [6:12:33<2:44:28,  1.85s/it, loss=0.337, lr=1e-5]Steps:  64%|██████▍   | 9675/15001 [6:12:35<2:53:26,  1.95s/it, loss=0.337, lr=1e-5]Steps:  64%|██████▍   | 9675/15001 [6:12:35<2:53:26,  1.95s/it, loss=0.0897, lr=1e-5]Steps:  65%|██████▍   | 9676/15001 [6:12:37<2:47:24,  1.89s/it, loss=0.0897, lr=1e-5]Steps:  65%|██████▍   | 9676/15001 [6:12:37<2:47:24,  1.89s/it, loss=0.12, lr=1e-5]  Steps:  65%|██████▍   | 9677/15001 [6:12:39<2:51:49,  1.94s/it, loss=0.12, lr=1e-5]Steps:  65%|██████▍   | 9677/15001 [6:12:39<2:51:49,  1.94s/it, loss=0.394, lr=1e-5]Steps:  65%|██████▍   | 9678/15001 [6:12:41<2:53:07,  1.95s/it, loss=0.394, lr=1e-5]Steps:  65%|██████▍   | 9678/15001 [6:12:41<2:53:07,  1.95s/it, loss=0.252, lr=1e-5]Steps:  65%|██████▍   | 9679/15001 [6:12:43<2:49:04,  1.91s/it, loss=0.252, lr=1e-5]Steps:  65%|██████▍   | 9679/15001 [6:12:43<2:49:04,  1.91s/it, loss=0.198, lr=1e-5]Steps:  65%|██████▍   | 9680/15001 [6:12:45<2:51:35,  1.93s/it, loss=0.198, lr=1e-5]Steps:  65%|██████▍   | 9680/15001 [6:12:45<2:51:35,  1.93s/it, loss=0.138, lr=1e-5]Steps:  65%|██████▍   | 9681/15001 [6:12:47<2:53:32,  1.96s/it, loss=0.138, lr=1e-5]Steps:  65%|██████▍   | 9681/15001 [6:12:47<2:53:32,  1.96s/it, loss=0.406, lr=1e-5]Steps:  65%|██████▍   | 9682/15001 [6:12:49<2:45:52,  1.87s/it, loss=0.406, lr=1e-5]Steps:  65%|██████▍   | 9682/15001 [6:12:49<2:45:52,  1.87s/it, loss=0.134, lr=1e-5]Steps:  65%|██████▍   | 9683/15001 [6:12:50<2:47:52,  1.89s/it, loss=0.134, lr=1e-5]Steps:  65%|██████▍   | 9683/15001 [6:12:51<2:47:52,  1.89s/it, loss=0.198, lr=1e-5]Steps:  65%|██████▍   | 9684/15001 [6:12:52<2:44:25,  1.86s/it, loss=0.198, lr=1e-5]Steps:  65%|██████▍   | 9684/15001 [6:12:52<2:44:25,  1.86s/it, loss=0.155, lr=1e-5]Steps:  65%|██████▍   | 9685/15001 [6:12:54<2:43:20,  1.84s/it, loss=0.155, lr=1e-5]Steps:  65%|██████▍   | 9685/15001 [6:12:54<2:43:20,  1.84s/it, loss=0.0315, lr=1e-5]Steps:  65%|██████▍   | 9686/15001 [6:12:56<2:42:40,  1.84s/it, loss=0.0315, lr=1e-5]Steps:  65%|██████▍   | 9686/15001 [6:12:56<2:42:40,  1.84s/it, loss=0.144, lr=1e-5] Steps:  65%|██████▍   | 9687/15001 [6:12:58<2:40:50,  1.82s/it, loss=0.144, lr=1e-5]Steps:  65%|██████▍   | 9687/15001 [6:12:58<2:40:50,  1.82s/it, loss=0.161, lr=1e-5]Steps:  65%|██████▍   | 9688/15001 [6:12:59<2:32:54,  1.73s/it, loss=0.161, lr=1e-5]Steps:  65%|██████▍   | 9688/15001 [6:13:00<2:32:54,  1.73s/it, loss=0.404, lr=1e-5]Steps:  65%|██████▍   | 9689/15001 [6:13:01<2:44:50,  1.86s/it, loss=0.404, lr=1e-5]Steps:  65%|██████▍   | 9689/15001 [6:13:01<2:44:50,  1.86s/it, loss=0.43, lr=1e-5] Steps:  65%|██████▍   | 9690/15001 [6:13:03<2:41:25,  1.82s/it, loss=0.43, lr=1e-5]Steps:  65%|██████▍   | 9690/15001 [6:13:03<2:41:25,  1.82s/it, loss=0.303, lr=1e-5]Steps:  65%|██████▍   | 9691/15001 [6:13:05<2:36:26,  1.77s/it, loss=0.303, lr=1e-5]Steps:  65%|██████▍   | 9691/15001 [6:13:05<2:36:26,  1.77s/it, loss=0.241, lr=1e-5]Steps:  65%|██████▍   | 9692/15001 [6:13:07<2:42:19,  1.83s/it, loss=0.241, lr=1e-5]Steps:  65%|██████▍   | 9692/15001 [6:13:07<2:42:19,  1.83s/it, loss=0.212, lr=1e-5]Steps:  65%|██████▍   | 9693/15001 [6:13:08<2:35:05,  1.75s/it, loss=0.212, lr=1e-5]Steps:  65%|██████▍   | 9693/15001 [6:13:09<2:35:05,  1.75s/it, loss=0.384, lr=1e-5]Steps:  65%|██████▍   | 9694/15001 [6:13:10<2:44:04,  1.86s/it, loss=0.384, lr=1e-5]Steps:  65%|██████▍   | 9694/15001 [6:13:10<2:44:04,  1.86s/it, loss=0.0368, lr=1e-5]Steps:  65%|██████▍   | 9695/15001 [6:13:12<2:40:51,  1.82s/it, loss=0.0368, lr=1e-5]Steps:  65%|██████▍   | 9695/15001 [6:13:12<2:40:51,  1.82s/it, loss=0.112, lr=1e-5] Steps:  65%|██████▍   | 9696/15001 [6:13:14<2:37:06,  1.78s/it, loss=0.112, lr=1e-5]Steps:  65%|██████▍   | 9696/15001 [6:13:14<2:37:06,  1.78s/it, loss=0.22, lr=1e-5] Steps:  65%|██████▍   | 9697/15001 [6:13:15<2:32:50,  1.73s/it, loss=0.22, lr=1e-5]Steps:  65%|██████▍   | 9697/15001 [6:13:16<2:32:50,  1.73s/it, loss=0.103, lr=1e-5]Steps:  65%|██████▍   | 9698/15001 [6:13:18<2:46:11,  1.88s/it, loss=0.103, lr=1e-5]Steps:  65%|██████▍   | 9698/15001 [6:13:18<2:46:11,  1.88s/it, loss=0.0798, lr=1e-5]Steps:  65%|██████▍   | 9699/15001 [6:13:20<2:45:42,  1.88s/it, loss=0.0798, lr=1e-5]Steps:  65%|██████▍   | 9699/15001 [6:13:20<2:45:42,  1.88s/it, loss=0.0381, lr=1e-5]Steps:  65%|██████▍   | 9700/15001 [6:13:21<2:47:15,  1.89s/it, loss=0.0381, lr=1e-5]Steps:  65%|██████▍   | 9700/15001 [6:13:22<2:47:15,  1.89s/it, loss=0.0558, lr=1e-5]Steps:  65%|██████▍   | 9701/15001 [6:13:24<2:52:19,  1.95s/it, loss=0.0558, lr=1e-5]Steps:  65%|██████▍   | 9701/15001 [6:13:24<2:52:19,  1.95s/it, loss=0.225, lr=1e-5] Steps:  65%|██████▍   | 9702/15001 [6:13:25<2:47:28,  1.90s/it, loss=0.225, lr=1e-5]Steps:  65%|██████▍   | 9702/15001 [6:13:26<2:47:28,  1.90s/it, loss=0.274, lr=1e-5]Steps:  65%|██████▍   | 9703/15001 [6:13:28<3:00:47,  2.05s/it, loss=0.274, lr=1e-5]Steps:  65%|██████▍   | 9703/15001 [6:13:28<3:00:47,  2.05s/it, loss=0.375, lr=1e-5]Steps:  65%|██████▍   | 9704/15001 [6:13:29<2:50:19,  1.93s/it, loss=0.375, lr=1e-5]Steps:  65%|██████▍   | 9704/15001 [6:13:30<2:50:19,  1.93s/it, loss=0.285, lr=1e-5]Steps:  65%|██████▍   | 9705/15001 [6:13:31<2:48:52,  1.91s/it, loss=0.285, lr=1e-5]Steps:  65%|██████▍   | 9705/15001 [6:13:31<2:48:52,  1.91s/it, loss=0.104, lr=1e-5]Steps:  65%|██████▍   | 9706/15001 [6:13:33<2:46:52,  1.89s/it, loss=0.104, lr=1e-5]Steps:  65%|██████▍   | 9706/15001 [6:13:33<2:46:52,  1.89s/it, loss=0.11, lr=1e-5] Steps:  65%|██████▍   | 9707/15001 [6:13:35<2:39:11,  1.80s/it, loss=0.11, lr=1e-5]Steps:  65%|██████▍   | 9707/15001 [6:13:35<2:39:11,  1.80s/it, loss=0.122, lr=1e-5]Steps:  65%|██████▍   | 9708/15001 [6:13:37<2:44:39,  1.87s/it, loss=0.122, lr=1e-5]Steps:  65%|██████▍   | 9708/15001 [6:13:37<2:44:39,  1.87s/it, loss=0.167, lr=1e-5]Steps:  65%|██████▍   | 9709/15001 [6:13:38<2:40:52,  1.82s/it, loss=0.167, lr=1e-5]Steps:  65%|██████▍   | 9709/15001 [6:13:39<2:40:52,  1.82s/it, loss=0.209, lr=1e-5]Steps:  65%|██████▍   | 9710/15001 [6:13:40<2:47:43,  1.90s/it, loss=0.209, lr=1e-5]Steps:  65%|██████▍   | 9710/15001 [6:13:41<2:47:43,  1.90s/it, loss=0.0544, lr=1e-5]Steps:  65%|██████▍   | 9711/15001 [6:13:42<2:44:01,  1.86s/it, loss=0.0544, lr=1e-5]Steps:  65%|██████▍   | 9711/15001 [6:13:42<2:44:01,  1.86s/it, loss=0.139, lr=1e-5] Steps:  65%|██████▍   | 9712/15001 [6:13:44<2:42:48,  1.85s/it, loss=0.139, lr=1e-5]Steps:  65%|██████▍   | 9712/15001 [6:13:44<2:42:48,  1.85s/it, loss=0.206, lr=1e-5]Steps:  65%|██████▍   | 9713/15001 [6:13:46<2:42:17,  1.84s/it, loss=0.206, lr=1e-5]Steps:  65%|██████▍   | 9713/15001 [6:13:46<2:42:17,  1.84s/it, loss=0.139, lr=1e-5]Steps:  65%|██████▍   | 9714/15001 [6:13:48<2:40:36,  1.82s/it, loss=0.139, lr=1e-5]Steps:  65%|██████▍   | 9714/15001 [6:13:48<2:40:36,  1.82s/it, loss=0.123, lr=1e-5]Steps:  65%|██████▍   | 9715/15001 [6:13:49<2:38:40,  1.80s/it, loss=0.123, lr=1e-5]Steps:  65%|██████▍   | 9715/15001 [6:13:50<2:38:40,  1.80s/it, loss=0.15, lr=1e-5] Steps:  65%|██████▍   | 9716/15001 [6:13:51<2:37:50,  1.79s/it, loss=0.15, lr=1e-5]Steps:  65%|██████▍   | 9716/15001 [6:13:51<2:37:50,  1.79s/it, loss=0.0316, lr=1e-5]Steps:  65%|██████▍   | 9717/15001 [6:13:53<2:42:35,  1.85s/it, loss=0.0316, lr=1e-5]Steps:  65%|██████▍   | 9717/15001 [6:13:53<2:42:35,  1.85s/it, loss=0.157, lr=1e-5] Steps:  65%|██████▍   | 9718/15001 [6:13:55<2:39:32,  1.81s/it, loss=0.157, lr=1e-5]Steps:  65%|██████▍   | 9718/15001 [6:13:55<2:39:32,  1.81s/it, loss=0.267, lr=1e-5]Steps:  65%|██████▍   | 9719/15001 [6:13:57<2:39:05,  1.81s/it, loss=0.267, lr=1e-5]Steps:  65%|██████▍   | 9719/15001 [6:13:57<2:39:05,  1.81s/it, loss=0.296, lr=1e-5]Steps:  65%|██████▍   | 9720/15001 [6:13:58<2:33:38,  1.75s/it, loss=0.296, lr=1e-5]Steps:  65%|██████▍   | 9720/15001 [6:13:59<2:33:38,  1.75s/it, loss=0.129, lr=1e-5]Steps:  65%|██████▍   | 9721/15001 [6:14:01<2:48:13,  1.91s/it, loss=0.129, lr=1e-5]Steps:  65%|██████▍   | 9721/15001 [6:14:01<2:48:13,  1.91s/it, loss=0.176, lr=1e-5]Steps:  65%|██████▍   | 9722/15001 [6:14:03<2:49:13,  1.92s/it, loss=0.176, lr=1e-5]Steps:  65%|██████▍   | 9722/15001 [6:14:03<2:49:13,  1.92s/it, loss=0.134, lr=1e-5]Steps:  65%|██████▍   | 9723/15001 [6:14:05<2:52:17,  1.96s/it, loss=0.134, lr=1e-5]Steps:  65%|██████▍   | 9723/15001 [6:14:05<2:52:17,  1.96s/it, loss=0.191, lr=1e-5]Steps:  65%|██████▍   | 9724/15001 [6:14:07<2:51:56,  1.95s/it, loss=0.191, lr=1e-5]Steps:  65%|██████▍   | 9724/15001 [6:14:07<2:51:56,  1.95s/it, loss=0.295, lr=1e-5]Steps:  65%|██████▍   | 9725/15001 [6:14:08<2:46:42,  1.90s/it, loss=0.295, lr=1e-5]Steps:  65%|██████▍   | 9725/15001 [6:14:09<2:46:42,  1.90s/it, loss=0.216, lr=1e-5]Steps:  65%|██████▍   | 9726/15001 [6:14:10<2:48:29,  1.92s/it, loss=0.216, lr=1e-5]Steps:  65%|██████▍   | 9726/15001 [6:14:11<2:48:29,  1.92s/it, loss=0.149, lr=1e-5]Steps:  65%|██████▍   | 9727/15001 [6:14:12<2:56:02,  2.00s/it, loss=0.149, lr=1e-5]Steps:  65%|██████▍   | 9727/15001 [6:14:13<2:56:02,  2.00s/it, loss=0.15, lr=1e-5] Steps:  65%|██████▍   | 9728/15001 [6:14:14<2:44:08,  1.87s/it, loss=0.15, lr=1e-5]Steps:  65%|██████▍   | 9728/15001 [6:14:14<2:44:08,  1.87s/it, loss=0.0419, lr=1e-5]Steps:  65%|██████▍   | 9729/15001 [6:14:16<2:46:37,  1.90s/it, loss=0.0419, lr=1e-5]Steps:  65%|██████▍   | 9729/15001 [6:14:16<2:46:37,  1.90s/it, loss=0.159, lr=1e-5] Steps:  65%|██████▍   | 9730/15001 [6:14:18<2:44:06,  1.87s/it, loss=0.159, lr=1e-5]Steps:  65%|██████▍   | 9730/15001 [6:14:18<2:44:06,  1.87s/it, loss=0.0649, lr=1e-5]Steps:  65%|██████▍   | 9731/15001 [6:14:20<2:44:23,  1.87s/it, loss=0.0649, lr=1e-5]Steps:  65%|██████▍   | 9731/15001 [6:14:20<2:44:23,  1.87s/it, loss=0.101, lr=1e-5] Steps:  65%|██████▍   | 9732/15001 [6:14:21<2:38:29,  1.80s/it, loss=0.101, lr=1e-5]Steps:  65%|██████▍   | 9732/15001 [6:14:22<2:38:29,  1.80s/it, loss=0.16, lr=1e-5] Steps:  65%|██████▍   | 9733/15001 [6:14:23<2:44:43,  1.88s/it, loss=0.16, lr=1e-5]Steps:  65%|██████▍   | 9733/15001 [6:14:24<2:44:43,  1.88s/it, loss=0.0929, lr=1e-5]Steps:  65%|██████▍   | 9734/15001 [6:14:25<2:41:12,  1.84s/it, loss=0.0929, lr=1e-5]Steps:  65%|██████▍   | 9734/15001 [6:14:25<2:41:12,  1.84s/it, loss=0.0823, lr=1e-5]Steps:  65%|██████▍   | 9735/15001 [6:14:27<2:40:05,  1.82s/it, loss=0.0823, lr=1e-5]Steps:  65%|██████▍   | 9735/15001 [6:14:27<2:40:05,  1.82s/it, loss=0.304, lr=1e-5] Steps:  65%|██████▍   | 9736/15001 [6:14:29<2:35:45,  1.78s/it, loss=0.304, lr=1e-5]Steps:  65%|██████▍   | 9736/15001 [6:14:29<2:35:45,  1.78s/it, loss=0.171, lr=1e-5]Steps:  65%|██████▍   | 9737/15001 [6:14:31<2:45:37,  1.89s/it, loss=0.171, lr=1e-5]Steps:  65%|██████▍   | 9737/15001 [6:14:31<2:45:37,  1.89s/it, loss=0.137, lr=1e-5]Steps:  65%|██████▍   | 9738/15001 [6:14:33<2:46:54,  1.90s/it, loss=0.137, lr=1e-5]Steps:  65%|██████▍   | 9738/15001 [6:14:33<2:46:54,  1.90s/it, loss=0.0639, lr=1e-5]Steps:  65%|██████▍   | 9739/15001 [6:14:34<2:40:52,  1.83s/it, loss=0.0639, lr=1e-5]Steps:  65%|██████▍   | 9739/15001 [6:14:34<2:40:52,  1.83s/it, loss=0.193, lr=1e-5] Steps:  65%|██████▍   | 9740/15001 [6:14:36<2:43:27,  1.86s/it, loss=0.193, lr=1e-5]Steps:  65%|██████▍   | 9740/15001 [6:14:36<2:43:27,  1.86s/it, loss=0.31, lr=1e-5] Steps:  65%|██████▍   | 9741/15001 [6:14:38<2:38:52,  1.81s/it, loss=0.31, lr=1e-5]Steps:  65%|██████▍   | 9741/15001 [6:14:38<2:38:52,  1.81s/it, loss=0.206, lr=1e-5]Steps:  65%|██████▍   | 9742/15001 [6:14:40<2:42:47,  1.86s/it, loss=0.206, lr=1e-5]Steps:  65%|██████▍   | 9742/15001 [6:14:40<2:42:47,  1.86s/it, loss=0.0552, lr=1e-5]Steps:  65%|██████▍   | 9743/15001 [6:14:42<2:38:42,  1.81s/it, loss=0.0552, lr=1e-5]Steps:  65%|██████▍   | 9743/15001 [6:14:42<2:38:42,  1.81s/it, loss=0.322, lr=1e-5] Steps:  65%|██████▍   | 9744/15001 [6:14:44<2:43:27,  1.87s/it, loss=0.322, lr=1e-5]Steps:  65%|██████▍   | 9744/15001 [6:14:44<2:43:27,  1.87s/it, loss=0.0983, lr=1e-5]Steps:  65%|██████▍   | 9745/15001 [6:14:45<2:42:25,  1.85s/it, loss=0.0983, lr=1e-5]Steps:  65%|██████▍   | 9745/15001 [6:14:46<2:42:25,  1.85s/it, loss=0.175, lr=1e-5] Steps:  65%|██████▍   | 9746/15001 [6:14:48<2:51:19,  1.96s/it, loss=0.175, lr=1e-5]Steps:  65%|██████▍   | 9746/15001 [6:14:48<2:51:19,  1.96s/it, loss=0.1, lr=1e-5]  Steps:  65%|██████▍   | 9747/15001 [6:14:50<2:54:10,  1.99s/it, loss=0.1, lr=1e-5]Steps:  65%|██████▍   | 9747/15001 [6:14:50<2:54:10,  1.99s/it, loss=0.292, lr=1e-5]Steps:  65%|██████▍   | 9748/15001 [6:14:52<2:51:25,  1.96s/it, loss=0.292, lr=1e-5]Steps:  65%|██████▍   | 9748/15001 [6:14:52<2:51:25,  1.96s/it, loss=0.0796, lr=1e-5]Steps:  65%|██████▍   | 9749/15001 [6:14:54<3:01:44,  2.08s/it, loss=0.0796, lr=1e-5]Steps:  65%|██████▍   | 9749/15001 [6:14:54<3:01:44,  2.08s/it, loss=0.0896, lr=1e-5]Steps:  65%|██████▍   | 9750/15001 [6:14:56<2:51:03,  1.95s/it, loss=0.0896, lr=1e-5]Steps:  65%|██████▍   | 9750/15001 [6:14:56<2:51:03,  1.95s/it, loss=0.188, lr=1e-5] Steps:  65%|██████▌   | 9751/15001 [6:14:58<2:52:22,  1.97s/it, loss=0.188, lr=1e-5]Steps:  65%|██████▌   | 9751/15001 [6:14:58<2:52:22,  1.97s/it, loss=0.0538, lr=1e-5]Steps:  65%|██████▌   | 9752/15001 [6:14:59<2:44:06,  1.88s/it, loss=0.0538, lr=1e-5]Steps:  65%|██████▌   | 9752/15001 [6:14:59<2:44:06,  1.88s/it, loss=0.259, lr=1e-5] Steps:  65%|██████▌   | 9753/15001 [6:15:01<2:44:09,  1.88s/it, loss=0.259, lr=1e-5]Steps:  65%|██████▌   | 9753/15001 [6:15:01<2:44:09,  1.88s/it, loss=0.248, lr=1e-5]Steps:  65%|██████▌   | 9754/15001 [6:15:03<2:42:03,  1.85s/it, loss=0.248, lr=1e-5]Steps:  65%|██████▌   | 9754/15001 [6:15:03<2:42:03,  1.85s/it, loss=0.197, lr=1e-5]Steps:  65%|██████▌   | 9755/15001 [6:15:05<2:37:19,  1.80s/it, loss=0.197, lr=1e-5]Steps:  65%|██████▌   | 9755/15001 [6:15:05<2:37:19,  1.80s/it, loss=0.0829, lr=1e-5]Steps:  65%|██████▌   | 9756/15001 [6:15:07<2:42:45,  1.86s/it, loss=0.0829, lr=1e-5]Steps:  65%|██████▌   | 9756/15001 [6:15:07<2:42:45,  1.86s/it, loss=0.0895, lr=1e-5]Steps:  65%|██████▌   | 9757/15001 [6:15:08<2:38:24,  1.81s/it, loss=0.0895, lr=1e-5]Steps:  65%|██████▌   | 9757/15001 [6:15:08<2:38:24,  1.81s/it, loss=0.154, lr=1e-5] Steps:  65%|██████▌   | 9758/15001 [6:15:10<2:40:45,  1.84s/it, loss=0.154, lr=1e-5]Steps:  65%|██████▌   | 9758/15001 [6:15:10<2:40:45,  1.84s/it, loss=0.18, lr=1e-5] Steps:  65%|██████▌   | 9759/15001 [6:15:12<2:31:46,  1.74s/it, loss=0.18, lr=1e-5]Steps:  65%|██████▌   | 9759/15001 [6:15:12<2:31:46,  1.74s/it, loss=0.153, lr=1e-5]Steps:  65%|██████▌   | 9760/15001 [6:15:14<2:34:58,  1.77s/it, loss=0.153, lr=1e-5]Steps:  65%|██████▌   | 9760/15001 [6:15:14<2:34:58,  1.77s/it, loss=0.164, lr=1e-5]Steps:  65%|██████▌   | 9761/15001 [6:15:15<2:35:38,  1.78s/it, loss=0.164, lr=1e-5]Steps:  65%|██████▌   | 9761/15001 [6:15:16<2:35:38,  1.78s/it, loss=0.0323, lr=1e-5]Steps:  65%|██████▌   | 9762/15001 [6:15:17<2:34:02,  1.76s/it, loss=0.0323, lr=1e-5]Steps:  65%|██████▌   | 9762/15001 [6:15:17<2:34:02,  1.76s/it, loss=0.233, lr=1e-5] Steps:  65%|██████▌   | 9763/15001 [6:15:19<2:33:34,  1.76s/it, loss=0.233, lr=1e-5]Steps:  65%|██████▌   | 9763/15001 [6:15:19<2:33:34,  1.76s/it, loss=0.0923, lr=1e-5]Steps:  65%|██████▌   | 9764/15001 [6:15:21<2:39:51,  1.83s/it, loss=0.0923, lr=1e-5]Steps:  65%|██████▌   | 9764/15001 [6:15:21<2:39:51,  1.83s/it, loss=0.209, lr=1e-5] Steps:  65%|██████▌   | 9765/15001 [6:15:23<2:35:43,  1.78s/it, loss=0.209, lr=1e-5]Steps:  65%|██████▌   | 9765/15001 [6:15:23<2:35:43,  1.78s/it, loss=0.143, lr=1e-5]Steps:  65%|██████▌   | 9766/15001 [6:15:25<2:46:49,  1.91s/it, loss=0.143, lr=1e-5]Steps:  65%|██████▌   | 9766/15001 [6:15:25<2:46:49,  1.91s/it, loss=0.0909, lr=1e-5]Steps:  65%|██████▌   | 9767/15001 [6:15:26<2:41:46,  1.85s/it, loss=0.0909, lr=1e-5]Steps:  65%|██████▌   | 9767/15001 [6:15:27<2:41:46,  1.85s/it, loss=0.304, lr=1e-5] Steps:  65%|██████▌   | 9768/15001 [6:15:29<2:55:00,  2.01s/it, loss=0.304, lr=1e-5]Steps:  65%|██████▌   | 9768/15001 [6:15:29<2:55:00,  2.01s/it, loss=0.228, lr=1e-5]Steps:  65%|██████▌   | 9769/15001 [6:15:31<2:52:28,  1.98s/it, loss=0.228, lr=1e-5]Steps:  65%|██████▌   | 9769/15001 [6:15:31<2:52:28,  1.98s/it, loss=0.234, lr=1e-5]Steps:  65%|██████▌   | 9770/15001 [6:15:33<2:50:49,  1.96s/it, loss=0.234, lr=1e-5]Steps:  65%|██████▌   | 9770/15001 [6:15:33<2:50:49,  1.96s/it, loss=0.0661, lr=1e-5]Steps:  65%|██████▌   | 9771/15001 [6:15:35<2:51:07,  1.96s/it, loss=0.0661, lr=1e-5]Steps:  65%|██████▌   | 9771/15001 [6:15:35<2:51:07,  1.96s/it, loss=0.174, lr=1e-5] Steps:  65%|██████▌   | 9772/15001 [6:15:36<2:47:10,  1.92s/it, loss=0.174, lr=1e-5]Steps:  65%|██████▌   | 9772/15001 [6:15:37<2:47:10,  1.92s/it, loss=0.208, lr=1e-5]Steps:  65%|██████▌   | 9773/15001 [6:15:39<2:53:39,  1.99s/it, loss=0.208, lr=1e-5]Steps:  65%|██████▌   | 9773/15001 [6:15:39<2:53:39,  1.99s/it, loss=0.178, lr=1e-5]Steps:  65%|██████▌   | 9774/15001 [6:15:40<2:42:43,  1.87s/it, loss=0.178, lr=1e-5]Steps:  65%|██████▌   | 9774/15001 [6:15:40<2:42:43,  1.87s/it, loss=0.221, lr=1e-5]Steps:  65%|██████▌   | 9775/15001 [6:15:42<2:41:50,  1.86s/it, loss=0.221, lr=1e-5]Steps:  65%|██████▌   | 9775/15001 [6:15:42<2:41:50,  1.86s/it, loss=0.157, lr=1e-5]Steps:  65%|██████▌   | 9776/15001 [6:15:44<2:39:15,  1.83s/it, loss=0.157, lr=1e-5]Steps:  65%|██████▌   | 9776/15001 [6:15:44<2:39:15,  1.83s/it, loss=0.0842, lr=1e-5]Steps:  65%|██████▌   | 9777/15001 [6:15:46<2:39:45,  1.83s/it, loss=0.0842, lr=1e-5]Steps:  65%|██████▌   | 9777/15001 [6:15:46<2:39:45,  1.83s/it, loss=0.218, lr=1e-5] Steps:  65%|██████▌   | 9778/15001 [6:15:47<2:33:03,  1.76s/it, loss=0.218, lr=1e-5]Steps:  65%|██████▌   | 9778/15001 [6:15:47<2:33:03,  1.76s/it, loss=0.26, lr=1e-5] Steps:  65%|██████▌   | 9779/15001 [6:15:49<2:35:22,  1.79s/it, loss=0.26, lr=1e-5]Steps:  65%|██████▌   | 9779/15001 [6:15:49<2:35:22,  1.79s/it, loss=0.202, lr=1e-5]Steps:  65%|██████▌   | 9780/15001 [6:15:51<2:44:44,  1.89s/it, loss=0.202, lr=1e-5]Steps:  65%|██████▌   | 9780/15001 [6:15:51<2:44:44,  1.89s/it, loss=0.059, lr=1e-5]Steps:  65%|██████▌   | 9781/15001 [6:15:53<2:34:16,  1.77s/it, loss=0.059, lr=1e-5]Steps:  65%|██████▌   | 9781/15001 [6:15:53<2:34:16,  1.77s/it, loss=0.21, lr=1e-5] Steps:  65%|██████▌   | 9782/15001 [6:15:55<2:38:14,  1.82s/it, loss=0.21, lr=1e-5]Steps:  65%|██████▌   | 9782/15001 [6:15:55<2:38:14,  1.82s/it, loss=0.145, lr=1e-5]Steps:  65%|██████▌   | 9783/15001 [6:15:57<2:40:30,  1.85s/it, loss=0.145, lr=1e-5]Steps:  65%|██████▌   | 9783/15001 [6:15:57<2:40:30,  1.85s/it, loss=0.239, lr=1e-5]Steps:  65%|██████▌   | 9784/15001 [6:15:58<2:41:37,  1.86s/it, loss=0.239, lr=1e-5]Steps:  65%|██████▌   | 9784/15001 [6:15:58<2:41:37,  1.86s/it, loss=0.0848, lr=1e-5]Steps:  65%|██████▌   | 9785/15001 [6:16:00<2:34:23,  1.78s/it, loss=0.0848, lr=1e-5]Steps:  65%|██████▌   | 9785/15001 [6:16:00<2:34:23,  1.78s/it, loss=0.238, lr=1e-5] Steps:  65%|██████▌   | 9786/15001 [6:16:02<2:35:42,  1.79s/it, loss=0.238, lr=1e-5]Steps:  65%|██████▌   | 9786/15001 [6:16:02<2:35:42,  1.79s/it, loss=0.296, lr=1e-5]Steps:  65%|██████▌   | 9787/15001 [6:16:04<2:35:25,  1.79s/it, loss=0.296, lr=1e-5]Steps:  65%|██████▌   | 9787/15001 [6:16:04<2:35:25,  1.79s/it, loss=0.154, lr=1e-5]Steps:  65%|██████▌   | 9788/15001 [6:16:06<2:41:52,  1.86s/it, loss=0.154, lr=1e-5]Steps:  65%|██████▌   | 9788/15001 [6:16:06<2:41:52,  1.86s/it, loss=0.312, lr=1e-5]Steps:  65%|██████▌   | 9789/15001 [6:16:07<2:41:25,  1.86s/it, loss=0.312, lr=1e-5]Steps:  65%|██████▌   | 9789/15001 [6:16:08<2:41:25,  1.86s/it, loss=0.261, lr=1e-5]Steps:  65%|██████▌   | 9790/15001 [6:16:10<2:46:14,  1.91s/it, loss=0.261, lr=1e-5]Steps:  65%|██████▌   | 9790/15001 [6:16:10<2:46:14,  1.91s/it, loss=0.036, lr=1e-5]Steps:  65%|██████▌   | 9791/15001 [6:16:11<2:43:55,  1.89s/it, loss=0.036, lr=1e-5]Steps:  65%|██████▌   | 9791/15001 [6:16:12<2:43:55,  1.89s/it, loss=0.313, lr=1e-5]Steps:  65%|██████▌   | 9792/15001 [6:16:13<2:42:36,  1.87s/it, loss=0.313, lr=1e-5]Steps:  65%|██████▌   | 9792/15001 [6:16:14<2:42:36,  1.87s/it, loss=0.0944, lr=1e-5]Steps:  65%|██████▌   | 9793/15001 [6:16:15<2:53:41,  2.00s/it, loss=0.0944, lr=1e-5]Steps:  65%|██████▌   | 9793/15001 [6:16:16<2:53:41,  2.00s/it, loss=0.153, lr=1e-5] Steps:  65%|██████▌   | 9794/15001 [6:16:18<2:55:07,  2.02s/it, loss=0.153, lr=1e-5]Steps:  65%|██████▌   | 9794/15001 [6:16:18<2:55:07,  2.02s/it, loss=0.154, lr=1e-5]Steps:  65%|██████▌   | 9795/15001 [6:16:19<2:50:15,  1.96s/it, loss=0.154, lr=1e-5]Steps:  65%|██████▌   | 9795/15001 [6:16:20<2:50:15,  1.96s/it, loss=0.18, lr=1e-5] Steps:  65%|██████▌   | 9796/15001 [6:16:21<2:46:06,  1.91s/it, loss=0.18, lr=1e-5]Steps:  65%|██████▌   | 9796/15001 [6:16:21<2:46:06,  1.91s/it, loss=0.175, lr=1e-5]Steps:  65%|██████▌   | 9797/15001 [6:16:23<2:33:15,  1.77s/it, loss=0.175, lr=1e-5]Steps:  65%|██████▌   | 9797/15001 [6:16:23<2:33:15,  1.77s/it, loss=0.0662, lr=1e-5]Steps:  65%|██████▌   | 9798/15001 [6:16:25<2:37:41,  1.82s/it, loss=0.0662, lr=1e-5]Steps:  65%|██████▌   | 9798/15001 [6:16:25<2:37:41,  1.82s/it, loss=0.146, lr=1e-5] Steps:  65%|██████▌   | 9799/15001 [6:16:27<2:43:30,  1.89s/it, loss=0.146, lr=1e-5]Steps:  65%|██████▌   | 9799/15001 [6:16:27<2:43:30,  1.89s/it, loss=0.0938, lr=1e-5]Steps:  65%|██████▌   | 9800/15001 [6:16:28<2:35:40,  1.80s/it, loss=0.0938, lr=1e-5]Steps:  65%|██████▌   | 9800/15001 [6:16:28<2:35:40,  1.80s/it, loss=0.224, lr=1e-5] Steps:  65%|██████▌   | 9801/15001 [6:16:30<2:38:12,  1.83s/it, loss=0.224, lr=1e-5]Steps:  65%|██████▌   | 9801/15001 [6:16:30<2:38:12,  1.83s/it, loss=0.228, lr=1e-5]Steps:  65%|██████▌   | 9802/15001 [6:16:32<2:32:03,  1.75s/it, loss=0.228, lr=1e-5]Steps:  65%|██████▌   | 9802/15001 [6:16:32<2:32:03,  1.75s/it, loss=0.307, lr=1e-5]Steps:  65%|██████▌   | 9803/15001 [6:16:34<2:39:12,  1.84s/it, loss=0.307, lr=1e-5]Steps:  65%|██████▌   | 9803/15001 [6:16:34<2:39:12,  1.84s/it, loss=0.152, lr=1e-5]Steps:  65%|██████▌   | 9804/15001 [6:16:36<2:39:00,  1.84s/it, loss=0.152, lr=1e-5]Steps:  65%|██████▌   | 9804/15001 [6:16:36<2:39:00,  1.84s/it, loss=0.23, lr=1e-5] Steps:  65%|██████▌   | 9805/15001 [6:16:37<2:39:49,  1.85s/it, loss=0.23, lr=1e-5]Steps:  65%|██████▌   | 9805/15001 [6:16:37<2:39:49,  1.85s/it, loss=0.208, lr=1e-5]Steps:  65%|██████▌   | 9806/15001 [6:16:39<2:30:07,  1.73s/it, loss=0.208, lr=1e-5]Steps:  65%|██████▌   | 9806/15001 [6:16:39<2:30:07,  1.73s/it, loss=0.0354, lr=1e-5]Steps:  65%|██████▌   | 9807/15001 [6:16:41<2:36:50,  1.81s/it, loss=0.0354, lr=1e-5]Steps:  65%|██████▌   | 9807/15001 [6:16:41<2:36:50,  1.81s/it, loss=0.08, lr=1e-5]  Steps:  65%|██████▌   | 9808/15001 [6:16:43<2:33:40,  1.78s/it, loss=0.08, lr=1e-5]Steps:  65%|██████▌   | 9808/15001 [6:16:43<2:33:40,  1.78s/it, loss=0.145, lr=1e-5]Steps:  65%|██████▌   | 9809/15001 [6:16:44<2:37:03,  1.82s/it, loss=0.145, lr=1e-5]Steps:  65%|██████▌   | 9809/15001 [6:16:45<2:37:03,  1.82s/it, loss=0.313, lr=1e-5]Steps:  65%|██████▌   | 9810/15001 [6:16:46<2:42:01,  1.87s/it, loss=0.313, lr=1e-5]Steps:  65%|██████▌   | 9810/15001 [6:16:47<2:42:01,  1.87s/it, loss=0.173, lr=1e-5]Steps:  65%|██████▌   | 9811/15001 [6:16:48<2:33:44,  1.78s/it, loss=0.173, lr=1e-5]Steps:  65%|██████▌   | 9811/15001 [6:16:48<2:33:44,  1.78s/it, loss=0.137, lr=1e-5]Steps:  65%|██████▌   | 9812/15001 [6:16:50<2:35:17,  1.80s/it, loss=0.137, lr=1e-5]Steps:  65%|██████▌   | 9812/15001 [6:16:50<2:35:17,  1.80s/it, loss=0.444, lr=1e-5]Steps:  65%|██████▌   | 9813/15001 [6:16:52<2:44:43,  1.91s/it, loss=0.444, lr=1e-5]Steps:  65%|██████▌   | 9813/15001 [6:16:52<2:44:43,  1.91s/it, loss=0.282, lr=1e-5]Steps:  65%|██████▌   | 9814/15001 [6:16:54<2:45:17,  1.91s/it, loss=0.282, lr=1e-5]Steps:  65%|██████▌   | 9814/15001 [6:16:54<2:45:17,  1.91s/it, loss=0.245, lr=1e-5]Steps:  65%|██████▌   | 9815/15001 [6:16:56<2:50:04,  1.97s/it, loss=0.245, lr=1e-5]Steps:  65%|██████▌   | 9815/15001 [6:16:56<2:50:04,  1.97s/it, loss=0.0205, lr=1e-5]Steps:  65%|██████▌   | 9816/15001 [6:16:58<2:49:55,  1.97s/it, loss=0.0205, lr=1e-5]Steps:  65%|██████▌   | 9816/15001 [6:16:58<2:49:55,  1.97s/it, loss=0.203, lr=1e-5] Steps:  65%|██████▌   | 9817/15001 [6:17:00<2:54:03,  2.01s/it, loss=0.203, lr=1e-5]Steps:  65%|██████▌   | 9817/15001 [6:17:00<2:54:03,  2.01s/it, loss=0.065, lr=1e-5]Steps:  65%|██████▌   | 9818/15001 [6:17:02<2:50:51,  1.98s/it, loss=0.065, lr=1e-5]Steps:  65%|██████▌   | 9818/15001 [6:17:02<2:50:51,  1.98s/it, loss=0.311, lr=1e-5]Steps:  65%|██████▌   | 9819/15001 [6:17:04<2:45:10,  1.91s/it, loss=0.311, lr=1e-5]Steps:  65%|██████▌   | 9819/15001 [6:17:04<2:45:10,  1.91s/it, loss=0.177, lr=1e-5]Steps:  65%|██████▌   | 9820/15001 [6:17:05<2:35:40,  1.80s/it, loss=0.177, lr=1e-5]Steps:  65%|██████▌   | 9820/15001 [6:17:06<2:35:40,  1.80s/it, loss=0.189, lr=1e-5]Steps:  65%|██████▌   | 9821/15001 [6:17:07<2:38:01,  1.83s/it, loss=0.189, lr=1e-5]Steps:  65%|██████▌   | 9821/15001 [6:17:08<2:38:01,  1.83s/it, loss=0.148, lr=1e-5]Steps:  65%|██████▌   | 9822/15001 [6:17:09<2:45:03,  1.91s/it, loss=0.148, lr=1e-5]Steps:  65%|██████▌   | 9822/15001 [6:17:09<2:45:03,  1.91s/it, loss=0.112, lr=1e-5]Steps:  65%|██████▌   | 9823/15001 [6:17:11<2:34:32,  1.79s/it, loss=0.112, lr=1e-5]Steps:  65%|██████▌   | 9823/15001 [6:17:11<2:34:32,  1.79s/it, loss=0.248, lr=1e-5]Steps:  65%|██████▌   | 9824/15001 [6:17:13<2:41:51,  1.88s/it, loss=0.248, lr=1e-5]Steps:  65%|██████▌   | 9824/15001 [6:17:13<2:41:51,  1.88s/it, loss=0.199, lr=1e-5]Steps:  65%|██████▌   | 9825/15001 [6:17:14<2:34:18,  1.79s/it, loss=0.199, lr=1e-5]Steps:  65%|██████▌   | 9825/15001 [6:17:15<2:34:18,  1.79s/it, loss=0.22, lr=1e-5] Steps:  66%|██████▌   | 9826/15001 [6:17:17<2:41:27,  1.87s/it, loss=0.22, lr=1e-5]Steps:  66%|██████▌   | 9826/15001 [6:17:17<2:41:27,  1.87s/it, loss=0.0682, lr=1e-5]Steps:  66%|██████▌   | 9827/15001 [6:17:18<2:39:44,  1.85s/it, loss=0.0682, lr=1e-5]Steps:  66%|██████▌   | 9827/15001 [6:17:18<2:39:44,  1.85s/it, loss=0.147, lr=1e-5] Steps:  66%|██████▌   | 9828/15001 [6:17:20<2:35:19,  1.80s/it, loss=0.147, lr=1e-5]Steps:  66%|██████▌   | 9828/15001 [6:17:20<2:35:19,  1.80s/it, loss=0.188, lr=1e-5]Steps:  66%|██████▌   | 9829/15001 [6:17:22<2:32:55,  1.77s/it, loss=0.188, lr=1e-5]Steps:  66%|██████▌   | 9829/15001 [6:17:22<2:32:55,  1.77s/it, loss=0.192, lr=1e-5]Steps:  66%|██████▌   | 9830/15001 [6:17:24<2:32:58,  1.78s/it, loss=0.192, lr=1e-5]Steps:  66%|██████▌   | 9830/15001 [6:17:24<2:32:58,  1.78s/it, loss=0.104, lr=1e-5]Steps:  66%|██████▌   | 9831/15001 [6:17:25<2:37:03,  1.82s/it, loss=0.104, lr=1e-5]Steps:  66%|██████▌   | 9831/15001 [6:17:26<2:37:03,  1.82s/it, loss=0.282, lr=1e-5]Steps:  66%|██████▌   | 9832/15001 [6:17:27<2:35:03,  1.80s/it, loss=0.282, lr=1e-5]Steps:  66%|██████▌   | 9832/15001 [6:17:27<2:35:03,  1.80s/it, loss=0.111, lr=1e-5]Steps:  66%|██████▌   | 9833/15001 [6:17:29<2:42:11,  1.88s/it, loss=0.111, lr=1e-5]Steps:  66%|██████▌   | 9833/15001 [6:17:29<2:42:11,  1.88s/it, loss=0.071, lr=1e-5]Steps:  66%|██████▌   | 9834/15001 [6:17:31<2:32:53,  1.78s/it, loss=0.071, lr=1e-5]Steps:  66%|██████▌   | 9834/15001 [6:17:31<2:32:53,  1.78s/it, loss=0.265, lr=1e-5]Steps:  66%|██████▌   | 9835/15001 [6:17:33<2:35:44,  1.81s/it, loss=0.265, lr=1e-5]Steps:  66%|██████▌   | 9835/15001 [6:17:33<2:35:44,  1.81s/it, loss=0.158, lr=1e-5]Steps:  66%|██████▌   | 9836/15001 [6:17:35<2:41:45,  1.88s/it, loss=0.158, lr=1e-5]Steps:  66%|██████▌   | 9836/15001 [6:17:35<2:41:45,  1.88s/it, loss=0.103, lr=1e-5]Steps:  66%|██████▌   | 9837/15001 [6:17:37<2:41:02,  1.87s/it, loss=0.103, lr=1e-5]Steps:  66%|██████▌   | 9837/15001 [6:17:37<2:41:02,  1.87s/it, loss=0.174, lr=1e-5]Steps:  66%|██████▌   | 9838/15001 [6:17:39<2:46:13,  1.93s/it, loss=0.174, lr=1e-5]Steps:  66%|██████▌   | 9838/15001 [6:17:39<2:46:13,  1.93s/it, loss=0.129, lr=1e-5]Steps:  66%|██████▌   | 9839/15001 [6:17:41<2:51:39,  2.00s/it, loss=0.129, lr=1e-5]Steps:  66%|██████▌   | 9839/15001 [6:17:41<2:51:39,  2.00s/it, loss=0.23, lr=1e-5] Steps:  66%|██████▌   | 9840/15001 [6:17:43<2:45:27,  1.92s/it, loss=0.23, lr=1e-5]Steps:  66%|██████▌   | 9840/15001 [6:17:43<2:45:27,  1.92s/it, loss=0.0951, lr=1e-5]Steps:  66%|██████▌   | 9841/15001 [6:17:45<2:49:46,  1.97s/it, loss=0.0951, lr=1e-5]Steps:  66%|██████▌   | 9841/15001 [6:17:45<2:49:46,  1.97s/it, loss=0.284, lr=1e-5] Steps:  66%|██████▌   | 9842/15001 [6:17:46<2:42:46,  1.89s/it, loss=0.284, lr=1e-5]Steps:  66%|██████▌   | 9842/15001 [6:17:47<2:42:46,  1.89s/it, loss=0.23, lr=1e-5] Steps:  66%|██████▌   | 9843/15001 [6:17:48<2:46:08,  1.93s/it, loss=0.23, lr=1e-5]Steps:  66%|██████▌   | 9843/15001 [6:17:49<2:46:08,  1.93s/it, loss=0.286, lr=1e-5]Steps:  66%|██████▌   | 9844/15001 [6:17:50<2:42:36,  1.89s/it, loss=0.286, lr=1e-5]Steps:  66%|██████▌   | 9844/15001 [6:17:50<2:42:36,  1.89s/it, loss=0.195, lr=1e-5]Steps:  66%|██████▌   | 9845/15001 [6:17:52<2:38:57,  1.85s/it, loss=0.195, lr=1e-5]Steps:  66%|██████▌   | 9845/15001 [6:17:52<2:38:57,  1.85s/it, loss=0.414, lr=1e-5]Steps:  66%|██████▌   | 9846/15001 [6:17:54<2:39:07,  1.85s/it, loss=0.414, lr=1e-5]Steps:  66%|██████▌   | 9846/15001 [6:17:54<2:39:07,  1.85s/it, loss=0.134, lr=1e-5]Steps:  66%|██████▌   | 9847/15001 [6:17:56<2:35:46,  1.81s/it, loss=0.134, lr=1e-5]Steps:  66%|██████▌   | 9847/15001 [6:17:56<2:35:46,  1.81s/it, loss=0.142, lr=1e-5]Steps:  66%|██████▌   | 9848/15001 [6:17:57<2:31:38,  1.77s/it, loss=0.142, lr=1e-5]Steps:  66%|██████▌   | 9848/15001 [6:17:57<2:31:38,  1.77s/it, loss=0.0552, lr=1e-5]Steps:  66%|██████▌   | 9849/15001 [6:17:59<2:31:08,  1.76s/it, loss=0.0552, lr=1e-5]Steps:  66%|██████▌   | 9849/15001 [6:17:59<2:31:08,  1.76s/it, loss=0.1, lr=1e-5]   Steps:  66%|██████▌   | 9850/15001 [6:18:01<2:33:21,  1.79s/it, loss=0.1, lr=1e-5]Steps:  66%|██████▌   | 9850/15001 [6:18:01<2:33:21,  1.79s/it, loss=0.258, lr=1e-5]Steps:  66%|██████▌   | 9851/15001 [6:18:03<2:36:06,  1.82s/it, loss=0.258, lr=1e-5]Steps:  66%|██████▌   | 9851/15001 [6:18:03<2:36:06,  1.82s/it, loss=0.0696, lr=1e-5]Steps:  66%|██████▌   | 9852/15001 [6:18:04<2:32:21,  1.78s/it, loss=0.0696, lr=1e-5]Steps:  66%|██████▌   | 9852/15001 [6:18:05<2:32:21,  1.78s/it, loss=0.174, lr=1e-5] Steps:  66%|██████▌   | 9853/15001 [6:18:06<2:31:38,  1.77s/it, loss=0.174, lr=1e-5]Steps:  66%|██████▌   | 9853/15001 [6:18:06<2:31:38,  1.77s/it, loss=0.0939, lr=1e-5]Steps:  66%|██████▌   | 9854/15001 [6:18:08<2:36:54,  1.83s/it, loss=0.0939, lr=1e-5]Steps:  66%|██████▌   | 9854/15001 [6:18:08<2:36:54,  1.83s/it, loss=0.148, lr=1e-5] Steps:  66%|██████▌   | 9855/15001 [6:18:10<2:32:52,  1.78s/it, loss=0.148, lr=1e-5]Steps:  66%|██████▌   | 9855/15001 [6:18:10<2:32:52,  1.78s/it, loss=0.0881, lr=1e-5]Steps:  66%|██████▌   | 9856/15001 [6:18:12<2:41:44,  1.89s/it, loss=0.0881, lr=1e-5]Steps:  66%|██████▌   | 9856/15001 [6:18:12<2:41:44,  1.89s/it, loss=0.125, lr=1e-5] Steps:  66%|██████▌   | 9857/15001 [6:18:14<2:37:15,  1.83s/it, loss=0.125, lr=1e-5]Steps:  66%|██████▌   | 9857/15001 [6:18:14<2:37:15,  1.83s/it, loss=0.102, lr=1e-5]Steps:  66%|██████▌   | 9858/15001 [6:18:15<2:37:11,  1.83s/it, loss=0.102, lr=1e-5]Steps:  66%|██████▌   | 9858/15001 [6:18:16<2:37:11,  1.83s/it, loss=0.22, lr=1e-5] Steps:  66%|██████▌   | 9859/15001 [6:18:17<2:39:31,  1.86s/it, loss=0.22, lr=1e-5]Steps:  66%|██████▌   | 9859/15001 [6:18:18<2:39:31,  1.86s/it, loss=0.268, lr=1e-5]Steps:  66%|██████▌   | 9860/15001 [6:18:19<2:46:57,  1.95s/it, loss=0.268, lr=1e-5]Steps:  66%|██████▌   | 9860/15001 [6:18:19<2:46:57,  1.95s/it, loss=0.0588, lr=1e-5]Steps:  66%|██████▌   | 9861/15001 [6:18:21<2:37:18,  1.84s/it, loss=0.0588, lr=1e-5]Steps:  66%|██████▌   | 9861/15001 [6:18:22<2:37:18,  1.84s/it, loss=0.159, lr=1e-5] Steps:  66%|██████▌   | 9862/15001 [6:18:23<2:46:04,  1.94s/it, loss=0.159, lr=1e-5]Steps:  66%|██████▌   | 9862/15001 [6:18:24<2:46:04,  1.94s/it, loss=0.279, lr=1e-5]Steps:  66%|██████▌   | 9863/15001 [6:18:25<2:50:02,  1.99s/it, loss=0.279, lr=1e-5]Steps:  66%|██████▌   | 9863/15001 [6:18:26<2:50:02,  1.99s/it, loss=0.189, lr=1e-5]Steps:  66%|██████▌   | 9864/15001 [6:18:27<2:48:22,  1.97s/it, loss=0.189, lr=1e-5]Steps:  66%|██████▌   | 9864/15001 [6:18:27<2:48:22,  1.97s/it, loss=0.249, lr=1e-5]Steps:  66%|██████▌   | 9865/15001 [6:18:29<2:46:47,  1.95s/it, loss=0.249, lr=1e-5]Steps:  66%|██████▌   | 9865/15001 [6:18:29<2:46:47,  1.95s/it, loss=0.239, lr=1e-5]Steps:  66%|██████▌   | 9866/15001 [6:18:31<2:45:21,  1.93s/it, loss=0.239, lr=1e-5]Steps:  66%|██████▌   | 9866/15001 [6:18:31<2:45:21,  1.93s/it, loss=0.21, lr=1e-5] Steps:  66%|██████▌   | 9867/15001 [6:18:33<2:33:40,  1.80s/it, loss=0.21, lr=1e-5]Steps:  66%|██████▌   | 9867/15001 [6:18:34<2:33:40,  1.80s/it, loss=0.0763, lr=1e-5]Steps:  66%|██████▌   | 9868/15001 [6:18:36<3:13:46,  2.26s/it, loss=0.0763, lr=1e-5]Steps:  66%|██████▌   | 9868/15001 [6:18:36<3:13:46,  2.26s/it, loss=0.25, lr=1e-5]  Steps:  66%|██████▌   | 9869/15001 [6:18:38<3:01:21,  2.12s/it, loss=0.25, lr=1e-5]Steps:  66%|██████▌   | 9869/15001 [6:18:38<3:01:21,  2.12s/it, loss=0.137, lr=1e-5]Steps:  66%|██████▌   | 9870/15001 [6:18:39<2:53:22,  2.03s/it, loss=0.137, lr=1e-5]Steps:  66%|██████▌   | 9870/15001 [6:18:40<2:53:22,  2.03s/it, loss=0.121, lr=1e-5]Steps:  66%|██████▌   | 9871/15001 [6:18:41<2:46:34,  1.95s/it, loss=0.121, lr=1e-5]Steps:  66%|██████▌   | 9871/15001 [6:18:42<2:46:34,  1.95s/it, loss=0.0428, lr=1e-5]Steps:  66%|██████▌   | 9872/15001 [6:18:43<2:43:50,  1.92s/it, loss=0.0428, lr=1e-5]Steps:  66%|██████▌   | 9872/15001 [6:18:43<2:43:50,  1.92s/it, loss=0.23, lr=1e-5]  Steps:  66%|██████▌   | 9873/15001 [6:18:45<2:39:26,  1.87s/it, loss=0.23, lr=1e-5]Steps:  66%|██████▌   | 9873/15001 [6:18:45<2:39:26,  1.87s/it, loss=0.275, lr=1e-5]Steps:  66%|██████▌   | 9874/15001 [6:18:47<2:38:27,  1.85s/it, loss=0.275, lr=1e-5]Steps:  66%|██████▌   | 9874/15001 [6:18:47<2:38:27,  1.85s/it, loss=0.187, lr=1e-5]Steps:  66%|██████▌   | 9875/15001 [6:18:48<2:32:19,  1.78s/it, loss=0.187, lr=1e-5]Steps:  66%|██████▌   | 9875/15001 [6:18:49<2:32:19,  1.78s/it, loss=0.291, lr=1e-5]Steps:  66%|██████▌   | 9876/15001 [6:18:50<2:36:17,  1.83s/it, loss=0.291, lr=1e-5]Steps:  66%|██████▌   | 9876/15001 [6:18:50<2:36:17,  1.83s/it, loss=0.0748, lr=1e-5]Steps:  66%|██████▌   | 9877/15001 [6:18:52<2:34:12,  1.81s/it, loss=0.0748, lr=1e-5]Steps:  66%|██████▌   | 9877/15001 [6:18:52<2:34:12,  1.81s/it, loss=0.0983, lr=1e-5]Steps:  66%|██████▌   | 9878/15001 [6:18:54<2:33:49,  1.80s/it, loss=0.0983, lr=1e-5]Steps:  66%|██████▌   | 9878/15001 [6:18:54<2:33:49,  1.80s/it, loss=0.25, lr=1e-5]  Steps:  66%|██████▌   | 9879/15001 [6:18:56<2:34:12,  1.81s/it, loss=0.25, lr=1e-5]Steps:  66%|██████▌   | 9879/15001 [6:18:56<2:34:12,  1.81s/it, loss=0.416, lr=1e-5]Steps:  66%|██████▌   | 9880/15001 [6:18:57<2:31:46,  1.78s/it, loss=0.416, lr=1e-5]Steps:  66%|██████▌   | 9880/15001 [6:18:58<2:31:46,  1.78s/it, loss=0.332, lr=1e-5]Steps:  66%|██████▌   | 9881/15001 [6:19:00<2:44:37,  1.93s/it, loss=0.332, lr=1e-5]Steps:  66%|██████▌   | 9881/15001 [6:19:00<2:44:37,  1.93s/it, loss=0.324, lr=1e-5]Steps:  66%|██████▌   | 9882/15001 [6:19:01<2:40:38,  1.88s/it, loss=0.324, lr=1e-5]Steps:  66%|██████▌   | 9882/15001 [6:19:02<2:40:38,  1.88s/it, loss=0.0738, lr=1e-5]Steps:  66%|██████▌   | 9883/15001 [6:19:03<2:44:10,  1.92s/it, loss=0.0738, lr=1e-5]Steps:  66%|██████▌   | 9883/15001 [6:19:03<2:44:10,  1.92s/it, loss=0.171, lr=1e-5] Steps:  66%|██████▌   | 9884/15001 [6:19:05<2:45:57,  1.95s/it, loss=0.171, lr=1e-5]Steps:  66%|██████▌   | 9884/15001 [6:19:06<2:45:57,  1.95s/it, loss=0.211, lr=1e-5]Steps:  66%|██████▌   | 9885/15001 [6:19:07<2:44:25,  1.93s/it, loss=0.211, lr=1e-5]Steps:  66%|██████▌   | 9885/15001 [6:19:08<2:44:25,  1.93s/it, loss=0.104, lr=1e-5]Steps:  66%|██████▌   | 9886/15001 [6:19:09<2:50:13,  2.00s/it, loss=0.104, lr=1e-5]Steps:  66%|██████▌   | 9886/15001 [6:19:10<2:50:13,  2.00s/it, loss=0.164, lr=1e-5]Steps:  66%|██████▌   | 9887/15001 [6:19:11<2:47:51,  1.97s/it, loss=0.164, lr=1e-5]Steps:  66%|██████▌   | 9887/15001 [6:19:11<2:47:51,  1.97s/it, loss=0.236, lr=1e-5]Steps:  66%|██████▌   | 9888/15001 [6:19:13<2:38:20,  1.86s/it, loss=0.236, lr=1e-5]Steps:  66%|██████▌   | 9888/15001 [6:19:13<2:38:20,  1.86s/it, loss=0.339, lr=1e-5]Steps:  66%|██████▌   | 9889/15001 [6:19:15<2:40:20,  1.88s/it, loss=0.339, lr=1e-5]Steps:  66%|██████▌   | 9889/15001 [6:19:15<2:40:20,  1.88s/it, loss=0.103, lr=1e-5]Steps:  66%|██████▌   | 9890/15001 [6:19:17<2:41:50,  1.90s/it, loss=0.103, lr=1e-5]Steps:  66%|██████▌   | 9890/15001 [6:19:17<2:41:50,  1.90s/it, loss=0.152, lr=1e-5]Steps:  66%|██████▌   | 9891/15001 [6:19:18<2:35:25,  1.83s/it, loss=0.152, lr=1e-5]Steps:  66%|██████▌   | 9891/15001 [6:19:19<2:35:25,  1.83s/it, loss=0.155, lr=1e-5]Steps:  66%|██████▌   | 9892/15001 [6:19:20<2:39:21,  1.87s/it, loss=0.155, lr=1e-5]Steps:  66%|██████▌   | 9892/15001 [6:19:21<2:39:21,  1.87s/it, loss=0.0585, lr=1e-5]Steps:  66%|██████▌   | 9893/15001 [6:19:22<2:35:32,  1.83s/it, loss=0.0585, lr=1e-5]Steps:  66%|██████▌   | 9893/15001 [6:19:22<2:35:32,  1.83s/it, loss=0.0282, lr=1e-5]Steps:  66%|██████▌   | 9894/15001 [6:19:24<2:33:11,  1.80s/it, loss=0.0282, lr=1e-5]Steps:  66%|██████▌   | 9894/15001 [6:19:24<2:33:11,  1.80s/it, loss=0.105, lr=1e-5] Steps:  66%|██████▌   | 9895/15001 [6:19:26<2:39:39,  1.88s/it, loss=0.105, lr=1e-5]Steps:  66%|██████▌   | 9895/15001 [6:19:26<2:39:39,  1.88s/it, loss=0.143, lr=1e-5]Steps:  66%|██████▌   | 9896/15001 [6:19:28<2:33:20,  1.80s/it, loss=0.143, lr=1e-5]Steps:  66%|██████▌   | 9896/15001 [6:19:28<2:33:20,  1.80s/it, loss=0.166, lr=1e-5]Steps:  66%|██████▌   | 9897/15001 [6:19:29<2:35:09,  1.82s/it, loss=0.166, lr=1e-5]Steps:  66%|██████▌   | 9897/15001 [6:19:30<2:35:09,  1.82s/it, loss=0.0525, lr=1e-5]Steps:  66%|██████▌   | 9898/15001 [6:19:31<2:33:34,  1.81s/it, loss=0.0525, lr=1e-5]Steps:  66%|██████▌   | 9898/15001 [6:19:31<2:33:34,  1.81s/it, loss=0.339, lr=1e-5] Steps:  66%|██████▌   | 9899/15001 [6:19:33<2:28:01,  1.74s/it, loss=0.339, lr=1e-5]Steps:  66%|██████▌   | 9899/15001 [6:19:33<2:28:01,  1.74s/it, loss=0.0872, lr=1e-5]Steps:  66%|██████▌   | 9900/15001 [6:19:35<2:36:29,  1.84s/it, loss=0.0872, lr=1e-5]Steps:  66%|██████▌   | 9900/15001 [6:19:35<2:36:29,  1.84s/it, loss=0.296, lr=1e-5] Steps:  66%|██████▌   | 9901/15001 [6:19:37<2:37:29,  1.85s/it, loss=0.296, lr=1e-5]Steps:  66%|██████▌   | 9901/15001 [6:19:37<2:37:29,  1.85s/it, loss=0.0437, lr=1e-5]Steps:  66%|██████▌   | 9902/15001 [6:19:39<2:35:57,  1.84s/it, loss=0.0437, lr=1e-5]Steps:  66%|██████▌   | 9902/15001 [6:19:39<2:35:57,  1.84s/it, loss=0.115, lr=1e-5] Steps:  66%|██████▌   | 9903/15001 [6:19:40<2:33:38,  1.81s/it, loss=0.115, lr=1e-5]Steps:  66%|██████▌   | 9903/15001 [6:19:41<2:33:38,  1.81s/it, loss=0.0855, lr=1e-5]Steps:  66%|██████▌   | 9904/15001 [6:19:42<2:42:42,  1.92s/it, loss=0.0855, lr=1e-5]Steps:  66%|██████▌   | 9904/15001 [6:19:43<2:42:42,  1.92s/it, loss=0.215, lr=1e-5] Steps:  66%|██████▌   | 9905/15001 [6:19:44<2:45:51,  1.95s/it, loss=0.215, lr=1e-5]Steps:  66%|██████▌   | 9905/15001 [6:19:45<2:45:51,  1.95s/it, loss=0.0565, lr=1e-5]Steps:  66%|██████▌   | 9906/15001 [6:19:46<2:42:33,  1.91s/it, loss=0.0565, lr=1e-5]Steps:  66%|██████▌   | 9906/15001 [6:19:46<2:42:33,  1.91s/it, loss=0.148, lr=1e-5] Steps:  66%|██████▌   | 9907/15001 [6:19:48<2:45:00,  1.94s/it, loss=0.148, lr=1e-5]Steps:  66%|██████▌   | 9907/15001 [6:19:49<2:45:00,  1.94s/it, loss=0.277, lr=1e-5]Steps:  66%|██████▌   | 9908/15001 [6:19:50<2:46:19,  1.96s/it, loss=0.277, lr=1e-5]Steps:  66%|██████▌   | 9908/15001 [6:19:51<2:46:19,  1.96s/it, loss=0.221, lr=1e-5]Steps:  66%|██████▌   | 9909/15001 [6:19:52<2:44:28,  1.94s/it, loss=0.221, lr=1e-5]Steps:  66%|██████▌   | 9909/15001 [6:19:52<2:44:28,  1.94s/it, loss=0.097, lr=1e-5]Steps:  66%|██████▌   | 9910/15001 [6:19:54<2:40:47,  1.90s/it, loss=0.097, lr=1e-5]Steps:  66%|██████▌   | 9910/15001 [6:19:54<2:40:47,  1.90s/it, loss=0.143, lr=1e-5]Steps:  66%|██████▌   | 9911/15001 [6:19:56<2:43:02,  1.92s/it, loss=0.143, lr=1e-5]Steps:  66%|██████▌   | 9911/15001 [6:19:56<2:43:02,  1.92s/it, loss=0.15, lr=1e-5] Steps:  66%|██████▌   | 9912/15001 [6:19:58<2:37:58,  1.86s/it, loss=0.15, lr=1e-5]Steps:  66%|██████▌   | 9912/15001 [6:19:58<2:37:58,  1.86s/it, loss=0.0914, lr=1e-5]Steps:  66%|██████▌   | 9913/15001 [6:20:00<2:35:54,  1.84s/it, loss=0.0914, lr=1e-5]Steps:  66%|██████▌   | 9913/15001 [6:20:00<2:35:54,  1.84s/it, loss=0.105, lr=1e-5] Steps:  66%|██████▌   | 9914/15001 [6:20:02<2:41:39,  1.91s/it, loss=0.105, lr=1e-5]Steps:  66%|██████▌   | 9914/15001 [6:20:02<2:41:39,  1.91s/it, loss=0.101, lr=1e-5]Steps:  66%|██████▌   | 9915/15001 [6:20:03<2:38:07,  1.87s/it, loss=0.101, lr=1e-5]Steps:  66%|██████▌   | 9915/15001 [6:20:04<2:38:07,  1.87s/it, loss=0.117, lr=1e-5]Steps:  66%|██████▌   | 9916/15001 [6:20:05<2:36:04,  1.84s/it, loss=0.117, lr=1e-5]Steps:  66%|██████▌   | 9916/15001 [6:20:05<2:36:04,  1.84s/it, loss=0.165, lr=1e-5]Steps:  66%|██████▌   | 9917/15001 [6:20:07<2:36:10,  1.84s/it, loss=0.165, lr=1e-5]Steps:  66%|██████▌   | 9917/15001 [6:20:07<2:36:10,  1.84s/it, loss=0.12, lr=1e-5] Steps:  66%|██████▌   | 9918/15001 [6:20:09<2:33:43,  1.81s/it, loss=0.12, lr=1e-5]Steps:  66%|██████▌   | 9918/15001 [6:20:09<2:33:43,  1.81s/it, loss=0.179, lr=1e-5]Steps:  66%|██████▌   | 9919/15001 [6:20:11<2:37:49,  1.86s/it, loss=0.179, lr=1e-5]Steps:  66%|██████▌   | 9919/15001 [6:20:11<2:37:49,  1.86s/it, loss=0.237, lr=1e-5]Steps:  66%|██████▌   | 9920/15001 [6:20:13<2:39:44,  1.89s/it, loss=0.237, lr=1e-5]Steps:  66%|██████▌   | 9920/15001 [6:20:13<2:39:44,  1.89s/it, loss=0.0959, lr=1e-5]Steps:  66%|██████▌   | 9921/15001 [6:20:15<2:41:13,  1.90s/it, loss=0.0959, lr=1e-5]Steps:  66%|██████▌   | 9921/15001 [6:20:15<2:41:13,  1.90s/it, loss=0.235, lr=1e-5] Steps:  66%|██████▌   | 9922/15001 [6:20:16<2:32:25,  1.80s/it, loss=0.235, lr=1e-5]Steps:  66%|██████▌   | 9922/15001 [6:20:16<2:32:25,  1.80s/it, loss=0.257, lr=1e-5]Steps:  66%|██████▌   | 9923/15001 [6:20:18<2:29:02,  1.76s/it, loss=0.257, lr=1e-5]Steps:  66%|██████▌   | 9923/15001 [6:20:18<2:29:02,  1.76s/it, loss=0.0659, lr=1e-5]Steps:  66%|██████▌   | 9924/15001 [6:20:20<2:30:37,  1.78s/it, loss=0.0659, lr=1e-5]Steps:  66%|██████▌   | 9924/15001 [6:20:20<2:30:37,  1.78s/it, loss=0.104, lr=1e-5] Steps:  66%|██████▌   | 9925/15001 [6:20:22<2:34:58,  1.83s/it, loss=0.104, lr=1e-5]Steps:  66%|██████▌   | 9925/15001 [6:20:22<2:34:58,  1.83s/it, loss=0.021, lr=1e-5]Steps:  66%|██████▌   | 9926/15001 [6:20:24<2:37:29,  1.86s/it, loss=0.021, lr=1e-5]Steps:  66%|██████▌   | 9926/15001 [6:20:24<2:37:29,  1.86s/it, loss=0.251, lr=1e-5]Steps:  66%|██████▌   | 9927/15001 [6:20:26<2:44:14,  1.94s/it, loss=0.251, lr=1e-5]Steps:  66%|██████▌   | 9927/15001 [6:20:26<2:44:14,  1.94s/it, loss=0.383, lr=1e-5]Steps:  66%|██████▌   | 9928/15001 [6:20:28<2:48:02,  1.99s/it, loss=0.383, lr=1e-5]Steps:  66%|██████▌   | 9928/15001 [6:20:28<2:48:02,  1.99s/it, loss=0.334, lr=1e-5]Steps:  66%|██████▌   | 9929/15001 [6:20:30<2:43:47,  1.94s/it, loss=0.334, lr=1e-5]Steps:  66%|██████▌   | 9929/15001 [6:20:30<2:43:47,  1.94s/it, loss=0.109, lr=1e-5]Steps:  66%|██████▌   | 9930/15001 [6:20:32<2:49:10,  2.00s/it, loss=0.109, lr=1e-5]Steps:  66%|██████▌   | 9930/15001 [6:20:32<2:49:10,  2.00s/it, loss=0.142, lr=1e-5]Steps:  66%|██████▌   | 9931/15001 [6:20:33<2:42:52,  1.93s/it, loss=0.142, lr=1e-5]Steps:  66%|██████▌   | 9931/15001 [6:20:34<2:42:52,  1.93s/it, loss=0.099, lr=1e-5]Steps:  66%|██████▌   | 9932/15001 [6:20:36<2:46:35,  1.97s/it, loss=0.099, lr=1e-5]Steps:  66%|██████▌   | 9932/15001 [6:20:36<2:46:35,  1.97s/it, loss=0.162, lr=1e-5]Steps:  66%|██████▌   | 9933/15001 [6:20:37<2:38:18,  1.87s/it, loss=0.162, lr=1e-5]Steps:  66%|██████▌   | 9933/15001 [6:20:38<2:38:18,  1.87s/it, loss=0.2, lr=1e-5]  Steps:  66%|██████▌   | 9934/15001 [6:20:39<2:43:42,  1.94s/it, loss=0.2, lr=1e-5]Steps:  66%|██████▌   | 9934/15001 [6:20:39<2:43:42,  1.94s/it, loss=0.129, lr=1e-5]Steps:  66%|██████▌   | 9935/15001 [6:20:41<2:37:02,  1.86s/it, loss=0.129, lr=1e-5]Steps:  66%|██████▌   | 9935/15001 [6:20:41<2:37:02,  1.86s/it, loss=0.245, lr=1e-5]Steps:  66%|██████▌   | 9936/15001 [6:20:43<2:37:52,  1.87s/it, loss=0.245, lr=1e-5]Steps:  66%|██████▌   | 9936/15001 [6:20:43<2:37:52,  1.87s/it, loss=0.068, lr=1e-5]Steps:  66%|██████▌   | 9937/15001 [6:20:45<2:36:17,  1.85s/it, loss=0.068, lr=1e-5]Steps:  66%|██████▌   | 9937/15001 [6:20:45<2:36:17,  1.85s/it, loss=0.28, lr=1e-5] Steps:  66%|██████▌   | 9938/15001 [6:20:46<2:32:26,  1.81s/it, loss=0.28, lr=1e-5]Steps:  66%|██████▌   | 9938/15001 [6:20:47<2:32:26,  1.81s/it, loss=0.235, lr=1e-5]Steps:  66%|██████▋   | 9939/15001 [6:20:48<2:29:25,  1.77s/it, loss=0.235, lr=1e-5]Steps:  66%|██████▋   | 9939/15001 [6:20:48<2:29:25,  1.77s/it, loss=0.0656, lr=1e-5]Steps:  66%|██████▋   | 9940/15001 [6:20:50<2:32:56,  1.81s/it, loss=0.0656, lr=1e-5]Steps:  66%|██████▋   | 9940/15001 [6:20:50<2:32:56,  1.81s/it, loss=0.157, lr=1e-5] Steps:  66%|██████▋   | 9941/15001 [6:20:52<2:34:33,  1.83s/it, loss=0.157, lr=1e-5]Steps:  66%|██████▋   | 9941/15001 [6:20:52<2:34:33,  1.83s/it, loss=0.122, lr=1e-5]Steps:  66%|██████▋   | 9942/15001 [6:20:54<2:35:38,  1.85s/it, loss=0.122, lr=1e-5]Steps:  66%|██████▋   | 9942/15001 [6:20:54<2:35:38,  1.85s/it, loss=0.146, lr=1e-5]Steps:  66%|██████▋   | 9943/15001 [6:20:56<2:37:25,  1.87s/it, loss=0.146, lr=1e-5]Steps:  66%|██████▋   | 9943/15001 [6:20:56<2:37:25,  1.87s/it, loss=0.0944, lr=1e-5]Steps:  66%|██████▋   | 9944/15001 [6:20:57<2:35:59,  1.85s/it, loss=0.0944, lr=1e-5]Steps:  66%|██████▋   | 9944/15001 [6:20:58<2:35:59,  1.85s/it, loss=0.175, lr=1e-5] Steps:  66%|██████▋   | 9945/15001 [6:20:59<2:31:50,  1.80s/it, loss=0.175, lr=1e-5]Steps:  66%|██████▋   | 9945/15001 [6:20:59<2:31:50,  1.80s/it, loss=0.189, lr=1e-5]Steps:  66%|██████▋   | 9946/15001 [6:21:01<2:33:59,  1.83s/it, loss=0.189, lr=1e-5]Steps:  66%|██████▋   | 9946/15001 [6:21:01<2:33:59,  1.83s/it, loss=0.174, lr=1e-5]Steps:  66%|██████▋   | 9947/15001 [6:21:03<2:29:55,  1.78s/it, loss=0.174, lr=1e-5]Steps:  66%|██████▋   | 9947/15001 [6:21:03<2:29:55,  1.78s/it, loss=0.209, lr=1e-5]Steps:  66%|██████▋   | 9948/15001 [6:21:04<2:28:08,  1.76s/it, loss=0.209, lr=1e-5]Steps:  66%|██████▋   | 9948/15001 [6:21:05<2:28:08,  1.76s/it, loss=0.137, lr=1e-5]Steps:  66%|██████▋   | 9949/15001 [6:21:06<2:32:42,  1.81s/it, loss=0.137, lr=1e-5]Steps:  66%|██████▋   | 9949/15001 [6:21:07<2:32:42,  1.81s/it, loss=0.175, lr=1e-5]Steps:  66%|██████▋   | 9950/15001 [6:21:08<2:36:50,  1.86s/it, loss=0.175, lr=1e-5]Steps:  66%|██████▋   | 9950/15001 [6:21:09<2:36:50,  1.86s/it, loss=0.401, lr=1e-5]Steps:  66%|██████▋   | 9951/15001 [6:21:10<2:40:07,  1.90s/it, loss=0.401, lr=1e-5]Steps:  66%|██████▋   | 9951/15001 [6:21:10<2:40:07,  1.90s/it, loss=0.147, lr=1e-5]Steps:  66%|██████▋   | 9952/15001 [6:21:12<2:40:04,  1.90s/it, loss=0.147, lr=1e-5]Steps:  66%|██████▋   | 9952/15001 [6:21:12<2:40:04,  1.90s/it, loss=0.221, lr=1e-5]Steps:  66%|██████▋   | 9953/15001 [6:21:14<2:47:06,  1.99s/it, loss=0.221, lr=1e-5]Steps:  66%|██████▋   | 9953/15001 [6:21:14<2:47:06,  1.99s/it, loss=0.0907, lr=1e-5]Steps:  66%|██████▋   | 9954/15001 [6:21:16<2:47:09,  1.99s/it, loss=0.0907, lr=1e-5]Steps:  66%|██████▋   | 9954/15001 [6:21:16<2:47:09,  1.99s/it, loss=0.106, lr=1e-5] Steps:  66%|██████▋   | 9955/15001 [6:21:18<2:42:37,  1.93s/it, loss=0.106, lr=1e-5]Steps:  66%|██████▋   | 9955/15001 [6:21:18<2:42:37,  1.93s/it, loss=0.113, lr=1e-5]Steps:  66%|██████▋   | 9956/15001 [6:21:20<2:37:29,  1.87s/it, loss=0.113, lr=1e-5]Steps:  66%|██████▋   | 9956/15001 [6:21:20<2:37:29,  1.87s/it, loss=0.384, lr=1e-5]Steps:  66%|██████▋   | 9957/15001 [6:21:22<2:36:31,  1.86s/it, loss=0.384, lr=1e-5]Steps:  66%|██████▋   | 9957/15001 [6:21:22<2:36:31,  1.86s/it, loss=0.155, lr=1e-5]Steps:  66%|██████▋   | 9958/15001 [6:21:24<2:35:59,  1.86s/it, loss=0.155, lr=1e-5]Steps:  66%|██████▋   | 9958/15001 [6:21:24<2:35:59,  1.86s/it, loss=0.0979, lr=1e-5]Steps:  66%|██████▋   | 9959/15001 [6:21:26<2:37:57,  1.88s/it, loss=0.0979, lr=1e-5]Steps:  66%|██████▋   | 9959/15001 [6:21:26<2:37:57,  1.88s/it, loss=0.225, lr=1e-5] Steps:  66%|██████▋   | 9960/15001 [6:21:27<2:38:36,  1.89s/it, loss=0.225, lr=1e-5]Steps:  66%|██████▋   | 9960/15001 [6:21:27<2:38:36,  1.89s/it, loss=0.0301, lr=1e-5]Steps:  66%|██████▋   | 9961/15001 [6:21:29<2:26:33,  1.74s/it, loss=0.0301, lr=1e-5]Steps:  66%|██████▋   | 9961/15001 [6:21:29<2:26:33,  1.74s/it, loss=0.249, lr=1e-5] Steps:  66%|██████▋   | 9962/15001 [6:21:31<2:38:52,  1.89s/it, loss=0.249, lr=1e-5]Steps:  66%|██████▋   | 9962/15001 [6:21:31<2:38:52,  1.89s/it, loss=0.106, lr=1e-5]Steps:  66%|██████▋   | 9963/15001 [6:21:33<2:33:43,  1.83s/it, loss=0.106, lr=1e-5]Steps:  66%|██████▋   | 9963/15001 [6:21:33<2:33:43,  1.83s/it, loss=0.146, lr=1e-5]Steps:  66%|██████▋   | 9964/15001 [6:21:35<2:37:03,  1.87s/it, loss=0.146, lr=1e-5]Steps:  66%|██████▋   | 9964/15001 [6:21:35<2:37:03,  1.87s/it, loss=0.141, lr=1e-5]Steps:  66%|██████▋   | 9965/15001 [6:21:37<2:39:25,  1.90s/it, loss=0.141, lr=1e-5]Steps:  66%|██████▋   | 9965/15001 [6:21:37<2:39:25,  1.90s/it, loss=0.452, lr=1e-5]Steps:  66%|██████▋   | 9966/15001 [6:21:38<2:35:12,  1.85s/it, loss=0.452, lr=1e-5]Steps:  66%|██████▋   | 9966/15001 [6:21:39<2:35:12,  1.85s/it, loss=0.237, lr=1e-5]Steps:  66%|██████▋   | 9967/15001 [6:21:40<2:33:00,  1.82s/it, loss=0.237, lr=1e-5]Steps:  66%|██████▋   | 9967/15001 [6:21:40<2:33:00,  1.82s/it, loss=0.37, lr=1e-5] Steps:  66%|██████▋   | 9968/15001 [6:21:42<2:34:25,  1.84s/it, loss=0.37, lr=1e-5]Steps:  66%|██████▋   | 9968/15001 [6:21:42<2:34:25,  1.84s/it, loss=0.131, lr=1e-5]Steps:  66%|██████▋   | 9969/15001 [6:21:44<2:32:18,  1.82s/it, loss=0.131, lr=1e-5]Steps:  66%|██████▋   | 9969/15001 [6:21:44<2:32:18,  1.82s/it, loss=0.225, lr=1e-5]Steps:  66%|██████▋   | 9970/15001 [6:21:45<2:27:54,  1.76s/it, loss=0.225, lr=1e-5]Steps:  66%|██████▋   | 9970/15001 [6:21:46<2:27:54,  1.76s/it, loss=0.201, lr=1e-5]Steps:  66%|██████▋   | 9971/15001 [6:21:47<2:28:27,  1.77s/it, loss=0.201, lr=1e-5]Steps:  66%|██████▋   | 9971/15001 [6:21:48<2:28:27,  1.77s/it, loss=0.0897, lr=1e-5]Steps:  66%|██████▋   | 9972/15001 [6:21:49<2:32:28,  1.82s/it, loss=0.0897, lr=1e-5]Steps:  66%|██████▋   | 9972/15001 [6:21:49<2:32:28,  1.82s/it, loss=0.238, lr=1e-5] Steps:  66%|██████▋   | 9973/15001 [6:21:52<2:44:46,  1.97s/it, loss=0.238, lr=1e-5]Steps:  66%|██████▋   | 9973/15001 [6:21:52<2:44:46,  1.97s/it, loss=0.26, lr=1e-5] Steps:  66%|██████▋   | 9974/15001 [6:21:54<2:45:35,  1.98s/it, loss=0.26, lr=1e-5]Steps:  66%|██████▋   | 9974/15001 [6:21:54<2:45:35,  1.98s/it, loss=0.18, lr=1e-5]Steps:  66%|██████▋   | 9975/15001 [6:21:55<2:45:06,  1.97s/it, loss=0.18, lr=1e-5]Steps:  66%|██████▋   | 9975/15001 [6:21:55<2:45:06,  1.97s/it, loss=0.159, lr=1e-5]Steps:  67%|██████▋   | 9976/15001 [6:21:57<2:36:09,  1.86s/it, loss=0.159, lr=1e-5]Steps:  67%|██████▋   | 9976/15001 [6:21:57<2:36:09,  1.86s/it, loss=0.171, lr=1e-5]Steps:  67%|██████▋   | 9977/15001 [6:21:59<2:42:11,  1.94s/it, loss=0.171, lr=1e-5]Steps:  67%|██████▋   | 9977/15001 [6:21:59<2:42:11,  1.94s/it, loss=0.177, lr=1e-5]Steps:  67%|██████▋   | 9978/15001 [6:22:01<2:37:04,  1.88s/it, loss=0.177, lr=1e-5]Steps:  67%|██████▋   | 9978/15001 [6:22:01<2:37:04,  1.88s/it, loss=0.168, lr=1e-5]Steps:  67%|██████▋   | 9979/15001 [6:22:03<2:43:44,  1.96s/it, loss=0.168, lr=1e-5]Steps:  67%|██████▋   | 9979/15001 [6:22:03<2:43:44,  1.96s/it, loss=0.0968, lr=1e-5]Steps:  67%|██████▋   | 9980/15001 [6:22:05<2:41:27,  1.93s/it, loss=0.0968, lr=1e-5]Steps:  67%|██████▋   | 9980/15001 [6:22:05<2:41:27,  1.93s/it, loss=0.113, lr=1e-5] Steps:  67%|██████▋   | 9981/15001 [6:22:07<2:38:33,  1.90s/it, loss=0.113, lr=1e-5]Steps:  67%|██████▋   | 9981/15001 [6:22:07<2:38:33,  1.90s/it, loss=0.146, lr=1e-5]Steps:  67%|██████▋   | 9982/15001 [6:22:09<2:36:05,  1.87s/it, loss=0.146, lr=1e-5]Steps:  67%|██████▋   | 9982/15001 [6:22:09<2:36:05,  1.87s/it, loss=0.0678, lr=1e-5]Steps:  67%|██████▋   | 9983/15001 [6:22:10<2:31:34,  1.81s/it, loss=0.0678, lr=1e-5]Steps:  67%|██████▋   | 9983/15001 [6:22:10<2:31:34,  1.81s/it, loss=0.247, lr=1e-5] Steps:  67%|██████▋   | 9984/15001 [6:22:12<2:29:33,  1.79s/it, loss=0.247, lr=1e-5]Steps:  67%|██████▋   | 9984/15001 [6:22:12<2:29:33,  1.79s/it, loss=0.212, lr=1e-5]Steps:  67%|██████▋   | 9985/15001 [6:22:14<2:32:33,  1.82s/it, loss=0.212, lr=1e-5]Steps:  67%|██████▋   | 9985/15001 [6:22:14<2:32:33,  1.82s/it, loss=0.117, lr=1e-5]Steps:  67%|██████▋   | 9986/15001 [6:22:16<2:31:50,  1.82s/it, loss=0.117, lr=1e-5]Steps:  67%|██████▋   | 9986/15001 [6:22:16<2:31:50,  1.82s/it, loss=0.0384, lr=1e-5]Steps:  67%|██████▋   | 9987/15001 [6:22:17<2:29:58,  1.79s/it, loss=0.0384, lr=1e-5]Steps:  67%|██████▋   | 9987/15001 [6:22:18<2:29:58,  1.79s/it, loss=0.141, lr=1e-5] Steps:  67%|██████▋   | 9988/15001 [6:22:19<2:23:28,  1.72s/it, loss=0.141, lr=1e-5]Steps:  67%|██████▋   | 9988/15001 [6:22:20<2:23:28,  1.72s/it, loss=0.138, lr=1e-5]Steps:  67%|██████▋   | 9989/15001 [6:22:21<2:36:49,  1.88s/it, loss=0.138, lr=1e-5]Steps:  67%|██████▋   | 9989/15001 [6:22:21<2:36:49,  1.88s/it, loss=0.095, lr=1e-5]Steps:  67%|██████▋   | 9990/15001 [6:22:23<2:32:25,  1.83s/it, loss=0.095, lr=1e-5]Steps:  67%|██████▋   | 9990/15001 [6:22:23<2:32:25,  1.83s/it, loss=0.347, lr=1e-5]Steps:  67%|██████▋   | 9991/15001 [6:22:25<2:32:47,  1.83s/it, loss=0.347, lr=1e-5]Steps:  67%|██████▋   | 9991/15001 [6:22:25<2:32:47,  1.83s/it, loss=0.024, lr=1e-5]Steps:  67%|██████▋   | 9992/15001 [6:22:27<2:33:10,  1.83s/it, loss=0.024, lr=1e-5]Steps:  67%|██████▋   | 9992/15001 [6:22:27<2:33:10,  1.83s/it, loss=0.148, lr=1e-5]Steps:  67%|██████▋   | 9993/15001 [6:22:28<2:26:35,  1.76s/it, loss=0.148, lr=1e-5]Steps:  67%|██████▋   | 9993/15001 [6:22:28<2:26:35,  1.76s/it, loss=0.219, lr=1e-5]Steps:  67%|██████▋   | 9994/15001 [6:22:30<2:28:38,  1.78s/it, loss=0.219, lr=1e-5]Steps:  67%|██████▋   | 9994/15001 [6:22:30<2:28:38,  1.78s/it, loss=0.223, lr=1e-5]Steps:  67%|██████▋   | 9995/15001 [6:22:32<2:29:59,  1.80s/it, loss=0.223, lr=1e-5]Steps:  67%|██████▋   | 9995/15001 [6:22:32<2:29:59,  1.80s/it, loss=0.0673, lr=1e-5]Steps:  67%|██████▋   | 9996/15001 [6:22:34<2:32:47,  1.83s/it, loss=0.0673, lr=1e-5]Steps:  67%|██████▋   | 9996/15001 [6:22:34<2:32:47,  1.83s/it, loss=0.0322, lr=1e-5]Steps:  67%|██████▋   | 9997/15001 [6:22:36<2:41:02,  1.93s/it, loss=0.0322, lr=1e-5]Steps:  67%|██████▋   | 9997/15001 [6:22:36<2:41:02,  1.93s/it, loss=0.341, lr=1e-5] Steps:  67%|██████▋   | 9998/15001 [6:22:38<2:42:19,  1.95s/it, loss=0.341, lr=1e-5]Steps:  67%|██████▋   | 9998/15001 [6:22:38<2:42:19,  1.95s/it, loss=0.187, lr=1e-5]Steps:  67%|██████▋   | 9999/15001 [6:22:40<2:48:13,  2.02s/it, loss=0.187, lr=1e-5]Steps:  67%|██████▋   | 9999/15001 [6:22:40<2:48:13,  2.02s/it, loss=0.0221, lr=1e-5]Steps:  67%|██████▋   | 10000/15001 [6:22:42<2:48:05,  2.02s/it, loss=0.0221, lr=1e-5]02/04/2024 19:25:01 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1730.92it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  67%|██████▋   | 10000/15001 [6:26:21<2:48:05,  2.02s/it, loss=0.168, lr=1e-5] Steps:  67%|██████▋   | 10001/15001 [6:26:23<93:55:00, 67.62s/it, loss=0.168, lr=1e-5]Steps:  67%|██████▋   | 10001/15001 [6:26:23<93:55:00, 67.62s/it, loss=0.0832, lr=1e-5]Steps:  67%|██████▋   | 10002/15001 [6:26:24<66:25:37, 47.84s/it, loss=0.0832, lr=1e-5]Steps:  67%|██████▋   | 10002/15001 [6:26:25<66:25:37, 47.84s/it, loss=0.192, lr=1e-5] Steps:  67%|██████▋   | 10003/15001 [6:26:27<47:21:51, 34.12s/it, loss=0.192, lr=1e-5]Steps:  67%|██████▋   | 10003/15001 [6:26:27<47:21:51, 34.12s/it, loss=0.136, lr=1e-5]Steps:  67%|██████▋   | 10004/15001 [6:26:28<33:56:19, 24.45s/it, loss=0.136, lr=1e-5]Steps:  67%|██████▋   | 10004/15001 [6:26:29<33:56:19, 24.45s/it, loss=0.343, lr=1e-5]Steps:  67%|██████▋   | 10005/15001 [6:26:31<24:35:41, 17.72s/it, loss=0.343, lr=1e-5]Steps:  67%|██████▋   | 10005/15001 [6:26:31<24:35:41, 17.72s/it, loss=0.187, lr=1e-5]Steps:  67%|██████▋   | 10006/15001 [6:26:32<17:58:00, 12.95s/it, loss=0.187, lr=1e-5]Steps:  67%|██████▋   | 10006/15001 [6:26:33<17:58:00, 12.95s/it, loss=0.179, lr=1e-5]Steps:  67%|██████▋   | 10007/15001 [6:26:35<13:29:59,  9.73s/it, loss=0.179, lr=1e-5]Steps:  67%|██████▋   | 10007/15001 [6:26:35<13:29:59,  9.73s/it, loss=0.234, lr=1e-5]Steps:  67%|██████▋   | 10008/15001 [6:26:37<10:16:11,  7.40s/it, loss=0.234, lr=1e-5]Steps:  67%|██████▋   | 10008/15001 [6:26:37<10:16:11,  7.40s/it, loss=0.181, lr=1e-5]Steps:  67%|██████▋   | 10009/15001 [6:26:38<7:57:31,  5.74s/it, loss=0.181, lr=1e-5] Steps:  67%|██████▋   | 10009/15001 [6:26:39<7:57:31,  5.74s/it, loss=0.0836, lr=1e-5]Steps:  67%|██████▋   | 10010/15001 [6:26:40<6:23:51,  4.61s/it, loss=0.0836, lr=1e-5]Steps:  67%|██████▋   | 10010/15001 [6:26:41<6:23:51,  4.61s/it, loss=0.211, lr=1e-5] Steps:  67%|██████▋   | 10011/15001 [6:26:43<5:44:01,  4.14s/it, loss=0.211, lr=1e-5]Steps:  67%|██████▋   | 10011/15001 [6:26:43<5:44:01,  4.14s/it, loss=0.268, lr=1e-5]Steps:  67%|██████▋   | 10012/15001 [6:26:45<4:44:38,  3.42s/it, loss=0.268, lr=1e-5]Steps:  67%|██████▋   | 10012/15001 [6:26:45<4:44:38,  3.42s/it, loss=0.347, lr=1e-5]Steps:  67%|██████▋   | 10013/15001 [6:26:47<3:57:59,  2.86s/it, loss=0.347, lr=1e-5]Steps:  67%|██████▋   | 10013/15001 [6:26:47<3:57:59,  2.86s/it, loss=0.226, lr=1e-5]Steps:  67%|██████▋   | 10014/15001 [6:26:49<3:38:23,  2.63s/it, loss=0.226, lr=1e-5]Steps:  67%|██████▋   | 10014/15001 [6:26:49<3:38:23,  2.63s/it, loss=0.151, lr=1e-5]Steps:  67%|██████▋   | 10015/15001 [6:26:50<3:14:29,  2.34s/it, loss=0.151, lr=1e-5]Steps:  67%|██████▋   | 10015/15001 [6:26:51<3:14:29,  2.34s/it, loss=0.191, lr=1e-5]Steps:  67%|██████▋   | 10016/15001 [6:26:52<3:03:43,  2.21s/it, loss=0.191, lr=1e-5]Steps:  67%|██████▋   | 10016/15001 [6:26:53<3:03:43,  2.21s/it, loss=0.233, lr=1e-5]Steps:  67%|██████▋   | 10017/15001 [6:26:54<2:50:52,  2.06s/it, loss=0.233, lr=1e-5]Steps:  67%|██████▋   | 10017/15001 [6:26:55<2:50:52,  2.06s/it, loss=0.0906, lr=1e-5]Steps:  67%|██████▋   | 10018/15001 [6:26:56<2:54:11,  2.10s/it, loss=0.0906, lr=1e-5]Steps:  67%|██████▋   | 10018/15001 [6:26:56<2:54:11,  2.10s/it, loss=0.139, lr=1e-5] Steps:  67%|██████▋   | 10019/15001 [6:26:58<2:40:33,  1.93s/it, loss=0.139, lr=1e-5]Steps:  67%|██████▋   | 10019/15001 [6:26:58<2:40:33,  1.93s/it, loss=0.0554, lr=1e-5]Steps:  67%|██████▋   | 10020/15001 [6:27:00<2:45:27,  1.99s/it, loss=0.0554, lr=1e-5]Steps:  67%|██████▋   | 10020/15001 [6:27:00<2:45:27,  1.99s/it, loss=0.151, lr=1e-5] Steps:  67%|██████▋   | 10021/15001 [6:27:02<2:37:56,  1.90s/it, loss=0.151, lr=1e-5]Steps:  67%|██████▋   | 10021/15001 [6:27:02<2:37:56,  1.90s/it, loss=0.235, lr=1e-5]Steps:  67%|██████▋   | 10022/15001 [6:27:03<2:36:38,  1.89s/it, loss=0.235, lr=1e-5]Steps:  67%|██████▋   | 10022/15001 [6:27:04<2:36:38,  1.89s/it, loss=0.329, lr=1e-5]Steps:  67%|██████▋   | 10023/15001 [6:27:05<2:38:58,  1.92s/it, loss=0.329, lr=1e-5]Steps:  67%|██████▋   | 10023/15001 [6:27:06<2:38:58,  1.92s/it, loss=0.234, lr=1e-5]Steps:  67%|██████▋   | 10024/15001 [6:27:07<2:35:46,  1.88s/it, loss=0.234, lr=1e-5]Steps:  67%|██████▋   | 10024/15001 [6:27:07<2:35:46,  1.88s/it, loss=0.22, lr=1e-5] Steps:  67%|██████▋   | 10025/15001 [6:27:09<2:30:02,  1.81s/it, loss=0.22, lr=1e-5]Steps:  67%|██████���   | 10025/15001 [6:27:09<2:30:02,  1.81s/it, loss=0.0628, lr=1e-5]Steps:  67%|██████▋   | 10026/15001 [6:27:11<2:27:52,  1.78s/it, loss=0.0628, lr=1e-5]Steps:  67%|██████▋   | 10026/15001 [6:27:11<2:27:52,  1.78s/it, loss=0.0329, lr=1e-5]Steps:  67%|██████▋   | 10027/15001 [6:27:13<2:44:05,  1.98s/it, loss=0.0329, lr=1e-5]Steps:  67%|██████▋   | 10027/15001 [6:27:13<2:44:05,  1.98s/it, loss=0.0331, lr=1e-5]Steps:  67%|██████▋   | 10028/15001 [6:27:15<2:43:12,  1.97s/it, loss=0.0331, lr=1e-5]Steps:  67%|██████▋   | 10028/15001 [6:27:15<2:43:12,  1.97s/it, loss=0.0915, lr=1e-5]Steps:  67%|██████▋   | 10029/15001 [6:27:17<2:48:19,  2.03s/it, loss=0.0915, lr=1e-5]Steps:  67%|██████▋   | 10029/15001 [6:27:17<2:48:19,  2.03s/it, loss=0.201, lr=1e-5] Steps:  67%|██████▋   | 10030/15001 [6:27:19<2:45:58,  2.00s/it, loss=0.201, lr=1e-5]Steps:  67%|██████▋   | 10030/15001 [6:27:19<2:45:58,  2.00s/it, loss=0.195, lr=1e-5]Steps:  67%|██████▋   | 10031/15001 [6:27:21<2:42:18,  1.96s/it, loss=0.195, lr=1e-5]Steps:  67%|██████▋   | 10031/15001 [6:27:21<2:42:18,  1.96s/it, loss=0.0765, lr=1e-5]Steps:  67%|██████▋   | 10032/15001 [6:27:23<2:44:21,  1.98s/it, loss=0.0765, lr=1e-5]Steps:  67%|██████▋   | 10032/15001 [6:27:23<2:44:21,  1.98s/it, loss=0.088, lr=1e-5] Steps:  67%|██████▋   | 10033/15001 [6:27:25<2:42:16,  1.96s/it, loss=0.088, lr=1e-5]Steps:  67%|██████▋   | 10033/15001 [6:27:25<2:42:16,  1.96s/it, loss=0.173, lr=1e-5]Steps:  67%|██████▋   | 10034/15001 [6:27:26<2:32:25,  1.84s/it, loss=0.173, lr=1e-5]Steps:  67%|██████▋   | 10034/15001 [6:27:27<2:32:25,  1.84s/it, loss=0.0866, lr=1e-5]Steps:  67%|██████▋   | 10035/15001 [6:27:28<2:36:29,  1.89s/it, loss=0.0866, lr=1e-5]Steps:  67%|██████▋   | 10035/15001 [6:27:29<2:36:29,  1.89s/it, loss=0.17, lr=1e-5]  Steps:  67%|██████▋   | 10036/15001 [6:27:30<2:33:45,  1.86s/it, loss=0.17, lr=1e-5]Steps:  67%|██████▋   | 10036/15001 [6:27:30<2:33:45,  1.86s/it, loss=0.265, lr=1e-5]Steps:  67%|██████▋   | 10037/15001 [6:27:32<2:31:50,  1.84s/it, loss=0.265, lr=1e-5]Steps:  67%|██████▋   | 10037/15001 [6:27:32<2:31:50,  1.84s/it, loss=0.34, lr=1e-5] Steps:  67%|██████▋   | 10038/15001 [6:27:34<2:35:58,  1.89s/it, loss=0.34, lr=1e-5]Steps:  67%|██████▋   | 10038/15001 [6:27:34<2:35:58,  1.89s/it, loss=0.104, lr=1e-5]Steps:  67%|██████▋   | 10039/15001 [6:27:36<2:28:11,  1.79s/it, loss=0.104, lr=1e-5]Steps:  67%|██████▋   | 10039/15001 [6:27:36<2:28:11,  1.79s/it, loss=0.0583, lr=1e-5]Steps:  67%|██████▋   | 10040/15001 [6:27:38<2:30:40,  1.82s/it, loss=0.0583, lr=1e-5]Steps:  67%|██████▋   | 10040/15001 [6:27:38<2:30:40,  1.82s/it, loss=0.412, lr=1e-5] Steps:  67%|██████▋   | 10041/15001 [6:27:39<2:32:13,  1.84s/it, loss=0.412, lr=1e-5]Steps:  67%|██████▋   | 10041/15001 [6:27:39<2:32:13,  1.84s/it, loss=0.11, lr=1e-5] Steps:  67%|██████▋   | 10042/15001 [6:27:41<2:26:08,  1.77s/it, loss=0.11, lr=1e-5]Steps:  67%|██████▋   | 10042/15001 [6:27:41<2:26:08,  1.77s/it, loss=0.133, lr=1e-5]Steps:  67%|██████▋   | 10043/15001 [6:27:43<2:30:07,  1.82s/it, loss=0.133, lr=1e-5]Steps:  67%|██████▋   | 10043/15001 [6:27:43<2:30:07,  1.82s/it, loss=0.112, lr=1e-5]Steps:  67%|██████▋   | 10044/15001 [6:27:45<2:36:11,  1.89s/it, loss=0.112, lr=1e-5]Steps:  67%|██████▋   | 10044/15001 [6:27:45<2:36:11,  1.89s/it, loss=0.172, lr=1e-5]Steps:  67%|██████▋   | 10045/15001 [6:27:47<2:32:56,  1.85s/it, loss=0.172, lr=1e-5]Steps:  67%|██████▋   | 10045/15001 [6:27:47<2:32:56,  1.85s/it, loss=0.0602, lr=1e-5]Steps:  67%|██████▋   | 10046/15001 [6:27:48<2:26:52,  1.78s/it, loss=0.0602, lr=1e-5]Steps:  67%|██████▋   | 10046/15001 [6:27:49<2:26:52,  1.78s/it, loss=0.0828, lr=1e-5]Steps:  67%|██████▋   | 10047/15001 [6:27:50<2:29:33,  1.81s/it, loss=0.0828, lr=1e-5]Steps:  67%|██████▋   | 10047/15001 [6:27:50<2:29:33,  1.81s/it, loss=0.267, lr=1e-5] Steps:  67%|██████▋   | 10048/15001 [6:27:52<2:30:30,  1.82s/it, loss=0.267, lr=1e-5]Steps:  67%|██████▋   | 10048/15001 [6:27:52<2:30:30,  1.82s/it, loss=0.101, lr=1e-5]Steps:  67%|██████▋   | 10049/15001 [6:27:54<2:30:10,  1.82s/it, loss=0.101, lr=1e-5]Steps:  67%|██████▋   | 10049/15001 [6:27:54<2:30:10,  1.82s/it, loss=0.0152, lr=1e-5]Steps:  67%|██████▋   | 10050/15001 [6:27:56<2:34:00,  1.87s/it, loss=0.0152, lr=1e-5]Steps:  67%|██████▋   | 10050/15001 [6:27:56<2:34:00,  1.87s/it, loss=0.192, lr=1e-5] Steps:  67%|█████���▋   | 10051/15001 [6:27:58<2:42:05,  1.96s/it, loss=0.192, lr=1e-5]Steps:  67%|██████▋   | 10051/15001 [6:27:58<2:42:05,  1.96s/it, loss=0.154, lr=1e-5]Steps:  67%|██████▋   | 10052/15001 [6:28:00<2:41:21,  1.96s/it, loss=0.154, lr=1e-5]Steps:  67%|██████▋   | 10052/15001 [6:28:00<2:41:21,  1.96s/it, loss=0.483, lr=1e-5]Steps:  67%|██████▋   | 10053/15001 [6:28:02<2:46:37,  2.02s/it, loss=0.483, lr=1e-5]Steps:  67%|██████▋   | 10053/15001 [6:28:02<2:46:37,  2.02s/it, loss=0.159, lr=1e-5]Steps:  67%|██████▋   | 10054/15001 [6:28:04<2:39:14,  1.93s/it, loss=0.159, lr=1e-5]Steps:  67%|██████▋   | 10054/15001 [6:28:04<2:39:14,  1.93s/it, loss=0.137, lr=1e-5]Steps:  67%|██████▋   | 10055/15001 [6:28:06<2:44:21,  1.99s/it, loss=0.137, lr=1e-5]Steps:  67%|██████▋   | 10055/15001 [6:28:06<2:44:21,  1.99s/it, loss=0.206, lr=1e-5]Steps:  67%|██████▋   | 10056/15001 [6:28:08<2:47:10,  2.03s/it, loss=0.206, lr=1e-5]Steps:  67%|██████▋   | 10056/15001 [6:28:08<2:47:10,  2.03s/it, loss=0.137, lr=1e-5]Steps:  67%|██████▋   | 10057/15001 [6:28:10<2:43:28,  1.98s/it, loss=0.137, lr=1e-5]Steps:  67%|██████▋   | 10057/15001 [6:28:10<2:43:28,  1.98s/it, loss=0.261, lr=1e-5]Steps:  67%|██████▋   | 10058/15001 [6:28:12<2:35:47,  1.89s/it, loss=0.261, lr=1e-5]Steps:  67%|██████▋   | 10058/15001 [6:28:12<2:35:47,  1.89s/it, loss=0.236, lr=1e-5]Steps:  67%|██████▋   | 10059/15001 [6:28:13<2:33:02,  1.86s/it, loss=0.236, lr=1e-5]Steps:  67%|██████▋   | 10059/15001 [6:28:14<2:33:02,  1.86s/it, loss=0.165, lr=1e-5]Steps:  67%|██████▋   | 10060/15001 [6:28:15<2:31:51,  1.84s/it, loss=0.165, lr=1e-5]Steps:  67%|██████▋   | 10060/15001 [6:28:15<2:31:51,  1.84s/it, loss=0.273, lr=1e-5]Steps:  67%|██████▋   | 10061/15001 [6:28:17<2:31:06,  1.84s/it, loss=0.273, lr=1e-5]Steps:  67%|██████▋   | 10061/15001 [6:28:17<2:31:06,  1.84s/it, loss=0.0836, lr=1e-5]Steps:  67%|██████▋   | 10062/15001 [6:28:19<2:22:26,  1.73s/it, loss=0.0836, lr=1e-5]Steps:  67%|██████▋   | 10062/15001 [6:28:19<2:22:26,  1.73s/it, loss=0.294, lr=1e-5] Steps:  67%|██████▋   | 10063/15001 [6:28:20<2:23:52,  1.75s/it, loss=0.294, lr=1e-5]Steps:  67%|██████▋   | 10063/15001 [6:28:21<2:23:52,  1.75s/it, loss=0.352, lr=1e-5]Steps:  67%|██████▋   | 10064/15001 [6:28:23<2:32:52,  1.86s/it, loss=0.352, lr=1e-5]Steps:  67%|██████▋   | 10064/15001 [6:28:23<2:32:52,  1.86s/it, loss=0.185, lr=1e-5]Steps:  67%|██████▋   | 10065/15001 [6:28:25<2:36:42,  1.90s/it, loss=0.185, lr=1e-5]Steps:  67%|██████▋   | 10065/15001 [6:28:25<2:36:42,  1.90s/it, loss=0.124, lr=1e-5]Steps:  67%|██████▋   | 10066/15001 [6:28:26<2:25:51,  1.77s/it, loss=0.124, lr=1e-5]Steps:  67%|██████▋   | 10066/15001 [6:28:26<2:25:51,  1.77s/it, loss=0.297, lr=1e-5]Steps:  67%|██████▋   | 10067/15001 [6:28:28<2:25:15,  1.77s/it, loss=0.297, lr=1e-5]Steps:  67%|██████▋   | 10067/15001 [6:28:28<2:25:15,  1.77s/it, loss=0.0297, lr=1e-5]Steps:  67%|██████▋   | 10068/15001 [6:28:30<2:32:17,  1.85s/it, loss=0.0297, lr=1e-5]Steps:  67%|██████▋   | 10068/15001 [6:28:30<2:32:17,  1.85s/it, loss=0.181, lr=1e-5] Steps:  67%|██████▋   | 10069/15001 [6:28:32<2:35:26,  1.89s/it, loss=0.181, lr=1e-5]Steps:  67%|██████▋   | 10069/15001 [6:28:32<2:35:26,  1.89s/it, loss=0.0499, lr=1e-5]Steps:  67%|██████▋   | 10070/15001 [6:28:33<2:30:52,  1.84s/it, loss=0.0499, lr=1e-5]Steps:  67%|██████▋   | 10070/15001 [6:28:34<2:30:52,  1.84s/it, loss=0.175, lr=1e-5] Steps:  67%|██████▋   | 10071/15001 [6:28:35<2:34:21,  1.88s/it, loss=0.175, lr=1e-5]Steps:  67%|██████▋   | 10071/15001 [6:28:36<2:34:21,  1.88s/it, loss=0.365, lr=1e-5]Steps:  67%|██████▋   | 10072/15001 [6:28:37<2:31:03,  1.84s/it, loss=0.365, lr=1e-5]Steps:  67%|██████▋   | 10072/15001 [6:28:37<2:31:03,  1.84s/it, loss=0.167, lr=1e-5]Steps:  67%|██████▋   | 10073/15001 [6:28:39<2:34:17,  1.88s/it, loss=0.167, lr=1e-5]Steps:  67%|██████▋   | 10073/15001 [6:28:39<2:34:17,  1.88s/it, loss=0.151, lr=1e-5]Steps:  67%|██████▋   | 10074/15001 [6:28:41<2:32:15,  1.85s/it, loss=0.151, lr=1e-5]Steps:  67%|██████▋   | 10074/15001 [6:28:41<2:32:15,  1.85s/it, loss=0.218, lr=1e-5]Steps:  67%|██████▋   | 10075/15001 [6:28:43<2:42:39,  1.98s/it, loss=0.218, lr=1e-5]Steps:  67%|██████▋   | 10075/15001 [6:28:43<2:42:39,  1.98s/it, loss=0.153, lr=1e-5]Steps:  67%|██████▋   | 10076/15001 [6:28:45<2:41:13,  1.96s/it, loss=0.153, lr=1e-5]Steps:  67%|██████▋   | 10076/15001 [6:28:45<2:41:13,  1.96s/it, loss=0.0369, lr=1e-5]Steps:  67%|██████▋   | 10077/15001 [6:28:47<2:33:26,  1.87s/it, loss=0.0369, lr=1e-5]Steps:  67%|██████▋   | 10077/15001 [6:28:47<2:33:26,  1.87s/it, loss=0.148, lr=1e-5] Steps:  67%|██████▋   | 10078/15001 [6:28:49<2:42:30,  1.98s/it, loss=0.148, lr=1e-5]Steps:  67%|██████▋   | 10078/15001 [6:28:49<2:42:30,  1.98s/it, loss=0.125, lr=1e-5]Steps:  67%|██████▋   | 10079/15001 [6:28:51<2:36:43,  1.91s/it, loss=0.125, lr=1e-5]Steps:  67%|██████▋   | 10079/15001 [6:28:51<2:36:43,  1.91s/it, loss=0.221, lr=1e-5]Steps:  67%|██████▋   | 10080/15001 [6:28:53<2:33:54,  1.88s/it, loss=0.221, lr=1e-5]Steps:  67%|██████▋   | 10080/15001 [6:28:53<2:33:54,  1.88s/it, loss=0.0449, lr=1e-5]Steps:  67%|██████▋   | 10081/15001 [6:28:54<2:33:20,  1.87s/it, loss=0.0449, lr=1e-5]Steps:  67%|██████▋   | 10081/15001 [6:28:55<2:33:20,  1.87s/it, loss=0.0964, lr=1e-5]Steps:  67%|██████▋   | 10082/15001 [6:28:57<2:38:51,  1.94s/it, loss=0.0964, lr=1e-5]Steps:  67%|██████▋   | 10082/15001 [6:28:57<2:38:51,  1.94s/it, loss=0.147, lr=1e-5] Steps:  67%|██████▋   | 10083/15001 [6:28:58<2:32:57,  1.87s/it, loss=0.147, lr=1e-5]Steps:  67%|██████▋   | 10083/15001 [6:28:59<2:32:57,  1.87s/it, loss=0.116, lr=1e-5]Steps:  67%|██████▋   | 10084/15001 [6:29:00<2:35:06,  1.89s/it, loss=0.116, lr=1e-5]Steps:  67%|██████▋   | 10084/15001 [6:29:00<2:35:06,  1.89s/it, loss=0.119, lr=1e-5]Steps:  67%|██████▋   | 10085/15001 [6:29:02<2:28:02,  1.81s/it, loss=0.119, lr=1e-5]Steps:  67%|██████▋   | 10085/15001 [6:29:02<2:28:02,  1.81s/it, loss=0.236, lr=1e-5]Steps:  67%|██████▋   | 10086/15001 [6:29:04<2:25:31,  1.78s/it, loss=0.236, lr=1e-5]Steps:  67%|██████▋   | 10086/15001 [6:29:04<2:25:31,  1.78s/it, loss=0.0993, lr=1e-5]Steps:  67%|██████▋   | 10087/15001 [6:29:05<2:27:12,  1.80s/it, loss=0.0993, lr=1e-5]Steps:  67%|██████▋   | 10087/15001 [6:29:06<2:27:12,  1.80s/it, loss=0.159, lr=1e-5] Steps:  67%|██████▋   | 10088/15001 [6:29:07<2:29:22,  1.82s/it, loss=0.159, lr=1e-5]Steps:  67%|██████▋   | 10088/15001 [6:29:07<2:29:22,  1.82s/it, loss=0.0864, lr=1e-5]Steps:  67%|██████▋   | 10089/15001 [6:29:09<2:31:45,  1.85s/it, loss=0.0864, lr=1e-5]Steps:  67%|██████▋   | 10089/15001 [6:29:09<2:31:45,  1.85s/it, loss=0.209, lr=1e-5] Steps:  67%|██████▋   | 10090/15001 [6:29:11<2:31:09,  1.85s/it, loss=0.209, lr=1e-5]Steps:  67%|██████▋   | 10090/15001 [6:29:11<2:31:09,  1.85s/it, loss=0.207, lr=1e-5]Steps:  67%|██████▋   | 10091/15001 [6:29:13<2:33:46,  1.88s/it, loss=0.207, lr=1e-5]Steps:  67%|██████▋   | 10091/15001 [6:29:13<2:33:46,  1.88s/it, loss=0.236, lr=1e-5]Steps:  67%|██████▋   | 10092/15001 [6:29:15<2:29:31,  1.83s/it, loss=0.236, lr=1e-5]Steps:  67%|██████▋   | 10092/15001 [6:29:15<2:29:31,  1.83s/it, loss=0.221, lr=1e-5]Steps:  67%|██████▋   | 10093/15001 [6:29:16<2:23:44,  1.76s/it, loss=0.221, lr=1e-5]Steps:  67%|██████▋   | 10093/15001 [6:29:17<2:23:44,  1.76s/it, loss=0.256, lr=1e-5]Steps:  67%|██████▋   | 10094/15001 [6:29:18<2:27:09,  1.80s/it, loss=0.256, lr=1e-5]Steps:  67%|██████▋   | 10094/15001 [6:29:18<2:27:09,  1.80s/it, loss=0.13, lr=1e-5] Steps:  67%|██████▋   | 10095/15001 [6:29:20<2:31:20,  1.85s/it, loss=0.13, lr=1e-5]Steps:  67%|██████▋   | 10095/15001 [6:29:20<2:31:20,  1.85s/it, loss=0.272, lr=1e-5]Steps:  67%|██████▋   | 10096/15001 [6:29:22<2:35:26,  1.90s/it, loss=0.272, lr=1e-5]Steps:  67%|██████▋   | 10096/15001 [6:29:22<2:35:26,  1.90s/it, loss=0.109, lr=1e-5]Steps:  67%|██████▋   | 10097/15001 [6:29:24<2:38:55,  1.94s/it, loss=0.109, lr=1e-5]Steps:  67%|██████▋   | 10097/15001 [6:29:24<2:38:55,  1.94s/it, loss=0.182, lr=1e-5]Steps:  67%|██████▋   | 10098/15001 [6:29:26<2:43:10,  2.00s/it, loss=0.182, lr=1e-5]Steps:  67%|██████▋   | 10098/15001 [6:29:26<2:43:10,  2.00s/it, loss=0.262, lr=1e-5]Steps:  67%|██████▋   | 10099/15001 [6:29:28<2:39:05,  1.95s/it, loss=0.262, lr=1e-5]Steps:  67%|██████▋   | 10099/15001 [6:29:28<2:39:05,  1.95s/it, loss=0.224, lr=1e-5]Steps:  67%|██████▋   | 10100/15001 [6:29:30<2:41:56,  1.98s/it, loss=0.224, lr=1e-5]Steps:  67%|██████▋   | 10100/15001 [6:29:30<2:41:56,  1.98s/it, loss=0.465, lr=1e-5]Steps:  67%|██████▋   | 10101/15001 [6:29:32<2:42:46,  1.99s/it, loss=0.465, lr=1e-5]Steps:  67%|██████▋   | 10101/15001 [6:29:32<2:42:46,  1.99s/it, loss=0.261, lr=1e-5]Steps:  67%|██████▋   | 10102/15001 [6:29:34<2:37:22,  1.93s/it, loss=0.261, lr=1e-5]Steps:  67%|██████▋   | 10102/15001 [6:29:34<2:37:22,  1.93s/it, loss=0.16, lr=1e-5] Steps:  67%|██████▋   | 10103/15001 [6:29:36<2:33:02,  1.87s/it, loss=0.16, lr=1e-5]Steps:  67%|██████▋   | 10103/15001 [6:29:36<2:33:02,  1.87s/it, loss=0.17, lr=1e-5]Steps:  67%|██████▋   | 10104/15001 [6:29:38<2:30:20,  1.84s/it, loss=0.17, lr=1e-5]Steps:  67%|██████▋   | 10104/15001 [6:29:38<2:30:20,  1.84s/it, loss=0.069, lr=1e-5]Steps:  67%|██████▋   | 10105/15001 [6:29:39<2:28:25,  1.82s/it, loss=0.069, lr=1e-5]Steps:  67%|██████▋   | 10105/15001 [6:29:39<2:28:25,  1.82s/it, loss=0.162, lr=1e-5]Steps:  67%|██████▋   | 10106/15001 [6:29:41<2:29:57,  1.84s/it, loss=0.162, lr=1e-5]Steps:  67%|██████▋   | 10106/15001 [6:29:41<2:29:57,  1.84s/it, loss=0.156, lr=1e-5]Steps:  67%|██████▋   | 10107/15001 [6:29:43<2:27:30,  1.81s/it, loss=0.156, lr=1e-5]Steps:  67%|██████▋   | 10107/15001 [6:29:43<2:27:30,  1.81s/it, loss=0.132, lr=1e-5]Steps:  67%|██████▋   | 10108/15001 [6:29:45<2:27:28,  1.81s/it, loss=0.132, lr=1e-5]Steps:  67%|██████▋   | 10108/15001 [6:29:45<2:27:28,  1.81s/it, loss=0.123, lr=1e-5]Steps:  67%|██████▋   | 10109/15001 [6:29:47<2:29:05,  1.83s/it, loss=0.123, lr=1e-5]Steps:  67%|██████▋   | 10109/15001 [6:29:47<2:29:05,  1.83s/it, loss=0.0871, lr=1e-5]Steps:  67%|██████▋   | 10110/15001 [6:29:48<2:26:11,  1.79s/it, loss=0.0871, lr=1e-5]Steps:  67%|██████▋   | 10110/15001 [6:29:48<2:26:11,  1.79s/it, loss=0.194, lr=1e-5] Steps:  67%|██████▋   | 10111/15001 [6:29:50<2:19:17,  1.71s/it, loss=0.194, lr=1e-5]Steps:  67%|██████▋   | 10111/15001 [6:29:50<2:19:17,  1.71s/it, loss=0.142, lr=1e-5]Steps:  67%|██████▋   | 10112/15001 [6:29:52<2:30:24,  1.85s/it, loss=0.142, lr=1e-5]Steps:  67%|██████▋   | 10112/15001 [6:29:52<2:30:24,  1.85s/it, loss=0.181, lr=1e-5]Steps:  67%|██████▋   | 10113/15001 [6:29:54<2:30:43,  1.85s/it, loss=0.181, lr=1e-5]Steps:  67%|██████▋   | 10113/15001 [6:29:54<2:30:43,  1.85s/it, loss=0.345, lr=1e-5]Steps:  67%|██████▋   | 10114/15001 [6:29:56<2:28:25,  1.82s/it, loss=0.345, lr=1e-5]Steps:  67%|██████▋   | 10114/15001 [6:29:56<2:28:25,  1.82s/it, loss=0.122, lr=1e-5]Steps:  67%|██████▋   | 10115/15001 [6:29:57<2:27:21,  1.81s/it, loss=0.122, lr=1e-5]Steps:  67%|██████▋   | 10115/15001 [6:29:58<2:27:21,  1.81s/it, loss=0.147, lr=1e-5]Steps:  67%|██████▋   | 10116/15001 [6:29:59<2:24:08,  1.77s/it, loss=0.147, lr=1e-5]Steps:  67%|██████▋   | 10116/15001 [6:29:59<2:24:08,  1.77s/it, loss=0.144, lr=1e-5]Steps:  67%|██████▋   | 10117/15001 [6:30:01<2:23:09,  1.76s/it, loss=0.144, lr=1e-5]Steps:  67%|██████▋   | 10117/15001 [6:30:01<2:23:09,  1.76s/it, loss=0.309, lr=1e-5]Steps:  67%|██████▋   | 10118/15001 [6:30:03<2:27:44,  1.82s/it, loss=0.309, lr=1e-5]Steps:  67%|██████▋   | 10118/15001 [6:30:03<2:27:44,  1.82s/it, loss=0.0712, lr=1e-5]Steps:  67%|██████▋   | 10119/15001 [6:30:05<2:32:52,  1.88s/it, loss=0.0712, lr=1e-5]Steps:  67%|██████▋   | 10119/15001 [6:30:05<2:32:52,  1.88s/it, loss=0.0219, lr=1e-5]Steps:  67%|██████▋   | 10120/15001 [6:30:07<2:39:51,  1.97s/it, loss=0.0219, lr=1e-5]Steps:  67%|██████▋   | 10120/15001 [6:30:07<2:39:51,  1.97s/it, loss=0.247, lr=1e-5] Steps:  67%|██████▋   | 10121/15001 [6:30:09<2:42:08,  1.99s/it, loss=0.247, lr=1e-5]Steps:  67%|██████▋   | 10121/15001 [6:30:09<2:42:08,  1.99s/it, loss=0.197, lr=1e-5]Steps:  67%|██████▋   | 10122/15001 [6:30:11<2:38:43,  1.95s/it, loss=0.197, lr=1e-5]Steps:  67%|██████▋   | 10122/15001 [6:30:11<2:38:43,  1.95s/it, loss=0.258, lr=1e-5]Steps:  67%|██████▋   | 10123/15001 [6:30:13<2:40:39,  1.98s/it, loss=0.258, lr=1e-5]Steps:  67%|██████▋   | 10123/15001 [6:30:13<2:40:39,  1.98s/it, loss=0.365, lr=1e-5]Steps:  67%|██████▋   | 10124/15001 [6:30:15<2:44:15,  2.02s/it, loss=0.365, lr=1e-5]Steps:  67%|██████▋   | 10124/15001 [6:30:15<2:44:15,  2.02s/it, loss=0.0573, lr=1e-5]Steps:  67%|██████▋   | 10125/15001 [6:30:17<2:38:48,  1.95s/it, loss=0.0573, lr=1e-5]Steps:  67%|██████▋   | 10125/15001 [6:30:17<2:38:48,  1.95s/it, loss=0.122, lr=1e-5] Steps:  68%|██████▊   | 10126/15001 [6:30:19<2:37:18,  1.94s/it, loss=0.122, lr=1e-5]Steps:  68%|██████▊   | 10126/15001 [6:30:19<2:37:18,  1.94s/it, loss=0.264, lr=1e-5]Steps:  68%|██████▊   | 10127/15001 [6:30:20<2:27:10,  1.81s/it, loss=0.264, lr=1e-5]Steps:  68%|██████▊   | 10127/15001 [6:30:21<2:27:10,  1.81s/it, loss=0.0691, lr=1e-5]Steps:  68%|██████▊   | 10128/15001 [6:30:22<2:34:12,  1.90s/it, loss=0.0691, lr=1e-5]Steps:  68%|██████▊   | 10128/15001 [6:30:23<2:34:12,  1.90s/it, loss=0.185, lr=1e-5] Steps:  68%|██████▊   | 10129/15001 [6:30:24<2:31:52,  1.87s/it, loss=0.185, lr=1e-5]Steps:  68%|██████▊   | 10129/15001 [6:30:24<2:31:52,  1.87s/it, loss=0.215, lr=1e-5]Steps:  68%|██████▊   | 10130/15001 [6:30:26<2:28:08,  1.82s/it, loss=0.215, lr=1e-5]Steps:  68%|██████▊   | 10130/15001 [6:30:26<2:28:08,  1.82s/it, loss=0.403, lr=1e-5]Steps:  68%|██████▊   | 10131/15001 [6:30:27<2:22:38,  1.76s/it, loss=0.403, lr=1e-5]Steps:  68%|██████▊   | 10131/15001 [6:30:28<2:22:38,  1.76s/it, loss=0.274, lr=1e-5]Steps:  68%|██████▊   | 10132/15001 [6:30:29<2:28:56,  1.84s/it, loss=0.274, lr=1e-5]Steps:  68%|██████▊   | 10132/15001 [6:30:30<2:28:56,  1.84s/it, loss=0.401, lr=1e-5]Steps:  68%|██████▊   | 10133/15001 [6:30:31<2:27:07,  1.81s/it, loss=0.401, lr=1e-5]Steps:  68%|██████▊   | 10133/15001 [6:30:31<2:27:07,  1.81s/it, loss=0.323, lr=1e-5]Steps:  68%|██████▊   | 10134/15001 [6:30:33<2:31:49,  1.87s/it, loss=0.323, lr=1e-5]Steps:  68%|██████▊   | 10134/15001 [6:30:33<2:31:49,  1.87s/it, loss=0.16, lr=1e-5] Steps:  68%|██████▊   | 10135/15001 [6:30:35<2:26:55,  1.81s/it, loss=0.16, lr=1e-5]Steps:  68%|██████▊   | 10135/15001 [6:30:35<2:26:55,  1.81s/it, loss=0.102, lr=1e-5]Steps:  68%|██████▊   | 10136/15001 [6:30:37<2:29:32,  1.84s/it, loss=0.102, lr=1e-5]Steps:  68%|██████▊   | 10136/15001 [6:30:37<2:29:32,  1.84s/it, loss=0.108, lr=1e-5]Steps:  68%|██████▊   | 10137/15001 [6:30:38<2:23:37,  1.77s/it, loss=0.108, lr=1e-5]Steps:  68%|██████▊   | 10137/15001 [6:30:39<2:23:37,  1.77s/it, loss=0.117, lr=1e-5]Steps:  68%|██████▊   | 10138/15001 [6:30:40<2:22:26,  1.76s/it, loss=0.117, lr=1e-5]Steps:  68%|██████▊   | 10138/15001 [6:30:41<2:22:26,  1.76s/it, loss=0.238, lr=1e-5]Steps:  68%|██████▊   | 10139/15001 [6:30:42<2:27:43,  1.82s/it, loss=0.238, lr=1e-5]Steps:  68%|██████▊   | 10139/15001 [6:30:42<2:27:43,  1.82s/it, loss=0.0538, lr=1e-5]Steps:  68%|██████▊   | 10140/15001 [6:30:44<2:31:20,  1.87s/it, loss=0.0538, lr=1e-5]Steps:  68%|██████▊   | 10140/15001 [6:30:44<2:31:20,  1.87s/it, loss=0.0995, lr=1e-5]Steps:  68%|██████▊   | 10141/15001 [6:30:46<2:28:40,  1.84s/it, loss=0.0995, lr=1e-5]Steps:  68%|██████▊   | 10141/15001 [6:30:46<2:28:40,  1.84s/it, loss=0.254, lr=1e-5] Steps:  68%|██████▊   | 10142/15001 [6:30:48<2:33:28,  1.90s/it, loss=0.254, lr=1e-5]Steps:  68%|██████▊   | 10142/15001 [6:30:48<2:33:28,  1.90s/it, loss=0.0679, lr=1e-5]Steps:  68%|██████▊   | 10143/15001 [6:30:50<2:35:55,  1.93s/it, loss=0.0679, lr=1e-5]Steps:  68%|██████▊   | 10143/15001 [6:30:50<2:35:55,  1.93s/it, loss=0.0566, lr=1e-5]Steps:  68%|██████▊   | 10144/15001 [6:30:52<2:34:55,  1.91s/it, loss=0.0566, lr=1e-5]Steps:  68%|██████▊   | 10144/15001 [6:30:52<2:34:55,  1.91s/it, loss=0.0555, lr=1e-5]Steps:  68%|██████▊   | 10145/15001 [6:30:54<2:38:53,  1.96s/it, loss=0.0555, lr=1e-5]Steps:  68%|██████▊   | 10145/15001 [6:30:54<2:38:53,  1.96s/it, loss=0.25, lr=1e-5]  Steps:  68%|██████▊   | 10146/15001 [6:30:56<2:34:56,  1.91s/it, loss=0.25, lr=1e-5]Steps:  68%|██████▊   | 10146/15001 [6:30:56<2:34:56,  1.91s/it, loss=0.105, lr=1e-5]Steps:  68%|██████▊   | 10147/15001 [6:30:58<2:36:35,  1.94s/it, loss=0.105, lr=1e-5]Steps:  68%|██████▊   | 10147/15001 [6:30:58<2:36:35,  1.94s/it, loss=0.307, lr=1e-5]Steps:  68%|██████▊   | 10148/15001 [6:31:00<2:36:38,  1.94s/it, loss=0.307, lr=1e-5]Steps:  68%|██████▊   | 10148/15001 [6:31:00<2:36:38,  1.94s/it, loss=0.166, lr=1e-5]Steps:  68%|██████▊   | 10149/15001 [6:31:01<2:32:18,  1.88s/it, loss=0.166, lr=1e-5]Steps:  68%|██████▊   | 10149/15001 [6:31:01<2:32:18,  1.88s/it, loss=0.168, lr=1e-5]Steps:  68%|██████▊   | 10150/15001 [6:31:03<2:30:57,  1.87s/it, loss=0.168, lr=1e-5]Steps:  68%|██████▊   | 10150/15001 [6:31:03<2:30:57,  1.87s/it, loss=0.31, lr=1e-5] Steps:  68%|██████▊   | 10151/15001 [6:31:05<2:32:51,  1.89s/it, loss=0.31, lr=1e-5]Steps:  68%|██████▊   | 10151/15001 [6:31:05<2:32:51,  1.89s/it, loss=0.0903, lr=1e-5]Steps:  68%|██████▊   | 10152/15001 [6:31:07<2:32:13,  1.88s/it, loss=0.0903, lr=1e-5]Steps:  68%|██████▊   | 10152/15001 [6:31:07<2:32:13,  1.88s/it, loss=0.109, lr=1e-5] Steps:  68%|██████▊   | 10153/15001 [6:31:09<2:28:21,  1.84s/it, loss=0.109, lr=1e-5]Steps:  68%|██████▊   | 10153/15001 [6:31:09<2:28:21,  1.84s/it, loss=0.132, lr=1e-5]Steps:  68%|██████▊   | 10154/15001 [6:31:10<2:27:15,  1.82s/it, loss=0.132, lr=1e-5]Steps:  68%|██████▊   | 10154/15001 [6:31:11<2:27:15,  1.82s/it, loss=0.231, lr=1e-5]Steps:  68%|██████▊   | 10155/15001 [6:31:12<2:24:55,  1.79s/it, loss=0.231, lr=1e-5]Steps:  68%|██████▊   | 10155/15001 [6:31:12<2:24:55,  1.79s/it, loss=0.164, lr=1e-5]Steps:  68%|██████▊   | 10156/15001 [6:31:14<2:27:01,  1.82s/it, loss=0.164, lr=1e-5]Steps:  68%|██████▊   | 10156/15001 [6:31:14<2:27:01,  1.82s/it, loss=0.111, lr=1e-5]Steps:  68%|██████▊   | 10157/15001 [6:31:16<2:23:56,  1.78s/it, loss=0.111, lr=1e-5]Steps:  68%|██████▊   | 10157/15001 [6:31:16<2:23:56,  1.78s/it, loss=0.201, lr=1e-5]Steps:  68%|██████▊   | 10158/15001 [6:31:18<2:23:19,  1.78s/it, loss=0.201, lr=1e-5]Steps:  68%|██████▊   | 10158/15001 [6:31:18<2:23:19,  1.78s/it, loss=0.191, lr=1e-5]Steps:  68%|██████▊   | 10159/15001 [6:31:20<2:27:44,  1.83s/it, loss=0.191, lr=1e-5]Steps:  68%|██████▊   | 10159/15001 [6:31:20<2:27:44,  1.83s/it, loss=0.254, lr=1e-5]Steps:  68%|██████▊   | 10160/15001 [6:31:21<2:25:10,  1.80s/it, loss=0.254, lr=1e-5]Steps:  68%|██████▊   | 10160/15001 [6:31:21<2:25:10,  1.80s/it, loss=0.141, lr=1e-5]Steps:  68%|██████▊   | 10161/15001 [6:31:23<2:26:12,  1.81s/it, loss=0.141, lr=1e-5]Steps:  68%|██████▊   | 10161/15001 [6:31:23<2:26:12,  1.81s/it, loss=0.0609, lr=1e-5]Steps:  68%|██████▊   | 10162/15001 [6:31:25<2:21:22,  1.75s/it, loss=0.0609, lr=1e-5]Steps:  68%|██████▊   | 10162/15001 [6:31:25<2:21:22,  1.75s/it, loss=0.0792, lr=1e-5]Steps:  68%|██████▊   | 10163/15001 [6:31:27<2:24:47,  1.80s/it, loss=0.0792, lr=1e-5]Steps:  68%|██████▊   | 10163/15001 [6:31:27<2:24:47,  1.80s/it, loss=0.32, lr=1e-5]  Steps:  68%|██████▊   | 10164/15001 [6:31:28<2:23:20,  1.78s/it, loss=0.32, lr=1e-5]Steps:  68%|██████▊   | 10164/15001 [6:31:29<2:23:20,  1.78s/it, loss=0.154, lr=1e-5]Steps:  68%|██████▊   | 10165/15001 [6:31:31<2:33:36,  1.91s/it, loss=0.154, lr=1e-5]Steps:  68%|██████▊   | 10165/15001 [6:31:31<2:33:36,  1.91s/it, loss=0.208, lr=1e-5]Steps:  68%|██████▊   | 10166/15001 [6:31:33<2:38:09,  1.96s/it, loss=0.208, lr=1e-5]Steps:  68%|██████▊   | 10166/15001 [6:31:33<2:38:09,  1.96s/it, loss=0.157, lr=1e-5]Steps:  68%|██████▊   | 10167/15001 [6:31:34<2:33:36,  1.91s/it, loss=0.157, lr=1e-5]Steps:  68%|██████▊   | 10167/15001 [6:31:35<2:33:36,  1.91s/it, loss=0.218, lr=1e-5]Steps:  68%|██████▊   | 10168/15001 [6:31:36<2:36:27,  1.94s/it, loss=0.218, lr=1e-5]Steps:  68%|██████▊   | 10168/15001 [6:31:37<2:36:27,  1.94s/it, loss=0.0729, lr=1e-5]Steps:  68%|██████▊   | 10169/15001 [6:31:38<2:39:11,  1.98s/it, loss=0.0729, lr=1e-5]Steps:  68%|██████▊   | 10169/15001 [6:31:39<2:39:11,  1.98s/it, loss=0.112, lr=1e-5] Steps:  68%|██████▊   | 10170/15001 [6:31:41<2:46:31,  2.07s/it, loss=0.112, lr=1e-5]Steps:  68%|██████▊   | 10170/15001 [6:31:41<2:46:31,  2.07s/it, loss=0.196, lr=1e-5]Steps:  68%|██████▊   | 10171/15001 [6:31:43<2:42:33,  2.02s/it, loss=0.196, lr=1e-5]Steps:  68%|██████▊   | 10171/15001 [6:31:43<2:42:33,  2.02s/it, loss=0.0674, lr=1e-5]Steps:  68%|██████▊   | 10172/15001 [6:31:45<2:41:38,  2.01s/it, loss=0.0674, lr=1e-5]Steps:  68%|██████▊   | 10172/15001 [6:31:45<2:41:38,  2.01s/it, loss=0.148, lr=1e-5] Steps:  68%|██████▊   | 10173/15001 [6:31:46<2:35:28,  1.93s/it, loss=0.148, lr=1e-5]Steps:  68%|██████▊   | 10173/15001 [6:31:47<2:35:28,  1.93s/it, loss=0.256, lr=1e-5]Steps:  68%|██████▊   | 10174/15001 [6:31:48<2:36:04,  1.94s/it, loss=0.256, lr=1e-5]Steps:  68%|██████▊   | 10174/15001 [6:31:48<2:36:04,  1.94s/it, loss=0.17, lr=1e-5] Steps:  68%|██████▊   | 10175/15001 [6:31:50<2:32:09,  1.89s/it, loss=0.17, lr=1e-5]Steps:  68%|██████▊   | 10175/15001 [6:31:50<2:32:09,  1.89s/it, loss=0.124, lr=1e-5]Steps:  68%|██████▊   | 10176/15001 [6:31:52<2:29:45,  1.86s/it, loss=0.124, lr=1e-5]Steps:  68%|██████▊   | 10176/15001 [6:31:52<2:29:45,  1.86s/it, loss=0.0235, lr=1e-5]Steps:  68%|██████▊   | 10177/15001 [6:31:54<2:30:35,  1.87s/it, loss=0.0235, lr=1e-5]Steps:  68%|██████▊   | 10177/15001 [6:31:54<2:30:35,  1.87s/it, loss=0.0545, lr=1e-5]Steps:  68%|██████▊   | 10178/15001 [6:31:56<2:28:24,  1.85s/it, loss=0.0545, lr=1e-5]Steps:  68%|██████▊   | 10178/15001 [6:31:56<2:28:24,  1.85s/it, loss=0.0641, lr=1e-5]Steps:  68%|██████▊   | 10179/15001 [6:31:57<2:19:48,  1.74s/it, loss=0.0641, lr=1e-5]Steps:  68%|██████▊   | 10179/15001 [6:31:57<2:19:48,  1.74s/it, loss=0.232, lr=1e-5] Steps:  68%|██████▊   | 10180/15001 [6:31:59<2:22:58,  1.78s/it, loss=0.232, lr=1e-5]Steps:  68%|██████▊   | 10180/15001 [6:31:59<2:22:58,  1.78s/it, loss=0.063, lr=1e-5]Steps:  68%|██████▊   | 10181/15001 [6:32:01<2:24:01,  1.79s/it, loss=0.063, lr=1e-5]Steps:  68%|██████▊   | 10181/15001 [6:32:01<2:24:01,  1.79s/it, loss=0.0819, lr=1e-5]Steps:  68%|██████▊   | 10182/15001 [6:32:02<2:20:26,  1.75s/it, loss=0.0819, lr=1e-5]Steps:  68%|██████▊   | 10182/15001 [6:32:03<2:20:26,  1.75s/it, loss=0.202, lr=1e-5] Steps:  68%|██████▊   | 10183/15001 [6:32:04<2:25:13,  1.81s/it, loss=0.202, lr=1e-5]Steps:  68%|██████▊   | 10183/15001 [6:32:05<2:25:13,  1.81s/it, loss=0.0846, lr=1e-5]Steps:  68%|██████▊   | 10184/15001 [6:32:06<2:27:05,  1.83s/it, loss=0.0846, lr=1e-5]Steps:  68%|██████▊   | 10184/15001 [6:32:07<2:27:05,  1.83s/it, loss=0.301, lr=1e-5] Steps:  68%|██████▊   | 10185/15001 [6:32:08<2:27:31,  1.84s/it, loss=0.301, lr=1e-5]Steps:  68%|██████▊   | 10185/15001 [6:32:08<2:27:31,  1.84s/it, loss=0.113, lr=1e-5]Steps:  68%|██████▊   | 10186/15001 [6:32:10<2:23:13,  1.78s/it, loss=0.113, lr=1e-5]Steps:  68%|██████▊   | 10186/15001 [6:32:10<2:23:13,  1.78s/it, loss=0.166, lr=1e-5]Steps:  68%|██████▊   | 10187/15001 [6:32:12<2:27:58,  1.84s/it, loss=0.166, lr=1e-5]Steps:  68%|██████▊   | 10187/15001 [6:32:12<2:27:58,  1.84s/it, loss=0.257, lr=1e-5]Steps:  68%|██████▊   | 10188/15001 [6:32:14<2:32:08,  1.90s/it, loss=0.257, lr=1e-5]Steps:  68%|██████▊   | 10188/15001 [6:32:14<2:32:08,  1.90s/it, loss=0.0614, lr=1e-5]Steps:  68%|██████▊   | 10189/15001 [6:32:16<2:42:18,  2.02s/it, loss=0.0614, lr=1e-5]Steps:  68%|██████▊   | 10189/15001 [6:32:16<2:42:18,  2.02s/it, loss=0.0588, lr=1e-5]Steps:  68%|██████▊   | 10190/15001 [6:32:18<2:38:09,  1.97s/it, loss=0.0588, lr=1e-5]Steps:  68%|██████▊   | 10190/15001 [6:32:18<2:38:09,  1.97s/it, loss=0.14, lr=1e-5]  Steps:  68%|██████▊   | 10191/15001 [6:32:20<2:42:45,  2.03s/it, loss=0.14, lr=1e-5]Steps:  68%|██████▊   | 10191/15001 [6:32:20<2:42:45,  2.03s/it, loss=0.228, lr=1e-5]Steps:  68%|██████▊   | 10192/15001 [6:32:22<2:38:22,  1.98s/it, loss=0.228, lr=1e-5]Steps:  68%|██████▊   | 10192/15001 [6:32:22<2:38:22,  1.98s/it, loss=0.0804, lr=1e-5]Steps:  68%|██████▊   | 10193/15001 [6:32:24<2:39:28,  1.99s/it, loss=0.0804, lr=1e-5]Steps:  68%|██████▊   | 10193/15001 [6:32:24<2:39:28,  1.99s/it, loss=0.147, lr=1e-5] Steps:  68%|██████▊   | 10194/15001 [6:32:26<2:35:23,  1.94s/it, loss=0.147, lr=1e-5]Steps:  68%|██████▊   | 10194/15001 [6:32:26<2:35:23,  1.94s/it, loss=0.241, lr=1e-5]Steps:  68%|██████▊   | 10195/15001 [6:32:28<2:35:44,  1.94s/it, loss=0.241, lr=1e-5]Steps:  68%|██████▊   | 10195/15001 [6:32:28<2:35:44,  1.94s/it, loss=0.105, lr=1e-5]Steps:  68%|██████▊   | 10196/15001 [6:32:30<2:34:56,  1.93s/it, loss=0.105, lr=1e-5]Steps:  68%|██████▊   | 10196/15001 [6:32:30<2:34:56,  1.93s/it, loss=0.0989, lr=1e-5]Steps:  68%|██████▊   | 10197/15001 [6:32:31<2:31:18,  1.89s/it, loss=0.0989, lr=1e-5]Steps:  68%|██████▊   | 10197/15001 [6:32:32<2:31:18,  1.89s/it, loss=0.0302, lr=1e-5]Steps:  68%|██████▊   | 10198/15001 [6:32:33<2:28:17,  1.85s/it, loss=0.0302, lr=1e-5]Steps:  68%|██████▊   | 10198/15001 [6:32:33<2:28:17,  1.85s/it, loss=0.161, lr=1e-5] Steps:  68%|██████▊   | 10199/15001 [6:32:35<2:25:26,  1.82s/it, loss=0.161, lr=1e-5]Steps:  68%|██████▊   | 10199/15001 [6:32:35<2:25:26,  1.82s/it, loss=0.0675, lr=1e-5]Steps:  68%|██████▊   | 10200/15001 [6:32:37<2:20:42,  1.76s/it, loss=0.0675, lr=1e-5]Steps:  68%|██████▊   | 10200/15001 [6:32:37<2:20:42,  1.76s/it, loss=0.354, lr=1e-5] Steps:  68%|██████▊   | 10201/15001 [6:32:39<2:29:07,  1.86s/it, loss=0.354, lr=1e-5]Steps:  68%|██████▊   | 10201/15001 [6:32:39<2:29:07,  1.86s/it, loss=0.251, lr=1e-5]Steps:  68%|██████▊   | 10202/15001 [6:32:40<2:23:35,  1.80s/it, loss=0.251, lr=1e-5]Steps:  68%|██████▊   | 10202/15001 [6:32:41<2:23:35,  1.80s/it, loss=0.144, lr=1e-5]Steps:  68%|██████▊   | 10203/15001 [6:32:42<2:28:39,  1.86s/it, loss=0.144, lr=1e-5]Steps:  68%|██████▊   | 10203/15001 [6:32:42<2:28:39,  1.86s/it, loss=0.196, lr=1e-5]Steps:  68%|██████▊   | 10204/15001 [6:32:44<2:26:38,  1.83s/it, loss=0.196, lr=1e-5]Steps:  68%|██████▊   | 10204/15001 [6:32:44<2:26:38,  1.83s/it, loss=0.125, lr=1e-5]Steps:  68%|██████▊   | 10205/15001 [6:32:46<2:20:03,  1.75s/it, loss=0.125, lr=1e-5]Steps:  68%|██████▊   | 10205/15001 [6:32:46<2:20:03,  1.75s/it, loss=0.164, lr=1e-5]Steps:  68%|██████▊   | 10206/15001 [6:32:47<2:20:36,  1.76s/it, loss=0.164, lr=1e-5]Steps:  68%|██████▊   | 10206/15001 [6:32:48<2:20:36,  1.76s/it, loss=0.442, lr=1e-5]Steps:  68%|██████▊   | 10207/15001 [6:32:50<2:27:30,  1.85s/it, loss=0.442, lr=1e-5]Steps:  68%|██████▊   | 10207/15001 [6:32:50<2:27:30,  1.85s/it, loss=0.209, lr=1e-5]Steps:  68%|██████▊   | 10208/15001 [6:32:51<2:26:25,  1.83s/it, loss=0.209, lr=1e-5]Steps:  68%|██████▊   | 10208/15001 [6:32:51<2:26:25,  1.83s/it, loss=0.289, lr=1e-5]Steps:  68%|██████▊   | 10209/15001 [6:32:53<2:24:46,  1.81s/it, loss=0.289, lr=1e-5]Steps:  68%|██████▊   | 10209/15001 [6:32:53<2:24:46,  1.81s/it, loss=0.292, lr=1e-5]Steps:  68%|██████▊   | 10210/15001 [6:32:55<2:28:31,  1.86s/it, loss=0.292, lr=1e-5]Steps:  68%|██████▊   | 10210/15001 [6:32:55<2:28:31,  1.86s/it, loss=0.0822, lr=1e-5]Steps:  68%|██████▊   | 10211/15001 [6:32:57<2:29:55,  1.88s/it, loss=0.0822, lr=1e-5]Steps:  68%|██████▊   | 10211/15001 [6:32:57<2:29:55,  1.88s/it, loss=0.166, lr=1e-5] Steps:  68%|██████▊   | 10212/15001 [6:32:59<2:27:42,  1.85s/it, loss=0.166, lr=1e-5]Steps:  68%|██████▊   | 10212/15001 [6:32:59<2:27:42,  1.85s/it, loss=0.188, lr=1e-5]Steps:  68%|██████▊   | 10213/15001 [6:33:01<2:30:31,  1.89s/it, loss=0.188, lr=1e-5]Steps:  68%|██████▊   | 10213/15001 [6:33:01<2:30:31,  1.89s/it, loss=0.17, lr=1e-5] Steps:  68%|██████▊   | 10214/15001 [6:33:03<2:40:03,  2.01s/it, loss=0.17, lr=1e-5]Steps:  68%|██████▊   | 10214/15001 [6:33:03<2:40:03,  2.01s/it, loss=0.192, lr=1e-5]Steps:  68%|██████▊   | 10215/15001 [6:33:05<2:41:03,  2.02s/it, loss=0.192, lr=1e-5]Steps:  68%|██████▊   | 10215/15001 [6:33:05<2:41:03,  2.02s/it, loss=0.0813, lr=1e-5]Steps:  68%|██████▊   | 10216/15001 [6:33:07<2:37:33,  1.98s/it, loss=0.0813, lr=1e-5]Steps:  68%|██████▊   | 10216/15001 [6:33:07<2:37:33,  1.98s/it, loss=0.0404, lr=1e-5]Steps:  68%|██████▊   | 10217/15001 [6:33:09<2:30:18,  1.89s/it, loss=0.0404, lr=1e-5]Steps:  68%|██████▊   | 10217/15001 [6:33:09<2:30:18,  1.89s/it, loss=0.0745, lr=1e-5]Steps:  68%|██████▊   | 10218/15001 [6:33:10<2:25:56,  1.83s/it, loss=0.0745, lr=1e-5]Steps:  68%|██████▊   | 10218/15001 [6:33:11<2:25:56,  1.83s/it, loss=0.0399, lr=1e-5]Steps:  68%|██████▊   | 10219/15001 [6:33:12<2:31:10,  1.90s/it, loss=0.0399, lr=1e-5]Steps:  68%|██████▊   | 10219/15001 [6:33:12<2:31:10,  1.90s/it, loss=0.1, lr=1e-5]   Steps:  68%|██████▊   | 10220/15001 [6:33:14<2:27:15,  1.85s/it, loss=0.1, lr=1e-5]Steps:  68%|██████▊   | 10220/15001 [6:33:14<2:27:15,  1.85s/it, loss=0.0707, lr=1e-5]Steps:  68%|██████▊   | 10221/15001 [6:33:16<2:25:07,  1.82s/it, loss=0.0707, lr=1e-5]Steps:  68%|██████▊   | 10221/15001 [6:33:16<2:25:07,  1.82s/it, loss=0.34, lr=1e-5]  Steps:  68%|██████▊   | 10222/15001 [6:33:18<2:27:31,  1.85s/it, loss=0.34, lr=1e-5]Steps:  68%|██████▊   | 10222/15001 [6:33:18<2:27:31,  1.85s/it, loss=0.13, lr=1e-5]Steps:  68%|██████▊   | 10223/15001 [6:33:20<2:30:19,  1.89s/it, loss=0.13, lr=1e-5]Steps:  68%|██████▊   | 10223/15001 [6:33:20<2:30:19,  1.89s/it, loss=0.0778, lr=1e-5]Steps:  68%|██████▊   | 10224/15001 [6:33:21<2:25:10,  1.82s/it, loss=0.0778, lr=1e-5]Steps:  68%|██████▊   | 10224/15001 [6:33:22<2:25:10,  1.82s/it, loss=0.171, lr=1e-5] Steps:  68%|██████▊   | 10225/15001 [6:33:23<2:21:47,  1.78s/it, loss=0.171, lr=1e-5]Steps:  68%|██████▊   | 10225/15001 [6:33:24<2:21:47,  1.78s/it, loss=0.0192, lr=1e-5]Steps:  68%|██████▊   | 10226/15001 [6:33:25<2:26:18,  1.84s/it, loss=0.0192, lr=1e-5]Steps:  68%|██████▊   | 10226/15001 [6:33:25<2:26:18,  1.84s/it, loss=0.188, lr=1e-5] Steps:  68%|██████▊   | 10227/15001 [6:33:27<2:26:33,  1.84s/it, loss=0.188, lr=1e-5]Steps:  68%|██████▊   | 10227/15001 [6:33:27<2:26:33,  1.84s/it, loss=0.14, lr=1e-5] Steps:  68%|██████▊   | 10228/15001 [6:33:29<2:28:06,  1.86s/it, loss=0.14, lr=1e-5]Steps:  68%|██████▊   | 10228/15001 [6:33:29<2:28:06,  1.86s/it, loss=0.362, lr=1e-5]Steps:  68%|██████▊   | 10229/15001 [6:33:31<2:27:56,  1.86s/it, loss=0.362, lr=1e-5]Steps:  68%|██████▊   | 10229/15001 [6:33:31<2:27:56,  1.86s/it, loss=0.276, lr=1e-5]Steps:  68%|██████▊   | 10230/15001 [6:33:33<2:30:10,  1.89s/it, loss=0.276, lr=1e-5]Steps:  68%|██████▊   | 10230/15001 [6:33:33<2:30:10,  1.89s/it, loss=0.283, lr=1e-5]Steps:  68%|██████▊   | 10231/15001 [6:33:34<2:27:51,  1.86s/it, loss=0.283, lr=1e-5]Steps:  68%|██████▊   | 10231/15001 [6:33:35<2:27:51,  1.86s/it, loss=0.082, lr=1e-5]Steps:  68%|██████▊   | 10232/15001 [6:33:36<2:27:02,  1.85s/it, loss=0.082, lr=1e-5]Steps:  68%|██████▊   | 10232/15001 [6:33:36<2:27:02,  1.85s/it, loss=0.232, lr=1e-5]Steps:  68%|██████▊   | 10233/15001 [6:33:38<2:27:29,  1.86s/it, loss=0.232, lr=1e-5]Steps:  68%|██████▊   | 10233/15001 [6:33:38<2:27:29,  1.86s/it, loss=0.119, lr=1e-5]Steps:  68%|██████▊   | 10234/15001 [6:33:40<2:30:23,  1.89s/it, loss=0.119, lr=1e-5]Steps:  68%|██████▊   | 10234/15001 [6:33:40<2:30:23,  1.89s/it, loss=0.186, lr=1e-5]Steps:  68%|██████▊   | 10235/15001 [6:33:42<2:27:11,  1.85s/it, loss=0.186, lr=1e-5]Steps:  68%|██████▊   | 10235/15001 [6:33:42<2:27:11,  1.85s/it, loss=0.242, lr=1e-5]Steps:  68%|██████▊   | 10236/15001 [6:33:44<2:32:50,  1.92s/it, loss=0.242, lr=1e-5]Steps:  68%|██████▊   | 10236/15001 [6:33:44<2:32:50,  1.92s/it, loss=0.147, lr=1e-5]Steps:  68%|██████▊   | 10237/15001 [6:33:46<2:35:26,  1.96s/it, loss=0.147, lr=1e-5]Steps:  68%|██████▊   | 10237/15001 [6:33:46<2:35:26,  1.96s/it, loss=0.257, lr=1e-5]Steps:  68%|██████▊   | 10238/15001 [6:33:48<2:31:47,  1.91s/it, loss=0.257, lr=1e-5]Steps:  68%|██████▊   | 10238/15001 [6:33:48<2:31:47,  1.91s/it, loss=0.112, lr=1e-5]Steps:  68%|██████▊   | 10239/15001 [6:33:50<2:29:01,  1.88s/it, loss=0.112, lr=1e-5]Steps:  68%|██████▊   | 10239/15001 [6:33:50<2:29:01,  1.88s/it, loss=0.229, lr=1e-5]Steps:  68%|██████▊   | 10240/15001 [6:33:51<2:27:22,  1.86s/it, loss=0.229, lr=1e-5]Steps:  68%|██████▊   | 10240/15001 [6:33:52<2:27:22,  1.86s/it, loss=0.082, lr=1e-5]Steps:  68%|██████▊   | 10241/15001 [6:33:53<2:29:55,  1.89s/it, loss=0.082, lr=1e-5]Steps:  68%|██████▊   | 10241/15001 [6:33:54<2:29:55,  1.89s/it, loss=0.0361, lr=1e-5]Steps:  68%|██████▊   | 10242/15001 [6:33:55<2:31:28,  1.91s/it, loss=0.0361, lr=1e-5]Steps:  68%|██████▊   | 10242/15001 [6:33:55<2:31:28,  1.91s/it, loss=0.111, lr=1e-5] Steps:  68%|██████▊   | 10243/15001 [6:33:57<2:28:25,  1.87s/it, loss=0.111, lr=1e-5]Steps:  68%|██████▊   | 10243/15001 [6:33:57<2:28:25,  1.87s/it, loss=0.163, lr=1e-5]Steps:  68%|██████▊   | 10244/15001 [6:33:59<2:22:25,  1.80s/it, loss=0.163, lr=1e-5]Steps:  68%|██████▊   | 10244/15001 [6:33:59<2:22:25,  1.80s/it, loss=0.169, lr=1e-5]Steps:  68%|██████▊   | 10245/15001 [6:34:01<2:22:21,  1.80s/it, loss=0.169, lr=1e-5]Steps:  68%|██████▊   | 10245/15001 [6:34:01<2:22:21,  1.80s/it, loss=0.0558, lr=1e-5]Steps:  68%|██████▊   | 10246/15001 [6:34:02<2:24:29,  1.82s/it, loss=0.0558, lr=1e-5]Steps:  68%|██████▊   | 10246/15001 [6:34:03<2:24:29,  1.82s/it, loss=0.119, lr=1e-5] Steps:  68%|██████▊   | 10247/15001 [6:34:04<2:25:54,  1.84s/it, loss=0.119, lr=1e-5]Steps:  68%|██████▊   | 10247/15001 [6:34:04<2:25:54,  1.84s/it, loss=0.0939, lr=1e-5]Steps:  68%|██████▊   | 10248/15001 [6:34:06<2:19:49,  1.77s/it, loss=0.0939, lr=1e-5]Steps:  68%|██████▊   | 10248/15001 [6:34:06<2:19:49,  1.77s/it, loss=0.142, lr=1e-5] Steps:  68%|██████▊   | 10249/15001 [6:34:08<2:27:55,  1.87s/it, loss=0.142, lr=1e-5]Steps:  68%|██████▊   | 10249/15001 [6:34:08<2:27:55,  1.87s/it, loss=0.194, lr=1e-5]Steps:  68%|██████▊   | 10250/15001 [6:34:10<2:21:31,  1.79s/it, loss=0.194, lr=1e-5]Steps:  68%|██████▊   | 10250/15001 [6:34:10<2:21:31,  1.79s/it, loss=0.146, lr=1e-5]Steps:  68%|██████▊   | 10251/15001 [6:34:11<2:22:14,  1.80s/it, loss=0.146, lr=1e-5]Steps:  68%|██████▊   | 10251/15001 [6:34:12<2:22:14,  1.80s/it, loss=0.217, lr=1e-5]Steps:  68%|██████▊   | 10252/15001 [6:34:14<2:28:44,  1.88s/it, loss=0.217, lr=1e-5]Steps:  68%|██████▊   | 10252/15001 [6:34:14<2:28:44,  1.88s/it, loss=0.0785, lr=1e-5]Steps:  68%|██████▊   | 10253/15001 [6:34:15<2:21:24,  1.79s/it, loss=0.0785, lr=1e-5]Steps:  68%|██████▊   | 10253/15001 [6:34:15<2:21:24,  1.79s/it, loss=0.231, lr=1e-5] Steps:  68%|██████▊   | 10254/15001 [6:34:17<2:21:25,  1.79s/it, loss=0.231, lr=1e-5]Steps:  68%|██████▊   | 10254/15001 [6:34:17<2:21:25,  1.79s/it, loss=0.242, lr=1e-5]Steps:  68%|██████▊   | 10255/15001 [6:34:19<2:20:17,  1.77s/it, loss=0.242, lr=1e-5]Steps:  68%|██████▊   | 10255/15001 [6:34:19<2:20:17,  1.77s/it, loss=0.144, lr=1e-5]Steps:  68%|██████▊   | 10256/15001 [6:34:21<2:24:48,  1.83s/it, loss=0.144, lr=1e-5]Steps:  68%|██████▊   | 10256/15001 [6:34:21<2:24:48,  1.83s/it, loss=0.407, lr=1e-5]Steps:  68%|██████▊   | 10257/15001 [6:34:23<2:33:47,  1.95s/it, loss=0.407, lr=1e-5]Steps:  68%|██████▊   | 10257/15001 [6:34:23<2:33:47,  1.95s/it, loss=0.0337, lr=1e-5]Steps:  68%|██████▊   | 10258/15001 [6:34:25<2:38:38,  2.01s/it, loss=0.0337, lr=1e-5]Steps:  68%|██████▊   | 10258/15001 [6:34:25<2:38:38,  2.01s/it, loss=0.271, lr=1e-5] Steps:  68%|██████▊   | 10259/15001 [6:34:27<2:31:20,  1.91s/it, loss=0.271, lr=1e-5]Steps:  68%|██████▊   | 10259/15001 [6:34:27<2:31:20,  1.91s/it, loss=0.127, lr=1e-5]Steps:  68%|██████▊   | 10260/15001 [6:34:29<2:41:35,  2.05s/it, loss=0.127, lr=1e-5]Steps:  68%|██████▊   | 10260/15001 [6:34:29<2:41:35,  2.05s/it, loss=0.243, lr=1e-5]Steps:  68%|██████▊   | 10261/15001 [6:34:31<2:36:49,  1.99s/it, loss=0.243, lr=1e-5]Steps:  68%|██████▊   | 10261/15001 [6:34:31<2:36:49,  1.99s/it, loss=0.0201, lr=1e-5]Steps:  68%|██████▊   | 10262/15001 [6:34:33<2:35:48,  1.97s/it, loss=0.0201, lr=1e-5]Steps:  68%|██████▊   | 10262/15001 [6:34:33<2:35:48,  1.97s/it, loss=0.346, lr=1e-5] Steps:  68%|██████▊   | 10263/15001 [6:34:35<2:29:44,  1.90s/it, loss=0.346, lr=1e-5]Steps:  68%|██████▊   | 10263/15001 [6:34:35<2:29:44,  1.90s/it, loss=0.145, lr=1e-5]Steps:  68%|██████▊   | 10264/15001 [6:34:36<2:25:52,  1.85s/it, loss=0.145, lr=1e-5]Steps:  68%|██████▊   | 10264/15001 [6:34:36<2:25:52,  1.85s/it, loss=0.344, lr=1e-5]Steps:  68%|██████▊   | 10265/15001 [6:34:38<2:30:00,  1.90s/it, loss=0.344, lr=1e-5]Steps:  68%|██████▊   | 10265/15001 [6:34:38<2:30:00,  1.90s/it, loss=0.268, lr=1e-5]Steps:  68%|██████▊   | 10266/15001 [6:34:40<2:28:39,  1.88s/it, loss=0.268, lr=1e-5]Steps:  68%|██████▊   | 10266/15001 [6:34:40<2:28:39,  1.88s/it, loss=0.0344, lr=1e-5]Steps:  68%|██████▊   | 10267/15001 [6:34:42<2:22:57,  1.81s/it, loss=0.0344, lr=1e-5]Steps:  68%|██████▊   | 10267/15001 [6:34:42<2:22:57,  1.81s/it, loss=0.218, lr=1e-5] Steps:  68%|██████▊   | 10268/15001 [6:34:44<2:25:22,  1.84s/it, loss=0.218, lr=1e-5]Steps:  68%|██████▊   | 10268/15001 [6:34:44<2:25:22,  1.84s/it, loss=0.205, lr=1e-5]Steps:  68%|██████▊   | 10269/15001 [6:34:45<2:23:50,  1.82s/it, loss=0.205, lr=1e-5]Steps:  68%|██████▊   | 10269/15001 [6:34:46<2:23:50,  1.82s/it, loss=0.129, lr=1e-5]Steps:  68%|██████▊   | 10270/15001 [6:34:47<2:24:25,  1.83s/it, loss=0.129, lr=1e-5]Steps:  68%|██████▊   | 10270/15001 [6:34:47<2:24:25,  1.83s/it, loss=0.0753, lr=1e-5]Steps:  68%|██████▊   | 10271/15001 [6:34:49<2:20:00,  1.78s/it, loss=0.0753, lr=1e-5]Steps:  68%|██████▊   | 10271/15001 [6:34:49<2:20:00,  1.78s/it, loss=0.2, lr=1e-5]   Steps:  68%|██████▊   | 10272/15001 [6:34:51<2:24:26,  1.83s/it, loss=0.2, lr=1e-5]Steps:  68%|██████▊   | 10272/15001 [6:34:51<2:24:26,  1.83s/it, loss=0.0661, lr=1e-5]Steps:  68%|██████▊   | 10273/15001 [6:34:53<2:22:10,  1.80s/it, loss=0.0661, lr=1e-5]Steps:  68%|██████▊   | 10273/15001 [6:34:53<2:22:10,  1.80s/it, loss=0.257, lr=1e-5] Steps:  68%|██████▊   | 10274/15001 [6:34:55<2:25:49,  1.85s/it, loss=0.257, lr=1e-5]Steps:  68%|██████▊   | 10274/15001 [6:34:55<2:25:49,  1.85s/it, loss=0.268, lr=1e-5]Steps:  68%|██████▊   | 10275/15001 [6:34:56<2:23:18,  1.82s/it, loss=0.268, lr=1e-5]Steps:  68%|██████▊   | 10275/15001 [6:34:57<2:23:18,  1.82s/it, loss=0.0939, lr=1e-5]Steps:  69%|██████▊   | 10276/15001 [6:34:59<2:31:20,  1.92s/it, loss=0.0939, lr=1e-5]Steps:  69%|██████▊   | 10276/15001 [6:34:59<2:31:20,  1.92s/it, loss=0.0932, lr=1e-5]Steps:  69%|██████▊   | 10277/15001 [6:35:00<2:28:53,  1.89s/it, loss=0.0932, lr=1e-5]Steps:  69%|██████▊   | 10277/15001 [6:35:01<2:28:53,  1.89s/it, loss=0.333, lr=1e-5] Steps:  69%|██████▊   | 10278/15001 [6:35:02<2:23:11,  1.82s/it, loss=0.333, lr=1e-5]Steps:  69%|██████▊   | 10278/15001 [6:35:02<2:23:11,  1.82s/it, loss=0.096, lr=1e-5]Steps:  69%|██████▊   | 10279/15001 [6:35:04<2:30:25,  1.91s/it, loss=0.096, lr=1e-5]Steps:  69%|██████▊   | 10279/15001 [6:35:04<2:30:25,  1.91s/it, loss=0.0942, lr=1e-5]Steps:  69%|██████▊   | 10280/15001 [6:35:06<2:33:08,  1.95s/it, loss=0.0942, lr=1e-5]Steps:  69%|██████▊   | 10280/15001 [6:35:06<2:33:08,  1.95s/it, loss=0.219, lr=1e-5] Steps:  69%|██████▊   | 10281/15001 [6:35:08<2:31:12,  1.92s/it, loss=0.219, lr=1e-5]Steps:  69%|██████▊   | 10281/15001 [6:35:08<2:31:12,  1.92s/it, loss=0.0853, lr=1e-5]Steps:  69%|██████▊   | 10282/15001 [6:35:10<2:36:02,  1.98s/it, loss=0.0853, lr=1e-5]Steps:  69%|██████▊   | 10282/15001 [6:35:10<2:36:02,  1.98s/it, loss=0.145, lr=1e-5] Steps:  69%|██████▊   | 10283/15001 [6:35:12<2:35:16,  1.97s/it, loss=0.145, lr=1e-5]Steps:  69%|██████▊   | 10283/15001 [6:35:12<2:35:16,  1.97s/it, loss=0.0643, lr=1e-5]Steps:  69%|██████▊   | 10284/15001 [6:35:14<2:34:44,  1.97s/it, loss=0.0643, lr=1e-5]Steps:  69%|██████▊   | 10284/15001 [6:35:14<2:34:44,  1.97s/it, loss=0.0744, lr=1e-5]Steps:  69%|██████▊   | 10285/15001 [6:35:16<2:36:58,  2.00s/it, loss=0.0744, lr=1e-5]Steps:  69%|██████▊   | 10285/15001 [6:35:16<2:36:58,  2.00s/it, loss=0.139, lr=1e-5] Steps:  69%|██████▊   | 10286/15001 [6:35:18<2:32:46,  1.94s/it, loss=0.139, lr=1e-5]Steps:  69%|██████▊   | 10286/15001 [6:35:18<2:32:46,  1.94s/it, loss=0.241, lr=1e-5]Steps:  69%|██████▊   | 10287/15001 [6:35:20<2:27:31,  1.88s/it, loss=0.241, lr=1e-5]Steps:  69%|██████▊   | 10287/15001 [6:35:20<2:27:31,  1.88s/it, loss=0.0638, lr=1e-5]Steps:  69%|██████▊   | 10288/15001 [6:35:21<2:25:30,  1.85s/it, loss=0.0638, lr=1e-5]Steps:  69%|██████▊   | 10288/15001 [6:35:22<2:25:30,  1.85s/it, loss=0.165, lr=1e-5] Steps:  69%|██████▊   | 10289/15001 [6:35:23<2:27:19,  1.88s/it, loss=0.165, lr=1e-5]Steps:  69%|██████▊   | 10289/15001 [6:35:23<2:27:19,  1.88s/it, loss=0.304, lr=1e-5]Steps:  69%|██████▊   | 10290/15001 [6:35:25<2:22:14,  1.81s/it, loss=0.304, lr=1e-5]Steps:  69%|██████▊   | 10290/15001 [6:35:25<2:22:14,  1.81s/it, loss=0.17, lr=1e-5] Steps:  69%|██████▊   | 10291/15001 [6:35:27<2:22:29,  1.82s/it, loss=0.17, lr=1e-5]Steps:  69%|██████▊   | 10291/15001 [6:35:27<2:22:29,  1.82s/it, loss=0.162, lr=1e-5]Steps:  69%|██████▊   | 10292/15001 [6:35:29<2:28:17,  1.89s/it, loss=0.162, lr=1e-5]Steps:  69%|██████▊   | 10292/15001 [6:35:29<2:28:17,  1.89s/it, loss=0.126, lr=1e-5]Steps:  69%|██████▊   | 10293/15001 [6:35:31<2:23:49,  1.83s/it, loss=0.126, lr=1e-5]Steps:  69%|██████▊   | 10293/15001 [6:35:31<2:23:49,  1.83s/it, loss=0.173, lr=1e-5]Steps:  69%|██████▊   | 10294/15001 [6:35:32<2:19:39,  1.78s/it, loss=0.173, lr=1e-5]Steps:  69%|██████▊   | 10294/15001 [6:35:33<2:19:39,  1.78s/it, loss=0.0967, lr=1e-5]Steps:  69%|██████▊   | 10295/15001 [6:35:34<2:22:00,  1.81s/it, loss=0.0967, lr=1e-5]Steps:  69%|██████▊   | 10295/15001 [6:35:34<2:22:00,  1.81s/it, loss=0.0207, lr=1e-5]Steps:  69%|██████▊   | 10296/15001 [6:35:36<2:25:14,  1.85s/it, loss=0.0207, lr=1e-5]Steps:  69%|██████▊   | 10296/15001 [6:35:36<2:25:14,  1.85s/it, loss=0.166, lr=1e-5] Steps:  69%|██████▊   | 10297/15001 [6:35:38<2:23:59,  1.84s/it, loss=0.166, lr=1e-5]Steps:  69%|██████▊   | 10297/15001 [6:35:38<2:23:59,  1.84s/it, loss=0.0977, lr=1e-5]Steps:  69%|██████▊   | 10298/15001 [6:35:40<2:23:23,  1.83s/it, loss=0.0977, lr=1e-5]Steps:  69%|██████▊   | 10298/15001 [6:35:40<2:23:23,  1.83s/it, loss=0.243, lr=1e-5] Steps:  69%|██████▊   | 10299/15001 [6:35:41<2:20:58,  1.80s/it, loss=0.243, lr=1e-5]Steps:  69%|██████▊   | 10299/15001 [6:35:42<2:20:58,  1.80s/it, loss=0.0937, lr=1e-5]Steps:  69%|██████▊   | 10300/15001 [6:35:43<2:14:55,  1.72s/it, loss=0.0937, lr=1e-5]Steps:  69%|██████▊   | 10300/15001 [6:35:43<2:14:55,  1.72s/it, loss=0.204, lr=1e-5] Steps:  69%|██████▊   | 10301/15001 [6:35:45<2:25:24,  1.86s/it, loss=0.204, lr=1e-5]Steps:  69%|██████▊   | 10301/15001 [6:35:45<2:25:24,  1.86s/it, loss=0.156, lr=1e-5]Steps:  69%|██████▊   | 10302/15001 [6:35:47<2:25:24,  1.86s/it, loss=0.156, lr=1e-5]Steps:  69%|██████▊   | 10302/15001 [6:35:47<2:25:24,  1.86s/it, loss=0.135, lr=1e-5]Steps:  69%|██████▊   | 10303/15001 [6:35:49<2:25:30,  1.86s/it, loss=0.135, lr=1e-5]Steps:  69%|██████▊   | 10303/15001 [6:35:49<2:25:30,  1.86s/it, loss=0.183, lr=1e-5]Steps:  69%|██████▊   | 10304/15001 [6:35:51<2:28:43,  1.90s/it, loss=0.183, lr=1e-5]Steps:  69%|██████▊   | 10304/15001 [6:35:51<2:28:43,  1.90s/it, loss=0.209, lr=1e-5]Steps:  69%|██████▊   | 10305/15001 [6:35:53<2:33:30,  1.96s/it, loss=0.209, lr=1e-5]Steps:  69%|██████▊   | 10305/15001 [6:35:53<2:33:30,  1.96s/it, loss=0.141, lr=1e-5]Steps:  69%|██████▊   | 10306/15001 [6:35:55<2:33:47,  1.97s/it, loss=0.141, lr=1e-5]Steps:  69%|██████▊   | 10306/15001 [6:35:55<2:33:47,  1.97s/it, loss=0.23, lr=1e-5] Steps:  69%|██████▊   | 10307/15001 [6:35:57<2:28:31,  1.90s/it, loss=0.23, lr=1e-5]Steps:  69%|██████▊   | 10307/15001 [6:35:57<2:28:31,  1.90s/it, loss=0.138, lr=1e-5]Steps:  69%|██████▊   | 10308/15001 [6:35:59<2:31:38,  1.94s/it, loss=0.138, lr=1e-5]Steps:  69%|██████▊   | 10308/15001 [6:35:59<2:31:38,  1.94s/it, loss=0.38, lr=1e-5] Steps:  69%|██████▊   | 10309/15001 [6:36:00<2:25:58,  1.87s/it, loss=0.38, lr=1e-5]Steps:  69%|██████▊   | 10309/15001 [6:36:01<2:25:58,  1.87s/it, loss=0.186, lr=1e-5]Steps:  69%|██████▊   | 10310/15001 [6:36:02<2:21:09,  1.81s/it, loss=0.186, lr=1e-5]Steps:  69%|██████▊   | 10310/15001 [6:36:02<2:21:09,  1.81s/it, loss=0.145, lr=1e-5]Steps:  69%|██████▊   | 10311/15001 [6:36:04<2:26:34,  1.88s/it, loss=0.145, lr=1e-5]Steps:  69%|██████▊   | 10311/15001 [6:36:04<2:26:34,  1.88s/it, loss=0.142, lr=1e-5]Steps:  69%|██████▊   | 10312/15001 [6:36:06<2:25:48,  1.87s/it, loss=0.142, lr=1e-5]Steps:  69%|██████▊   | 10312/15001 [6:36:06<2:25:48,  1.87s/it, loss=0.092, lr=1e-5]Steps:  69%|██████▊   | 10313/15001 [6:36:08<2:19:20,  1.78s/it, loss=0.092, lr=1e-5]Steps:  69%|██████▊   | 10313/15001 [6:36:08<2:19:20,  1.78s/it, loss=0.11, lr=1e-5] Steps:  69%|██████▉   | 10314/15001 [6:36:09<2:21:51,  1.82s/it, loss=0.11, lr=1e-5]Steps:  69%|██████▉   | 10314/15001 [6:36:10<2:21:51,  1.82s/it, loss=0.0967, lr=1e-5]Steps:  69%|██████▉   | 10315/15001 [6:36:11<2:18:34,  1.77s/it, loss=0.0967, lr=1e-5]Steps:  69%|██████▉   | 10315/15001 [6:36:11<2:18:34,  1.77s/it, loss=0.174, lr=1e-5] Steps:  69%|██████▉   | 10316/15001 [6:36:13<2:23:59,  1.84s/it, loss=0.174, lr=1e-5]Steps:  69%|██████▉   | 10316/15001 [6:36:13<2:23:59,  1.84s/it, loss=0.278, lr=1e-5]Steps:  69%|██████▉   | 10317/15001 [6:36:15<2:19:20,  1.78s/it, loss=0.278, lr=1e-5]Steps:  69%|██████▉   | 10317/15001 [6:36:15<2:19:20,  1.78s/it, loss=0.0613, lr=1e-5]Steps:  69%|██████▉   | 10318/15001 [6:36:17<2:22:08,  1.82s/it, loss=0.0613, lr=1e-5]Steps:  69%|██████▉   | 10318/15001 [6:36:17<2:22:08,  1.82s/it, loss=0.193, lr=1e-5] Steps:  69%|██████▉   | 10319/15001 [6:36:18<2:17:38,  1.76s/it, loss=0.193, lr=1e-5]Steps:  69%|██████▉   | 10319/15001 [6:36:18<2:17:38,  1.76s/it, loss=0.0728, lr=1e-5]Steps:  69%|██████▉   | 10320/15001 [6:36:20<2:21:13,  1.81s/it, loss=0.0728, lr=1e-5]Steps:  69%|██████▉   | 10320/15001 [6:36:20<2:21:13,  1.81s/it, loss=0.364, lr=1e-5] Steps:  69%|██████▉   | 10321/15001 [6:36:22<2:16:34,  1.75s/it, loss=0.364, lr=1e-5]Steps:  69%|██████▉   | 10321/15001 [6:36:22<2:16:34,  1.75s/it, loss=0.157, lr=1e-5]Steps:  69%|██████▉   | 10322/15001 [6:36:24<2:20:25,  1.80s/it, loss=0.157, lr=1e-5]Steps:  69%|██████▉   | 10322/15001 [6:36:24<2:20:25,  1.80s/it, loss=0.109, lr=1e-5]Steps:  69%|██████▉   | 10323/15001 [6:36:25<2:18:41,  1.78s/it, loss=0.109, lr=1e-5]Steps:  69%|██████▉   | 10323/15001 [6:36:26<2:18:41,  1.78s/it, loss=0.14, lr=1e-5] Steps:  69%|██████▉   | 10324/15001 [6:36:27<2:20:31,  1.80s/it, loss=0.14, lr=1e-5]Steps:  69%|██████▉   | 10324/15001 [6:36:27<2:20:31,  1.80s/it, loss=0.105, lr=1e-5]Steps:  69%|██████▉   | 10325/15001 [6:36:29<2:19:50,  1.79s/it, loss=0.105, lr=1e-5]Steps:  69%|██████▉   | 10325/15001 [6:36:29<2:19:50,  1.79s/it, loss=0.0829, lr=1e-5]Steps:  69%|██████▉   | 10326/15001 [6:36:31<2:22:55,  1.83s/it, loss=0.0829, lr=1e-5]Steps:  69%|██████▉   | 10326/15001 [6:36:31<2:22:55,  1.83s/it, loss=0.34, lr=1e-5]  Steps:  69%|██████▉   | 10327/15001 [6:36:33<2:26:20,  1.88s/it, loss=0.34, lr=1e-5]Steps:  69%|██████▉   | 10327/15001 [6:36:33<2:26:20,  1.88s/it, loss=0.266, lr=1e-5]Steps:  69%|██████▉   | 10328/15001 [6:36:35<2:37:05,  2.02s/it, loss=0.266, lr=1e-5]Steps:  69%|██████▉   | 10328/15001 [6:36:35<2:37:05,  2.02s/it, loss=0.161, lr=1e-5]Steps:  69%|██████▉   | 10329/15001 [6:36:37<2:32:25,  1.96s/it, loss=0.161, lr=1e-5]Steps:  69%|██████▉   | 10329/15001 [6:36:38<2:32:25,  1.96s/it, loss=0.0473, lr=1e-5]Steps:  69%|██████▉   | 10330/15001 [6:36:39<2:38:40,  2.04s/it, loss=0.0473, lr=1e-5]Steps:  69%|██████▉   | 10330/15001 [6:36:40<2:38:40,  2.04s/it, loss=0.196, lr=1e-5] Steps:  69%|██████▉   | 10331/15001 [6:36:42<2:40:12,  2.06s/it, loss=0.196, lr=1e-5]Steps:  69%|██████▉   | 10331/15001 [6:36:42<2:40:12,  2.06s/it, loss=0.116, lr=1e-5]Steps:  69%|██████▉   | 10332/15001 [6:36:44<2:38:16,  2.03s/it, loss=0.116, lr=1e-5]Steps:  69%|██████▉   | 10332/15001 [6:36:44<2:38:16,  2.03s/it, loss=0.275, lr=1e-5]Steps:  69%|██████▉   | 10333/15001 [6:36:45<2:31:59,  1.95s/it, loss=0.275, lr=1e-5]Steps:  69%|██████▉   | 10333/15001 [6:36:45<2:31:59,  1.95s/it, loss=0.207, lr=1e-5]Steps:  69%|██████▉   | 10334/15001 [6:36:47<2:29:55,  1.93s/it, loss=0.207, lr=1e-5]Steps:  69%|██████▉   | 10334/15001 [6:36:47<2:29:55,  1.93s/it, loss=0.194, lr=1e-5]Steps:  69%|██████▉   | 10335/15001 [6:36:49<2:20:03,  1.80s/it, loss=0.194, lr=1e-5]Steps:  69%|██████▉   | 10335/15001 [6:36:49<2:20:03,  1.80s/it, loss=0.354, lr=1e-5]Steps:  69%|██████▉   | 10336/15001 [6:36:50<2:19:12,  1.79s/it, loss=0.354, lr=1e-5]Steps:  69%|██████▉   | 10336/15001 [6:36:51<2:19:12,  1.79s/it, loss=0.373, lr=1e-5]Steps:  69%|██████▉   | 10337/15001 [6:36:52<2:23:06,  1.84s/it, loss=0.373, lr=1e-5]Steps:  69%|██████▉   | 10337/15001 [6:36:53<2:23:06,  1.84s/it, loss=0.281, lr=1e-5]Steps:  69%|██████▉   | 10338/15001 [6:36:54<2:23:59,  1.85s/it, loss=0.281, lr=1e-5]Steps:  69%|██████▉   | 10338/15001 [6:36:54<2:23:59,  1.85s/it, loss=0.224, lr=1e-5]Steps:  69%|██████▉   | 10339/15001 [6:36:56<2:24:04,  1.85s/it, loss=0.224, lr=1e-5]Steps:  69%|██████▉   | 10339/15001 [6:36:56<2:24:04,  1.85s/it, loss=0.186, lr=1e-5]Steps:  69%|██████▉   | 10340/15001 [6:36:58<2:18:53,  1.79s/it, loss=0.186, lr=1e-5]Steps:  69%|██████▉   | 10340/15001 [6:36:58<2:18:53,  1.79s/it, loss=0.227, lr=1e-5]Steps:  69%|██████▉   | 10341/15001 [6:37:00<2:20:40,  1.81s/it, loss=0.227, lr=1e-5]Steps:  69%|██████▉   | 10341/15001 [6:37:00<2:20:40,  1.81s/it, loss=0.128, lr=1e-5]Steps:  69%|██████▉   | 10342/15001 [6:37:01<2:21:59,  1.83s/it, loss=0.128, lr=1e-5]Steps:  69%|██████▉   | 10342/15001 [6:37:02<2:21:59,  1.83s/it, loss=0.188, lr=1e-5]Steps:  69%|██████▉   | 10343/15001 [6:37:03<2:18:36,  1.79s/it, loss=0.188, lr=1e-5]Steps:  69%|██████▉   | 10343/15001 [6:37:03<2:18:36,  1.79s/it, loss=0.188, lr=1e-5]Steps:  69%|██████▉   | 10344/15001 [6:37:05<2:23:48,  1.85s/it, loss=0.188, lr=1e-5]Steps:  69%|██████▉   | 10344/15001 [6:37:05<2:23:48,  1.85s/it, loss=0.118, lr=1e-5]Steps:  69%|██████▉   | 10345/15001 [6:37:07<2:23:24,  1.85s/it, loss=0.118, lr=1e-5]Steps:  69%|██████▉   | 10345/15001 [6:37:07<2:23:24,  1.85s/it, loss=0.131, lr=1e-5]Steps:  69%|██████▉   | 10346/15001 [6:37:09<2:26:17,  1.89s/it, loss=0.131, lr=1e-5]Steps:  69%|██████▉   | 10346/15001 [6:37:09<2:26:17,  1.89s/it, loss=0.0254, lr=1e-5]Steps:  69%|██████▉   | 10347/15001 [6:37:11<2:22:37,  1.84s/it, loss=0.0254, lr=1e-5]Steps:  69%|██████▉   | 10347/15001 [6:37:11<2:22:37,  1.84s/it, loss=0.243, lr=1e-5] Steps:  69%|██████▉   | 10348/15001 [6:37:13<2:22:30,  1.84s/it, loss=0.243, lr=1e-5]Steps:  69%|██████▉   | 10348/15001 [6:37:13<2:22:30,  1.84s/it, loss=0.0599, lr=1e-5]Steps:  69%|██████▉   | 10349/15001 [6:37:14<2:22:43,  1.84s/it, loss=0.0599, lr=1e-5]Steps:  69%|██████▉   | 10349/15001 [6:37:15<2:22:43,  1.84s/it, loss=0.0678, lr=1e-5]Steps:  69%|██████▉   | 10350/15001 [6:37:16<2:25:54,  1.88s/it, loss=0.0678, lr=1e-5]Steps:  69%|██████▉   | 10350/15001 [6:37:17<2:25:54,  1.88s/it, loss=0.0579, lr=1e-5]Steps:  69%|██████▉   | 10351/15001 [6:37:18<2:26:40,  1.89s/it, loss=0.0579, lr=1e-5]Steps:  69%|██████▉   | 10351/15001 [6:37:19<2:26:40,  1.89s/it, loss=0.1, lr=1e-5]   Steps:  69%|██████▉   | 10352/15001 [6:37:20<2:30:05,  1.94s/it, loss=0.1, lr=1e-5]Steps:  69%|██████▉   | 10352/15001 [6:37:21<2:30:05,  1.94s/it, loss=0.267, lr=1e-5]Steps:  69%|██████▉   | 10353/15001 [6:37:22<2:30:51,  1.95s/it, loss=0.267, lr=1e-5]Steps:  69%|██████▉   | 10353/15001 [6:37:23<2:30:51,  1.95s/it, loss=0.059, lr=1e-5]Steps:  69%|██████▉   | 10354/15001 [6:37:24<2:36:12,  2.02s/it, loss=0.059, lr=1e-5]Steps:  69%|██████▉   | 10354/15001 [6:37:25<2:36:12,  2.02s/it, loss=0.0933, lr=1e-5]Steps:  69%|██████▉   | 10355/15001 [6:37:26<2:31:09,  1.95s/it, loss=0.0933, lr=1e-5]Steps:  69%|██████▉   | 10355/15001 [6:37:26<2:31:09,  1.95s/it, loss=0.104, lr=1e-5] Steps:  69%|██████▉   | 10356/15001 [6:37:28<2:23:17,  1.85s/it, loss=0.104, lr=1e-5]Steps:  69%|██████▉   | 10356/15001 [6:37:28<2:23:17,  1.85s/it, loss=0.0664, lr=1e-5]Steps:  69%|██████▉   | 10357/15001 [6:37:30<2:24:37,  1.87s/it, loss=0.0664, lr=1e-5]Steps:  69%|██████▉   | 10357/15001 [6:37:30<2:24:37,  1.87s/it, loss=0.212, lr=1e-5] Steps:  69%|██████▉   | 10358/15001 [6:37:31<2:19:16,  1.80s/it, loss=0.212, lr=1e-5]Steps:  69%|██████▉   | 10358/15001 [6:37:32<2:19:16,  1.80s/it, loss=0.169, lr=1e-5]Steps:  69%|██████▉   | 10359/15001 [6:37:33<2:19:05,  1.80s/it, loss=0.169, lr=1e-5]Steps:  69%|██████▉   | 10359/15001 [6:37:34<2:19:05,  1.80s/it, loss=0.267, lr=1e-5]Steps:  69%|██████▉   | 10360/15001 [6:37:35<2:27:53,  1.91s/it, loss=0.267, lr=1e-5]Steps:  69%|██████▉   | 10360/15001 [6:37:35<2:27:53,  1.91s/it, loss=0.0825, lr=1e-5]Steps:  69%|██████▉   | 10361/15001 [6:37:37<2:20:29,  1.82s/it, loss=0.0825, lr=1e-5]Steps:  69%|██████▉   | 10361/15001 [6:37:37<2:20:29,  1.82s/it, loss=0.123, lr=1e-5] Steps:  69%|██████▉   | 10362/15001 [6:37:39<2:23:02,  1.85s/it, loss=0.123, lr=1e-5]Steps:  69%|██████▉   | 10362/15001 [6:37:39<2:23:02,  1.85s/it, loss=0.116, lr=1e-5]Steps:  69%|██████▉   | 10363/15001 [6:37:41<2:19:58,  1.81s/it, loss=0.116, lr=1e-5]Steps:  69%|██████▉   | 10363/15001 [6:37:41<2:19:58,  1.81s/it, loss=0.157, lr=1e-5]Steps:  69%|██████▉   | 10364/15001 [6:37:42<2:16:41,  1.77s/it, loss=0.157, lr=1e-5]Steps:  69%|██████▉   | 10364/15001 [6:37:43<2:16:41,  1.77s/it, loss=0.0666, lr=1e-5]Steps:  69%|██████▉   | 10365/15001 [6:37:44<2:23:13,  1.85s/it, loss=0.0666, lr=1e-5]Steps:  69%|██████▉   | 10365/15001 [6:37:45<2:23:13,  1.85s/it, loss=0.169, lr=1e-5] Steps:  69%|██████▉   | 10366/15001 [6:37:46<2:21:16,  1.83s/it, loss=0.169, lr=1e-5]Steps:  69%|██████▉   | 10366/15001 [6:37:46<2:21:16,  1.83s/it, loss=0.0611, lr=1e-5]Steps:  69%|██████▉   | 10367/15001 [6:37:48<2:19:38,  1.81s/it, loss=0.0611, lr=1e-5]Steps:  69%|██████▉   | 10367/15001 [6:37:48<2:19:38,  1.81s/it, loss=0.335, lr=1e-5] Steps:  69%|██████▉   | 10368/15001 [6:37:50<2:16:03,  1.76s/it, loss=0.335, lr=1e-5]Steps:  69%|██████▉   | 10368/15001 [6:37:50<2:16:03,  1.76s/it, loss=0.183, lr=1e-5]Steps:  69%|██████▉   | 10369/15001 [6:37:51<2:19:59,  1.81s/it, loss=0.183, lr=1e-5]Steps:  69%|██████▉   | 10369/15001 [6:37:52<2:19:59,  1.81s/it, loss=0.253, lr=1e-5]Steps:  69%|██████▉   | 10370/15001 [6:37:53<2:21:00,  1.83s/it, loss=0.253, lr=1e-5]Steps:  69%|██████▉   | 10370/15001 [6:37:53<2:21:00,  1.83s/it, loss=0.23, lr=1e-5] Steps:  69%|██████▉   | 10371/15001 [6:37:55<2:22:54,  1.85s/it, loss=0.23, lr=1e-5]Steps:  69%|██████▉   | 10371/15001 [6:37:55<2:22:54,  1.85s/it, loss=0.26, lr=1e-5]Steps:  69%|██████▉   | 10372/15001 [6:37:57<2:23:48,  1.86s/it, loss=0.26, lr=1e-5]Steps:  69%|██████▉   | 10372/15001 [6:37:57<2:23:48,  1.86s/it, loss=0.127, lr=1e-5]Steps:  69%|██████▉   | 10373/15001 [6:37:59<2:28:53,  1.93s/it, loss=0.127, lr=1e-5]Steps:  69%|██████▉   | 10373/15001 [6:37:59<2:28:53,  1.93s/it, loss=0.212, lr=1e-5]Steps:  69%|██████▉   | 10374/15001 [6:38:01<2:28:45,  1.93s/it, loss=0.212, lr=1e-5]Steps:  69%|██████▉   | 10374/15001 [6:38:02<2:28:45,  1.93s/it, loss=0.319, lr=1e-5]Steps:  69%|██████▉   | 10375/15001 [6:38:03<2:36:09,  2.03s/it, loss=0.319, lr=1e-5]Steps:  69%|██████▉   | 10375/15001 [6:38:04<2:36:09,  2.03s/it, loss=0.328, lr=1e-5]Steps:  69%|██████▉   | 10376/15001 [6:38:05<2:32:25,  1.98s/it, loss=0.328, lr=1e-5]Steps:  69%|██████▉   | 10376/15001 [6:38:06<2:32:25,  1.98s/it, loss=0.106, lr=1e-5]Steps:  69%|██████▉   | 10377/15001 [6:38:07<2:27:22,  1.91s/it, loss=0.106, lr=1e-5]Steps:  69%|██████▉   | 10377/15001 [6:38:07<2:27:22,  1.91s/it, loss=0.184, lr=1e-5]Steps:  69%|██████▉   | 10378/15001 [6:38:09<2:30:40,  1.96s/it, loss=0.184, lr=1e-5]Steps:  69%|██████▉   | 10378/15001 [6:38:09<2:30:40,  1.96s/it, loss=0.111, lr=1e-5]Steps:  69%|██████▉   | 10379/15001 [6:38:11<2:22:41,  1.85s/it, loss=0.111, lr=1e-5]Steps:  69%|██████▉   | 10379/15001 [6:38:11<2:22:41,  1.85s/it, loss=0.252, lr=1e-5]Steps:  69%|██████▉   | 10380/15001 [6:38:13<2:24:05,  1.87s/it, loss=0.252, lr=1e-5]Steps:  69%|██████▉   | 10380/15001 [6:38:13<2:24:05,  1.87s/it, loss=0.266, lr=1e-5]Steps:  69%|██████▉   | 10381/15001 [6:38:14<2:21:24,  1.84s/it, loss=0.266, lr=1e-5]Steps:  69%|██████▉   | 10381/15001 [6:38:15<2:21:24,  1.84s/it, loss=0.189, lr=1e-5]Steps:  69%|██████▉   | 10382/15001 [6:38:16<2:27:32,  1.92s/it, loss=0.189, lr=1e-5]Steps:  69%|██████▉   | 10382/15001 [6:38:17<2:27:32,  1.92s/it, loss=0.137, lr=1e-5]Steps:  69%|██████▉   | 10383/15001 [6:38:18<2:23:41,  1.87s/it, loss=0.137, lr=1e-5]Steps:  69%|██████▉   | 10383/15001 [6:38:18<2:23:41,  1.87s/it, loss=0.0989, lr=1e-5]Steps:  69%|██████▉   | 10384/15001 [6:38:20<2:21:05,  1.83s/it, loss=0.0989, lr=1e-5]Steps:  69%|██████▉   | 10384/15001 [6:38:20<2:21:05,  1.83s/it, loss=0.0519, lr=1e-5]Steps:  69%|██████▉   | 10385/15001 [6:38:22<2:21:01,  1.83s/it, loss=0.0519, lr=1e-5]Steps:  69%|██████▉   | 10385/15001 [6:38:22<2:21:01,  1.83s/it, loss=0.3, lr=1e-5]   Steps:  69%|██████▉   | 10386/15001 [6:38:24<2:26:56,  1.91s/it, loss=0.3, lr=1e-5]Steps:  69%|██████▉   | 10386/15001 [6:38:24<2:26:56,  1.91s/it, loss=0.148, lr=1e-5]Steps:  69%|██████▉   | 10387/15001 [6:38:25<2:17:53,  1.79s/it, loss=0.148, lr=1e-5]Steps:  69%|██████▉   | 10387/15001 [6:38:26<2:17:53,  1.79s/it, loss=0.35, lr=1e-5] Steps:  69%|██████▉   | 10388/15001 [6:38:27<2:17:58,  1.79s/it, loss=0.35, lr=1e-5]Steps:  69%|██████▉   | 10388/15001 [6:38:28<2:17:58,  1.79s/it, loss=0.0345, lr=1e-5]Steps:  69%|██████▉   | 10389/15001 [6:38:29<2:18:13,  1.80s/it, loss=0.0345, lr=1e-5]Steps:  69%|██████▉   | 10389/15001 [6:38:29<2:18:13,  1.80s/it, loss=0.213, lr=1e-5] Steps:  69%|██████▉   | 10390/15001 [6:38:31<2:26:01,  1.90s/it, loss=0.213, lr=1e-5]Steps:  69%|██████▉   | 10390/15001 [6:38:31<2:26:01,  1.90s/it, loss=0.061, lr=1e-5]Steps:  69%|██████▉   | 10391/15001 [6:38:33<2:17:48,  1.79s/it, loss=0.061, lr=1e-5]Steps:  69%|██████▉   | 10391/15001 [6:38:33<2:17:48,  1.79s/it, loss=0.0916, lr=1e-5]Steps:  69%|██████▉   | 10392/15001 [6:38:35<2:18:28,  1.80s/it, loss=0.0916, lr=1e-5]Steps:  69%|██████▉   | 10392/15001 [6:38:35<2:18:28,  1.80s/it, loss=0.197, lr=1e-5] Steps:  69%|██████▉   | 10393/15001 [6:38:36<2:19:38,  1.82s/it, loss=0.197, lr=1e-5]Steps:  69%|██████▉   | 10393/15001 [6:38:37<2:19:38,  1.82s/it, loss=0.0703, lr=1e-5]Steps:  69%|██████▉   | 10394/15001 [6:38:38<2:25:45,  1.90s/it, loss=0.0703, lr=1e-5]Steps:  69%|██████▉   | 10394/15001 [6:38:39<2:25:45,  1.90s/it, loss=0.265, lr=1e-5] Steps:  69%|██████▉   | 10395/15001 [6:38:41<2:28:24,  1.93s/it, loss=0.265, lr=1e-5]Steps:  69%|██████▉   | 10395/15001 [6:38:41<2:28:24,  1.93s/it, loss=0.274, lr=1e-5]Steps:  69%|██████▉   | 10396/15001 [6:38:42<2:28:32,  1.94s/it, loss=0.274, lr=1e-5]Steps:  69%|██████▉   | 10396/15001 [6:38:43<2:28:32,  1.94s/it, loss=0.2, lr=1e-5]  Steps:  69%|██████▉   | 10397/15001 [6:38:44<2:27:43,  1.93s/it, loss=0.2, lr=1e-5]Steps:  69%|██████▉   | 10397/15001 [6:38:44<2:27:43,  1.93s/it, loss=0.0648, lr=1e-5]Steps:  69%|██████▉   | 10398/15001 [6:38:46<2:29:14,  1.95s/it, loss=0.0648, lr=1e-5]Steps:  69%|██████▉   | 10398/15001 [6:38:47<2:29:14,  1.95s/it, loss=0.329, lr=1e-5] Steps:  69%|██████▉   | 10399/15001 [6:38:48<2:31:04,  1.97s/it, loss=0.329, lr=1e-5]Steps:  69%|██████▉   | 10399/15001 [6:38:48<2:31:04,  1.97s/it, loss=0.168, lr=1e-5]Steps:  69%|██████▉   | 10400/15001 [6:38:50<2:24:31,  1.88s/it, loss=0.168, lr=1e-5]Steps:  69%|██████▉   | 10400/15001 [6:38:50<2:24:31,  1.88s/it, loss=0.0537, lr=1e-5]Steps:  69%|██████▉   | 10401/15001 [6:38:52<2:18:38,  1.81s/it, loss=0.0537, lr=1e-5]Steps:  69%|██████▉   | 10401/15001 [6:38:52<2:18:38,  1.81s/it, loss=0.166, lr=1e-5] Steps:  69%|██████▉   | 10402/15001 [6:38:54<2:19:10,  1.82s/it, loss=0.166, lr=1e-5]Steps:  69%|██████▉   | 10402/15001 [6:38:54<2:19:10,  1.82s/it, loss=0.151, lr=1e-5]Steps:  69%|██████▉   | 10403/15001 [6:38:56<2:24:32,  1.89s/it, loss=0.151, lr=1e-5]Steps:  69%|██████▉   | 10403/15001 [6:38:56<2:24:32,  1.89s/it, loss=0.193, lr=1e-5]Steps:  69%|██████▉   | 10404/15001 [6:38:58<2:26:53,  1.92s/it, loss=0.193, lr=1e-5]Steps:  69%|██████▉   | 10404/15001 [6:38:58<2:26:53,  1.92s/it, loss=0.122, lr=1e-5]Steps:  69%|██████▉   | 10405/15001 [6:38:59<2:22:14,  1.86s/it, loss=0.122, lr=1e-5]Steps:  69%|██████▉   | 10405/15001 [6:38:59<2:22:14,  1.86s/it, loss=0.249, lr=1e-5]Steps:  69%|██████▉   | 10406/15001 [6:39:01<2:18:24,  1.81s/it, loss=0.249, lr=1e-5]Steps:  69%|██████▉   | 10406/15001 [6:39:01<2:18:24,  1.81s/it, loss=0.237, lr=1e-5]Steps:  69%|██████▉   | 10407/15001 [6:39:03<2:16:37,  1.78s/it, loss=0.237, lr=1e-5]Steps:  69%|██████▉   | 10407/15001 [6:39:03<2:16:37,  1.78s/it, loss=0.101, lr=1e-5]Steps:  69%|██████▉   | 10408/15001 [6:39:05<2:23:40,  1.88s/it, loss=0.101, lr=1e-5]Steps:  69%|���█████▉   | 10408/15001 [6:39:05<2:23:40,  1.88s/it, loss=0.138, lr=1e-5]Steps:  69%|██████▉   | 10409/15001 [6:39:07<2:21:35,  1.85s/it, loss=0.138, lr=1e-5]Steps:  69%|██████▉   | 10409/15001 [6:39:07<2:21:35,  1.85s/it, loss=0.1, lr=1e-5]  Steps:  69%|██████▉   | 10410/15001 [6:39:08<2:16:44,  1.79s/it, loss=0.1, lr=1e-5]Steps:  69%|██████▉   | 10410/15001 [6:39:08<2:16:44,  1.79s/it, loss=0.271, lr=1e-5]Steps:  69%|██████▉   | 10411/15001 [6:39:10<2:12:52,  1.74s/it, loss=0.271, lr=1e-5]Steps:  69%|██████▉   | 10411/15001 [6:39:10<2:12:52,  1.74s/it, loss=0.425, lr=1e-5]Steps:  69%|██████▉   | 10412/15001 [6:39:12<2:16:07,  1.78s/it, loss=0.425, lr=1e-5]Steps:  69%|██████▉   | 10412/15001 [6:39:12<2:16:07,  1.78s/it, loss=0.209, lr=1e-5]Steps:  69%|██████▉   | 10413/15001 [6:39:14<2:22:40,  1.87s/it, loss=0.209, lr=1e-5]Steps:  69%|██████▉   | 10413/15001 [6:39:14<2:22:40,  1.87s/it, loss=0.219, lr=1e-5]Steps:  69%|██████▉   | 10414/15001 [6:39:16<2:22:56,  1.87s/it, loss=0.219, lr=1e-5]Steps:  69%|██████▉   | 10414/15001 [6:39:16<2:22:56,  1.87s/it, loss=0.186, lr=1e-5]Steps:  69%|██████▉   | 10415/15001 [6:39:17<2:21:33,  1.85s/it, loss=0.186, lr=1e-5]Steps:  69%|██████▉   | 10415/15001 [6:39:18<2:21:33,  1.85s/it, loss=0.0643, lr=1e-5]Steps:  69%|██████▉   | 10416/15001 [6:39:19<2:17:38,  1.80s/it, loss=0.0643, lr=1e-5]Steps:  69%|██████▉   | 10416/15001 [6:39:19<2:17:38,  1.80s/it, loss=0.0871, lr=1e-5]Steps:  69%|██████▉   | 10417/15001 [6:39:21<2:27:12,  1.93s/it, loss=0.0871, lr=1e-5]Steps:  69%|██████▉   | 10417/15001 [6:39:21<2:27:12,  1.93s/it, loss=0.139, lr=1e-5] Steps:  69%|██████▉   | 10418/15001 [6:39:23<2:28:13,  1.94s/it, loss=0.139, lr=1e-5]Steps:  69%|██████▉   | 10418/15001 [6:39:23<2:28:13,  1.94s/it, loss=0.129, lr=1e-5]Steps:  69%|██████▉   | 10419/15001 [6:39:25<2:31:07,  1.98s/it, loss=0.129, lr=1e-5]Steps:  69%|██████▉   | 10419/15001 [6:39:25<2:31:07,  1.98s/it, loss=0.194, lr=1e-5]Steps:  69%|██████▉   | 10420/15001 [6:39:27<2:29:32,  1.96s/it, loss=0.194, lr=1e-5]Steps:  69%|██████▉   | 10420/15001 [6:39:28<2:29:32,  1.96s/it, loss=0.311, lr=1e-5]Steps:  69%|██████▉   | 10421/15001 [6:39:29<2:27:08,  1.93s/it, loss=0.311, lr=1e-5]Steps:  69%|██████▉   | 10421/15001 [6:39:30<2:27:08,  1.93s/it, loss=0.181, lr=1e-5]Steps:  69%|██████▉   | 10422/15001 [6:39:32<2:36:36,  2.05s/it, loss=0.181, lr=1e-5]Steps:  69%|██████▉   | 10422/15001 [6:39:32<2:36:36,  2.05s/it, loss=0.224, lr=1e-5]Steps:  69%|██████▉   | 10423/15001 [6:39:33<2:27:49,  1.94s/it, loss=0.224, lr=1e-5]Steps:  69%|██████▉   | 10423/15001 [6:39:34<2:27:49,  1.94s/it, loss=0.453, lr=1e-5]Steps:  69%|██████▉   | 10424/15001 [6:39:35<2:29:25,  1.96s/it, loss=0.453, lr=1e-5]Steps:  69%|██████▉   | 10424/15001 [6:39:35<2:29:25,  1.96s/it, loss=0.34, lr=1e-5] Steps:  69%|██████▉   | 10425/15001 [6:39:37<2:24:40,  1.90s/it, loss=0.34, lr=1e-5]Steps:  69%|██████▉   | 10425/15001 [6:39:37<2:24:40,  1.90s/it, loss=0.246, lr=1e-5]Steps:  70%|██████▉   | 10426/15001 [6:39:39<2:21:57,  1.86s/it, loss=0.246, lr=1e-5]Steps:  70%|██████▉   | 10426/15001 [6:39:39<2:21:57,  1.86s/it, loss=0.188, lr=1e-5]Steps:  70%|██████▉   | 10427/15001 [6:39:40<2:18:06,  1.81s/it, loss=0.188, lr=1e-5]Steps:  70%|██████▉   | 10427/15001 [6:39:41<2:18:06,  1.81s/it, loss=0.228, lr=1e-5]Steps:  70%|██████▉   | 10428/15001 [6:39:42<2:16:11,  1.79s/it, loss=0.228, lr=1e-5]Steps:  70%|██████▉   | 10428/15001 [6:39:42<2:16:11,  1.79s/it, loss=0.142, lr=1e-5]Steps:  70%|██████▉   | 10429/15001 [6:39:44<2:19:30,  1.83s/it, loss=0.142, lr=1e-5]Steps:  70%|██████▉   | 10429/15001 [6:39:44<2:19:30,  1.83s/it, loss=0.104, lr=1e-5]Steps:  70%|██████▉   | 10430/15001 [6:39:46<2:15:46,  1.78s/it, loss=0.104, lr=1e-5]Steps:  70%|██████▉   | 10430/15001 [6:39:46<2:15:46,  1.78s/it, loss=0.342, lr=1e-5]Steps:  70%|██████▉   | 10431/15001 [6:39:48<2:19:41,  1.83s/it, loss=0.342, lr=1e-5]Steps:  70%|██████▉   | 10431/15001 [6:39:48<2:19:41,  1.83s/it, loss=0.123, lr=1e-5]Steps:  70%|██████▉   | 10432/15001 [6:39:50<2:21:54,  1.86s/it, loss=0.123, lr=1e-5]Steps:  70%|██████▉   | 10432/15001 [6:39:50<2:21:54,  1.86s/it, loss=0.207, lr=1e-5]Steps:  70%|██████▉   | 10433/15001 [6:39:51<2:19:43,  1.84s/it, loss=0.207, lr=1e-5]Steps:  70%|██████▉   | 10433/15001 [6:39:51<2:19:43,  1.84s/it, loss=0.307, lr=1e-5]Steps:  70%|██████���   | 10434/15001 [6:39:53<2:13:50,  1.76s/it, loss=0.307, lr=1e-5]Steps:  70%|██████▉   | 10434/15001 [6:39:53<2:13:50,  1.76s/it, loss=0.0688, lr=1e-5]Steps:  70%|██████▉   | 10435/15001 [6:39:55<2:17:04,  1.80s/it, loss=0.0688, lr=1e-5]Steps:  70%|██████▉   | 10435/15001 [6:39:55<2:17:04,  1.80s/it, loss=0.111, lr=1e-5] Steps:  70%|██████▉   | 10436/15001 [6:39:57<2:17:21,  1.81s/it, loss=0.111, lr=1e-5]Steps:  70%|██████▉   | 10436/15001 [6:39:57<2:17:21,  1.81s/it, loss=0.0877, lr=1e-5]Steps:  70%|██████▉   | 10437/15001 [6:39:59<2:19:29,  1.83s/it, loss=0.0877, lr=1e-5]Steps:  70%|██████▉   | 10437/15001 [6:39:59<2:19:29,  1.83s/it, loss=0.0801, lr=1e-5]Steps:  70%|██████▉   | 10438/15001 [6:40:00<2:16:51,  1.80s/it, loss=0.0801, lr=1e-5]Steps:  70%|██████▉   | 10438/15001 [6:40:00<2:16:51,  1.80s/it, loss=0.243, lr=1e-5] Steps:  70%|██████▉   | 10439/15001 [6:40:02<2:19:59,  1.84s/it, loss=0.243, lr=1e-5]Steps:  70%|██████▉   | 10439/15001 [6:40:02<2:19:59,  1.84s/it, loss=0.169, lr=1e-5]Steps:  70%|██████▉   | 10440/15001 [6:40:04<2:27:36,  1.94s/it, loss=0.169, lr=1e-5]Steps:  70%|██████▉   | 10440/15001 [6:40:05<2:27:36,  1.94s/it, loss=0.222, lr=1e-5]Steps:  70%|██████▉   | 10441/15001 [6:40:06<2:25:23,  1.91s/it, loss=0.222, lr=1e-5]Steps:  70%|██████▉   | 10441/15001 [6:40:07<2:25:23,  1.91s/it, loss=0.204, lr=1e-5]Steps:  70%|██████▉   | 10442/15001 [6:40:08<2:27:14,  1.94s/it, loss=0.204, lr=1e-5]Steps:  70%|██████▉   | 10442/15001 [6:40:08<2:27:14,  1.94s/it, loss=0.216, lr=1e-5]Steps:  70%|██████▉   | 10443/15001 [6:40:10<2:23:50,  1.89s/it, loss=0.216, lr=1e-5]Steps:  70%|██████▉   | 10443/15001 [6:40:10<2:23:50,  1.89s/it, loss=0.0368, lr=1e-5]Steps:  70%|██████▉   | 10444/15001 [6:40:12<2:26:58,  1.94s/it, loss=0.0368, lr=1e-5]Steps:  70%|██████▉   | 10444/15001 [6:40:13<2:26:58,  1.94s/it, loss=0.201, lr=1e-5] Steps:  70%|██████▉   | 10445/15001 [6:40:14<2:35:06,  2.04s/it, loss=0.201, lr=1e-5]Steps:  70%|██████▉   | 10445/15001 [6:40:15<2:35:06,  2.04s/it, loss=0.095, lr=1e-5]Steps:  70%|██████▉   | 10446/15001 [6:40:16<2:32:30,  2.01s/it, loss=0.095, lr=1e-5]Steps:  70%|██████▉   | 10446/15001 [6:40:16<2:32:30,  2.01s/it, loss=0.199, lr=1e-5]Steps:  70%|██████▉   | 10447/15001 [6:40:18<2:25:40,  1.92s/it, loss=0.199, lr=1e-5]Steps:  70%|██████▉   | 10447/15001 [6:40:18<2:25:40,  1.92s/it, loss=0.215, lr=1e-5]Steps:  70%|██████▉   | 10448/15001 [6:40:20<2:26:30,  1.93s/it, loss=0.215, lr=1e-5]Steps:  70%|██████▉   | 10448/15001 [6:40:20<2:26:30,  1.93s/it, loss=0.216, lr=1e-5]Steps:  70%|██████▉   | 10449/15001 [6:40:22<2:21:46,  1.87s/it, loss=0.216, lr=1e-5]Steps:  70%|██████▉   | 10449/15001 [6:40:22<2:21:46,  1.87s/it, loss=0.315, lr=1e-5]Steps:  70%|██████▉   | 10450/15001 [6:40:23<2:15:01,  1.78s/it, loss=0.315, lr=1e-5]Steps:  70%|██████▉   | 10450/15001 [6:40:24<2:15:01,  1.78s/it, loss=0.219, lr=1e-5]Steps:  70%|██████▉   | 10451/15001 [6:40:25<2:18:08,  1.82s/it, loss=0.219, lr=1e-5]Steps:  70%|██████▉   | 10451/15001 [6:40:26<2:18:08,  1.82s/it, loss=0.446, lr=1e-5]Steps:  70%|██████▉   | 10452/15001 [6:40:27<2:22:13,  1.88s/it, loss=0.446, lr=1e-5]Steps:  70%|██████▉   | 10452/15001 [6:40:27<2:22:13,  1.88s/it, loss=0.0533, lr=1e-5]Steps:  70%|██████▉   | 10453/15001 [6:40:29<2:18:08,  1.82s/it, loss=0.0533, lr=1e-5]Steps:  70%|██████▉   | 10453/15001 [6:40:29<2:18:08,  1.82s/it, loss=0.154, lr=1e-5] Steps:  70%|██████▉   | 10454/15001 [6:40:31<2:14:23,  1.77s/it, loss=0.154, lr=1e-5]Steps:  70%|██████▉   | 10454/15001 [6:40:31<2:14:23,  1.77s/it, loss=0.133, lr=1e-5]Steps:  70%|██████▉   | 10455/15001 [6:40:33<2:19:48,  1.85s/it, loss=0.133, lr=1e-5]Steps:  70%|██████▉   | 10455/15001 [6:40:33<2:19:48,  1.85s/it, loss=0.0593, lr=1e-5]Steps:  70%|██████▉   | 10456/15001 [6:40:34<2:12:39,  1.75s/it, loss=0.0593, lr=1e-5]Steps:  70%|██████▉   | 10456/15001 [6:40:35<2:12:39,  1.75s/it, loss=0.114, lr=1e-5] Steps:  70%|██████▉   | 10457/15001 [6:40:36<2:19:15,  1.84s/it, loss=0.114, lr=1e-5]Steps:  70%|██████▉   | 10457/15001 [6:40:36<2:19:15,  1.84s/it, loss=0.171, lr=1e-5]Steps:  70%|██████▉   | 10458/15001 [6:40:38<2:13:39,  1.77s/it, loss=0.171, lr=1e-5]Steps:  70%|██████▉   | 10458/15001 [6:40:38<2:13:39,  1.77s/it, loss=0.201, lr=1e-5]Steps:  70%|██████▉   | 10459/15001 [6:40:40<2:16:48,  1.81s/it, loss=0.201, lr=1e-5]Steps:  70%|██████▉   | 10459/15001 [6:40:40<2:16:48,  1.81s/it, loss=0.197, lr=1e-5]Steps:  70%|██████▉   | 10460/15001 [6:40:41<2:17:23,  1.82s/it, loss=0.197, lr=1e-5]Steps:  70%|██████▉   | 10460/15001 [6:40:42<2:17:23,  1.82s/it, loss=0.166, lr=1e-5]Steps:  70%|██████▉   | 10461/15001 [6:40:43<2:17:34,  1.82s/it, loss=0.166, lr=1e-5]Steps:  70%|██████▉   | 10461/15001 [6:40:44<2:17:34,  1.82s/it, loss=0.107, lr=1e-5]Steps:  70%|██████▉   | 10462/15001 [6:40:45<2:17:08,  1.81s/it, loss=0.107, lr=1e-5]Steps:  70%|██████▉   | 10462/15001 [6:40:45<2:17:08,  1.81s/it, loss=0.214, lr=1e-5]Steps:  70%|██████▉   | 10463/15001 [6:40:47<2:19:50,  1.85s/it, loss=0.214, lr=1e-5]Steps:  70%|██████▉   | 10463/15001 [6:40:47<2:19:50,  1.85s/it, loss=0.195, lr=1e-5]Steps:  70%|██████▉   | 10464/15001 [6:40:49<2:27:36,  1.95s/it, loss=0.195, lr=1e-5]Steps:  70%|██████▉   | 10464/15001 [6:40:49<2:27:36,  1.95s/it, loss=0.269, lr=1e-5]Steps:  70%|██████▉   | 10465/15001 [6:40:51<2:25:00,  1.92s/it, loss=0.269, lr=1e-5]Steps:  70%|██████▉   | 10465/15001 [6:40:51<2:25:00,  1.92s/it, loss=0.265, lr=1e-5]Steps:  70%|██████▉   | 10466/15001 [6:40:53<2:27:09,  1.95s/it, loss=0.265, lr=1e-5]Steps:  70%|██████▉   | 10466/15001 [6:40:53<2:27:09,  1.95s/it, loss=0.141, lr=1e-5]Steps:  70%|██████▉   | 10467/15001 [6:40:55<2:27:59,  1.96s/it, loss=0.141, lr=1e-5]Steps:  70%|██████▉   | 10467/15001 [6:40:55<2:27:59,  1.96s/it, loss=0.237, lr=1e-5]Steps:  70%|██████▉   | 10468/15001 [6:40:57<2:30:51,  2.00s/it, loss=0.237, lr=1e-5]Steps:  70%|██████▉   | 10468/15001 [6:40:57<2:30:51,  2.00s/it, loss=0.201, lr=1e-5]Steps:  70%|██████▉   | 10469/15001 [6:40:59<2:24:42,  1.92s/it, loss=0.201, lr=1e-5]Steps:  70%|██████▉   | 10469/15001 [6:40:59<2:24:42,  1.92s/it, loss=0.0486, lr=1e-5]Steps:  70%|██████▉   | 10470/15001 [6:41:01<2:22:46,  1.89s/it, loss=0.0486, lr=1e-5]Steps:  70%|██████▉   | 10470/15001 [6:41:01<2:22:46,  1.89s/it, loss=0.0454, lr=1e-5]Steps:  70%|██████▉   | 10471/15001 [6:41:02<2:17:48,  1.83s/it, loss=0.0454, lr=1e-5]Steps:  70%|██████▉   | 10471/15001 [6:41:03<2:17:48,  1.83s/it, loss=0.0821, lr=1e-5]Steps:  70%|██████▉   | 10472/15001 [6:41:04<2:15:43,  1.80s/it, loss=0.0821, lr=1e-5]Steps:  70%|██████▉   | 10472/15001 [6:41:04<2:15:43,  1.80s/it, loss=0.295, lr=1e-5] Steps:  70%|██████▉   | 10473/15001 [6:41:06<2:22:11,  1.88s/it, loss=0.295, lr=1e-5]Steps:  70%|██████▉   | 10473/15001 [6:41:06<2:22:11,  1.88s/it, loss=0.116, lr=1e-5]Steps:  70%|██████▉   | 10474/15001 [6:41:08<2:17:11,  1.82s/it, loss=0.116, lr=1e-5]Steps:  70%|██████▉   | 10474/15001 [6:41:08<2:17:11,  1.82s/it, loss=0.0438, lr=1e-5]Steps:  70%|██████▉   | 10475/15001 [6:41:10<2:13:27,  1.77s/it, loss=0.0438, lr=1e-5]Steps:  70%|██████▉   | 10475/15001 [6:41:10<2:13:27,  1.77s/it, loss=0.203, lr=1e-5] Steps:  70%|██████▉   | 10476/15001 [6:41:11<2:15:24,  1.80s/it, loss=0.203, lr=1e-5]Steps:  70%|██████▉   | 10476/15001 [6:41:12<2:15:24,  1.80s/it, loss=0.268, lr=1e-5]Steps:  70%|██████▉   | 10477/15001 [6:41:13<2:19:14,  1.85s/it, loss=0.268, lr=1e-5]Steps:  70%|██████▉   | 10477/15001 [6:41:14<2:19:14,  1.85s/it, loss=0.219, lr=1e-5]Steps:  70%|██████▉   | 10478/15001 [6:41:15<2:16:55,  1.82s/it, loss=0.219, lr=1e-5]Steps:  70%|██████▉   | 10478/15001 [6:41:15<2:16:55,  1.82s/it, loss=0.0371, lr=1e-5]Steps:  70%|██████▉   | 10479/15001 [6:41:17<2:16:11,  1.81s/it, loss=0.0371, lr=1e-5]Steps:  70%|██████▉   | 10479/15001 [6:41:17<2:16:11,  1.81s/it, loss=0.17, lr=1e-5]  Steps:  70%|██████▉   | 10480/15001 [6:41:19<2:15:20,  1.80s/it, loss=0.17, lr=1e-5]Steps:  70%|██████▉   | 10480/15001 [6:41:19<2:15:20,  1.80s/it, loss=0.274, lr=1e-5]Steps:  70%|██████▉   | 10481/15001 [6:41:21<2:21:27,  1.88s/it, loss=0.274, lr=1e-5]Steps:  70%|██████▉   | 10481/15001 [6:41:21<2:21:27,  1.88s/it, loss=0.229, lr=1e-5]Steps:  70%|██████▉   | 10482/15001 [6:41:22<2:15:16,  1.80s/it, loss=0.229, lr=1e-5]Steps:  70%|██████▉   | 10482/15001 [6:41:23<2:15:16,  1.80s/it, loss=0.0209, lr=1e-5]Steps:  70%|██████▉   | 10483/15001 [6:41:24<2:18:22,  1.84s/it, loss=0.0209, lr=1e-5]Steps:  70%|██████▉   | 10483/15001 [6:41:25<2:18:22,  1.84s/it, loss=0.103, lr=1e-5] Steps:  70%|██████▉   | 10484/15001 [6:41:26<2:20:57,  1.87s/it, loss=0.103, lr=1e-5]Steps:  70%|██████▉   | 10484/15001 [6:41:26<2:20:57,  1.87s/it, loss=0.205, lr=1e-5]Steps:  70%|██████▉   | 10485/15001 [6:41:28<2:15:07,  1.80s/it, loss=0.205, lr=1e-5]Steps:  70%|██████▉   | 10485/15001 [6:41:28<2:15:07,  1.80s/it, loss=0.0212, lr=1e-5]Steps:  70%|██████▉   | 10486/15001 [6:41:30<2:25:59,  1.94s/it, loss=0.0212, lr=1e-5]Steps:  70%|██████▉   | 10486/15001 [6:41:30<2:25:59,  1.94s/it, loss=0.222, lr=1e-5] Steps:  70%|██████▉   | 10487/15001 [6:41:32<2:22:41,  1.90s/it, loss=0.222, lr=1e-5]Steps:  70%|██████▉   | 10487/15001 [6:41:32<2:22:41,  1.90s/it, loss=0.0297, lr=1e-5]Steps:  70%|██████▉   | 10488/15001 [6:41:34<2:25:11,  1.93s/it, loss=0.0297, lr=1e-5]Steps:  70%|██████▉   | 10488/15001 [6:41:34<2:25:11,  1.93s/it, loss=0.402, lr=1e-5] Steps:  70%|██████▉   | 10489/15001 [6:41:36<2:23:57,  1.91s/it, loss=0.402, lr=1e-5]Steps:  70%|██████▉   | 10489/15001 [6:41:36<2:23:57,  1.91s/it, loss=0.146, lr=1e-5]Steps:  70%|██████▉   | 10490/15001 [6:41:38<2:27:22,  1.96s/it, loss=0.146, lr=1e-5]Steps:  70%|██████▉   | 10490/15001 [6:41:38<2:27:22,  1.96s/it, loss=0.0661, lr=1e-5]Steps:  70%|██████▉   | 10491/15001 [6:41:40<2:27:23,  1.96s/it, loss=0.0661, lr=1e-5]Steps:  70%|██████▉   | 10491/15001 [6:41:40<2:27:23,  1.96s/it, loss=0.254, lr=1e-5] Steps:  70%|██████▉   | 10492/15001 [6:41:42<2:21:34,  1.88s/it, loss=0.254, lr=1e-5]Steps:  70%|██████▉   | 10492/15001 [6:41:42<2:21:34,  1.88s/it, loss=0.107, lr=1e-5]Steps:  70%|██████▉   | 10493/15001 [6:41:43<2:23:15,  1.91s/it, loss=0.107, lr=1e-5]Steps:  70%|██████▉   | 10493/15001 [6:41:44<2:23:15,  1.91s/it, loss=0.14, lr=1e-5] Steps:  70%|██████▉   | 10494/15001 [6:41:46<2:26:49,  1.95s/it, loss=0.14, lr=1e-5]Steps:  70%|██████▉   | 10494/15001 [6:41:46<2:26:49,  1.95s/it, loss=0.294, lr=1e-5]Steps:  70%|██████▉   | 10495/15001 [6:41:47<2:17:21,  1.83s/it, loss=0.294, lr=1e-5]Steps:  70%|██████▉   | 10495/15001 [6:41:47<2:17:21,  1.83s/it, loss=0.153, lr=1e-5]Steps:  70%|██████▉   | 10496/15001 [6:41:49<2:23:57,  1.92s/it, loss=0.153, lr=1e-5]Steps:  70%|██████▉   | 10496/15001 [6:41:49<2:23:57,  1.92s/it, loss=0.0481, lr=1e-5]Steps:  70%|██████▉   | 10497/15001 [6:41:51<2:19:19,  1.86s/it, loss=0.0481, lr=1e-5]Steps:  70%|██████▉   | 10497/15001 [6:41:51<2:19:19,  1.86s/it, loss=0.21, lr=1e-5]  Steps:  70%|██████▉   | 10498/15001 [6:41:53<2:18:37,  1.85s/it, loss=0.21, lr=1e-5]Steps:  70%|██████▉   | 10498/15001 [6:41:53<2:18:37,  1.85s/it, loss=0.111, lr=1e-5]Steps:  70%|██████▉   | 10499/15001 [6:41:54<2:11:43,  1.76s/it, loss=0.111, lr=1e-5]Steps:  70%|██████▉   | 10499/15001 [6:41:55<2:11:43,  1.76s/it, loss=0.37, lr=1e-5] Steps:  70%|██████▉   | 10500/15001 [6:41:56<2:18:15,  1.84s/it, loss=0.37, lr=1e-5]02/04/2024 19:44:16 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 685.34it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  70%|██████▉   | 10500/15001 [6:45:36<2:18:15,  1.84s/it, loss=0.0884, lr=1e-5]Steps:  70%|███████   | 10501/15001 [6:45:37<84:27:29, 67.57s/it, loss=0.0884, lr=1e-5]Steps:  70%|███████   | 10501/15001 [6:45:37<84:27:29, 67.57s/it, loss=0.0813, lr=1e-5]Steps:  70%|███████   | 10502/15001 [6:45:39<59:44:16, 47.80s/it, loss=0.0813, lr=1e-5]Steps:  70%|███████   | 10502/15001 [6:45:39<59:44:16, 47.80s/it, loss=0.32, lr=1e-5]  Steps:  70%|███████   | 10503/15001 [6:45:41<42:32:38, 34.05s/it, loss=0.32, lr=1e-5]Steps:  70%|███████   | 10503/15001 [6:45:41<42:32:38, 34.05s/it, loss=0.16, lr=1e-5]Steps:  70%|███████   | 10504/15001 [6:45:43<30:28:59, 24.40s/it, loss=0.16, lr=1e-5]Steps:  70%|███████   | 10504/15001 [6:45:43<30:28:59, 24.40s/it, loss=0.271, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  70%|███████   | 10505/15001 [6:45:44<21:56:57, 17.57s/it, loss=0.271, lr=1e-5]Steps:  70%|███████   | 10505/15001 [6:45:45<21:56:57, 17.57s/it, loss=0.114, lr=1e-5]Steps:  70%|███████   | 10506/15001 [6:45:46<16:02:07, 12.84s/it, loss=0.114, lr=1e-5]Steps:  70%|███████   | 10506/15001 [6:45:46<16:02:07, 12.84s/it, loss=0.0896, lr=1e-5]Steps:  70%|███████   | 10507/15001 [6:45:48<11:53:15,  9.52s/it, loss=0.0896, lr=1e-5]Steps:  70%|███████   | 10507/15001 [6:45:48<11:53:15,  9.52s/it, loss=0.0515, lr=1e-5]Steps:  70%|███████   | 10508/15001 [6:45:50<9:01:33,  7.23s/it, loss=0.0515, lr=1e-5] Steps:  70%|███████   | 10508/15001 [6:45:50<9:01:33,  7.23s/it, loss=0.271, lr=1e-5] Steps:  70%|███████   | 10509/15001 [6:45:52<7:00:10,  5.61s/it, loss=0.271, lr=1e-5]Steps:  70%|███████   | 10509/15001 [6:45:52<7:00:10,  5.61s/it, loss=0.168, lr=1e-5]Steps:  70%|███████   | 10510/15001 [6:45:54<5:35:59,  4.49s/it, loss=0.168, lr=1e-5]Steps:  70%|███████   | 10510/15001 [6:45:54<5:35:59,  4.49s/it, loss=0.277, lr=1e-5]Steps:  70%|███████   | 10511/15001 [6:45:55<4:30:52,  3.62s/it, loss=0.277, lr=1e-5]Steps:  70%|███████   | 10511/15001 [6:45:55<4:30:52,  3.62s/it, loss=0.114, lr=1e-5]Steps:  70%|███████   | 10512/15001 [6:45:57<3:51:12,  3.09s/it, loss=0.114, lr=1e-5]Steps:  70%|███████   | 10512/15001 [6:45:57<3:51:12,  3.09s/it, loss=0.157, lr=1e-5]Steps:  70%|███████   | 10513/15001 [6:45:59<3:25:43,  2.75s/it, loss=0.157, lr=1e-5]Steps:  70%|███████   | 10513/15001 [6:45:59<3:25:43,  2.75s/it, loss=0.102, lr=1e-5]Steps:  70%|███████   | 10514/15001 [6:46:01<3:02:46,  2.44s/it, loss=0.102, lr=1e-5]Steps:  70%|███████   | 10514/15001 [6:46:01<3:02:46,  2.44s/it, loss=0.249, lr=1e-5]Steps:  70%|███████   | 10515/15001 [6:46:03<2:54:08,  2.33s/it, loss=0.249, lr=1e-5]Steps:  70%|███████   | 10515/15001 [6:46:03<2:54:08,  2.33s/it, loss=0.112, lr=1e-5]Steps:  70%|███████   | 10516/15001 [6:46:05<2:43:12,  2.18s/it, loss=0.112, lr=1e-5]Steps:  70%|███████   | 10516/15001 [6:46:05<2:43:12,  2.18s/it, loss=0.0836, lr=1e-5]Steps:  70%|███████   | 10517/15001 [6:46:07<2:37:42,  2.11s/it, loss=0.0836, lr=1e-5]Steps:  70%|███████   | 10517/15001 [6:46:07<2:37:42,  2.11s/it, loss=0.0607, lr=1e-5]Steps:  70%|███████   | 10518/15001 [6:46:09<2:39:22,  2.13s/it, loss=0.0607, lr=1e-5]Steps:  70%|███████   | 10518/15001 [6:46:09<2:39:22,  2.13s/it, loss=0.132, lr=1e-5] Steps:  70%|███████   | 10519/15001 [6:46:11<2:33:36,  2.06s/it, loss=0.132, lr=1e-5]Steps:  70%|███████   | 10519/15001 [6:46:11<2:33:36,  2.06s/it, loss=0.168, lr=1e-5]Steps:  70%|███████   | 10520/15001 [6:46:13<2:28:59,  1.99s/it, loss=0.168, lr=1e-5]Steps:  70%|███████   | 10520/15001 [6:46:13<2:28:59,  1.99s/it, loss=0.161, lr=1e-5]Steps:  70%|███████   | 10521/15001 [6:46:14<2:27:22,  1.97s/it, loss=0.161, lr=1e-5]Steps:  70%|███████   | 10521/15001 [6:46:15<2:27:22,  1.97s/it, loss=0.0867, lr=1e-5]Steps:  70%|███████   | 10522/15001 [6:46:16<2:26:36,  1.96s/it, loss=0.0867, lr=1e-5]Steps:  70%|███████   | 10522/15001 [6:46:17<2:26:36,  1.96s/it, loss=0.0665, lr=1e-5]Steps:  70%|███████   | 10523/15001 [6:46:18<2:26:44,  1.97s/it, loss=0.0665, lr=1e-5]Steps:  70%|███████   | 10523/15001 [6:46:19<2:26:44,  1.97s/it, loss=0.0217, lr=1e-5]Steps:  70%|███████   | 10524/15001 [6:46:20<2:23:06,  1.92s/it, loss=0.0217, lr=1e-5]Steps:  70%|███████   | 10524/15001 [6:46:20<2:23:06,  1.92s/it, loss=0.323, lr=1e-5] Steps:  70%|███████   | 10525/15001 [6:46:22<2:19:43,  1.87s/it, loss=0.323, lr=1e-5]Steps:  70%|███████   | 10525/15001 [6:46:22<2:19:43,  1.87s/it, loss=0.16, lr=1e-5] Steps:  70%|███████   | 10526/15001 [6:46:24<2:18:35,  1.86s/it, loss=0.16, lr=1e-5]Steps:  70%|███████   | 10526/15001 [6:46:24<2:18:35,  1.86s/it, loss=0.0655, lr=1e-5]Steps:  70%|███████   | 10527/15001 [6:46:26<2:21:49,  1.90s/it, loss=0.0655, lr=1e-5]Steps:  70%|███████   | 10527/15001 [6:46:26<2:21:49,  1.90s/it, loss=0.289, lr=1e-5] Steps:  70%|███████   | 10528/15001 [6:46:27<2:14:23,  1.80s/it, loss=0.289, lr=1e-5]Steps:  70%|███████   | 10528/15001 [6:46:28<2:14:23,  1.80s/it, loss=0.184, lr=1e-5]Steps:  70%|███████   | 10529/15001 [6:46:29<2:19:34,  1.87s/it, loss=0.184, lr=1e-5]Steps:  70%|███████   | 10529/15001 [6:46:29<2:19:34,  1.87s/it, loss=0.164, lr=1e-5]Steps:  70%|███████   | 10530/15001 [6:46:31<2:16:33,  1.83s/it, loss=0.164, lr=1e-5]Steps:  70%|███████   | 10530/15001 [6:46:31<2:16:33,  1.83s/it, loss=0.176, lr=1e-5]Steps:  70%|███████   | 10531/15001 [6:46:33<2:11:27,  1.76s/it, loss=0.176, lr=1e-5]Steps:  70%|███████   | 10531/15001 [6:46:33<2:11:27,  1.76s/it, loss=0.251, lr=1e-5]Steps:  70%|███████   | 10532/15001 [6:46:34<2:11:59,  1.77s/it, loss=0.251, lr=1e-5]Steps:  70%|███████   | 10532/15001 [6:46:35<2:11:59,  1.77s/it, loss=0.198, lr=1e-5]Steps:  70%|███████   | 10533/15001 [6:46:37<2:18:26,  1.86s/it, loss=0.198, lr=1e-5]Steps:  70%|███████   | 10533/15001 [6:46:37<2:18:26,  1.86s/it, loss=0.196, lr=1e-5]Steps:  70%|███████   | 10534/15001 [6:46:38<2:20:16,  1.88s/it, loss=0.196, lr=1e-5]Steps:  70%|███████   | 10534/15001 [6:46:39<2:20:16,  1.88s/it, loss=0.142, lr=1e-5]Steps:  70%|███████   | 10535/15001 [6:46:40<2:16:45,  1.84s/it, loss=0.142, lr=1e-5]Steps:  70%|███████   | 10535/15001 [6:46:40<2:16:45,  1.84s/it, loss=0.0247, lr=1e-5]Steps:  70%|███████   | 10536/15001 [6:46:42<2:20:50,  1.89s/it, loss=0.0247, lr=1e-5]Steps:  70%|███████   | 10536/15001 [6:46:42<2:20:50,  1.89s/it, loss=0.197, lr=1e-5] Steps:  70%|███████   | 10537/15001 [6:46:44<2:20:28,  1.89s/it, loss=0.197, lr=1e-5]Steps:  70%|███████   | 10537/15001 [6:46:44<2:20:28,  1.89s/it, loss=0.18, lr=1e-5] Steps:  70%|███████   | 10538/15001 [6:46:46<2:12:43,  1.78s/it, loss=0.18, lr=1e-5]Steps:  70%|███████   | 10538/15001 [6:46:46<2:12:43,  1.78s/it, loss=0.164, lr=1e-5]Steps:  70%|███████   | 10539/15001 [6:46:48<2:18:32,  1.86s/it, loss=0.164, lr=1e-5]Steps:  70%|███████   | 10539/15001 [6:46:48<2:18:32,  1.86s/it, loss=0.164, lr=1e-5]Steps:  70%|███████   | 10540/15001 [6:46:50<2:25:29,  1.96s/it, loss=0.164, lr=1e-5]Steps:  70%|███████   | 10540/15001 [6:46:50<2:25:29,  1.96s/it, loss=0.162, lr=1e-5]Steps:  70%|███████   | 10541/15001 [6:46:52<2:25:30,  1.96s/it, loss=0.162, lr=1e-5]Steps:  70%|███████   | 10541/15001 [6:46:52<2:25:30,  1.96s/it, loss=0.0241, lr=1e-5]Steps:  70%|███████   | 10542/15001 [6:46:54<2:24:38,  1.95s/it, loss=0.0241, lr=1e-5]Steps:  70%|███████   | 10542/15001 [6:46:54<2:24:38,  1.95s/it, loss=0.226, lr=1e-5] Steps:  70%|███████   | 10543/15001 [6:46:56<2:22:39,  1.92s/it, loss=0.226, lr=1e-5]Steps:  70%|███████   | 10543/15001 [6:46:56<2:22:39,  1.92s/it, loss=0.0165, lr=1e-5]Steps:  70%|███████   | 10544/15001 [6:46:58<2:26:29,  1.97s/it, loss=0.0165, lr=1e-5]Steps:  70%|███████   | 10544/15001 [6:46:58<2:26:29,  1.97s/it, loss=0.0693, lr=1e-5]Steps:  70%|███████   | 10545/15001 [6:47:00<2:25:40,  1.96s/it, loss=0.0693, lr=1e-5]Steps:  70%|███████   | 10545/15001 [6:47:00<2:25:40,  1.96s/it, loss=0.174, lr=1e-5] Steps:  70%|███████   | 10546/15001 [6:47:01<2:21:13,  1.90s/it, loss=0.174, lr=1e-5]Steps:  70%|███████   | 10546/15001 [6:47:02<2:21:13,  1.90s/it, loss=0.041, lr=1e-5]Steps:  70%|███████   | 10547/15001 [6:47:03<2:18:09,  1.86s/it, loss=0.041, lr=1e-5]Steps:  70%|███████   | 10547/15001 [6:47:03<2:18:09,  1.86s/it, loss=0.295, lr=1e-5]Steps:  70%|███████   | 10548/15001 [6:47:05<2:14:37,  1.81s/it, loss=0.295, lr=1e-5]Steps:  70%|███████   | 10548/15001 [6:47:05<2:14:37,  1.81s/it, loss=0.141, lr=1e-5]Steps:  70%|███████   | 10549/15001 [6:47:07<2:20:11,  1.89s/it, loss=0.141, lr=1e-5]Steps:  70%|███████   | 10549/15001 [6:47:07<2:20:11,  1.89s/it, loss=0.288, lr=1e-5]Steps:  70%|███████   | 10550/15001 [6:47:09<2:18:00,  1.86s/it, loss=0.288, lr=1e-5]Steps:  70%|███████   | 10550/15001 [6:47:09<2:18:00,  1.86s/it, loss=0.258, lr=1e-5]Steps:  70%|███████   | 10551/15001 [6:47:10<2:12:59,  1.79s/it, loss=0.258, lr=1e-5]Steps:  70%|███████   | 10551/15001 [6:47:11<2:12:59,  1.79s/it, loss=0.255, lr=1e-5]Steps:  70%|███████   | 10552/15001 [6:47:12<2:13:18,  1.80s/it, loss=0.255, lr=1e-5]Steps:  70%|███████   | 10552/15001 [6:47:12<2:13:18,  1.80s/it, loss=0.227, lr=1e-5]Steps:  70%|███████   | 10553/15001 [6:47:14<2:14:21,  1.81s/it, loss=0.227, lr=1e-5]Steps:  70%|███████   | 10553/15001 [6:47:14<2:14:21,  1.81s/it, loss=0.0813, lr=1e-5]Steps:  70%|███████   | 10554/15001 [6:47:16<2:14:06,  1.81s/it, loss=0.0813, lr=1e-5]Steps:  70%|███████   | 10554/15001 [6:47:16<2:14:06,  1.81s/it, loss=0.215, lr=1e-5] Steps:  70%|███████   | 10555/15001 [6:47:18<2:12:11,  1.78s/it, loss=0.215, lr=1e-5]Steps:  70%|███████   | 10555/15001 [6:47:18<2:12:11,  1.78s/it, loss=0.163, lr=1e-5]Steps:  70%|███████   | 10556/15001 [6:47:19<2:13:56,  1.81s/it, loss=0.163, lr=1e-5]Steps:  70%|███████   | 10556/15001 [6:47:20<2:13:56,  1.81s/it, loss=0.515, lr=1e-5]Steps:  70%|███████   | 10557/15001 [6:47:21<2:13:58,  1.81s/it, loss=0.515, lr=1e-5]Steps:  70%|███████   | 10557/15001 [6:47:22<2:13:58,  1.81s/it, loss=0.0656, lr=1e-5]Steps:  70%|███████   | 10558/15001 [6:47:23<2:15:52,  1.83s/it, loss=0.0656, lr=1e-5]Steps:  70%|███████   | 10558/15001 [6:47:24<2:15:52,  1.83s/it, loss=0.335, lr=1e-5] Steps:  70%|███████   | 10559/15001 [6:47:25<2:22:39,  1.93s/it, loss=0.335, lr=1e-5]Steps:  70%|███████   | 10559/15001 [6:47:25<2:22:39,  1.93s/it, loss=0.24, lr=1e-5] Steps:  70%|███████   | 10560/15001 [6:47:27<2:17:25,  1.86s/it, loss=0.24, lr=1e-5]Steps:  70%|███████   | 10560/15001 [6:47:27<2:17:25,  1.86s/it, loss=0.176, lr=1e-5]Steps:  70%|███████   | 10561/15001 [6:47:29<2:15:29,  1.83s/it, loss=0.176, lr=1e-5]Steps:  70%|███████   | 10561/15001 [6:47:29<2:15:29,  1.83s/it, loss=0.0602, lr=1e-5]Steps:  70%|███████   | 10562/15001 [6:47:31<2:20:09,  1.89s/it, loss=0.0602, lr=1e-5]Steps:  70%|███████   | 10562/15001 [6:47:31<2:20:09,  1.89s/it, loss=0.12, lr=1e-5]  Steps:  70%|███████   | 10563/15001 [6:47:33<2:26:07,  1.98s/it, loss=0.12, lr=1e-5]Steps:  70%|███████   | 10563/15001 [6:47:33<2:26:07,  1.98s/it, loss=0.32, lr=1e-5]Steps:  70%|███████   | 10564/15001 [6:47:35<2:20:22,  1.90s/it, loss=0.32, lr=1e-5]Steps:  70%|███████   | 10564/15001 [6:47:35<2:20:22,  1.90s/it, loss=0.371, lr=1e-5]Steps:  70%|███████   | 10565/15001 [6:47:37<2:26:19,  1.98s/it, loss=0.371, lr=1e-5]Steps:  70%|███████   | 10565/15001 [6:47:37<2:26:19,  1.98s/it, loss=0.278, lr=1e-5]Steps:  70%|███████   | 10566/15001 [6:47:39<2:21:33,  1.92s/it, loss=0.278, lr=1e-5]Steps:  70%|███████   | 10566/15001 [6:47:39<2:21:33,  1.92s/it, loss=0.245, lr=1e-5]Steps:  70%|███████   | 10567/15001 [6:47:41<2:28:05,  2.00s/it, loss=0.245, lr=1e-5]Steps:  70%|███████   | 10567/15001 [6:47:41<2:28:05,  2.00s/it, loss=0.212, lr=1e-5]Steps:  70%|███████   | 10568/15001 [6:47:43<2:30:19,  2.03s/it, loss=0.212, lr=1e-5]Steps:  70%|███████   | 10568/15001 [6:47:43<2:30:19,  2.03s/it, loss=0.0904, lr=1e-5]Steps:  70%|███████   | 10569/15001 [6:47:45<2:24:43,  1.96s/it, loss=0.0904, lr=1e-5]Steps:  70%|███████   | 10569/15001 [6:47:45<2:24:43,  1.96s/it, loss=0.166, lr=1e-5] Steps:  70%|███████   | 10570/15001 [6:47:47<2:25:47,  1.97s/it, loss=0.166, lr=1e-5]Steps:  70%|███████   | 10570/15001 [6:47:47<2:25:47,  1.97s/it, loss=0.182, lr=1e-5]Steps:  70%|███████   | 10571/15001 [6:47:48<2:18:29,  1.88s/it, loss=0.182, lr=1e-5]Steps:  70%|███████   | 10571/15001 [6:47:49<2:18:29,  1.88s/it, loss=0.105, lr=1e-5]Steps:  70%|███████   | 10572/15001 [6:47:50<2:17:53,  1.87s/it, loss=0.105, lr=1e-5]Steps:  70%|███████   | 10572/15001 [6:47:50<2:17:53,  1.87s/it, loss=0.138, lr=1e-5]Steps:  70%|███████   | 10573/15001 [6:47:52<2:16:15,  1.85s/it, loss=0.138, lr=1e-5]Steps:  70%|███████   | 10573/15001 [6:47:52<2:16:15,  1.85s/it, loss=0.104, lr=1e-5]Steps:  70%|███████   | 10574/15001 [6:47:54<2:14:41,  1.83s/it, loss=0.104, lr=1e-5]Steps:  70%|███████   | 10574/15001 [6:47:54<2:14:41,  1.83s/it, loss=0.326, lr=1e-5]Steps:  70%|███████   | 10575/15001 [6:47:56<2:14:55,  1.83s/it, loss=0.326, lr=1e-5]Steps:  70%|███████   | 10575/15001 [6:47:56<2:14:55,  1.83s/it, loss=0.335, lr=1e-5]Steps:  71%|███████   | 10576/15001 [6:47:57<2:07:47,  1.73s/it, loss=0.335, lr=1e-5]Steps:  71%|███████   | 10576/15001 [6:47:58<2:07:47,  1.73s/it, loss=0.066, lr=1e-5]Steps:  71%|███████   | 10577/15001 [6:47:59<2:18:52,  1.88s/it, loss=0.066, lr=1e-5]Steps:  71%|███████   | 10577/15001 [6:47:59<2:18:52,  1.88s/it, loss=0.236, lr=1e-5]Steps:  71%|███████   | 10578/15001 [6:48:01<2:17:04,  1.86s/it, loss=0.236, lr=1e-5]Steps:  71%|███████   | 10578/15001 [6:48:01<2:17:04,  1.86s/it, loss=0.0838, lr=1e-5]Steps:  71%|███████   | 10579/15001 [6:48:03<2:16:01,  1.85s/it, loss=0.0838, lr=1e-5]Steps:  71%|███████   | 10579/15001 [6:48:03<2:16:01,  1.85s/it, loss=0.222, lr=1e-5] Steps:  71%|███████   | 10580/15001 [6:48:05<2:13:28,  1.81s/it, loss=0.222, lr=1e-5]Steps:  71%|███████   | 10580/15001 [6:48:05<2:13:28,  1.81s/it, loss=0.258, lr=1e-5]Steps:  71%|███████   | 10581/15001 [6:48:07<2:17:32,  1.87s/it, loss=0.258, lr=1e-5]Steps:  71%|███████   | 10581/15001 [6:48:07<2:17:32,  1.87s/it, loss=0.0529, lr=1e-5]Steps:  71%|███████   | 10582/15001 [6:48:08<2:14:06,  1.82s/it, loss=0.0529, lr=1e-5]Steps:  71%|███████   | 10582/15001 [6:48:09<2:14:06,  1.82s/it, loss=0.0635, lr=1e-5]Steps:  71%|███████   | 10583/15001 [6:48:10<2:16:21,  1.85s/it, loss=0.0635, lr=1e-5]Steps:  71%|███████   | 10583/15001 [6:48:10<2:16:21,  1.85s/it, loss=0.327, lr=1e-5] Steps:  71%|███████   | 10584/15001 [6:48:12<2:12:11,  1.80s/it, loss=0.327, lr=1e-5]Steps:  71%|███████   | 10584/15001 [6:48:12<2:12:11,  1.80s/it, loss=0.334, lr=1e-5]Steps:  71%|███████   | 10585/15001 [6:48:14<2:11:20,  1.78s/it, loss=0.334, lr=1e-5]Steps:  71%|███████   | 10585/15001 [6:48:14<2:11:20,  1.78s/it, loss=0.18, lr=1e-5] Steps:  71%|███████   | 10586/15001 [6:48:16<2:18:10,  1.88s/it, loss=0.18, lr=1e-5]Steps:  71%|███████   | 10586/15001 [6:48:16<2:18:10,  1.88s/it, loss=0.0248, lr=1e-5]Steps:  71%|███████   | 10587/15001 [6:48:18<2:16:46,  1.86s/it, loss=0.0248, lr=1e-5]Steps:  71%|███████   | 10587/15001 [6:48:18<2:16:46,  1.86s/it, loss=0.254, lr=1e-5] Steps:  71%|███████   | 10588/15001 [6:48:20<2:19:47,  1.90s/it, loss=0.254, lr=1e-5]Steps:  71%|███████   | 10588/15001 [6:48:20<2:19:47,  1.90s/it, loss=0.14, lr=1e-5] Steps:  71%|███████   | 10589/15001 [6:48:22<2:24:44,  1.97s/it, loss=0.14, lr=1e-5]Steps:  71%|███████   | 10589/15001 [6:48:22<2:24:44,  1.97s/it, loss=0.167, lr=1e-5]Steps:  71%|███████   | 10590/15001 [6:48:24<2:26:35,  1.99s/it, loss=0.167, lr=1e-5]Steps:  71%|███████   | 10590/15001 [6:48:24<2:26:35,  1.99s/it, loss=0.135, lr=1e-5]Steps:  71%|███████   | 10591/15001 [6:48:26<2:24:30,  1.97s/it, loss=0.135, lr=1e-5]Steps:  71%|███████   | 10591/15001 [6:48:26<2:24:30,  1.97s/it, loss=0.205, lr=1e-5]Steps:  71%|███████   | 10592/15001 [6:48:27<2:19:10,  1.89s/it, loss=0.205, lr=1e-5]Steps:  71%|███████   | 10592/15001 [6:48:28<2:19:10,  1.89s/it, loss=0.0562, lr=1e-5]Steps:  71%|███████   | 10593/15001 [6:48:29<2:20:20,  1.91s/it, loss=0.0562, lr=1e-5]Steps:  71%|███████   | 10593/15001 [6:48:30<2:20:20,  1.91s/it, loss=0.0694, lr=1e-5]Steps:  71%|███████   | 10594/15001 [6:48:31<2:19:33,  1.90s/it, loss=0.0694, lr=1e-5]Steps:  71%|███████   | 10594/15001 [6:48:31<2:19:33,  1.90s/it, loss=0.186, lr=1e-5] Steps:  71%|███████   | 10595/15001 [6:48:33<2:16:00,  1.85s/it, loss=0.186, lr=1e-5]Steps:  71%|███████   | 10595/15001 [6:48:33<2:16:00,  1.85s/it, loss=0.0113, lr=1e-5]Steps:  71%|███████   | 10596/15001 [6:48:35<2:13:33,  1.82s/it, loss=0.0113, lr=1e-5]Steps:  71%|███████   | 10596/15001 [6:48:35<2:13:33,  1.82s/it, loss=0.195, lr=1e-5] Steps:  71%|███████   | 10597/15001 [6:48:36<2:09:39,  1.77s/it, loss=0.195, lr=1e-5]Steps:  71%|███████   | 10597/15001 [6:48:37<2:09:39,  1.77s/it, loss=0.261, lr=1e-5]Steps:  71%|███████   | 10598/15001 [6:48:38<2:14:09,  1.83s/it, loss=0.261, lr=1e-5]Steps:  71%|███████   | 10598/15001 [6:48:39<2:14:09,  1.83s/it, loss=0.204, lr=1e-5]Steps:  71%|███████   | 10599/15001 [6:48:40<2:14:33,  1.83s/it, loss=0.204, lr=1e-5]Steps:  71%|███████   | 10599/15001 [6:48:41<2:14:33,  1.83s/it, loss=0.217, lr=1e-5]Steps:  71%|███████   | 10600/15001 [6:48:42<2:16:10,  1.86s/it, loss=0.217, lr=1e-5]Steps:  71%|███████   | 10600/15001 [6:48:42<2:16:10,  1.86s/it, loss=0.29, lr=1e-5] Steps:  71%|███████   | 10601/15001 [6:48:44<2:17:31,  1.88s/it, loss=0.29, lr=1e-5]Steps:  71%|███████   | 10601/15001 [6:48:44<2:17:31,  1.88s/it, loss=0.392, lr=1e-5]Steps:  71%|███████   | 10602/15001 [6:48:46<2:15:28,  1.85s/it, loss=0.392, lr=1e-5]Steps:  71%|███████   | 10602/15001 [6:48:46<2:15:28,  1.85s/it, loss=0.12, lr=1e-5] Steps:  71%|███████   | 10603/15001 [6:48:48<2:17:04,  1.87s/it, loss=0.12, lr=1e-5]Steps:  71%|███████   | 10603/15001 [6:48:48<2:17:04,  1.87s/it, loss=0.187, lr=1e-5]Steps:  71%|███████   | 10604/15001 [6:48:49<2:11:06,  1.79s/it, loss=0.187, lr=1e-5]Steps:  71%|███████   | 10604/15001 [6:48:50<2:11:06,  1.79s/it, loss=0.206, lr=1e-5]Steps:  71%|███████   | 10605/15001 [6:48:51<2:13:29,  1.82s/it, loss=0.206, lr=1e-5]Steps:  71%|███████   | 10605/15001 [6:48:51<2:13:29,  1.82s/it, loss=0.0992, lr=1e-5]Steps:  71%|███████   | 10606/15001 [6:48:53<2:14:36,  1.84s/it, loss=0.0992, lr=1e-5]Steps:  71%|███████   | 10606/15001 [6:48:53<2:14:36,  1.84s/it, loss=0.221, lr=1e-5] Steps:  71%|███████   | 10607/15001 [6:48:55<2:16:04,  1.86s/it, loss=0.221, lr=1e-5]Steps:  71%|███████   | 10607/15001 [6:48:55<2:16:04,  1.86s/it, loss=0.413, lr=1e-5]Steps:  71%|███████   | 10608/15001 [6:48:57<2:11:06,  1.79s/it, loss=0.413, lr=1e-5]Steps:  71%|███████   | 10608/15001 [6:48:57<2:11:06,  1.79s/it, loss=0.289, lr=1e-5]Steps:  71%|███████   | 10609/15001 [6:48:59<2:19:31,  1.91s/it, loss=0.289, lr=1e-5]Steps:  71%|███████   | 10609/15001 [6:48:59<2:19:31,  1.91s/it, loss=0.259, lr=1e-5]Steps:  71%|███████   | 10610/15001 [6:49:01<2:25:02,  1.98s/it, loss=0.259, lr=1e-5]Steps:  71%|███████   | 10610/15001 [6:49:01<2:25:02,  1.98s/it, loss=0.122, lr=1e-5]Steps:  71%|███████   | 10611/15001 [6:49:03<2:25:50,  1.99s/it, loss=0.122, lr=1e-5]Steps:  71%|███████   | 10611/15001 [6:49:03<2:25:50,  1.99s/it, loss=0.145, lr=1e-5]Steps:  71%|███████   | 10612/15001 [6:49:05<2:26:39,  2.00s/it, loss=0.145, lr=1e-5]Steps:  71%|███████   | 10612/15001 [6:49:05<2:26:39,  2.00s/it, loss=0.23, lr=1e-5] Steps:  71%|███████   | 10613/15001 [6:49:07<2:26:14,  2.00s/it, loss=0.23, lr=1e-5]Steps:  71%|███████   | 10613/15001 [6:49:07<2:26:14,  2.00s/it, loss=0.112, lr=1e-5]Steps:  71%|███████   | 10614/15001 [6:49:09<2:16:41,  1.87s/it, loss=0.112, lr=1e-5]Steps:  71%|███████   | 10614/15001 [6:49:09<2:16:41,  1.87s/it, loss=0.0992, lr=1e-5]Steps:  71%|███████   | 10615/15001 [6:49:11<2:22:10,  1.94s/it, loss=0.0992, lr=1e-5]Steps:  71%|███████   | 10615/15001 [6:49:11<2:22:10,  1.94s/it, loss=0.182, lr=1e-5] Steps:  71%|███████   | 10616/15001 [6:49:12<2:12:58,  1.82s/it, loss=0.182, lr=1e-5]Steps:  71%|███████   | 10616/15001 [6:49:13<2:12:58,  1.82s/it, loss=0.216, lr=1e-5]Steps:  71%|███████   | 10617/15001 [6:49:14<2:12:54,  1.82s/it, loss=0.216, lr=1e-5]Steps:  71%|███████   | 10617/15001 [6:49:15<2:12:54,  1.82s/it, loss=0.32, lr=1e-5] Steps:  71%|███████   | 10618/15001 [6:49:16<2:20:21,  1.92s/it, loss=0.32, lr=1e-5]Steps:  71%|███████   | 10618/15001 [6:49:16<2:20:21,  1.92s/it, loss=0.249, lr=1e-5]Steps:  71%|███████   | 10619/15001 [6:49:18<2:21:06,  1.93s/it, loss=0.249, lr=1e-5]Steps:  71%|███████   | 10619/15001 [6:49:18<2:21:06,  1.93s/it, loss=0.06, lr=1e-5] Steps:  71%|███████   | 10620/15001 [6:49:20<2:21:06,  1.93s/it, loss=0.06, lr=1e-5]Steps:  71%|███████   | 10620/15001 [6:49:20<2:21:06,  1.93s/it, loss=0.242, lr=1e-5]Steps:  71%|███████   | 10621/15001 [6:49:22<2:13:35,  1.83s/it, loss=0.242, lr=1e-5]Steps:  71%|███████   | 10621/15001 [6:49:22<2:13:35,  1.83s/it, loss=0.135, lr=1e-5]Steps:  71%|███████   | 10622/15001 [6:49:24<2:18:50,  1.90s/it, loss=0.135, lr=1e-5]Steps:  71%|███████   | 10622/15001 [6:49:24<2:18:50,  1.90s/it, loss=0.431, lr=1e-5]Steps:  71%|███████   | 10623/15001 [6:49:26<2:15:11,  1.85s/it, loss=0.431, lr=1e-5]Steps:  71%|███████   | 10623/15001 [6:49:26<2:15:11,  1.85s/it, loss=0.0867, lr=1e-5]Steps:  71%|███████   | 10624/15001 [6:49:27<2:15:45,  1.86s/it, loss=0.0867, lr=1e-5]Steps:  71%|███████   | 10624/15001 [6:49:28<2:15:45,  1.86s/it, loss=0.0938, lr=1e-5]Steps:  71%|███████   | 10625/15001 [6:49:29<2:15:01,  1.85s/it, loss=0.0938, lr=1e-5]Steps:  71%|███████   | 10625/15001 [6:49:29<2:15:01,  1.85s/it, loss=0.147, lr=1e-5] Steps:  71%|███████   | 10626/15001 [6:49:31<2:14:19,  1.84s/it, loss=0.147, lr=1e-5]Steps:  71%|███████   | 10626/15001 [6:49:31<2:14:19,  1.84s/it, loss=0.0554, lr=1e-5]Steps:  71%|███████   | 10627/15001 [6:49:33<2:10:57,  1.80s/it, loss=0.0554, lr=1e-5]Steps:  71%|███████   | 10627/15001 [6:49:33<2:10:57,  1.80s/it, loss=0.142, lr=1e-5] Steps:  71%|███████   | 10628/15001 [6:49:35<2:13:30,  1.83s/it, loss=0.142, lr=1e-5]Steps:  71%|███████   | 10628/15001 [6:49:35<2:13:30,  1.83s/it, loss=0.176, lr=1e-5]Steps:  71%|███████   | 10629/15001 [6:49:36<2:10:10,  1.79s/it, loss=0.176, lr=1e-5]Steps:  71%|███████   | 10629/15001 [6:49:37<2:10:10,  1.79s/it, loss=0.0669, lr=1e-5]Steps:  71%|███████   | 10630/15001 [6:49:38<2:14:53,  1.85s/it, loss=0.0669, lr=1e-5]Steps:  71%|███████   | 10630/15001 [6:49:38<2:14:53,  1.85s/it, loss=0.359, lr=1e-5] Steps:  71%|███████   | 10631/15001 [6:49:40<2:16:57,  1.88s/it, loss=0.359, lr=1e-5]Steps:  71%|███████   | 10631/15001 [6:49:40<2:16:57,  1.88s/it, loss=0.386, lr=1e-5]Steps:  71%|███████   | 10632/15001 [6:49:42<2:16:15,  1.87s/it, loss=0.386, lr=1e-5]Steps:  71%|███████   | 10632/15001 [6:49:42<2:16:15,  1.87s/it, loss=0.155, lr=1e-5]Steps:  71%|███████   | 10633/15001 [6:49:44<2:25:02,  1.99s/it, loss=0.155, lr=1e-5]Steps:  71%|███████   | 10633/15001 [6:49:44<2:25:02,  1.99s/it, loss=0.23, lr=1e-5] Steps:  71%|███████   | 10634/15001 [6:49:47<2:26:41,  2.02s/it, loss=0.23, lr=1e-5]Steps:  71%|███████   | 10634/15001 [6:49:47<2:26:41,  2.02s/it, loss=0.112, lr=1e-5]Steps:  71%|███████   | 10635/15001 [6:49:48<2:24:49,  1.99s/it, loss=0.112, lr=1e-5]Steps:  71%|███████   | 10635/15001 [6:49:49<2:24:49,  1.99s/it, loss=0.063, lr=1e-5]Steps:  71%|███████   | 10636/15001 [6:49:50<2:21:29,  1.94s/it, loss=0.063, lr=1e-5]Steps:  71%|███████   | 10636/15001 [6:49:51<2:21:29,  1.94s/it, loss=0.0842, lr=1e-5]Steps:  71%|███████   | 10637/15001 [6:49:52<2:23:24,  1.97s/it, loss=0.0842, lr=1e-5]Steps:  71%|███████   | 10637/15001 [6:49:52<2:23:24,  1.97s/it, loss=0.0961, lr=1e-5]Steps:  71%|███████   | 10638/15001 [6:49:54<2:14:43,  1.85s/it, loss=0.0961, lr=1e-5]Steps:  71%|███████   | 10638/15001 [6:49:54<2:14:43,  1.85s/it, loss=0.324, lr=1e-5] Steps:  71%|███████   | 10639/15001 [6:49:56<2:12:37,  1.82s/it, loss=0.324, lr=1e-5]Steps:  71%|███████   | 10639/15001 [6:49:56<2:12:37,  1.82s/it, loss=0.0219, lr=1e-5]Steps:  71%|███████   | 10640/15001 [6:49:58<2:20:49,  1.94s/it, loss=0.0219, lr=1e-5]Steps:  71%|███████   | 10640/15001 [6:49:58<2:20:49,  1.94s/it, loss=0.0903, lr=1e-5]Steps:  71%|███████   | 10641/15001 [6:50:00<2:14:46,  1.85s/it, loss=0.0903, lr=1e-5]Steps:  71%|███████   | 10641/15001 [6:50:00<2:14:46,  1.85s/it, loss=0.224, lr=1e-5] Steps:  71%|███████   | 10642/15001 [6:50:01<2:12:11,  1.82s/it, loss=0.224, lr=1e-5]Steps:  71%|███████   | 10642/15001 [6:50:01<2:12:11,  1.82s/it, loss=0.246, lr=1e-5]Steps:  71%|███████   | 10643/15001 [6:50:03<2:09:42,  1.79s/it, loss=0.246, lr=1e-5]Steps:  71%|███████   | 10643/15001 [6:50:03<2:09:42,  1.79s/it, loss=0.0962, lr=1e-5]Steps:  71%|███████   | 10644/15001 [6:50:05<2:14:47,  1.86s/it, loss=0.0962, lr=1e-5]Steps:  71%|███████   | 10644/15001 [6:50:05<2:14:47,  1.86s/it, loss=0.153, lr=1e-5] Steps:  71%|███████   | 10645/15001 [6:50:07<2:13:24,  1.84s/it, loss=0.153, lr=1e-5]Steps:  71%|███████   | 10645/15001 [6:50:07<2:13:24,  1.84s/it, loss=0.194, lr=1e-5]Steps:  71%|███████   | 10646/15001 [6:50:08<2:08:23,  1.77s/it, loss=0.194, lr=1e-5]Steps:  71%|███████   | 10646/15001 [6:50:09<2:08:23,  1.77s/it, loss=0.359, lr=1e-5]Steps:  71%|███████   | 10647/15001 [6:50:10<2:12:51,  1.83s/it, loss=0.359, lr=1e-5]Steps:  71%|███████   | 10647/15001 [6:50:10<2:12:51,  1.83s/it, loss=0.13, lr=1e-5] Steps:  71%|███████   | 10648/15001 [6:50:12<2:14:27,  1.85s/it, loss=0.13, lr=1e-5]Steps:  71%|███████   | 10648/15001 [6:50:12<2:14:27,  1.85s/it, loss=0.0972, lr=1e-5]Steps:  71%|███████   | 10649/15001 [6:50:14<2:15:26,  1.87s/it, loss=0.0972, lr=1e-5]Steps:  71%|███████   | 10649/15001 [6:50:14<2:15:26,  1.87s/it, loss=0.0879, lr=1e-5]Steps:  71%|███████   | 10650/15001 [6:50:16<2:14:20,  1.85s/it, loss=0.0879, lr=1e-5]Steps:  71%|███████   | 10650/15001 [6:50:16<2:14:20,  1.85s/it, loss=0.216, lr=1e-5] Steps:  71%|███████   | 10651/15001 [6:50:18<2:12:58,  1.83s/it, loss=0.216, lr=1e-5]Steps:  71%|███████   | 10651/15001 [6:50:18<2:12:58,  1.83s/it, loss=0.202, lr=1e-5]Steps:  71%|███████   | 10652/15001 [6:50:19<2:06:37,  1.75s/it, loss=0.202, lr=1e-5]Steps:  71%|███████   | 10652/15001 [6:50:20<2:06:37,  1.75s/it, loss=0.14, lr=1e-5] Steps:  71%|███████   | 10653/15001 [6:50:21<2:06:09,  1.74s/it, loss=0.14, lr=1e-5]Steps:  71%|███████   | 10653/15001 [6:50:22<2:06:09,  1.74s/it, loss=0.141, lr=1e-5]Steps:  71%|███████   | 10654/15001 [6:50:23<2:16:15,  1.88s/it, loss=0.141, lr=1e-5]Steps:  71%|███████   | 10654/15001 [6:50:23<2:16:15,  1.88s/it, loss=0.16, lr=1e-5] Steps:  71%|███████   | 10655/15001 [6:50:25<2:19:35,  1.93s/it, loss=0.16, lr=1e-5]Steps:  71%|███████   | 10655/15001 [6:50:25<2:19:35,  1.93s/it, loss=0.212, lr=1e-5]Steps:  71%|███████   | 10656/15001 [6:50:27<2:16:31,  1.89s/it, loss=0.212, lr=1e-5]Steps:  71%|███████   | 10656/15001 [6:50:27<2:16:31,  1.89s/it, loss=0.218, lr=1e-5]Steps:  71%|███████   | 10657/15001 [6:50:29<2:21:10,  1.95s/it, loss=0.218, lr=1e-5]Steps:  71%|███████   | 10657/15001 [6:50:29<2:21:10,  1.95s/it, loss=0.169, lr=1e-5]Steps:  71%|███████   | 10658/15001 [6:50:31<2:19:48,  1.93s/it, loss=0.169, lr=1e-5]Steps:  71%|███████   | 10658/15001 [6:50:31<2:19:48,  1.93s/it, loss=0.23, lr=1e-5] Steps:  71%|███████   | 10659/15001 [6:50:33<2:28:07,  2.05s/it, loss=0.23, lr=1e-5]Steps:  71%|███████   | 10659/15001 [6:50:33<2:28:07,  2.05s/it, loss=0.273, lr=1e-5]Steps:  71%|███████   | 10660/15001 [6:50:35<2:18:39,  1.92s/it, loss=0.273, lr=1e-5]Steps:  71%|███████   | 10660/15001 [6:50:35<2:18:39,  1.92s/it, loss=0.216, lr=1e-5]Steps:  71%|███████   | 10661/15001 [6:50:37<2:20:05,  1.94s/it, loss=0.216, lr=1e-5]Steps:  71%|███████   | 10661/15001 [6:50:37<2:20:05,  1.94s/it, loss=0.151, lr=1e-5]Steps:  71%|███████   | 10662/15001 [6:50:39<2:18:12,  1.91s/it, loss=0.151, lr=1e-5]Steps:  71%|███████   | 10662/15001 [6:50:39<2:18:12,  1.91s/it, loss=0.0834, lr=1e-5]Steps:  71%|███████   | 10663/15001 [6:50:41<2:16:08,  1.88s/it, loss=0.0834, lr=1e-5]Steps:  71%|███████   | 10663/15001 [6:50:41<2:16:08,  1.88s/it, loss=0.0302, lr=1e-5]Steps:  71%|███████   | 10664/15001 [6:50:42<2:10:41,  1.81s/it, loss=0.0302, lr=1e-5]Steps:  71%|███████   | 10664/15001 [6:50:42<2:10:41,  1.81s/it, loss=0.277, lr=1e-5] Steps:  71%|███████   | 10665/15001 [6:50:44<2:06:25,  1.75s/it, loss=0.277, lr=1e-5]Steps:  71%|███████   | 10665/15001 [6:50:44<2:06:25,  1.75s/it, loss=0.278, lr=1e-5]Steps:  71%|███████   | 10666/15001 [6:50:46<2:12:14,  1.83s/it, loss=0.278, lr=1e-5]Steps:  71%|███████   | 10666/15001 [6:50:46<2:12:14,  1.83s/it, loss=0.0396, lr=1e-5]Steps:  71%|███████   | 10667/15001 [6:50:48<2:16:40,  1.89s/it, loss=0.0396, lr=1e-5]Steps:  71%|███████   | 10667/15001 [6:50:48<2:16:40,  1.89s/it, loss=0.0559, lr=1e-5]Steps:  71%|███████   | 10668/15001 [6:50:50<2:14:12,  1.86s/it, loss=0.0559, lr=1e-5]Steps:  71%|███████   | 10668/15001 [6:50:50<2:14:12,  1.86s/it, loss=0.029, lr=1e-5] Steps:  71%|███████   | 10669/15001 [6:50:52<2:12:32,  1.84s/it, loss=0.029, lr=1e-5]Steps:  71%|███████   | 10669/15001 [6:50:52<2:12:32,  1.84s/it, loss=0.0797, lr=1e-5]Steps:  71%|███████   | 10670/15001 [6:50:53<2:07:34,  1.77s/it, loss=0.0797, lr=1e-5]Steps:  71%|███████   | 10670/15001 [6:50:53<2:07:34,  1.77s/it, loss=0.112, lr=1e-5] Steps:  71%|███████   | 10671/15001 [6:50:55<2:05:36,  1.74s/it, loss=0.112, lr=1e-5]Steps:  71%|███████   | 10671/15001 [6:50:55<2:05:36,  1.74s/it, loss=0.163, lr=1e-5]Steps:  71%|███████   | 10672/15001 [6:50:57<2:11:03,  1.82s/it, loss=0.163, lr=1e-5]Steps:  71%|███████   | 10672/15001 [6:50:57<2:11:03,  1.82s/it, loss=0.342, lr=1e-5]Steps:  71%|███████   | 10673/15001 [6:50:59<2:10:26,  1.81s/it, loss=0.342, lr=1e-5]Steps:  71%|███████   | 10673/15001 [6:50:59<2:10:26,  1.81s/it, loss=0.349, lr=1e-5]Steps:  71%|███████   | 10674/15001 [6:51:01<2:16:19,  1.89s/it, loss=0.349, lr=1e-5]Steps:  71%|███████   | 10674/15001 [6:51:01<2:16:19,  1.89s/it, loss=0.0424, lr=1e-5]Steps:  71%|███████   | 10675/15001 [6:51:03<2:15:20,  1.88s/it, loss=0.0424, lr=1e-5]Steps:  71%|███████   | 10675/15001 [6:51:03<2:15:20,  1.88s/it, loss=0.207, lr=1e-5] Steps:  71%|███████   | 10676/15001 [6:51:04<2:12:53,  1.84s/it, loss=0.207, lr=1e-5]Steps:  71%|███████   | 10676/15001 [6:51:04<2:12:53,  1.84s/it, loss=0.11, lr=1e-5] Steps:  71%|███████   | 10677/15001 [6:51:06<2:17:53,  1.91s/it, loss=0.11, lr=1e-5]Steps:  71%|███████   | 10677/15001 [6:51:06<2:17:53,  1.91s/it, loss=0.145, lr=1e-5]Steps:  71%|███████   | 10678/15001 [6:51:08<2:16:50,  1.90s/it, loss=0.145, lr=1e-5]Steps:  71%|███████   | 10678/15001 [6:51:09<2:16:50,  1.90s/it, loss=0.119, lr=1e-5]Steps:  71%|███████   | 10679/15001 [6:51:10<2:25:04,  2.01s/it, loss=0.119, lr=1e-5]Steps:  71%|███████   | 10679/15001 [6:51:11<2:25:04,  2.01s/it, loss=0.244, lr=1e-5]Steps:  71%|███████   | 10680/15001 [6:51:12<2:19:11,  1.93s/it, loss=0.244, lr=1e-5]Steps:  71%|███████   | 10680/15001 [6:51:13<2:19:11,  1.93s/it, loss=0.302, lr=1e-5]Steps:  71%|███████   | 10681/15001 [6:51:14<2:26:15,  2.03s/it, loss=0.302, lr=1e-5]Steps:  71%|███████   | 10681/15001 [6:51:15<2:26:15,  2.03s/it, loss=0.0296, lr=1e-5]Steps:  71%|███████   | 10682/15001 [6:51:16<2:23:45,  2.00s/it, loss=0.0296, lr=1e-5]Steps:  71%|███████   | 10682/15001 [6:51:17<2:23:45,  2.00s/it, loss=0.344, lr=1e-5] Steps:  71%|███████   | 10683/15001 [6:51:18<2:20:17,  1.95s/it, loss=0.344, lr=1e-5]Steps:  71%|███████   | 10683/15001 [6:51:18<2:20:17,  1.95s/it, loss=0.28, lr=1e-5] Steps:  71%|███████   | 10684/15001 [6:51:20<2:22:21,  1.98s/it, loss=0.28, lr=1e-5]Steps:  71%|███████   | 10684/15001 [6:51:20<2:22:21,  1.98s/it, loss=0.0482, lr=1e-5]Steps:  71%|███████   | 10685/15001 [6:51:22<2:20:51,  1.96s/it, loss=0.0482, lr=1e-5]Steps:  71%|███████   | 10685/15001 [6:51:22<2:20:51,  1.96s/it, loss=0.272, lr=1e-5] Steps:  71%|███████   | 10686/15001 [6:51:24<2:15:54,  1.89s/it, loss=0.272, lr=1e-5]Steps:  71%|███████   | 10686/15001 [6:51:24<2:15:54,  1.89s/it, loss=0.215, lr=1e-5]Steps:  71%|███████   | 10687/15001 [6:51:26<2:09:56,  1.81s/it, loss=0.215, lr=1e-5]Steps:  71%|███████   | 10687/15001 [6:51:26<2:09:56,  1.81s/it, loss=0.184, lr=1e-5]Steps:  71%|███████   | 10688/15001 [6:51:28<2:14:19,  1.87s/it, loss=0.184, lr=1e-5]Steps:  71%|███████   | 10688/15001 [6:51:28<2:14:19,  1.87s/it, loss=0.112, lr=1e-5]Steps:  71%|███████▏  | 10689/15001 [6:51:29<2:14:51,  1.88s/it, loss=0.112, lr=1e-5]Steps:  71%|███████▏  | 10689/15001 [6:51:30<2:14:51,  1.88s/it, loss=0.33, lr=1e-5] Steps:  71%|███████▏  | 10690/15001 [6:51:31<2:14:51,  1.88s/it, loss=0.33, lr=1e-5]Steps:  71%|███████▏  | 10690/15001 [6:51:31<2:14:51,  1.88s/it, loss=0.381, lr=1e-5]Steps:  71%|███████▏  | 10691/15001 [6:51:33<2:11:46,  1.83s/it, loss=0.381, lr=1e-5]Steps:  71%|███████▏  | 10691/15001 [6:51:33<2:11:46,  1.83s/it, loss=0.387, lr=1e-5]Steps:  71%|███████▏  | 10692/15001 [6:51:35<2:10:18,  1.81s/it, loss=0.387, lr=1e-5]Steps:  71%|███████▏  | 10692/15001 [6:51:35<2:10:18,  1.81s/it, loss=0.191, lr=1e-5]Steps:  71%|███████▏  | 10693/15001 [6:51:37<2:16:34,  1.90s/it, loss=0.191, lr=1e-5]Steps:  71%|███████▏  | 10693/15001 [6:51:37<2:16:34,  1.90s/it, loss=0.194, lr=1e-5]Steps:  71%|███████▏  | 10694/15001 [6:51:39<2:15:28,  1.89s/it, loss=0.194, lr=1e-5]Steps:  71%|███████▏  | 10694/15001 [6:51:39<2:15:28,  1.89s/it, loss=0.217, lr=1e-5]Steps:  71%|███████▏  | 10695/15001 [6:51:40<2:10:34,  1.82s/it, loss=0.217, lr=1e-5]Steps:  71%|███████▏  | 10695/15001 [6:51:41<2:10:34,  1.82s/it, loss=0.151, lr=1e-5]Steps:  71%|███████▏  | 10696/15001 [6:51:43<2:15:43,  1.89s/it, loss=0.151, lr=1e-5]Steps:  71%|███████▏  | 10696/15001 [6:51:43<2:15:43,  1.89s/it, loss=0.0908, lr=1e-5]Steps:  71%|███████▏  | 10697/15001 [6:51:44<2:10:59,  1.83s/it, loss=0.0908, lr=1e-5]Steps:  71%|███████▏  | 10697/15001 [6:51:45<2:10:59,  1.83s/it, loss=0.0961, lr=1e-5]Steps:  71%|███████▏  | 10698/15001 [6:51:46<2:15:39,  1.89s/it, loss=0.0961, lr=1e-5]Steps:  71%|███████▏  | 10698/15001 [6:51:46<2:15:39,  1.89s/it, loss=0.296, lr=1e-5] Steps:  71%|███████▏  | 10699/15001 [6:51:48<2:15:23,  1.89s/it, loss=0.296, lr=1e-5]Steps:  71%|███████▏  | 10699/15001 [6:51:48<2:15:23,  1.89s/it, loss=0.343, lr=1e-5]Steps:  71%|███████▏  | 10700/15001 [6:51:50<2:18:31,  1.93s/it, loss=0.343, lr=1e-5]Steps:  71%|███████▏  | 10700/15001 [6:51:50<2:18:31,  1.93s/it, loss=0.303, lr=1e-5]Steps:  71%|███████▏  | 10701/15001 [6:51:52<2:16:07,  1.90s/it, loss=0.303, lr=1e-5]Steps:  71%|███████▏  | 10701/15001 [6:51:52<2:16:07,  1.90s/it, loss=0.0761, lr=1e-5]Steps:  71%|███████▏  | 10702/15001 [6:51:54<2:17:19,  1.92s/it, loss=0.0761, lr=1e-5]Steps:  71%|███████▏  | 10702/15001 [6:51:54<2:17:19,  1.92s/it, loss=0.176, lr=1e-5] Steps:  71%|███████▏  | 10703/15001 [6:51:56<2:18:19,  1.93s/it, loss=0.176, lr=1e-5]Steps:  71%|███████▏  | 10703/15001 [6:51:56<2:18:19,  1.93s/it, loss=0.057, lr=1e-5]Steps:  71%|███████▏  | 10704/15001 [6:51:58<2:20:04,  1.96s/it, loss=0.057, lr=1e-5]Steps:  71%|███████▏  | 10704/15001 [6:51:58<2:20:04,  1.96s/it, loss=0.145, lr=1e-5]Steps:  71%|███████▏  | 10705/15001 [6:52:00<2:24:01,  2.01s/it, loss=0.145, lr=1e-5]Steps:  71%|███████▏  | 10705/15001 [6:52:00<2:24:01,  2.01s/it, loss=0.194, lr=1e-5]Steps:  71%|███████▏  | 10706/15001 [6:52:02<2:18:20,  1.93s/it, loss=0.194, lr=1e-5]Steps:  71%|███████▏  | 10706/15001 [6:52:02<2:18:20,  1.93s/it, loss=0.13, lr=1e-5] Steps:  71%|███████▏  | 10707/15001 [6:52:03<2:12:07,  1.85s/it, loss=0.13, lr=1e-5]Steps:  71%|███████▏  | 10707/15001 [6:52:04<2:12:07,  1.85s/it, loss=0.217, lr=1e-5]Steps:  71%|███████▏  | 10708/15001 [6:52:06<2:18:51,  1.94s/it, loss=0.217, lr=1e-5]Steps:  71%|███████▏  | 10708/15001 [6:52:06<2:18:51,  1.94s/it, loss=0.186, lr=1e-5]Steps:  71%|███████▏  | 10709/15001 [6:52:08<2:18:36,  1.94s/it, loss=0.186, lr=1e-5]Steps:  71%|███████▏  | 10709/15001 [6:52:08<2:18:36,  1.94s/it, loss=0.0566, lr=1e-5]Steps:  71%|███████▏  | 10710/15001 [6:52:09<2:14:06,  1.88s/it, loss=0.0566, lr=1e-5]Steps:  71%|███████▏  | 10710/15001 [6:52:09<2:14:06,  1.88s/it, loss=0.177, lr=1e-5] Steps:  71%|███████▏  | 10711/15001 [6:52:11<2:11:11,  1.83s/it, loss=0.177, lr=1e-5]Steps:  71%|███████▏  | 10711/15001 [6:52:11<2:11:11,  1.83s/it, loss=0.055, lr=1e-5]Steps:  71%|███████▏  | 10712/15001 [6:52:13<2:12:55,  1.86s/it, loss=0.055, lr=1e-5]Steps:  71%|███████▏  | 10712/15001 [6:52:13<2:12:55,  1.86s/it, loss=0.0292, lr=1e-5]Steps:  71%|███████▏  | 10713/15001 [6:52:15<2:11:55,  1.85s/it, loss=0.0292, lr=1e-5]Steps:  71%|███████▏  | 10713/15001 [6:52:15<2:11:55,  1.85s/it, loss=0.106, lr=1e-5] Steps:  71%|███████▏  | 10714/15001 [6:52:17<2:12:11,  1.85s/it, loss=0.106, lr=1e-5]Steps:  71%|███████▏  | 10714/15001 [6:52:17<2:12:11,  1.85s/it, loss=0.181, lr=1e-5]Steps:  71%|███████▏  | 10715/15001 [6:52:18<2:10:02,  1.82s/it, loss=0.181, lr=1e-5]Steps:  71%|███████▏  | 10715/15001 [6:52:18<2:10:02,  1.82s/it, loss=0.141, lr=1e-5]Steps:  71%|███████▏  | 10716/15001 [6:52:20<2:07:02,  1.78s/it, loss=0.141, lr=1e-5]Steps:  71%|███████▏  | 10716/15001 [6:52:20<2:07:02,  1.78s/it, loss=0.252, lr=1e-5]Steps:  71%|███████▏  | 10717/15001 [6:52:22<2:10:25,  1.83s/it, loss=0.252, lr=1e-5]Steps:  71%|███████▏  | 10717/15001 [6:52:22<2:10:25,  1.83s/it, loss=0.213, lr=1e-5]Steps:  71%|███████▏  | 10718/15001 [6:52:24<2:08:55,  1.81s/it, loss=0.213, lr=1e-5]Steps:  71%|███████▏  | 10718/15001 [6:52:24<2:08:55,  1.81s/it, loss=0.19, lr=1e-5] Steps:  71%|███████▏  | 10719/15001 [6:52:25<2:04:19,  1.74s/it, loss=0.19, lr=1e-5]Steps:  71%|███████▏  | 10719/15001 [6:52:26<2:04:19,  1.74s/it, loss=0.14, lr=1e-5]Steps:  71%|███████▏  | 10720/15001 [6:52:27<2:08:32,  1.80s/it, loss=0.14, lr=1e-5]Steps:  71%|███████▏  | 10720/15001 [6:52:27<2:08:32,  1.80s/it, loss=0.11, lr=1e-5]Steps:  71%|███████▏  | 10721/15001 [6:52:29<2:08:49,  1.81s/it, loss=0.11, lr=1e-5]Steps:  71%|███████▏  | 10721/15001 [6:52:29<2:08:49,  1.81s/it, loss=0.135, lr=1e-5]Steps:  71%|███████▏  | 10722/15001 [6:52:31<2:09:14,  1.81s/it, loss=0.135, lr=1e-5]Steps:  71%|███████▏  | 10722/15001 [6:52:31<2:09:14,  1.81s/it, loss=0.12, lr=1e-5] Steps:  71%|███████▏  | 10723/15001 [6:52:33<2:10:24,  1.83s/it, loss=0.12, lr=1e-5]Steps:  71%|███████▏  | 10723/15001 [6:52:33<2:10:24,  1.83s/it, loss=0.117, lr=1e-5]Steps:  71%|███████▏  | 10724/15001 [6:52:35<2:14:59,  1.89s/it, loss=0.117, lr=1e-5]Steps:  71%|███████▏  | 10724/15001 [6:52:35<2:14:59,  1.89s/it, loss=0.239, lr=1e-5]Steps:  71%|███████▏  | 10725/15001 [6:52:37<2:18:10,  1.94s/it, loss=0.239, lr=1e-5]Steps:  71%|███████▏  | 10725/15001 [6:52:37<2:18:10,  1.94s/it, loss=0.23, lr=1e-5] Steps:  72%|███████▏  | 10726/15001 [6:52:39<2:19:40,  1.96s/it, loss=0.23, lr=1e-5]Steps:  72%|███████▏  | 10726/15001 [6:52:39<2:19:40,  1.96s/it, loss=0.138, lr=1e-5]Steps:  72%|███████▏  | 10727/15001 [6:52:41<2:19:20,  1.96s/it, loss=0.138, lr=1e-5]Steps:  72%|███████▏  | 10727/15001 [6:52:41<2:19:20,  1.96s/it, loss=0.253, lr=1e-5]Steps:  72%|███████▏  | 10728/15001 [6:52:43<2:19:05,  1.95s/it, loss=0.253, lr=1e-5]Steps:  72%|███████▏  | 10728/15001 [6:52:43<2:19:05,  1.95s/it, loss=0.243, lr=1e-5]Steps:  72%|███████▏  | 10729/15001 [6:52:45<2:20:42,  1.98s/it, loss=0.243, lr=1e-5]Steps:  72%|███████▏  | 10729/15001 [6:52:45<2:20:42,  1.98s/it, loss=0.198, lr=1e-5]Steps:  72%|███████▏  | 10730/15001 [6:52:47<2:16:59,  1.92s/it, loss=0.198, lr=1e-5]Steps:  72%|███████▏  | 10730/15001 [6:52:47<2:16:59,  1.92s/it, loss=0.204, lr=1e-5]Steps:  72%|███████▏  | 10731/15001 [6:52:48<2:14:00,  1.88s/it, loss=0.204, lr=1e-5]Steps:  72%|███████▏  | 10731/15001 [6:52:48<2:14:00,  1.88s/it, loss=0.22, lr=1e-5] Steps:  72%|███████▏  | 10732/15001 [6:52:50<2:07:45,  1.80s/it, loss=0.22, lr=1e-5]Steps:  72%|███████▏  | 10732/15001 [6:52:50<2:07:45,  1.80s/it, loss=0.157, lr=1e-5]Steps:  72%|███████▏  | 10733/15001 [6:52:52<2:15:02,  1.90s/it, loss=0.157, lr=1e-5]Steps:  72%|███████▏  | 10733/15001 [6:52:52<2:15:02,  1.90s/it, loss=0.245, lr=1e-5]Steps:  72%|████��██▏  | 10734/15001 [6:52:54<2:09:12,  1.82s/it, loss=0.245, lr=1e-5]Steps:  72%|███████▏  | 10734/15001 [6:52:54<2:09:12,  1.82s/it, loss=0.23, lr=1e-5] Steps:  72%|███████▏  | 10735/15001 [6:52:56<2:15:03,  1.90s/it, loss=0.23, lr=1e-5]Steps:  72%|███████▏  | 10735/15001 [6:52:56<2:15:03,  1.90s/it, loss=0.0722, lr=1e-5]Steps:  72%|███████▏  | 10736/15001 [6:52:58<2:12:03,  1.86s/it, loss=0.0722, lr=1e-5]Steps:  72%|███████▏  | 10736/15001 [6:52:58<2:12:03,  1.86s/it, loss=0.143, lr=1e-5] Steps:  72%|███████▏  | 10737/15001 [6:52:59<2:09:55,  1.83s/it, loss=0.143, lr=1e-5]Steps:  72%|███████▏  | 10737/15001 [6:53:00<2:09:55,  1.83s/it, loss=0.0212, lr=1e-5]Steps:  72%|███████▏  | 10738/15001 [6:53:01<2:11:48,  1.86s/it, loss=0.0212, lr=1e-5]Steps:  72%|███████▏  | 10738/15001 [6:53:01<2:11:48,  1.86s/it, loss=0.154, lr=1e-5] Steps:  72%|███████▏  | 10739/15001 [6:53:03<2:12:05,  1.86s/it, loss=0.154, lr=1e-5]Steps:  72%|███████▏  | 10739/15001 [6:53:03<2:12:05,  1.86s/it, loss=0.2, lr=1e-5]  Steps:  72%|███████▏  | 10740/15001 [6:53:05<2:07:14,  1.79s/it, loss=0.2, lr=1e-5]Steps:  72%|███████▏  | 10740/15001 [6:53:05<2:07:14,  1.79s/it, loss=0.112, lr=1e-5]Steps:  72%|███████▏  | 10741/15001 [6:53:06<2:05:03,  1.76s/it, loss=0.112, lr=1e-5]Steps:  72%|███████▏  | 10741/15001 [6:53:07<2:05:03,  1.76s/it, loss=0.286, lr=1e-5]Steps:  72%|███████▏  | 10742/15001 [6:53:08<2:08:04,  1.80s/it, loss=0.286, lr=1e-5]Steps:  72%|███████▏  | 10742/15001 [6:53:09<2:08:04,  1.80s/it, loss=0.109, lr=1e-5]Steps:  72%|███████▏  | 10743/15001 [6:53:10<2:11:17,  1.85s/it, loss=0.109, lr=1e-5]Steps:  72%|███████▏  | 10743/15001 [6:53:10<2:11:17,  1.85s/it, loss=0.14, lr=1e-5] Steps:  72%|███████▏  | 10744/15001 [6:53:12<2:08:36,  1.81s/it, loss=0.14, lr=1e-5]Steps:  72%|███████▏  | 10744/15001 [6:53:12<2:08:36,  1.81s/it, loss=0.0668, lr=1e-5]Steps:  72%|███████▏  | 10745/15001 [6:53:14<2:06:15,  1.78s/it, loss=0.0668, lr=1e-5]Steps:  72%|███████▏  | 10745/15001 [6:53:14<2:06:15,  1.78s/it, loss=0.0382, lr=1e-5]Steps:  72%|███████▏  | 10746/15001 [6:53:16<2:19:33,  1.97s/it, loss=0.0382, lr=1e-5]Steps:  72%|███████▏  | 10746/15001 [6:53:16<2:19:33,  1.97s/it, loss=0.238, lr=1e-5] Steps:  72%|███████▏  | 10747/15001 [6:53:18<2:20:15,  1.98s/it, loss=0.238, lr=1e-5]Steps:  72%|███████▏  | 10747/15001 [6:53:18<2:20:15,  1.98s/it, loss=0.0822, lr=1e-5]Steps:  72%|███████▏  | 10748/15001 [6:53:20<2:25:03,  2.05s/it, loss=0.0822, lr=1e-5]Steps:  72%|███████▏  | 10748/15001 [6:53:20<2:25:03,  2.05s/it, loss=0.247, lr=1e-5] Steps:  72%|███████▏  | 10749/15001 [6:53:22<2:25:12,  2.05s/it, loss=0.247, lr=1e-5]Steps:  72%|███████▏  | 10749/15001 [6:53:23<2:25:12,  2.05s/it, loss=0.225, lr=1e-5]Steps:  72%|███████▏  | 10750/15001 [6:53:24<2:21:22,  2.00s/it, loss=0.225, lr=1e-5]Steps:  72%|███████▏  | 10750/15001 [6:53:24<2:21:22,  2.00s/it, loss=0.134, lr=1e-5]Steps:  72%|███████▏  | 10751/15001 [6:53:26<2:20:51,  1.99s/it, loss=0.134, lr=1e-5]Steps:  72%|███████▏  | 10751/15001 [6:53:26<2:20:51,  1.99s/it, loss=0.121, lr=1e-5]Steps:  72%|███████▏  | 10752/15001 [6:53:28<2:11:17,  1.85s/it, loss=0.121, lr=1e-5]Steps:  72%|███████▏  | 10752/15001 [6:53:28<2:11:17,  1.85s/it, loss=0.00759, lr=1e-5]Steps:  72%|███████▏  | 10753/15001 [6:53:30<2:14:16,  1.90s/it, loss=0.00759, lr=1e-5]Steps:  72%|███████▏  | 10753/15001 [6:53:30<2:14:16,  1.90s/it, loss=0.257, lr=1e-5]  Steps:  72%|███████▏  | 10754/15001 [6:53:32<2:18:43,  1.96s/it, loss=0.257, lr=1e-5]Steps:  72%|███████▏  | 10754/15001 [6:53:32<2:18:43,  1.96s/it, loss=0.231, lr=1e-5]Steps:  72%|███████▏  | 10755/15001 [6:53:34<2:14:37,  1.90s/it, loss=0.231, lr=1e-5]Steps:  72%|███████▏  | 10755/15001 [6:53:34<2:14:37,  1.90s/it, loss=0.204, lr=1e-5]Steps:  72%|███████▏  | 10756/15001 [6:53:36<2:13:39,  1.89s/it, loss=0.204, lr=1e-5]Steps:  72%|███████▏  | 10756/15001 [6:53:36<2:13:39,  1.89s/it, loss=0.185, lr=1e-5]Steps:  72%|███████▏  | 10757/15001 [6:53:37<2:07:30,  1.80s/it, loss=0.185, lr=1e-5]Steps:  72%|███████▏  | 10757/15001 [6:53:37<2:07:30,  1.80s/it, loss=0.156, lr=1e-5]Steps:  72%|███████▏  | 10758/15001 [6:53:39<2:11:12,  1.86s/it, loss=0.156, lr=1e-5]Steps:  72%|███████▏  | 10758/15001 [6:53:39<2:11:12,  1.86s/it, loss=0.263, lr=1e-5]Steps:  72%|███████▏  | 10759/15001 [6:53:41<2:10:55,  1.85s/it, loss=0.263, lr=1e-5]Steps:  72%|███████▏  | 10759/15001 [6:53:41<2:10:55,  1.85s/it, loss=0.182, lr=1e-5]Steps:  72%|███████▏  | 10760/15001 [6:53:42<2:03:58,  1.75s/it, loss=0.182, lr=1e-5]Steps:  72%|███████▏  | 10760/15001 [6:53:43<2:03:58,  1.75s/it, loss=0.123, lr=1e-5]Steps:  72%|███████▏  | 10761/15001 [6:53:45<2:09:43,  1.84s/it, loss=0.123, lr=1e-5]Steps:  72%|███████▏  | 10761/15001 [6:53:45<2:09:43,  1.84s/it, loss=0.166, lr=1e-5]Steps:  72%|███████▏  | 10762/15001 [6:53:46<2:07:57,  1.81s/it, loss=0.166, lr=1e-5]Steps:  72%|███████▏  | 10762/15001 [6:53:47<2:07:57,  1.81s/it, loss=0.196, lr=1e-5]Steps:  72%|███████▏  | 10763/15001 [6:53:48<2:12:00,  1.87s/it, loss=0.196, lr=1e-5]Steps:  72%|███████▏  | 10763/15001 [6:53:48<2:12:00,  1.87s/it, loss=0.132, lr=1e-5]Steps:  72%|███████▏  | 10764/15001 [6:53:50<2:14:23,  1.90s/it, loss=0.132, lr=1e-5]Steps:  72%|███████▏  | 10764/15001 [6:53:50<2:14:23,  1.90s/it, loss=0.0743, lr=1e-5]Steps:  72%|███████▏  | 10765/15001 [6:53:52<2:07:59,  1.81s/it, loss=0.0743, lr=1e-5]Steps:  72%|███████▏  | 10765/15001 [6:53:52<2:07:59,  1.81s/it, loss=0.114, lr=1e-5] Steps:  72%|███████▏  | 10766/15001 [6:53:54<2:05:52,  1.78s/it, loss=0.114, lr=1e-5]Steps:  72%|███████▏  | 10766/15001 [6:53:54<2:05:52,  1.78s/it, loss=0.151, lr=1e-5]Steps:  72%|███████▏  | 10767/15001 [6:53:56<2:10:02,  1.84s/it, loss=0.151, lr=1e-5]Steps:  72%|███████▏  | 10767/15001 [6:53:56<2:10:02,  1.84s/it, loss=0.14, lr=1e-5] Steps:  72%|███████▏  | 10768/15001 [6:53:57<2:12:14,  1.87s/it, loss=0.14, lr=1e-5]Steps:  72%|███████▏  | 10768/15001 [6:53:58<2:12:14,  1.87s/it, loss=0.0456, lr=1e-5]Steps:  72%|███████▏  | 10769/15001 [6:53:59<2:14:26,  1.91s/it, loss=0.0456, lr=1e-5]Steps:  72%|███████▏  | 10769/15001 [6:54:00<2:14:26,  1.91s/it, loss=0.0677, lr=1e-5]Steps:  72%|███████▏  | 10770/15001 [6:54:02<2:18:34,  1.97s/it, loss=0.0677, lr=1e-5]Steps:  72%|███████▏  | 10770/15001 [6:54:02<2:18:34,  1.97s/it, loss=0.21, lr=1e-5]  Steps:  72%|███████▏  | 10771/15001 [6:54:04<2:19:07,  1.97s/it, loss=0.21, lr=1e-5]Steps:  72%|███████▏  | 10771/15001 [6:54:04<2:19:07,  1.97s/it, loss=0.125, lr=1e-5]Steps:  72%|███████▏  | 10772/15001 [6:54:05<2:15:12,  1.92s/it, loss=0.125, lr=1e-5]Steps:  72%|███████▏  | 10772/15001 [6:54:06<2:15:12,  1.92s/it, loss=0.106, lr=1e-5]Steps:  72%|███████▏  | 10773/15001 [6:54:07<2:19:31,  1.98s/it, loss=0.106, lr=1e-5]Steps:  72%|███████▏  | 10773/15001 [6:54:08<2:19:31,  1.98s/it, loss=0.188, lr=1e-5]Steps:  72%|███████▏  | 10774/15001 [6:54:09<2:16:00,  1.93s/it, loss=0.188, lr=1e-5]Steps:  72%|███████▏  | 10774/15001 [6:54:09<2:16:00,  1.93s/it, loss=0.18, lr=1e-5] Steps:  72%|███████▏  | 10775/15001 [6:54:11<2:10:18,  1.85s/it, loss=0.18, lr=1e-5]Steps:  72%|███████▏  | 10775/15001 [6:54:11<2:10:18,  1.85s/it, loss=0.105, lr=1e-5]Steps:  72%|███████▏  | 10776/15001 [6:54:13<2:13:57,  1.90s/it, loss=0.105, lr=1e-5]Steps:  72%|███████▏  | 10776/15001 [6:54:13<2:13:57,  1.90s/it, loss=0.135, lr=1e-5]Steps:  72%|███████▏  | 10777/15001 [6:54:15<2:09:09,  1.83s/it, loss=0.135, lr=1e-5]Steps:  72%|███████▏  | 10777/15001 [6:54:15<2:09:09,  1.83s/it, loss=0.122, lr=1e-5]Steps:  72%|███████▏  | 10778/15001 [6:54:16<2:08:47,  1.83s/it, loss=0.122, lr=1e-5]Steps:  72%|███████▏  | 10778/15001 [6:54:17<2:08:47,  1.83s/it, loss=0.155, lr=1e-5]Steps:  72%|███████▏  | 10779/15001 [6:54:18<2:11:45,  1.87s/it, loss=0.155, lr=1e-5]Steps:  72%|███████▏  | 10779/15001 [6:54:19<2:11:45,  1.87s/it, loss=0.141, lr=1e-5]Steps:  72%|███████▏  | 10780/15001 [6:54:20<2:06:14,  1.79s/it, loss=0.141, lr=1e-5]Steps:  72%|███████▏  | 10780/15001 [6:54:20<2:06:14,  1.79s/it, loss=0.0424, lr=1e-5]Steps:  72%|███████▏  | 10781/15001 [6:54:22<2:12:56,  1.89s/it, loss=0.0424, lr=1e-5]Steps:  72%|███████▏  | 10781/15001 [6:54:22<2:12:56,  1.89s/it, loss=0.282, lr=1e-5] Steps:  72%|███████▏  | 10782/15001 [6:54:24<2:13:04,  1.89s/it, loss=0.282, lr=1e-5]Steps:  72%|███████▏  | 10782/15001 [6:54:24<2:13:04,  1.89s/it, loss=0.307, lr=1e-5]Steps:  72%|███████▏  | 10783/15001 [6:54:26<2:07:26,  1.81s/it, loss=0.307, lr=1e-5]Steps:  72%|███████▏  | 10783/15001 [6:54:26<2:07:26,  1.81s/it, loss=0.195, lr=1e-5]Steps:  72%|███████▏  | 10784/15001 [6:54:27<2:06:39,  1.80s/it, loss=0.195, lr=1e-5]Steps:  72%|███████▏  | 10784/15001 [6:54:28<2:06:39,  1.80s/it, loss=0.0986, lr=1e-5]Steps:  72%|███████▏  | 10785/15001 [6:54:29<2:08:28,  1.83s/it, loss=0.0986, lr=1e-5]Steps:  72%|███████▏  | 10785/15001 [6:54:30<2:08:28,  1.83s/it, loss=0.058, lr=1e-5] Steps:  72%|███████▏  | 10786/15001 [6:54:31<2:12:30,  1.89s/it, loss=0.058, lr=1e-5]Steps:  72%|███████▏  | 10786/15001 [6:54:32<2:12:30,  1.89s/it, loss=0.146, lr=1e-5]Steps:  72%|███████▏  | 10787/15001 [6:54:33<2:14:22,  1.91s/it, loss=0.146, lr=1e-5]Steps:  72%|███████▏  | 10787/15001 [6:54:33<2:14:22,  1.91s/it, loss=0.292, lr=1e-5]Steps:  72%|███████▏  | 10788/15001 [6:54:35<2:11:40,  1.88s/it, loss=0.292, lr=1e-5]Steps:  72%|███████▏  | 10788/15001 [6:54:35<2:11:40,  1.88s/it, loss=0.15, lr=1e-5] Steps:  72%|███████▏  | 10789/15001 [6:54:37<2:04:25,  1.77s/it, loss=0.15, lr=1e-5]Steps:  72%|███████▏  | 10789/15001 [6:54:37<2:04:25,  1.77s/it, loss=0.0749, lr=1e-5]Steps:  72%|███████▏  | 10790/15001 [6:54:39<2:06:42,  1.81s/it, loss=0.0749, lr=1e-5]Steps:  72%|███████▏  | 10790/15001 [6:54:39<2:06:42,  1.81s/it, loss=0.199, lr=1e-5] Steps:  72%|███████▏  | 10791/15001 [6:54:41<2:14:27,  1.92s/it, loss=0.199, lr=1e-5]Steps:  72%|███████▏  | 10791/15001 [6:54:41<2:14:27,  1.92s/it, loss=0.181, lr=1e-5]Steps:  72%|███████▏  | 10792/15001 [6:54:42<2:10:14,  1.86s/it, loss=0.181, lr=1e-5]Steps:  72%|███████▏  | 10792/15001 [6:54:43<2:10:14,  1.86s/it, loss=0.0882, lr=1e-5]Steps:  72%|███████▏  | 10793/15001 [6:54:45<2:15:01,  1.93s/it, loss=0.0882, lr=1e-5]Steps:  72%|███████▏  | 10793/15001 [6:54:45<2:15:01,  1.93s/it, loss=0.384, lr=1e-5] Steps:  72%|███████▏  | 10794/15001 [6:54:47<2:20:15,  2.00s/it, loss=0.384, lr=1e-5]Steps:  72%|███████▏  | 10794/15001 [6:54:47<2:20:15,  2.00s/it, loss=0.117, lr=1e-5]Steps:  72%|███████▏  | 10795/15001 [6:54:48<2:13:21,  1.90s/it, loss=0.117, lr=1e-5]Steps:  72%|███████▏  | 10795/15001 [6:54:49<2:13:21,  1.90s/it, loss=0.0676, lr=1e-5]Steps:  72%|███████▏  | 10796/15001 [6:54:51<2:18:24,  1.97s/it, loss=0.0676, lr=1e-5]Steps:  72%|███████▏  | 10796/15001 [6:54:51<2:18:24,  1.97s/it, loss=0.0838, lr=1e-5]Steps:  72%|███████▏  | 10797/15001 [6:54:52<2:14:17,  1.92s/it, loss=0.0838, lr=1e-5]Steps:  72%|███████▏  | 10797/15001 [6:54:53<2:14:17,  1.92s/it, loss=0.179, lr=1e-5] Steps:  72%|███████▏  | 10798/15001 [6:54:54<2:14:20,  1.92s/it, loss=0.179, lr=1e-5]Steps:  72%|███████▏  | 10798/15001 [6:54:54<2:14:20,  1.92s/it, loss=0.306, lr=1e-5]Steps:  72%|███████▏  | 10799/15001 [6:54:56<2:14:21,  1.92s/it, loss=0.306, lr=1e-5]Steps:  72%|███████▏  | 10799/15001 [6:54:56<2:14:21,  1.92s/it, loss=0.0794, lr=1e-5]Steps:  72%|███████▏  | 10800/15001 [6:54:58<2:11:09,  1.87s/it, loss=0.0794, lr=1e-5]Steps:  72%|███████▏  | 10800/15001 [6:54:58<2:11:09,  1.87s/it, loss=0.0655, lr=1e-5]Steps:  72%|███████▏  | 10801/15001 [6:55:00<2:08:47,  1.84s/it, loss=0.0655, lr=1e-5]Steps:  72%|███████▏  | 10801/15001 [6:55:00<2:08:47,  1.84s/it, loss=0.396, lr=1e-5] Steps:  72%|███████▏  | 10802/15001 [6:55:02<2:13:00,  1.90s/it, loss=0.396, lr=1e-5]Steps:  72%|███████▏  | 10802/15001 [6:55:02<2:13:00,  1.90s/it, loss=0.183, lr=1e-5]Steps:  72%|███████▏  | 10803/15001 [6:55:04<2:12:15,  1.89s/it, loss=0.183, lr=1e-5]Steps:  72%|███████▏  | 10803/15001 [6:55:04<2:12:15,  1.89s/it, loss=0.326, lr=1e-5]Steps:  72%|███████▏  | 10804/15001 [6:55:05<2:07:34,  1.82s/it, loss=0.326, lr=1e-5]Steps:  72%|███████▏  | 10804/15001 [6:55:06<2:07:34,  1.82s/it, loss=0.174, lr=1e-5]Steps:  72%|███████▏  | 10805/15001 [6:55:07<2:07:57,  1.83s/it, loss=0.174, lr=1e-5]Steps:  72%|███████▏  | 10805/15001 [6:55:07<2:07:57,  1.83s/it, loss=0.231, lr=1e-5]Steps:  72%|███████▏  | 10806/15001 [6:55:09<2:07:01,  1.82s/it, loss=0.231, lr=1e-5]Steps:  72%|███████▏  | 10806/15001 [6:55:09<2:07:01,  1.82s/it, loss=0.152, lr=1e-5]Steps:  72%|███████▏  | 10807/15001 [6:55:11<2:03:43,  1.77s/it, loss=0.152, lr=1e-5]Steps:  72%|███████▏  | 10807/15001 [6:55:11<2:03:43,  1.77s/it, loss=0.0495, lr=1e-5]Steps:  72%|███████▏  | 10808/15001 [6:55:12<2:07:08,  1.82s/it, loss=0.0495, lr=1e-5]Steps:  72%|███████▏  | 10808/15001 [6:55:13<2:07:08,  1.82s/it, loss=0.148, lr=1e-5] Steps:  72%|███████▏  | 10809/15001 [6:55:14<2:06:04,  1.80s/it, loss=0.148, lr=1e-5]Steps:  72%|███████▏  | 10809/15001 [6:55:14<2:06:04,  1.80s/it, loss=0.176, lr=1e-5]Steps:  72%|███████▏  | 10810/15001 [6:55:16<2:04:43,  1.79s/it, loss=0.176, lr=1e-5]Steps:  72%|███████▏  | 10810/15001 [6:55:16<2:04:43,  1.79s/it, loss=0.065, lr=1e-5]Steps:  72%|███████▏  | 10811/15001 [6:55:18<2:09:07,  1.85s/it, loss=0.065, lr=1e-5]Steps:  72%|███████▏  | 10811/15001 [6:55:18<2:09:07,  1.85s/it, loss=0.108, lr=1e-5]Steps:  72%|███████▏  | 10812/15001 [6:55:20<2:08:27,  1.84s/it, loss=0.108, lr=1e-5]Steps:  72%|███████▏  | 10812/15001 [6:55:20<2:08:27,  1.84s/it, loss=0.259, lr=1e-5]Steps:  72%|███████▏  | 10813/15001 [6:55:22<2:05:43,  1.80s/it, loss=0.259, lr=1e-5]Steps:  72%|███████▏  | 10813/15001 [6:55:22<2:05:43,  1.80s/it, loss=0.176, lr=1e-5]Steps:  72%|███████▏  | 10814/15001 [6:55:23<2:05:15,  1.79s/it, loss=0.176, lr=1e-5]Steps:  72%|███████▏  | 10814/15001 [6:55:24<2:05:15,  1.79s/it, loss=0.103, lr=1e-5]Steps:  72%|███████▏  | 10815/15001 [6:55:26<2:16:27,  1.96s/it, loss=0.103, lr=1e-5]Steps:  72%|███████▏  | 10815/15001 [6:55:26<2:16:27,  1.96s/it, loss=0.0209, lr=1e-5]Steps:  72%|███████▏  | 10816/15001 [6:55:28<2:16:34,  1.96s/it, loss=0.0209, lr=1e-5]Steps:  72%|███████▏  | 10816/15001 [6:55:28<2:16:34,  1.96s/it, loss=0.112, lr=1e-5] Steps:  72%|███████▏  | 10817/15001 [6:55:30<2:22:40,  2.05s/it, loss=0.112, lr=1e-5]Steps:  72%|███████▏  | 10817/15001 [6:55:30<2:22:40,  2.05s/it, loss=0.207, lr=1e-5]Steps:  72%|███████▏  | 10818/15001 [6:55:32<2:23:26,  2.06s/it, loss=0.207, lr=1e-5]Steps:  72%|███████▏  | 10818/15001 [6:55:32<2:23:26,  2.06s/it, loss=0.105, lr=1e-5]Steps:  72%|███████▏  | 10819/15001 [6:55:34<2:14:52,  1.93s/it, loss=0.105, lr=1e-5]Steps:  72%|███████▏  | 10819/15001 [6:55:34<2:14:52,  1.93s/it, loss=0.278, lr=1e-5]Steps:  72%|███████▏  | 10820/15001 [6:55:36<2:20:14,  2.01s/it, loss=0.278, lr=1e-5]Steps:  72%|███████▏  | 10820/15001 [6:55:36<2:20:14,  2.01s/it, loss=0.108, lr=1e-5]Steps:  72%|███████▏  | 10821/15001 [6:55:38<2:14:39,  1.93s/it, loss=0.108, lr=1e-5]Steps:  72%|███████▏  | 10821/15001 [6:55:38<2:14:39,  1.93s/it, loss=0.114, lr=1e-5]Steps:  72%|███████▏  | 10822/15001 [6:55:39<2:12:22,  1.90s/it, loss=0.114, lr=1e-5]Steps:  72%|███████▏  | 10822/15001 [6:55:40<2:12:22,  1.90s/it, loss=0.187, lr=1e-5]Steps:  72%|███████▏  | 10823/15001 [6:55:41<2:09:39,  1.86s/it, loss=0.187, lr=1e-5]Steps:  72%|███████▏  | 10823/15001 [6:55:41<2:09:39,  1.86s/it, loss=0.353, lr=1e-5]Steps:  72%|███████▏  | 10824/15001 [6:55:43<2:08:41,  1.85s/it, loss=0.353, lr=1e-5]Steps:  72%|███████▏  | 10824/15001 [6:55:43<2:08:41,  1.85s/it, loss=0.234, lr=1e-5]Steps:  72%|███████▏  | 10825/15001 [6:55:45<2:04:56,  1.80s/it, loss=0.234, lr=1e-5]Steps:  72%|███████▏  | 10825/15001 [6:55:45<2:04:56,  1.80s/it, loss=0.134, lr=1e-5]Steps:  72%|███████▏  | 10826/15001 [6:55:47<2:08:22,  1.84s/it, loss=0.134, lr=1e-5]Steps:  72%|███████▏  | 10826/15001 [6:55:47<2:08:22,  1.84s/it, loss=0.104, lr=1e-5]Steps:  72%|███████▏  | 10827/15001 [6:55:48<2:08:00,  1.84s/it, loss=0.104, lr=1e-5]Steps:  72%|███████▏  | 10827/15001 [6:55:48<2:08:00,  1.84s/it, loss=0.147, lr=1e-5]Steps:  72%|███████▏  | 10828/15001 [6:55:50<2:04:47,  1.79s/it, loss=0.147, lr=1e-5]Steps:  72%|███████▏  | 10828/15001 [6:55:50<2:04:47,  1.79s/it, loss=0.154, lr=1e-5]Steps:  72%|███████▏  | 10829/15001 [6:55:52<2:02:16,  1.76s/it, loss=0.154, lr=1e-5]Steps:  72%|███████▏  | 10829/15001 [6:55:52<2:02:16,  1.76s/it, loss=0.132, lr=1e-5]Steps:  72%|███████▏  | 10830/15001 [6:55:54<2:02:56,  1.77s/it, loss=0.132, lr=1e-5]Steps:  72%|███████▏  | 10830/15001 [6:55:54<2:02:56,  1.77s/it, loss=0.0938, lr=1e-5]Steps:  72%|███████▏  | 10831/15001 [6:55:56<2:06:40,  1.82s/it, loss=0.0938, lr=1e-5]Steps:  72%|███████▏  | 10831/15001 [6:55:56<2:06:40,  1.82s/it, loss=0.113, lr=1e-5] Steps:  72%|███████▏  | 10832/15001 [6:55:57<2:04:47,  1.80s/it, loss=0.113, lr=1e-5]Steps:  72%|███████▏  | 10832/15001 [6:55:58<2:04:47,  1.80s/it, loss=0.237, lr=1e-5]Steps:  72%|███████▏  | 10833/15001 [6:55:59<2:11:35,  1.89s/it, loss=0.237, lr=1e-5]Steps:  72%|███████▏  | 10833/15001 [6:55:59<2:11:35,  1.89s/it, loss=0.339, lr=1e-5]Steps:  72%|███████▏  | 10834/15001 [6:56:01<2:07:51,  1.84s/it, loss=0.339, lr=1e-5]Steps:  72%|███████▏  | 10834/15001 [6:56:01<2:07:51,  1.84s/it, loss=0.0554, lr=1e-5]Steps:  72%|███████▏  | 10835/15001 [6:56:03<2:07:02,  1.83s/it, loss=0.0554, lr=1e-5]Steps:  72%|███████▏  | 10835/15001 [6:56:03<2:07:02,  1.83s/it, loss=0.157, lr=1e-5] Steps:  72%|███████▏  | 10836/15001 [6:56:05<2:06:47,  1.83s/it, loss=0.157, lr=1e-5]Steps:  72%|███████▏  | 10836/15001 [6:56:05<2:06:47,  1.83s/it, loss=0.0675, lr=1e-5]Steps:  72%|███████▏  | 10837/15001 [6:56:07<2:12:30,  1.91s/it, loss=0.0675, lr=1e-5]Steps:  72%|███████▏  | 10837/15001 [6:56:07<2:12:30,  1.91s/it, loss=0.218, lr=1e-5] Steps:  72%|███████▏  | 10838/15001 [6:56:09<2:11:25,  1.89s/it, loss=0.218, lr=1e-5]Steps:  72%|███████▏  | 10838/15001 [6:56:09<2:11:25,  1.89s/it, loss=0.14, lr=1e-5] Steps:  72%|███████▏  | 10839/15001 [6:56:11<2:14:54,  1.94s/it, loss=0.14, lr=1e-5]Steps:  72%|███████▏  | 10839/15001 [6:56:11<2:14:54,  1.94s/it, loss=0.044, lr=1e-5]Steps:  72%|███████▏  | 10840/15001 [6:56:13<2:21:58,  2.05s/it, loss=0.044, lr=1e-5]Steps:  72%|███████▏  | 10840/15001 [6:56:13<2:21:58,  2.05s/it, loss=0.0747, lr=1e-5]Steps:  72%|███████▏  | 10841/15001 [6:56:15<2:21:09,  2.04s/it, loss=0.0747, lr=1e-5]Steps:  72%|███████▏  | 10841/15001 [6:56:15<2:21:09,  2.04s/it, loss=0.113, lr=1e-5] Steps:  72%|███████▏  | 10842/15001 [6:56:17<2:12:24,  1.91s/it, loss=0.113, lr=1e-5]Steps:  72%|███████▏  | 10842/15001 [6:56:17<2:12:24,  1.91s/it, loss=0.14, lr=1e-5] Steps:  72%|███████▏  | 10843/15001 [6:56:19<2:13:39,  1.93s/it, loss=0.14, lr=1e-5]Steps:  72%|███████▏  | 10843/15001 [6:56:19<2:13:39,  1.93s/it, loss=0.0786, lr=1e-5]Steps:  72%|███████▏  | 10844/15001 [6:56:20<2:11:16,  1.89s/it, loss=0.0786, lr=1e-5]Steps:  72%|███████▏  | 10844/15001 [6:56:21<2:11:16,  1.89s/it, loss=0.105, lr=1e-5] Steps:  72%|███████▏  | 10845/15001 [6:56:22<2:10:12,  1.88s/it, loss=0.105, lr=1e-5]Steps:  72%|███████▏  | 10845/15001 [6:56:22<2:10:12,  1.88s/it, loss=0.117, lr=1e-5]Steps:  72%|███████▏  | 10846/15001 [6:56:24<2:10:21,  1.88s/it, loss=0.117, lr=1e-5]Steps:  72%|███████▏  | 10846/15001 [6:56:24<2:10:21,  1.88s/it, loss=0.187, lr=1e-5]Steps:  72%|███████▏  | 10847/15001 [6:56:26<2:05:27,  1.81s/it, loss=0.187, lr=1e-5]Steps:  72%|███████▏  | 10847/15001 [6:56:26<2:05:27,  1.81s/it, loss=0.41, lr=1e-5] Steps:  72%|███████▏  | 10848/15001 [6:56:28<2:04:33,  1.80s/it, loss=0.41, lr=1e-5]Steps:  72%|███████▏  | 10848/15001 [6:56:28<2:04:33,  1.80s/it, loss=0.268, lr=1e-5]Steps:  72%|███████▏  | 10849/15001 [6:56:30<2:12:13,  1.91s/it, loss=0.268, lr=1e-5]Steps:  72%|███████▏  | 10849/15001 [6:56:30<2:12:13,  1.91s/it, loss=0.206, lr=1e-5]Steps:  72%|███████▏  | 10850/15001 [6:56:31<2:07:24,  1.84s/it, loss=0.206, lr=1e-5]Steps:  72%|███████▏  | 10850/15001 [6:56:32<2:07:24,  1.84s/it, loss=0.0387, lr=1e-5]Steps:  72%|███████▏  | 10851/15001 [6:56:33<2:10:29,  1.89s/it, loss=0.0387, lr=1e-5]Steps:  72%|███████▏  | 10851/15001 [6:56:34<2:10:29,  1.89s/it, loss=0.0492, lr=1e-5]Steps:  72%|███████▏  | 10852/15001 [6:56:35<2:05:22,  1.81s/it, loss=0.0492, lr=1e-5]Steps:  72%|███████▏  | 10852/15001 [6:56:35<2:05:22,  1.81s/it, loss=0.348, lr=1e-5] Steps:  72%|███████▏  | 10853/15001 [6:56:37<2:10:38,  1.89s/it, loss=0.348, lr=1e-5]Steps:  72%|███████▏  | 10853/15001 [6:56:37<2:10:38,  1.89s/it, loss=0.0513, lr=1e-5]Steps:  72%|███████▏  | 10854/15001 [6:56:39<2:05:26,  1.82s/it, loss=0.0513, lr=1e-5]Steps:  72%|███████▏  | 10854/15001 [6:56:39<2:05:26,  1.82s/it, loss=0.0563, lr=1e-5]Steps:  72%|███████▏  | 10855/15001 [6:56:41<2:15:38,  1.96s/it, loss=0.0563, lr=1e-5]Steps:  72%|███████▏  | 10855/15001 [6:56:41<2:15:38,  1.96s/it, loss=0.165, lr=1e-5] Steps:  72%|███████▏  | 10856/15001 [6:56:43<2:10:34,  1.89s/it, loss=0.165, lr=1e-5]Steps:  72%|███████▏  | 10856/15001 [6:56:43<2:10:34,  1.89s/it, loss=0.358, lr=1e-5]Steps:  72%|███████▏  | 10857/15001 [6:56:45<2:11:00,  1.90s/it, loss=0.358, lr=1e-5]Steps:  72%|███████▏  | 10857/15001 [6:56:45<2:11:00,  1.90s/it, loss=0.109, lr=1e-5]Steps:  72%|███████▏  | 10858/15001 [6:56:47<2:09:23,  1.87s/it, loss=0.109, lr=1e-5]Steps:  72%|███████▏  | 10858/15001 [6:56:47<2:09:23,  1.87s/it, loss=0.263, lr=1e-5]Steps:  72%|███████▏  | 10859/15001 [6:56:49<2:15:29,  1.96s/it, loss=0.263, lr=1e-5]Steps:  72%|███████▏  | 10859/15001 [6:56:49<2:15:29,  1.96s/it, loss=0.0837, lr=1e-5]Steps:  72%|███████▏  | 10860/15001 [6:56:51<2:14:27,  1.95s/it, loss=0.0837, lr=1e-5]Steps:  72%|███████▏  | 10860/15001 [6:56:51<2:14:27,  1.95s/it, loss=0.248, lr=1e-5] Steps:  72%|███████▏  | 10861/15001 [6:56:52<2:12:24,  1.92s/it, loss=0.248, lr=1e-5]Steps:  72%|███████▏  | 10861/15001 [6:56:53<2:12:24,  1.92s/it, loss=0.299, lr=1e-5]Steps:  72%|███████▏  | 10862/15001 [6:56:55<2:20:41,  2.04s/it, loss=0.299, lr=1e-5]Steps:  72%|███████▏  | 10862/15001 [6:56:55<2:20:41,  2.04s/it, loss=0.17, lr=1e-5] Steps:  72%|███████▏  | 10863/15001 [6:56:56<2:11:54,  1.91s/it, loss=0.17, lr=1e-5]Steps:  72%|███████▏  | 10863/15001 [6:56:57<2:11:54,  1.91s/it, loss=0.21, lr=1e-5]Steps:  72%|███████▏  | 10864/15001 [6:56:59<2:23:55,  2.09s/it, loss=0.21, lr=1e-5]Steps:  72%|███████▏  | 10864/15001 [6:56:59<2:23:55,  2.09s/it, loss=0.301, lr=1e-5]Steps:  72%|███████▏  | 10865/15001 [6:57:01<2:17:59,  2.00s/it, loss=0.301, lr=1e-5]Steps:  72%|███████▏  | 10865/15001 [6:57:01<2:17:59,  2.00s/it, loss=0.194, lr=1e-5]Steps:  72%|███████▏  | 10866/15001 [6:57:02<2:10:22,  1.89s/it, loss=0.194, lr=1e-5]Steps:  72%|███████▏  | 10866/15001 [6:57:03<2:10:22,  1.89s/it, loss=0.033, lr=1e-5]Steps:  72%|███████▏  | 10867/15001 [6:57:04<2:11:48,  1.91s/it, loss=0.033, lr=1e-5]Steps:  72%|███████▏  | 10867/15001 [6:57:04<2:11:48,  1.91s/it, loss=0.104, lr=1e-5]Steps:  72%|███████▏  | 10868/15001 [6:57:06<2:09:29,  1.88s/it, loss=0.104, lr=1e-5]Steps:  72%|███████▏  | 10868/15001 [6:57:06<2:09:29,  1.88s/it, loss=0.14, lr=1e-5] Steps:  72%|███████▏  | 10869/15001 [6:57:08<2:05:36,  1.82s/it, loss=0.14, lr=1e-5]Steps:  72%|███████▏  | 10869/15001 [6:57:08<2:05:36,  1.82s/it, loss=0.192, lr=1e-5]Steps:  72%|███████▏  | 10870/15001 [6:57:10<2:05:13,  1.82s/it, loss=0.192, lr=1e-5]Steps:  72%|███████▏  | 10870/15001 [6:57:10<2:05:13,  1.82s/it, loss=0.409, lr=1e-5]Steps:  72%|███████▏  | 10871/15001 [6:57:12<2:10:08,  1.89s/it, loss=0.409, lr=1e-5]Steps:  72%|███████▏  | 10871/15001 [6:57:12<2:10:08,  1.89s/it, loss=0.207, lr=1e-5]Steps:  72%|███████▏  | 10872/15001 [6:57:14<2:10:56,  1.90s/it, loss=0.207, lr=1e-5]Steps:  72%|███████▏  | 10872/15001 [6:57:14<2:10:56,  1.90s/it, loss=0.201, lr=1e-5]Steps:  72%|███████▏  | 10873/15001 [6:57:15<2:08:49,  1.87s/it, loss=0.201, lr=1e-5]Steps:  72%|███████▏  | 10873/15001 [6:57:15<2:08:49,  1.87s/it, loss=0.0813, lr=1e-5]Steps:  72%|███████▏  | 10874/15001 [6:57:17<2:05:07,  1.82s/it, loss=0.0813, lr=1e-5]Steps:  72%|███████▏  | 10874/15001 [6:57:17<2:05:07,  1.82s/it, loss=0.25, lr=1e-5]  Steps:  72%|███████▏  | 10875/15001 [6:57:19<2:00:52,  1.76s/it, loss=0.25, lr=1e-5]Steps:  72%|███████▏  | 10875/15001 [6:57:19<2:00:52,  1.76s/it, loss=0.292, lr=1e-5]Steps:  73%|███████▎  | 10876/15001 [6:57:21<2:05:28,  1.83s/it, loss=0.292, lr=1e-5]Steps:  73%|███████▎  | 10876/15001 [6:57:21<2:05:28,  1.83s/it, loss=0.333, lr=1e-5]Steps:  73%|███████▎  | 10877/15001 [6:57:23<2:11:24,  1.91s/it, loss=0.333, lr=1e-5]Steps:  73%|███████▎  | 10877/15001 [6:57:23<2:11:24,  1.91s/it, loss=0.189, lr=1e-5]Steps:  73%|███████▎  | 10878/15001 [6:57:25<2:08:24,  1.87s/it, loss=0.189, lr=1e-5]Steps:  73%|███████▎  | 10878/15001 [6:57:25<2:08:24,  1.87s/it, loss=0.266, lr=1e-5]Steps:  73%|███████▎  | 10879/15001 [6:57:26<2:04:44,  1.82s/it, loss=0.266, lr=1e-5]Steps:  73%|███████▎  | 10879/15001 [6:57:27<2:04:44,  1.82s/it, loss=0.0721, lr=1e-5]Steps:  73%|███████▎  | 10880/15001 [6:57:28<2:08:44,  1.87s/it, loss=0.0721, lr=1e-5]Steps:  73%|███████▎  | 10880/15001 [6:57:29<2:08:44,  1.87s/it, loss=0.0522, lr=1e-5]Steps:  73%|███████▎  | 10881/15001 [6:57:30<2:12:53,  1.94s/it, loss=0.0522, lr=1e-5]Steps:  73%|███████▎  | 10881/15001 [6:57:30<2:12:53,  1.94s/it, loss=0.156, lr=1e-5] Steps:  73%|███████▎  | 10882/15001 [6:57:32<2:12:52,  1.94s/it, loss=0.156, lr=1e-5]Steps:  73%|███████▎  | 10882/15001 [6:57:32<2:12:52,  1.94s/it, loss=0.186, lr=1e-5]Steps:  73%|███████▎  | 10883/15001 [6:57:34<2:12:59,  1.94s/it, loss=0.186, lr=1e-5]Steps:  73%|███████▎  | 10883/15001 [6:57:34<2:12:59,  1.94s/it, loss=0.0448, lr=1e-5]Steps:  73%|███████▎  | 10884/15001 [6:57:36<2:16:41,  1.99s/it, loss=0.0448, lr=1e-5]Steps:  73%|███████▎  | 10884/15001 [6:57:36<2:16:41,  1.99s/it, loss=0.143, lr=1e-5] Steps:  73%|███████▎  | 10885/15001 [6:57:38<2:14:23,  1.96s/it, loss=0.143, lr=1e-5]Steps:  73%|███████▎  | 10885/15001 [6:57:38<2:14:23,  1.96s/it, loss=0.0631, lr=1e-5]Steps:  73%|███████▎  | 10886/15001 [6:57:40<2:09:24,  1.89s/it, loss=0.0631, lr=1e-5]Steps:  73%|███████▎  | 10886/15001 [6:57:41<2:09:24,  1.89s/it, loss=0.059, lr=1e-5] Steps:  73%|███████▎  | 10887/15001 [6:57:42<2:16:41,  1.99s/it, loss=0.059, lr=1e-5]Steps:  73%|███████▎  | 10887/15001 [6:57:42<2:16:41,  1.99s/it, loss=0.102, lr=1e-5]Steps:  73%|███████▎  | 10888/15001 [6:57:44<2:12:39,  1.94s/it, loss=0.102, lr=1e-5]Steps:  73%|███████▎  | 10888/15001 [6:57:44<2:12:39,  1.94s/it, loss=0.315, lr=1e-5]Steps:  73%|███████▎  | 10889/15001 [6:57:46<2:09:37,  1.89s/it, loss=0.315, lr=1e-5]Steps:  73%|███████▎  | 10889/15001 [6:57:46<2:09:37,  1.89s/it, loss=0.242, lr=1e-5]Steps:  73%|███████▎  | 10890/15001 [6:57:48<2:08:32,  1.88s/it, loss=0.242, lr=1e-5]Steps:  73%|███████▎  | 10890/15001 [6:57:48<2:08:32,  1.88s/it, loss=0.168, lr=1e-5]Steps:  73%|███████▎  | 10891/15001 [6:57:49<2:05:11,  1.83s/it, loss=0.168, lr=1e-5]Steps:  73%|███████▎  | 10891/15001 [6:57:49<2:05:11,  1.83s/it, loss=0.247, lr=1e-5]Steps:  73%|███████▎  | 10892/15001 [6:57:51<2:03:46,  1.81s/it, loss=0.247, lr=1e-5]Steps:  73%|███████▎  | 10892/15001 [6:57:51<2:03:46,  1.81s/it, loss=0.0402, lr=1e-5]Steps:  73%|███████▎  | 10893/15001 [6:57:53<2:03:25,  1.80s/it, loss=0.0402, lr=1e-5]Steps:  73%|███████▎  | 10893/15001 [6:57:53<2:03:25,  1.80s/it, loss=0.437, lr=1e-5] Steps:  73%|███████▎  | 10894/15001 [6:57:55<2:04:15,  1.82s/it, loss=0.437, lr=1e-5]Steps:  73%|███████▎  | 10894/15001 [6:57:55<2:04:15,  1.82s/it, loss=0.0828, lr=1e-5]Steps:  73%|███████▎  | 10895/15001 [6:57:57<2:04:45,  1.82s/it, loss=0.0828, lr=1e-5]Steps:  73%|███████▎  | 10895/15001 [6:57:57<2:04:45,  1.82s/it, loss=0.0245, lr=1e-5]Steps:  73%|███████▎  | 10896/15001 [6:57:58<2:04:47,  1.82s/it, loss=0.0245, lr=1e-5]Steps:  73%|███████▎  | 10896/15001 [6:57:58<2:04:47,  1.82s/it, loss=0.177, lr=1e-5] Steps:  73%|███████▎  | 10897/15001 [6:58:00<2:02:06,  1.79s/it, loss=0.177, lr=1e-5]Steps:  73%|███████▎  | 10897/15001 [6:58:00<2:02:06,  1.79s/it, loss=0.0503, lr=1e-5]Steps:  73%|███████▎  | 10898/15001 [6:58:02<2:02:46,  1.80s/it, loss=0.0503, lr=1e-5]Steps:  73%|███████▎  | 10898/15001 [6:58:02<2:02:46,  1.80s/it, loss=0.145, lr=1e-5] Steps:  73%|███████▎  | 10899/15001 [6:58:04<2:00:43,  1.77s/it, loss=0.145, lr=1e-5]Steps:  73%|███████▎  | 10899/15001 [6:58:04<2:00:43,  1.77s/it, loss=0.061, lr=1e-5]Steps:  73%|███████▎  | 10900/15001 [6:58:05<2:02:40,  1.79s/it, loss=0.061, lr=1e-5]Steps:  73%|███████▎  | 10900/15001 [6:58:06<2:02:40,  1.79s/it, loss=0.125, lr=1e-5]Steps:  73%|███████▎  | 10901/15001 [6:58:07<2:02:07,  1.79s/it, loss=0.125, lr=1e-5]Steps:  73%|███████▎  | 10901/15001 [6:58:07<2:02:07,  1.79s/it, loss=0.0609, lr=1e-5]Steps:  73%|███████▎  | 10902/15001 [6:58:09<1:58:23,  1.73s/it, loss=0.0609, lr=1e-5]Steps:  73%|███████▎  | 10902/15001 [6:58:09<1:58:23,  1.73s/it, loss=0.0388, lr=1e-5]Steps:  73%|███████▎  | 10903/15001 [6:58:11<2:03:54,  1.81s/it, loss=0.0388, lr=1e-5]Steps:  73%|███████▎  | 10903/15001 [6:58:11<2:03:54,  1.81s/it, loss=0.208, lr=1e-5] Steps:  73%|███████▎  | 10904/15001 [6:58:13<2:03:29,  1.81s/it, loss=0.208, lr=1e-5]Steps:  73%|███████▎  | 10904/15001 [6:58:13<2:03:29,  1.81s/it, loss=0.193, lr=1e-5]Steps:  73%|███████▎  | 10905/15001 [6:58:15<2:04:36,  1.83s/it, loss=0.193, lr=1e-5]Steps:  73%|███████▎  | 10905/15001 [6:58:15<2:04:36,  1.83s/it, loss=0.178, lr=1e-5]Steps:  73%|███████▎  | 10906/15001 [6:58:17<2:10:11,  1.91s/it, loss=0.178, lr=1e-5]Steps:  73%|███████▎  | 10906/15001 [6:58:17<2:10:11,  1.91s/it, loss=0.137, lr=1e-5]Steps:  73%|███████▎  | 10907/15001 [6:58:19<2:19:07,  2.04s/it, loss=0.137, lr=1e-5]Steps:  73%|███████▎  | 10907/15001 [6:58:19<2:19:07,  2.04s/it, loss=0.113, lr=1e-5]Steps:  73%|███████▎  | 10908/15001 [6:58:21<2:17:35,  2.02s/it, loss=0.113, lr=1e-5]Steps:  73%|███████▎  | 10908/15001 [6:58:21<2:17:35,  2.02s/it, loss=0.271, lr=1e-5]Steps:  73%|███████▎  | 10909/15001 [6:58:23<2:15:46,  1.99s/it, loss=0.271, lr=1e-5]Steps:  73%|███████▎  | 10909/15001 [6:58:23<2:15:46,  1.99s/it, loss=0.0513, lr=1e-5]Steps:  73%|███████▎  | 10910/15001 [6:58:25<2:14:26,  1.97s/it, loss=0.0513, lr=1e-5]Steps:  73%|███████▎  | 10910/15001 [6:58:25<2:14:26,  1.97s/it, loss=0.121, lr=1e-5] Steps:  73%|███████▎  | 10911/15001 [6:58:27<2:13:59,  1.97s/it, loss=0.121, lr=1e-5]Steps:  73%|███████▎  | 10911/15001 [6:58:27<2:13:59,  1.97s/it, loss=0.306, lr=1e-5]Steps:  73%|███████▎  | 10912/15001 [6:58:29<2:14:50,  1.98s/it, loss=0.306, lr=1e-5]Steps:  73%|███████▎  | 10912/15001 [6:58:29<2:14:50,  1.98s/it, loss=0.193, lr=1e-5]Steps:  73%|███████▎  | 10913/15001 [6:58:31<2:11:07,  1.92s/it, loss=0.193, lr=1e-5]Steps:  73%|███████▎  | 10913/15001 [6:58:31<2:11:07,  1.92s/it, loss=0.052, lr=1e-5]Steps:  73%|███████▎  | 10914/15001 [6:58:32<2:02:33,  1.80s/it, loss=0.052, lr=1e-5]Steps:  73%|███████▎  | 10914/15001 [6:58:32<2:02:33,  1.80s/it, loss=0.24, lr=1e-5] Steps:  73%|███████▎  | 10915/15001 [6:58:34<2:09:49,  1.91s/it, loss=0.24, lr=1e-5]Steps:  73%|███████▎  | 10915/15001 [6:58:34<2:09:49,  1.91s/it, loss=0.247, lr=1e-5]Steps:  73%|███████▎  | 10916/15001 [6:58:36<2:04:46,  1.83s/it, loss=0.247, lr=1e-5]Steps:  73%|███████▎  | 10916/15001 [6:58:36<2:04:46,  1.83s/it, loss=0.101, lr=1e-5]Steps:  73%|███████▎  | 10917/15001 [6:58:38<2:03:38,  1.82s/it, loss=0.101, lr=1e-5]Steps:  73%|███████▎  | 10917/15001 [6:58:38<2:03:38,  1.82s/it, loss=0.203, lr=1e-5]Steps:  73%|███████▎  | 10918/15001 [6:58:39<2:02:07,  1.79s/it, loss=0.203, lr=1e-5]Steps:  73%|███████▎  | 10918/15001 [6:58:40<2:02:07,  1.79s/it, loss=0.137, lr=1e-5]Steps:  73%|███████▎  | 10919/15001 [6:58:41<2:01:24,  1.78s/it, loss=0.137, lr=1e-5]Steps:  73%|███████▎  | 10919/15001 [6:58:42<2:01:24,  1.78s/it, loss=0.0933, lr=1e-5]Steps:  73%|███████▎  | 10920/15001 [6:58:43<2:05:42,  1.85s/it, loss=0.0933, lr=1e-5]Steps:  73%|███████▎  | 10920/15001 [6:58:43<2:05:42,  1.85s/it, loss=0.237, lr=1e-5] Steps:  73%|███████▎  | 10921/15001 [6:58:45<2:02:37,  1.80s/it, loss=0.237, lr=1e-5]Steps:  73%|███████▎  | 10921/15001 [6:58:45<2:02:37,  1.80s/it, loss=0.225, lr=1e-5]Steps:  73%|███████▎  | 10922/15001 [6:58:47<2:07:17,  1.87s/it, loss=0.225, lr=1e-5]Steps:  73%|███████▎  | 10922/15001 [6:58:47<2:07:17,  1.87s/it, loss=0.204, lr=1e-5]Steps:  73%|███████▎  | 10923/15001 [6:58:49<2:04:15,  1.83s/it, loss=0.204, lr=1e-5]Steps:  73%|███████▎  | 10923/15001 [6:58:49<2:04:15,  1.83s/it, loss=0.047, lr=1e-5]Steps:  73%|███████▎  | 10924/15001 [6:58:50<2:05:17,  1.84s/it, loss=0.047, lr=1e-5]Steps:  73%|███████▎  | 10924/15001 [6:58:51<2:05:17,  1.84s/it, loss=0.0424, lr=1e-5]Steps:  73%|███████▎  | 10925/15001 [6:58:52<2:06:26,  1.86s/it, loss=0.0424, lr=1e-5]Steps:  73%|███████▎  | 10925/15001 [6:58:53<2:06:26,  1.86s/it, loss=0.15, lr=1e-5]  Steps:  73%|███████▎  | 10926/15001 [6:58:54<2:03:46,  1.82s/it, loss=0.15, lr=1e-5]Steps:  73%|███████▎  | 10926/15001 [6:58:54<2:03:46,  1.82s/it, loss=0.144, lr=1e-5]Steps:  73%|███████▎  | 10927/15001 [6:58:56<2:08:47,  1.90s/it, loss=0.144, lr=1e-5]Steps:  73%|███████▎  | 10927/15001 [6:58:56<2:08:47,  1.90s/it, loss=0.151, lr=1e-5]Steps:  73%|███████▎  | 10928/15001 [6:58:58<2:06:25,  1.86s/it, loss=0.151, lr=1e-5]Steps:  73%|███████▎  | 10928/15001 [6:58:58<2:06:25,  1.86s/it, loss=0.145, lr=1e-5]Steps:  73%|███████▎  | 10929/15001 [6:59:00<2:14:13,  1.98s/it, loss=0.145, lr=1e-5]Steps:  73%|███████▎  | 10929/15001 [6:59:00<2:14:13,  1.98s/it, loss=0.266, lr=1e-5]Steps:  73%|███████▎  | 10930/15001 [6:59:02<2:15:15,  1.99s/it, loss=0.266, lr=1e-5]Steps:  73%|███████▎  | 10930/15001 [6:59:02<2:15:15,  1.99s/it, loss=0.0588, lr=1e-5]Steps:  73%|███████▎  | 10931/15001 [6:59:04<2:14:14,  1.98s/it, loss=0.0588, lr=1e-5]Steps:  73%|███████▎  | 10931/15001 [6:59:04<2:14:14,  1.98s/it, loss=0.197, lr=1e-5] Steps:  73%|███████▎  | 10932/15001 [6:59:06<2:12:47,  1.96s/it, loss=0.197, lr=1e-5]Steps:  73%|███████▎  | 10932/15001 [6:59:06<2:12:47,  1.96s/it, loss=0.0456, lr=1e-5]Steps:  73%|███████▎  | 10933/15001 [6:59:08<2:08:15,  1.89s/it, loss=0.0456, lr=1e-5]Steps:  73%|███████▎  | 10933/15001 [6:59:08<2:08:15,  1.89s/it, loss=0.105, lr=1e-5] Steps:  73%|███████▎  | 10934/15001 [6:59:10<2:07:18,  1.88s/it, loss=0.105, lr=1e-5]Steps:  73%|███████▎  | 10934/15001 [6:59:10<2:07:18,  1.88s/it, loss=0.25, lr=1e-5] Steps:  73%|███████▎  | 10935/15001 [6:59:12<2:10:19,  1.92s/it, loss=0.25, lr=1e-5]Steps:  73%|███████▎  | 10935/15001 [6:59:12<2:10:19,  1.92s/it, loss=0.215, lr=1e-5]Steps:  73%|███████▎  | 10936/15001 [6:59:13<2:07:06,  1.88s/it, loss=0.215, lr=1e-5]Steps:  73%|███████▎  | 10936/15001 [6:59:14<2:07:06,  1.88s/it, loss=0.205, lr=1e-5]Steps:  73%|███████▎  | 10937/15001 [6:59:15<2:07:47,  1.89s/it, loss=0.205, lr=1e-5]Steps:  73%|███████▎  | 10937/15001 [6:59:15<2:07:47,  1.89s/it, loss=0.212, lr=1e-5]Steps:  73%|███████▎  | 10938/15001 [6:59:17<2:04:29,  1.84s/it, loss=0.212, lr=1e-5]Steps:  73%|███████▎  | 10938/15001 [6:59:17<2:04:29,  1.84s/it, loss=0.0856, lr=1e-5]Steps:  73%|███████▎  | 10939/15001 [6:59:19<2:03:55,  1.83s/it, loss=0.0856, lr=1e-5]Steps:  73%|███████▎  | 10939/15001 [6:59:19<2:03:55,  1.83s/it, loss=0.0734, lr=1e-5]Steps:  73%|███████▎  | 10940/15001 [6:59:21<2:02:20,  1.81s/it, loss=0.0734, lr=1e-5]Steps:  73%|███████▎  | 10940/15001 [6:59:21<2:02:20,  1.81s/it, loss=0.0452, lr=1e-5]Steps:  73%|███████▎  | 10941/15001 [6:59:23<2:05:51,  1.86s/it, loss=0.0452, lr=1e-5]Steps:  73%|███████▎  | 10941/15001 [6:59:23<2:05:51,  1.86s/it, loss=0.268, lr=1e-5] Steps:  73%|███████▎  | 10942/15001 [6:59:24<2:03:33,  1.83s/it, loss=0.268, lr=1e-5]Steps:  73%|███████▎  | 10942/15001 [6:59:25<2:03:33,  1.83s/it, loss=0.0976, lr=1e-5]Steps:  73%|███████▎  | 10943/15001 [6:59:26<2:06:46,  1.87s/it, loss=0.0976, lr=1e-5]Steps:  73%|███████▎  | 10943/15001 [6:59:26<2:06:46,  1.87s/it, loss=0.113, lr=1e-5] Steps:  73%|███████▎  | 10944/15001 [6:59:28<2:01:12,  1.79s/it, loss=0.113, lr=1e-5]Steps:  73%|███████▎  | 10944/15001 [6:59:28<2:01:12,  1.79s/it, loss=0.173, lr=1e-5]Steps:  73%|███████▎  | 10945/15001 [6:59:30<2:01:02,  1.79s/it, loss=0.173, lr=1e-5]Steps:  73%|███████▎  | 10945/15001 [6:59:30<2:01:02,  1.79s/it, loss=0.0962, lr=1e-5]Steps:  73%|███████▎  | 10946/15001 [6:59:32<2:05:41,  1.86s/it, loss=0.0962, lr=1e-5]Steps:  73%|███████▎  | 10946/15001 [6:59:32<2:05:41,  1.86s/it, loss=0.0788, lr=1e-5]Steps:  73%|███████▎  | 10947/15001 [6:59:34<2:02:39,  1.82s/it, loss=0.0788, lr=1e-5]Steps:  73%|███████▎  | 10947/15001 [6:59:34<2:02:39,  1.82s/it, loss=0.0574, lr=1e-5]Steps:  73%|███████▎  | 10948/15001 [6:59:35<2:01:49,  1.80s/it, loss=0.0574, lr=1e-5]Steps:  73%|███████▎  | 10948/15001 [6:59:35<2:01:49,  1.80s/it, loss=0.219, lr=1e-5] Steps:  73%|███████▎  | 10949/15001 [6:59:37<1:58:46,  1.76s/it, loss=0.219, lr=1e-5]Steps:  73%|███████▎  | 10949/15001 [6:59:37<1:58:46,  1.76s/it, loss=0.0936, lr=1e-5]Steps:  73%|███████▎  | 10950/15001 [6:59:39<2:01:00,  1.79s/it, loss=0.0936, lr=1e-5]Steps:  73%|███████▎  | 10950/15001 [6:59:39<2:01:00,  1.79s/it, loss=0.0433, lr=1e-5]Steps:  73%|███████▎  | 10951/15001 [6:59:41<2:06:51,  1.88s/it, loss=0.0433, lr=1e-5]Steps:  73%|███████▎  | 10951/15001 [6:59:41<2:06:51,  1.88s/it, loss=0.0462, lr=1e-5]Steps:  73%|███████▎  | 10952/15001 [6:59:43<2:16:20,  2.02s/it, loss=0.0462, lr=1e-5]Steps:  73%|███████▎  | 10952/15001 [6:59:43<2:16:20,  2.02s/it, loss=0.121, lr=1e-5] Steps:  73%|███████▎  | 10953/15001 [6:59:45<2:14:40,  2.00s/it, loss=0.121, lr=1e-5]Steps:  73%|███████▎  | 10953/15001 [6:59:45<2:14:40,  2.00s/it, loss=0.0996, lr=1e-5]Steps:  73%|███████▎  | 10954/15001 [6:59:47<2:07:10,  1.89s/it, loss=0.0996, lr=1e-5]Steps:  73%|███████▎  | 10954/15001 [6:59:47<2:07:10,  1.89s/it, loss=0.197, lr=1e-5] Steps:  73%|███████▎  | 10955/15001 [6:59:49<2:18:58,  2.06s/it, loss=0.197, lr=1e-5]Steps:  73%|███████▎  | 10955/15001 [6:59:49<2:18:58,  2.06s/it, loss=0.119, lr=1e-5]Steps:  73%|███████▎  | 10956/15001 [6:59:51<2:15:03,  2.00s/it, loss=0.119, lr=1e-5]Steps:  73%|███████▎  | 10956/15001 [6:59:51<2:15:03,  2.00s/it, loss=0.258, lr=1e-5]Steps:  73%|███████▎  | 10957/15001 [6:59:53<2:07:49,  1.90s/it, loss=0.258, lr=1e-5]Steps:  73%|███████▎  | 10957/15001 [6:59:53<2:07:49,  1.90s/it, loss=0.0709, lr=1e-5]Steps:  73%|███████▎  | 10958/15001 [6:59:55<2:09:11,  1.92s/it, loss=0.0709, lr=1e-5]Steps:  73%|███████▎  | 10958/15001 [6:59:55<2:09:11,  1.92s/it, loss=0.0473, lr=1e-5]Steps:  73%|███████▎  | 10959/15001 [6:59:57<2:08:51,  1.91s/it, loss=0.0473, lr=1e-5]Steps:  73%|███████▎  | 10959/15001 [6:59:57<2:08:51,  1.91s/it, loss=0.244, lr=1e-5] Steps:  73%|███████▎  | 10960/15001 [6:59:58<2:03:43,  1.84s/it, loss=0.244, lr=1e-5]Steps:  73%|███████▎  | 10960/15001 [6:59:58<2:03:43,  1.84s/it, loss=0.0951, lr=1e-5]Steps:  73%|███████▎  | 10961/15001 [7:00:00<2:01:29,  1.80s/it, loss=0.0951, lr=1e-5]Steps:  73%|███████▎  | 10961/15001 [7:00:00<2:01:29,  1.80s/it, loss=0.081, lr=1e-5] Steps:  73%|███████▎  | 10962/15001 [7:00:02<2:05:38,  1.87s/it, loss=0.081, lr=1e-5]Steps:  73%|███████▎  | 10962/15001 [7:00:02<2:05:38,  1.87s/it, loss=0.119, lr=1e-5]Steps:  73%|███████▎  | 10963/15001 [7:00:04<2:02:57,  1.83s/it, loss=0.119, lr=1e-5]Steps:  73%|███████▎  | 10963/15001 [7:00:04<2:02:57,  1.83s/it, loss=0.0367, lr=1e-5]Steps:  73%|███████▎  | 10964/15001 [7:00:06<2:03:21,  1.83s/it, loss=0.0367, lr=1e-5]Steps:  73%|███████▎  | 10964/15001 [7:00:06<2:03:21,  1.83s/it, loss=0.17, lr=1e-5]  Steps:  73%|███████▎  | 10965/15001 [7:00:08<2:09:44,  1.93s/it, loss=0.17, lr=1e-5]Steps:  73%|███████▎  | 10965/15001 [7:00:08<2:09:44,  1.93s/it, loss=0.197, lr=1e-5]Steps:  73%|███████▎  | 10966/15001 [7:00:10<2:06:46,  1.89s/it, loss=0.197, lr=1e-5]Steps:  73%|███████▎  | 10966/15001 [7:00:10<2:06:46,  1.89s/it, loss=0.249, lr=1e-5]Steps:  73%|███████▎  | 10967/15001 [7:00:11<2:06:09,  1.88s/it, loss=0.249, lr=1e-5]Steps:  73%|███████▎  | 10967/15001 [7:00:12<2:06:09,  1.88s/it, loss=0.164, lr=1e-5]Steps:  73%|███████▎  | 10968/15001 [7:00:13<1:59:51,  1.78s/it, loss=0.164, lr=1e-5]Steps:  73%|███████▎  | 10968/15001 [7:00:13<1:59:51,  1.78s/it, loss=0.283, lr=1e-5]Steps:  73%|███████▎  | 10969/15001 [7:00:15<2:01:35,  1.81s/it, loss=0.283, lr=1e-5]Steps:  73%|███████▎  | 10969/15001 [7:00:15<2:01:35,  1.81s/it, loss=0.134, lr=1e-5]Steps:  73%|███████▎  | 10970/15001 [7:00:17<1:58:17,  1.76s/it, loss=0.134, lr=1e-5]Steps:  73%|███████▎  | 10970/15001 [7:00:17<1:58:17,  1.76s/it, loss=0.152, lr=1e-5]Steps:  73%|███████▎  | 10971/15001 [7:00:18<1:59:53,  1.78s/it, loss=0.152, lr=1e-5]Steps:  73%|███████▎  | 10971/15001 [7:00:19<1:59:53,  1.78s/it, loss=0.195, lr=1e-5]Steps:  73%|███████▎  | 10972/15001 [7:00:20<2:01:31,  1.81s/it, loss=0.195, lr=1e-5]Steps:  73%|███████▎  | 10972/15001 [7:00:20<2:01:31,  1.81s/it, loss=0.144, lr=1e-5]Steps:  73%|███████▎  | 10973/15001 [7:00:22<1:56:41,  1.74s/it, loss=0.144, lr=1e-5]Steps:  73%|███████▎  | 10973/15001 [7:00:22<1:56:41,  1.74s/it, loss=0.175, lr=1e-5]Steps:  73%|███████▎  | 10974/15001 [7:00:24<2:11:54,  1.97s/it, loss=0.175, lr=1e-5]Steps:  73%|███████▎  | 10974/15001 [7:00:24<2:11:54,  1.97s/it, loss=0.185, lr=1e-5]Steps:  73%|███████▎  | 10975/15001 [7:00:26<2:10:05,  1.94s/it, loss=0.185, lr=1e-5]Steps:  73%|███████▎  | 10975/15001 [7:00:26<2:10:05,  1.94s/it, loss=0.148, lr=1e-5]Steps:  73%|███████▎  | 10976/15001 [7:00:28<2:12:04,  1.97s/it, loss=0.148, lr=1e-5]Steps:  73%|███████▎  | 10976/15001 [7:00:28<2:12:04,  1.97s/it, loss=0.215, lr=1e-5]Steps:  73%|███████▎  | 10977/15001 [7:00:30<2:10:23,  1.94s/it, loss=0.215, lr=1e-5]Steps:  73%|███████▎  | 10977/15001 [7:00:30<2:10:23,  1.94s/it, loss=0.0949, lr=1e-5]Steps:  73%|███████▎  | 10978/15001 [7:00:32<2:09:03,  1.92s/it, loss=0.0949, lr=1e-5]Steps:  73%|███████▎  | 10978/15001 [7:00:32<2:09:03,  1.92s/it, loss=0.162, lr=1e-5] Steps:  73%|███████▎  | 10979/15001 [7:00:34<2:07:43,  1.91s/it, loss=0.162, lr=1e-5]Steps:  73%|███████▎  | 10979/15001 [7:00:34<2:07:43,  1.91s/it, loss=0.285, lr=1e-5]Steps:  73%|███████▎  | 10980/15001 [7:00:36<2:09:33,  1.93s/it, loss=0.285, lr=1e-5]Steps:  73%|███████▎  | 10980/15001 [7:00:36<2:09:33,  1.93s/it, loss=0.0666, lr=1e-5]Steps:  73%|███████▎  | 10981/15001 [7:00:38<2:06:49,  1.89s/it, loss=0.0666, lr=1e-5]Steps:  73%|███████▎  | 10981/15001 [7:00:38<2:06:49,  1.89s/it, loss=0.0782, lr=1e-5]Steps:  73%|███████▎  | 10982/15001 [7:00:39<2:05:34,  1.87s/it, loss=0.0782, lr=1e-5]Steps:  73%|███████▎  | 10982/15001 [7:00:40<2:05:34,  1.87s/it, loss=0.194, lr=1e-5] Steps:  73%|███████▎  | 10983/15001 [7:00:41<2:02:36,  1.83s/it, loss=0.194, lr=1e-5]Steps:  73%|███████▎  | 10983/15001 [7:00:41<2:02:36,  1.83s/it, loss=0.109, lr=1e-5]Steps:  73%|███████▎  | 10984/15001 [7:00:43<2:06:13,  1.89s/it, loss=0.109, lr=1e-5]Steps:  73%|███████▎  | 10984/15001 [7:00:43<2:06:13,  1.89s/it, loss=0.261, lr=1e-5]Steps:  73%|███████▎  | 10985/15001 [7:00:45<2:01:31,  1.82s/it, loss=0.261, lr=1e-5]Steps:  73%|███████▎  | 10985/15001 [7:00:45<2:01:31,  1.82s/it, loss=0.406, lr=1e-5]Steps:  73%|███████▎  | 10986/15001 [7:00:47<2:00:56,  1.81s/it, loss=0.406, lr=1e-5]Steps:  73%|███████▎  | 10986/15001 [7:00:47<2:00:56,  1.81s/it, loss=0.148, lr=1e-5]Steps:  73%|███████▎  | 10987/15001 [7:00:49<2:02:27,  1.83s/it, loss=0.148, lr=1e-5]Steps:  73%|███████▎  | 10987/15001 [7:00:49<2:02:27,  1.83s/it, loss=0.196, lr=1e-5]Steps:  73%|███████▎  | 10988/15001 [7:00:50<1:59:52,  1.79s/it, loss=0.196, lr=1e-5]Steps:  73%|███████▎  | 10988/15001 [7:00:50<1:59:52,  1.79s/it, loss=0.0702, lr=1e-5]Steps:  73%|███████▎  | 10989/15001 [7:00:52<2:00:16,  1.80s/it, loss=0.0702, lr=1e-5]Steps:  73%|███████▎  | 10989/15001 [7:00:52<2:00:16,  1.80s/it, loss=0.265, lr=1e-5] Steps:  73%|███████▎  | 10990/15001 [7:00:54<1:58:07,  1.77s/it, loss=0.265, lr=1e-5]Steps:  73%|███████▎  | 10990/15001 [7:00:54<1:58:07,  1.77s/it, loss=0.0867, lr=1e-5]Steps:  73%|███████▎  | 10991/15001 [7:00:56<2:02:32,  1.83s/it, loss=0.0867, lr=1e-5]Steps:  73%|███████▎  | 10991/15001 [7:00:56<2:02:32,  1.83s/it, loss=0.147, lr=1e-5] Steps:  73%|███████▎  | 10992/15001 [7:00:58<2:03:42,  1.85s/it, loss=0.147, lr=1e-5]Steps:  73%|███████▎  | 10992/15001 [7:00:58<2:03:42,  1.85s/it, loss=0.0586, lr=1e-5]Steps:  73%|███████▎  | 10993/15001 [7:00:59<1:59:49,  1.79s/it, loss=0.0586, lr=1e-5]Steps:  73%|███████▎  | 10993/15001 [7:01:00<1:59:49,  1.79s/it, loss=0.0613, lr=1e-5]Steps:  73%|███████▎  | 10994/15001 [7:01:01<1:56:05,  1.74s/it, loss=0.0613, lr=1e-5]Steps:  73%|███████▎  | 10994/15001 [7:01:01<1:56:05,  1.74s/it, loss=0.151, lr=1e-5] Steps:  73%|███████▎  | 10995/15001 [7:01:03<2:02:39,  1.84s/it, loss=0.151, lr=1e-5]Steps:  73%|███████▎  | 10995/15001 [7:01:03<2:02:39,  1.84s/it, loss=0.0897, lr=1e-5]Steps:  73%|███████▎  | 10996/15001 [7:01:05<2:04:35,  1.87s/it, loss=0.0897, lr=1e-5]Steps:  73%|███████▎  | 10996/15001 [7:01:05<2:04:35,  1.87s/it, loss=0.29, lr=1e-5]  Steps:  73%|███████▎  | 10997/15001 [7:01:07<2:06:52,  1.90s/it, loss=0.29, lr=1e-5]Steps:  73%|███████▎  | 10997/15001 [7:01:07<2:06:52,  1.90s/it, loss=0.118, lr=1e-5]Steps:  73%|███████▎  | 10998/15001 [7:01:09<2:12:41,  1.99s/it, loss=0.118, lr=1e-5]Steps:  73%|███████▎  | 10998/15001 [7:01:09<2:12:41,  1.99s/it, loss=0.138, lr=1e-5]Steps:  73%|███████▎  | 10999/15001 [7:01:11<2:13:11,  2.00s/it, loss=0.138, lr=1e-5]Steps:  73%|███████▎  | 10999/15001 [7:01:11<2:13:11,  2.00s/it, loss=0.0454, lr=1e-5]Steps:  73%|███████▎  | 11000/15001 [7:01:13<2:13:47,  2.01s/it, loss=0.0454, lr=1e-5]02/04/2024 20:03:32 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1744.11it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  73%|███████▎  | 11000/15001 [7:04:52<2:13:47,  2.01s/it, loss=0.229, lr=1e-5] Steps:  73%|███████▎  | 11001/15001 [7:04:54<75:09:19, 67.64s/it, loss=0.229, lr=1e-5]Steps:  73%|███████▎  | 11001/15001 [7:04:54<75:09:19, 67.64s/it, loss=0.0292, lr=1e-5]Steps:  73%|███████▎  | 11002/15001 [7:04:55<53:06:02, 47.80s/it, loss=0.0292, lr=1e-5]Steps:  73%|███████▎  | 11002/15001 [7:04:56<53:06:02, 47.80s/it, loss=0.133, lr=1e-5] Steps:  73%|███████▎  | 11003/15001 [7:04:57<37:49:27, 34.06s/it, loss=0.133, lr=1e-5]Steps:  73%|███████▎  | 11003/15001 [7:04:58<37:49:27, 34.06s/it, loss=0.135, lr=1e-5]Steps:  73%|███████▎  | 11004/15001 [7:04:59<27:04:31, 24.39s/it, loss=0.135, lr=1e-5]Steps:  73%|███████▎  | 11004/15001 [7:04:59<27:04:31, 24.39s/it, loss=0.245, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  73%|███████▎  | 11005/15001 [7:05:01<19:35:23, 17.65s/it, loss=0.245, lr=1e-5]Steps:  73%|███████▎  | 11005/15001 [7:05:01<19:35:23, 17.65s/it, loss=0.103, lr=1e-5]Steps:  73%|███████▎  | 11006/15001 [7:05:03<14:19:32, 12.91s/it, loss=0.103, lr=1e-5]Steps:  73%|███████▎  | 11006/15001 [7:05:03<14:19:32, 12.91s/it, loss=0.0962, lr=1e-5]Steps:  73%|███████▎  | 11007/15001 [7:05:05<10:41:09,  9.63s/it, loss=0.0962, lr=1e-5]Steps:  73%|███████▎  | 11007/15001 [7:05:05<10:41:09,  9.63s/it, loss=0.273, lr=1e-5] Steps:  73%|███████▎  | 11008/15001 [7:05:07<8:08:22,  7.34s/it, loss=0.273, lr=1e-5] Steps:  73%|███████▎  | 11008/15001 [7:05:07<8:08:22,  7.34s/it, loss=0.188, lr=1e-5]Steps:  73%|███████▎  | 11009/15001 [7:05:09<6:22:32,  5.75s/it, loss=0.188, lr=1e-5]Steps:  73%|███████▎  | 11009/15001 [7:05:09<6:22:32,  5.75s/it, loss=0.245, lr=1e-5]Steps:  73%|███████▎  | 11010/15001 [7:05:11<5:07:10,  4.62s/it, loss=0.245, lr=1e-5]Steps:  73%|███████▎  | 11010/15001 [7:05:11<5:07:10,  4.62s/it, loss=0.27, lr=1e-5] Steps:  73%|███████▎  | 11011/15001 [7:05:13<4:13:29,  3.81s/it, loss=0.27, lr=1e-5]Steps:  73%|███████▎  | 11011/15001 [7:05:13<4:13:29,  3.81s/it, loss=0.263, lr=1e-5]Steps:  73%|███████▎  | 11012/15001 [7:05:15<3:31:28,  3.18s/it, loss=0.263, lr=1e-5]Steps:  73%|███████▎  | 11012/15001 [7:05:15<3:31:28,  3.18s/it, loss=0.291, lr=1e-5]Steps:  73%|███████▎  | 11013/15001 [7:05:17<3:05:46,  2.80s/it, loss=0.291, lr=1e-5]Steps:  73%|███████▎  | 11013/15001 [7:05:17<3:05:46,  2.80s/it, loss=0.273, lr=1e-5]Steps:  73%|███████▎  | 11014/15001 [7:05:18<2:47:37,  2.52s/it, loss=0.273, lr=1e-5]Steps:  73%|███████▎  | 11014/15001 [7:05:19<2:47:37,  2.52s/it, loss=0.128, lr=1e-5]Steps:  73%|███████▎  | 11015/15001 [7:05:20<2:30:44,  2.27s/it, loss=0.128, lr=1e-5]Steps:  73%|███████▎  | 11015/15001 [7:05:20<2:30:44,  2.27s/it, loss=0.149, lr=1e-5]Steps:  73%|███████▎  | 11016/15001 [7:05:22<2:26:39,  2.21s/it, loss=0.149, lr=1e-5]Steps:  73%|███████▎  | 11016/15001 [7:05:22<2:26:39,  2.21s/it, loss=0.533, lr=1e-5]Steps:  73%|███████▎  | 11017/15001 [7:05:24<2:15:11,  2.04s/it, loss=0.533, lr=1e-5]Steps:  73%|███████▎  | 11017/15001 [7:05:24<2:15:11,  2.04s/it, loss=0.117, lr=1e-5]Steps:  73%|███████▎  | 11018/15001 [7:05:26<2:09:28,  1.95s/it, loss=0.117, lr=1e-5]Steps:  73%|███████▎  | 11018/15001 [7:05:26<2:09:28,  1.95s/it, loss=0.128, lr=1e-5]Steps:  73%|███████▎  | 11019/15001 [7:05:27<2:08:17,  1.93s/it, loss=0.128, lr=1e-5]Steps:  73%|███████▎  | 11019/15001 [7:05:28<2:08:17,  1.93s/it, loss=0.162, lr=1e-5]Steps:  73%|███████▎  | 11020/15001 [7:05:29<2:04:28,  1.88s/it, loss=0.162, lr=1e-5]Steps:  73%|███████▎  | 11020/15001 [7:05:29<2:04:28,  1.88s/it, loss=0.038, lr=1e-5]Steps:  73%|███████▎  | 11021/15001 [7:05:31<2:00:35,  1.82s/it, loss=0.038, lr=1e-5]Steps:  73%|███████▎  | 11021/15001 [7:05:31<2:00:35,  1.82s/it, loss=0.134, lr=1e-5]Steps:  73%|███████▎  | 11022/15001 [7:05:33<2:00:04,  1.81s/it, loss=0.134, lr=1e-5]Steps:  73%|███████▎  | 11022/15001 [7:05:33<2:00:04,  1.81s/it, loss=0.103, lr=1e-5]Steps:  73%|███████▎  | 11023/15001 [7:05:35<2:05:40,  1.90s/it, loss=0.103, lr=1e-5]Steps:  73%|███████▎  | 11023/15001 [7:05:35<2:05:40,  1.90s/it, loss=0.198, lr=1e-5]Steps:  73%|███████▎  | 11024/15001 [7:05:37<2:02:57,  1.86s/it, loss=0.198, lr=1e-5]Steps:  73%|███████▎  | 11024/15001 [7:05:37<2:02:57,  1.86s/it, loss=0.12, lr=1e-5] Steps:  73%|███████▎  | 11025/15001 [7:05:38<2:01:04,  1.83s/it, loss=0.12, lr=1e-5]Steps:  73%|███████▎  | 11025/15001 [7:05:38<2:01:04,  1.83s/it, loss=0.217, lr=1e-5]Steps:  74%|███████▎  | 11026/15001 [7:05:40<1:59:24,  1.80s/it, loss=0.217, lr=1e-5]Steps:  74%|███████▎  | 11026/15001 [7:05:40<1:59:24,  1.80s/it, loss=0.0887, lr=1e-5]Steps:  74%|███████▎  | 11027/15001 [7:05:42<1:59:38,  1.81s/it, loss=0.0887, lr=1e-5]Steps:  74%|███████▎  | 11027/15001 [7:05:42<1:59:38,  1.81s/it, loss=0.163, lr=1e-5] Steps:  74%|███████▎  | 11028/15001 [7:05:43<1:54:42,  1.73s/it, loss=0.163, lr=1e-5]Steps:  74%|███████▎  | 11028/15001 [7:05:44<1:54:42,  1.73s/it, loss=0.0225, lr=1e-5]Steps:  74%|███████▎  | 11029/15001 [7:05:46<2:02:52,  1.86s/it, loss=0.0225, lr=1e-5]Steps:  74%|███████▎  | 11029/15001 [7:05:46<2:02:52,  1.86s/it, loss=0.178, lr=1e-5] Steps:  74%|███████▎  | 11030/15001 [7:05:47<2:03:50,  1.87s/it, loss=0.178, lr=1e-5]Steps:  74%|███████▎  | 11030/15001 [7:05:48<2:03:50,  1.87s/it, loss=0.241, lr=1e-5]Steps:  74%|███████▎  | 11031/15001 [7:05:50<2:11:19,  1.98s/it, loss=0.241, lr=1e-5]Steps:  74%|███████▎  | 11031/15001 [7:05:50<2:11:19,  1.98s/it, loss=0.145, lr=1e-5]Steps:  74%|███████▎  | 11032/15001 [7:05:51<2:06:37,  1.91s/it, loss=0.145, lr=1e-5]Steps:  74%|███████▎  | 11032/15001 [7:05:52<2:06:37,  1.91s/it, loss=0.0913, lr=1e-5]Steps:  74%|███████▎  | 11033/15001 [7:05:53<2:08:44,  1.95s/it, loss=0.0913, lr=1e-5]Steps:  74%|███████▎  | 11033/15001 [7:05:54<2:08:44,  1.95s/it, loss=0.2, lr=1e-5]   Steps:  74%|███████▎  | 11034/15001 [7:05:55<2:09:17,  1.96s/it, loss=0.2, lr=1e-5]Steps:  74%|███████▎  | 11034/15001 [7:05:56<2:09:17,  1.96s/it, loss=0.143, lr=1e-5]Steps:  74%|███████▎  | 11035/15001 [7:05:58<2:15:14,  2.05s/it, loss=0.143, lr=1e-5]Steps:  74%|███████▎  | 11035/15001 [7:05:58<2:15:14,  2.05s/it, loss=0.124, lr=1e-5]Steps:  74%|███████▎  | 11036/15001 [7:05:59<2:07:17,  1.93s/it, loss=0.124, lr=1e-5]Steps:  74%|███████▎  | 11036/15001 [7:05:59<2:07:17,  1.93s/it, loss=0.0678, lr=1e-5]Steps:  74%|███████▎  | 11037/15001 [7:06:01<2:04:19,  1.88s/it, loss=0.0678, lr=1e-5]Steps:  74%|███████▎  | 11037/15001 [7:06:02<2:04:19,  1.88s/it, loss=0.143, lr=1e-5] Steps:  74%|███████▎  | 11038/15001 [7:06:03<2:08:12,  1.94s/it, loss=0.143, lr=1e-5]Steps:  74%|███████▎  | 11038/15001 [7:06:03<2:08:12,  1.94s/it, loss=0.225, lr=1e-5]Steps:  74%|███████▎  | 11039/15001 [7:06:05<2:03:15,  1.87s/it, loss=0.225, lr=1e-5]Steps:  74%|███████▎  | 11039/15001 [7:06:05<2:03:15,  1.87s/it, loss=0.104, lr=1e-5]Steps:  74%|███████▎  | 11040/15001 [7:06:07<2:00:54,  1.83s/it, loss=0.104, lr=1e-5]Steps:  74%|███████▎  | 11040/15001 [7:06:07<2:00:54,  1.83s/it, loss=0.372, lr=1e-5]Steps:  74%|███████▎  | 11041/15001 [7:06:08<1:58:51,  1.80s/it, loss=0.372, lr=1e-5]Steps:  74%|███████▎  | 11041/15001 [7:06:09<1:58:51,  1.80s/it, loss=0.221, lr=1e-5]Steps:  74%|███████▎  | 11042/15001 [7:06:10<2:00:06,  1.82s/it, loss=0.221, lr=1e-5]Steps:  74%|███████▎  | 11042/15001 [7:06:10<2:00:06,  1.82s/it, loss=0.148, lr=1e-5]Steps:  74%|███████▎  | 11043/15001 [7:06:12<2:03:20,  1.87s/it, loss=0.148, lr=1e-5]Steps:  74%|███████▎  | 11043/15001 [7:06:12<2:03:20,  1.87s/it, loss=0.119, lr=1e-5]Steps:  74%|███████▎  | 11044/15001 [7:06:14<2:03:03,  1.87s/it, loss=0.119, lr=1e-5]Steps:  74%|███████▎  | 11044/15001 [7:06:14<2:03:03,  1.87s/it, loss=0.0912, lr=1e-5]Steps:  74%|███████▎  | 11045/15001 [7:06:16<2:02:57,  1.86s/it, loss=0.0912, lr=1e-5]Steps:  74%|███████▎  | 11045/15001 [7:06:16<2:02:57,  1.86s/it, loss=0.196, lr=1e-5] Steps:  74%|███████▎  | 11046/15001 [7:06:18<1:59:53,  1.82s/it, loss=0.196, lr=1e-5]Steps:  74%|███████▎  | 11046/15001 [7:06:18<1:59:53,  1.82s/it, loss=0.314, lr=1e-5]Steps:  74%|███████▎  | 11047/15001 [7:06:19<1:59:27,  1.81s/it, loss=0.314, lr=1e-5]Steps:  74%|███████▎  | 11047/15001 [7:06:20<1:59:27,  1.81s/it, loss=0.133, lr=1e-5]Steps:  74%|███████▎  | 11048/15001 [7:06:21<1:58:22,  1.80s/it, loss=0.133, lr=1e-5]Steps:  74%|███████▎  | 11048/15001 [7:06:22<1:58:22,  1.80s/it, loss=0.0454, lr=1e-5]Steps:  74%|███████▎  | 11049/15001 [7:06:23<2:03:50,  1.88s/it, loss=0.0454, lr=1e-5]Steps:  74%|███████▎  | 11049/15001 [7:06:23<2:03:50,  1.88s/it, loss=0.0798, lr=1e-5]Steps:  74%|███████▎  | 11050/15001 [7:06:25<2:01:08,  1.84s/it, loss=0.0798, lr=1e-5]Steps:  74%|███████▎  | 11050/15001 [7:06:25<2:01:08,  1.84s/it, loss=0.0786, lr=1e-5]Steps:  74%|███████▎  | 11051/15001 [7:06:27<2:04:27,  1.89s/it, loss=0.0786, lr=1e-5]Steps:  74%|███████▎  | 11051/15001 [7:06:27<2:04:27,  1.89s/it, loss=0.0693, lr=1e-5]Steps:  74%|███████▎  | 11052/15001 [7:06:29<2:06:20,  1.92s/it, loss=0.0693, lr=1e-5]Steps:  74%|███████▎  | 11052/15001 [7:06:29<2:06:20,  1.92s/it, loss=0.14, lr=1e-5]  Steps:  74%|███████▎  | 11053/15001 [7:06:31<2:08:52,  1.96s/it, loss=0.14, lr=1e-5]Steps:  74%|███████▎  | 11053/15001 [7:06:31<2:08:52,  1.96s/it, loss=0.0471, lr=1e-5]Steps:  74%|███████▎  | 11054/15001 [7:06:33<2:11:17,  2.00s/it, loss=0.0471, lr=1e-5]Steps:  74%|███████▎  | 11054/15001 [7:06:33<2:11:17,  2.00s/it, loss=0.2, lr=1e-5]   Steps:  74%|███████▎  | 11055/15001 [7:06:35<2:05:40,  1.91s/it, loss=0.2, lr=1e-5]Steps:  74%|███████▎  | 11055/15001 [7:06:35<2:05:40,  1.91s/it, loss=0.146, lr=1e-5]Steps:  74%|███████▎  | 11056/15001 [7:06:37<2:12:32,  2.02s/it, loss=0.146, lr=1e-5]Steps:  74%|███████▎  | 11056/15001 [7:06:37<2:12:32,  2.02s/it, loss=0.103, lr=1e-5]Steps:  74%|███████▎  | 11057/15001 [7:06:39<2:11:44,  2.00s/it, loss=0.103, lr=1e-5]Steps:  74%|███████▎  | 11057/15001 [7:06:39<2:11:44,  2.00s/it, loss=0.23, lr=1e-5] Steps:  74%|███████▎  | 11058/15001 [7:06:41<2:07:41,  1.94s/it, loss=0.23, lr=1e-5]Steps:  74%|███████▎  | 11058/15001 [7:06:41<2:07:41,  1.94s/it, loss=0.416, lr=1e-5]Steps:  74%|███████▎  | 11059/15001 [7:06:43<2:09:08,  1.97s/it, loss=0.416, lr=1e-5]Steps:  74%|███████▎  | 11059/15001 [7:06:43<2:09:08,  1.97s/it, loss=0.141, lr=1e-5]Steps:  74%|███████▎  | 11060/15001 [7:06:45<2:02:45,  1.87s/it, loss=0.141, lr=1e-5]Steps:  74%|███████▎  | 11060/15001 [7:06:45<2:02:45,  1.87s/it, loss=0.315, lr=1e-5]Steps:  74%|███████▎  | 11061/15001 [7:06:46<2:03:00,  1.87s/it, loss=0.315, lr=1e-5]Steps:  74%|███████▎  | 11061/15001 [7:06:47<2:03:00,  1.87s/it, loss=0.0714, lr=1e-5]Steps:  74%|███████▎  | 11062/15001 [7:06:48<1:57:29,  1.79s/it, loss=0.0714, lr=1e-5]Steps:  74%|███████▎  | 11062/15001 [7:06:48<1:57:29,  1.79s/it, loss=0.15, lr=1e-5]  Steps:  74%|███████▎  | 11063/15001 [7:06:50<1:57:58,  1.80s/it, loss=0.15, lr=1e-5]Steps:  74%|███████▎  | 11063/15001 [7:06:50<1:57:58,  1.80s/it, loss=0.198, lr=1e-5]Steps:  74%|███████▍  | 11064/15001 [7:06:52<1:57:47,  1.80s/it, loss=0.198, lr=1e-5]Steps:  74%|███████▍  | 11064/15001 [7:06:52<1:57:47,  1.80s/it, loss=0.108, lr=1e-5]Steps:  74%|███████▍  | 11065/15001 [7:06:54<2:00:22,  1.84s/it, loss=0.108, lr=1e-5]Steps:  74%|███████▍  | 11065/15001 [7:06:54<2:00:22,  1.84s/it, loss=0.215, lr=1e-5]Steps:  74%|███████▍  | 11066/15001 [7:06:55<1:58:00,  1.80s/it, loss=0.215, lr=1e-5]Steps:  74%|███████▍  | 11066/15001 [7:06:56<1:58:00,  1.80s/it, loss=0.106, lr=1e-5]Steps:  74%|███████▍  | 11067/15001 [7:06:57<1:58:35,  1.81s/it, loss=0.106, lr=1e-5]Steps:  74%|███████▍  | 11067/15001 [7:06:58<1:58:35,  1.81s/it, loss=0.109, lr=1e-5]Steps:  74%|███████▍  | 11068/15001 [7:06:59<2:03:47,  1.89s/it, loss=0.109, lr=1e-5]Steps:  74%|███████▍  | 11068/15001 [7:06:59<2:03:47,  1.89s/it, loss=0.186, lr=1e-5]Steps:  74%|███████▍  | 11069/15001 [7:07:01<2:07:14,  1.94s/it, loss=0.186, lr=1e-5]Steps:  74%|███████▍  | 11069/15001 [7:07:01<2:07:14,  1.94s/it, loss=0.304, lr=1e-5]Steps:  74%|███████▍  | 11070/15001 [7:07:03<2:03:33,  1.89s/it, loss=0.304, lr=1e-5]Steps:  74%|███████▍  | 11070/15001 [7:07:03<2:03:33,  1.89s/it, loss=0.0895, lr=1e-5]Steps:  74%|███████▍  | 11071/15001 [7:07:05<1:57:24,  1.79s/it, loss=0.0895, lr=1e-5]Steps:  74%|███████▍  | 11071/15001 [7:07:05<1:57:24,  1.79s/it, loss=0.145, lr=1e-5] Steps:  74%|███████▍  | 11072/15001 [7:07:07<2:02:02,  1.86s/it, loss=0.145, lr=1e-5]Steps:  74%|███████▍  | 11072/15001 [7:07:07<2:02:02,  1.86s/it, loss=0.168, lr=1e-5]Steps:  74%|███████▍  | 11073/15001 [7:07:09<2:03:14,  1.88s/it, loss=0.168, lr=1e-5]Steps:  74%|███████▍  | 11073/15001 [7:07:09<2:03:14,  1.88s/it, loss=0.0725, lr=1e-5]Steps:  74%|███████▍  | 11074/15001 [7:07:10<2:03:10,  1.88s/it, loss=0.0725, lr=1e-5]Steps:  74%|███████▍  | 11074/15001 [7:07:11<2:03:10,  1.88s/it, loss=0.0926, lr=1e-5]Steps:  74%|███████▍  | 11075/15001 [7:07:12<2:03:14,  1.88s/it, loss=0.0926, lr=1e-5]Steps:  74%|███████▍  | 11075/15001 [7:07:12<2:03:14,  1.88s/it, loss=0.154, lr=1e-5] Steps:  74%|███████▍  | 11076/15001 [7:07:14<2:01:34,  1.86s/it, loss=0.154, lr=1e-5]Steps:  74%|███████▍  | 11076/15001 [7:07:14<2:01:34,  1.86s/it, loss=0.0367, lr=1e-5]Steps:  74%|███████▍  | 11077/15001 [7:07:16<2:01:39,  1.86s/it, loss=0.0367, lr=1e-5]Steps:  74%|███████▍  | 11077/15001 [7:07:17<2:01:39,  1.86s/it, loss=0.0759, lr=1e-5]Steps:  74%|███████▍  | 11078/15001 [7:07:18<2:10:45,  2.00s/it, loss=0.0759, lr=1e-5]Steps:  74%|███████▍  | 11078/15001 [7:07:18<2:10:45,  2.00s/it, loss=0.196, lr=1e-5] Steps:  74%|███████▍  | 11079/15001 [7:07:20<2:08:13,  1.96s/it, loss=0.196, lr=1e-5]Steps:  74%|███████▍  | 11079/15001 [7:07:20<2:08:13,  1.96s/it, loss=0.181, lr=1e-5]Steps:  74%|███████▍  | 11080/15001 [7:07:22<2:05:50,  1.93s/it, loss=0.181, lr=1e-5]Steps:  74%|███████▍  | 11080/15001 [7:07:22<2:05:50,  1.93s/it, loss=0.173, lr=1e-5]Steps:  74%|███████▍  | 11081/15001 [7:07:24<2:10:03,  1.99s/it, loss=0.173, lr=1e-5]Steps:  74%|███████▍  | 11081/15001 [7:07:24<2:10:03,  1.99s/it, loss=0.248, lr=1e-5]Steps:  74%|███████▍  | 11082/15001 [7:07:26<2:06:04,  1.93s/it, loss=0.248, lr=1e-5]Steps:  74%|███████▍  | 11082/15001 [7:07:26<2:06:04,  1.93s/it, loss=0.158, lr=1e-5]Steps:  74%|███████▍  | 11083/15001 [7:07:28<2:00:24,  1.84s/it, loss=0.158, lr=1e-5]Steps:  74%|███████▍  | 11083/15001 [7:07:28<2:00:24,  1.84s/it, loss=0.403, lr=1e-5]Steps:  74%|███████▍  | 11084/15001 [7:07:30<2:01:42,  1.86s/it, loss=0.403, lr=1e-5]Steps:  74%|███████▍  | 11084/15001 [7:07:30<2:01:42,  1.86s/it, loss=0.079, lr=1e-5]Steps:  74%|███████▍  | 11085/15001 [7:07:32<2:05:30,  1.92s/it, loss=0.079, lr=1e-5]Steps:  74%|███████▍  | 11085/15001 [7:07:32<2:05:30,  1.92s/it, loss=0.38, lr=1e-5] Steps:  74%|███████▍  | 11086/15001 [7:07:33<2:01:32,  1.86s/it, loss=0.38, lr=1e-5]Steps:  74%|███████▍  | 11086/15001 [7:07:33<2:01:32,  1.86s/it, loss=0.104, lr=1e-5]Steps:  74%|███████▍  | 11087/15001 [7:07:35<2:01:10,  1.86s/it, loss=0.104, lr=1e-5]Steps:  74%|███████▍  | 11087/15001 [7:07:35<2:01:10,  1.86s/it, loss=0.147, lr=1e-5]Steps:  74%|███████▍  | 11088/15001 [7:07:37<1:57:19,  1.80s/it, loss=0.147, lr=1e-5]Steps:  74%|███████▍  | 11088/15001 [7:07:37<1:57:19,  1.80s/it, loss=0.268, lr=1e-5]Steps:  74%|███████▍  | 11089/15001 [7:07:39<1:56:23,  1.79s/it, loss=0.268, lr=1e-5]Steps:  74%|███████▍  | 11089/15001 [7:07:39<1:56:23,  1.79s/it, loss=0.172, lr=1e-5]Steps:  74%|███████▍  | 11090/15001 [7:07:41<2:00:43,  1.85s/it, loss=0.172, lr=1e-5]Steps:  74%|███████▍  | 11090/15001 [7:07:41<2:00:43,  1.85s/it, loss=0.14, lr=1e-5] Steps:  74%|███████▍  | 11091/15001 [7:07:42<2:01:23,  1.86s/it, loss=0.14, lr=1e-5]Steps:  74%|███████▍  | 11091/15001 [7:07:43<2:01:23,  1.86s/it, loss=0.174, lr=1e-5]Steps:  74%|███████▍  | 11092/15001 [7:07:44<1:56:08,  1.78s/it, loss=0.174, lr=1e-5]Steps:  74%|███████▍  | 11092/15001 [7:07:44<1:56:08,  1.78s/it, loss=0.126, lr=1e-5]Steps:  74%|███████▍  | 11093/15001 [7:07:46<1:59:23,  1.83s/it, loss=0.126, lr=1e-5]Steps:  74%|███████▍  | 11093/15001 [7:07:46<1:59:23,  1.83s/it, loss=0.225, lr=1e-5]Steps:  74%|███████▍  | 11094/15001 [7:07:48<1:58:46,  1.82s/it, loss=0.225, lr=1e-5]Steps:  74%|███████▍  | 11094/15001 [7:07:48<1:58:46,  1.82s/it, loss=0.423, lr=1e-5]Steps:  74%|███████▍  | 11095/15001 [7:07:50<1:57:41,  1.81s/it, loss=0.423, lr=1e-5]Steps:  74%|███████▍  | 11095/15001 [7:07:50<1:57:41,  1.81s/it, loss=0.161, lr=1e-5]Steps:  74%|███████▍  | 11096/15001 [7:07:51<1:52:57,  1.74s/it, loss=0.161, lr=1e-5]Steps:  74%|███████▍  | 11096/15001 [7:07:52<1:52:57,  1.74s/it, loss=0.226, lr=1e-5]Steps:  74%|███████▍  | 11097/15001 [7:07:53<1:57:24,  1.80s/it, loss=0.226, lr=1e-5]Steps:  74%|███████▍  | 11097/15001 [7:07:53<1:57:24,  1.80s/it, loss=0.161, lr=1e-5]Steps:  74%|███████▍  | 11098/15001 [7:07:55<2:03:16,  1.90s/it, loss=0.161, lr=1e-5]Steps:  74%|███████▍  | 11098/15001 [7:07:55<2:03:16,  1.90s/it, loss=0.092, lr=1e-5]Steps:  74%|███████▍  | 11099/15001 [7:07:57<2:05:42,  1.93s/it, loss=0.092, lr=1e-5]Steps:  74%|███████▍  | 11099/15001 [7:07:57<2:05:42,  1.93s/it, loss=0.17, lr=1e-5] Steps:  74%|███████▍  | 11100/15001 [7:07:59<2:05:30,  1.93s/it, loss=0.17, lr=1e-5]Steps:  74%|███████▍  | 11100/15001 [7:07:59<2:05:30,  1.93s/it, loss=0.141, lr=1e-5]Steps:  74%|███████▍  | 11101/15001 [7:08:01<2:03:43,  1.90s/it, loss=0.141, lr=1e-5]Steps:  74%|███████▍  | 11101/15001 [7:08:01<2:03:43,  1.90s/it, loss=0.0865, lr=1e-5]Steps:  74%|███████▍  | 11102/15001 [7:08:03<2:07:02,  1.96s/it, loss=0.0865, lr=1e-5]Steps:  74%|███████▍  | 11102/15001 [7:08:03<2:07:02,  1.96s/it, loss=0.136, lr=1e-5] Steps:  74%|███████▍  | 11103/15001 [7:08:05<2:07:29,  1.96s/it, loss=0.136, lr=1e-5]Steps:  74%|███████▍  | 11103/15001 [7:08:05<2:07:29,  1.96s/it, loss=0.178, lr=1e-5]Steps:  74%|███████▍  | 11104/15001 [7:08:07<2:02:03,  1.88s/it, loss=0.178, lr=1e-5]Steps:  74%|███████▍  | 11104/15001 [7:08:07<2:02:03,  1.88s/it, loss=0.096, lr=1e-5]Steps:  74%|███████▍  | 11105/15001 [7:08:09<2:07:17,  1.96s/it, loss=0.096, lr=1e-5]Steps:  74%|███████▍  | 11105/15001 [7:08:09<2:07:17,  1.96s/it, loss=0.228, lr=1e-5]Steps:  74%|███████▍  | 11106/15001 [7:08:11<2:02:55,  1.89s/it, loss=0.228, lr=1e-5]Steps:  74%|███████▍  | 11106/15001 [7:08:11<2:02:55,  1.89s/it, loss=0.0689, lr=1e-5]Steps:  74%|███████▍  | 11107/15001 [7:08:13<2:04:10,  1.91s/it, loss=0.0689, lr=1e-5]Steps:  74%|███████▍  | 11107/15001 [7:08:13<2:04:10,  1.91s/it, loss=0.25, lr=1e-5]  Steps:  74%|███████▍  | 11108/15001 [7:08:15<2:03:52,  1.91s/it, loss=0.25, lr=1e-5]Steps:  74%|███████▍  | 11108/15001 [7:08:15<2:03:52,  1.91s/it, loss=0.0962, lr=1e-5]Steps:  74%|███████▍  | 11109/15001 [7:08:16<1:59:59,  1.85s/it, loss=0.0962, lr=1e-5]Steps:  74%|███████▍  | 11109/15001 [7:08:16<1:59:59,  1.85s/it, loss=0.134, lr=1e-5] Steps:  74%|███████▍  | 11110/15001 [7:08:18<1:59:39,  1.85s/it, loss=0.134, lr=1e-5]Steps:  74%|███████▍  | 11110/15001 [7:08:18<1:59:39,  1.85s/it, loss=0.236, lr=1e-5]Steps:  74%|███████▍  | 11111/15001 [7:08:20<1:57:31,  1.81s/it, loss=0.236, lr=1e-5]Steps:  74%|███████▍  | 11111/15001 [7:08:20<1:57:31,  1.81s/it, loss=0.0338, lr=1e-5]Steps:  74%|███████▍  | 11112/15001 [7:08:22<1:58:55,  1.83s/it, loss=0.0338, lr=1e-5]Steps:  74%|███████▍  | 11112/15001 [7:08:22<1:58:55,  1.83s/it, loss=0.0718, lr=1e-5]Steps:  74%|███████▍  | 11113/15001 [7:08:24<1:59:54,  1.85s/it, loss=0.0718, lr=1e-5]Steps:  74%|███████▍  | 11113/15001 [7:08:24<1:59:54,  1.85s/it, loss=0.327, lr=1e-5] Steps:  74%|███████▍  | 11114/15001 [7:08:25<1:58:02,  1.82s/it, loss=0.327, lr=1e-5]Steps:  74%|███████▍  | 11114/15001 [7:08:26<1:58:02,  1.82s/it, loss=0.0248, lr=1e-5]Steps:  74%|███████▍  | 11115/15001 [7:08:27<1:59:08,  1.84s/it, loss=0.0248, lr=1e-5]Steps:  74%|███████▍  | 11115/15001 [7:08:27<1:59:08,  1.84s/it, loss=0.168, lr=1e-5] Steps:  74%|███████▍  | 11116/15001 [7:08:29<1:58:36,  1.83s/it, loss=0.168, lr=1e-5]Steps:  74%|███████▍  | 11116/15001 [7:08:29<1:58:36,  1.83s/it, loss=0.219, lr=1e-5]Steps:  74%|███████▍  | 11117/15001 [7:08:31<1:57:17,  1.81s/it, loss=0.219, lr=1e-5]Steps:  74%|███████▍  | 11117/15001 [7:08:31<1:57:17,  1.81s/it, loss=0.0553, lr=1e-5]Steps:  74%|███████▍  | 11118/15001 [7:08:33<1:57:41,  1.82s/it, loss=0.0553, lr=1e-5]Steps:  74%|███████▍  | 11118/15001 [7:08:33<1:57:41,  1.82s/it, loss=0.138, lr=1e-5] Steps:  74%|███████▍  | 11119/15001 [7:08:34<1:54:39,  1.77s/it, loss=0.138, lr=1e-5]Steps:  74%|███████▍  | 11119/15001 [7:08:35<1:54:39,  1.77s/it, loss=0.0957, lr=1e-5]Steps:  74%|███████▍  | 11120/15001 [7:08:36<1:58:00,  1.82s/it, loss=0.0957, lr=1e-5]Steps:  74%|███████▍  | 11120/15001 [7:08:36<1:58:00,  1.82s/it, loss=0.109, lr=1e-5] Steps:  74%|███████▍  | 11121/15001 [7:08:38<2:00:05,  1.86s/it, loss=0.109, lr=1e-5]Steps:  74%|███████▍  | 11121/15001 [7:08:38<2:00:05,  1.86s/it, loss=0.374, lr=1e-5]Steps:  74%|███████▍  | 11122/15001 [7:08:40<2:00:30,  1.86s/it, loss=0.374, lr=1e-5]Steps:  74%|███████▍  | 11122/15001 [7:08:40<2:00:30,  1.86s/it, loss=0.309, lr=1e-5]Steps:  74%|███████▍  | 11123/15001 [7:08:42<2:01:43,  1.88s/it, loss=0.309, lr=1e-5]Steps:  74%|███████▍  | 11123/15001 [7:08:42<2:01:43,  1.88s/it, loss=0.232, lr=1e-5]Steps:  74%|███████▍  | 11124/15001 [7:08:44<1:59:47,  1.85s/it, loss=0.232, lr=1e-5]Steps:  74%|███████▍  | 11124/15001 [7:08:44<1:59:47,  1.85s/it, loss=0.266, lr=1e-5]Steps:  74%|███████▍  | 11125/15001 [7:08:46<1:58:52,  1.84s/it, loss=0.266, lr=1e-5]Steps:  74%|███████▍  | 11125/15001 [7:08:46<1:58:52,  1.84s/it, loss=0.238, lr=1e-5]Steps:  74%|███████▍  | 11126/15001 [7:08:48<2:05:18,  1.94s/it, loss=0.238, lr=1e-5]Steps:  74%|███████▍  | 11126/15001 [7:08:48<2:05:18,  1.94s/it, loss=0.39, lr=1e-5] Steps:  74%|███████▍  | 11127/15001 [7:08:50<2:08:21,  1.99s/it, loss=0.39, lr=1e-5]Steps:  74%|███████▍  | 11127/15001 [7:08:50<2:08:21,  1.99s/it, loss=0.013, lr=1e-5]Steps:  74%|███████▍  | 11128/15001 [7:08:52<2:04:52,  1.93s/it, loss=0.013, lr=1e-5]Steps:  74%|███████▍  | 11128/15001 [7:08:52<2:04:52,  1.93s/it, loss=0.309, lr=1e-5]Steps:  74%|█��█████▍  | 11129/15001 [7:08:53<2:02:38,  1.90s/it, loss=0.309, lr=1e-5]Steps:  74%|███████▍  | 11129/15001 [7:08:54<2:02:38,  1.90s/it, loss=0.0804, lr=1e-5]Steps:  74%|███████▍  | 11130/15001 [7:08:55<2:02:36,  1.90s/it, loss=0.0804, lr=1e-5]Steps:  74%|███████▍  | 11130/15001 [7:08:56<2:02:36,  1.90s/it, loss=0.138, lr=1e-5] Steps:  74%|███████▍  | 11131/15001 [7:08:57<2:03:02,  1.91s/it, loss=0.138, lr=1e-5]Steps:  74%|███████▍  | 11131/15001 [7:08:57<2:03:02,  1.91s/it, loss=0.0669, lr=1e-5]Steps:  74%|███████▍  | 11132/15001 [7:08:59<1:56:49,  1.81s/it, loss=0.0669, lr=1e-5]Steps:  74%|███████▍  | 11132/15001 [7:08:59<1:56:49,  1.81s/it, loss=0.2, lr=1e-5]   Steps:  74%|███████▍  | 11133/15001 [7:09:01<1:58:19,  1.84s/it, loss=0.2, lr=1e-5]Steps:  74%|███████▍  | 11133/15001 [7:09:01<1:58:19,  1.84s/it, loss=0.306, lr=1e-5]Steps:  74%|███████▍  | 11134/15001 [7:09:02<1:55:17,  1.79s/it, loss=0.306, lr=1e-5]Steps:  74%|███████▍  | 11134/15001 [7:09:03<1:55:17,  1.79s/it, loss=0.172, lr=1e-5]Steps:  74%|███████▍  | 11135/15001 [7:09:04<1:51:43,  1.73s/it, loss=0.172, lr=1e-5]Steps:  74%|███████▍  | 11135/15001 [7:09:04<1:51:43,  1.73s/it, loss=0.0703, lr=1e-5]Steps:  74%|███████▍  | 11136/15001 [7:09:06<2:00:16,  1.87s/it, loss=0.0703, lr=1e-5]Steps:  74%|███████▍  | 11136/15001 [7:09:06<2:00:16,  1.87s/it, loss=0.236, lr=1e-5] Steps:  74%|███████▍  | 11137/15001 [7:09:08<1:57:40,  1.83s/it, loss=0.236, lr=1e-5]Steps:  74%|███████▍  | 11137/15001 [7:09:08<1:57:40,  1.83s/it, loss=0.0452, lr=1e-5]Steps:  74%|███████▍  | 11138/15001 [7:09:10<1:53:45,  1.77s/it, loss=0.0452, lr=1e-5]Steps:  74%|███████▍  | 11138/15001 [7:09:10<1:53:45,  1.77s/it, loss=0.139, lr=1e-5] Steps:  74%|███████▍  | 11139/15001 [7:09:12<2:00:16,  1.87s/it, loss=0.139, lr=1e-5]Steps:  74%|███████▍  | 11139/15001 [7:09:12<2:00:16,  1.87s/it, loss=0.0867, lr=1e-5]Steps:  74%|███████▍  | 11140/15001 [7:09:13<1:57:45,  1.83s/it, loss=0.0867, lr=1e-5]Steps:  74%|███████▍  | 11140/15001 [7:09:14<1:57:45,  1.83s/it, loss=0.143, lr=1e-5] Steps:  74%|███████▍  | 11141/15001 [7:09:15<1:53:33,  1.77s/it, loss=0.143, lr=1e-5]Steps:  74%|███████▍  | 11141/15001 [7:09:15<1:53:33,  1.77s/it, loss=0.363, lr=1e-5]Steps:  74%|███████▍  | 11142/15001 [7:09:17<1:59:14,  1.85s/it, loss=0.363, lr=1e-5]Steps:  74%|███████▍  | 11142/15001 [7:09:17<1:59:14,  1.85s/it, loss=0.335, lr=1e-5]Steps:  74%|███████▍  | 11143/15001 [7:09:19<1:57:00,  1.82s/it, loss=0.335, lr=1e-5]Steps:  74%|███████▍  | 11143/15001 [7:09:19<1:57:00,  1.82s/it, loss=0.0789, lr=1e-5]Steps:  74%|███████▍  | 11144/15001 [7:09:21<2:00:58,  1.88s/it, loss=0.0789, lr=1e-5]Steps:  74%|███████▍  | 11144/15001 [7:09:21<2:00:58,  1.88s/it, loss=0.102, lr=1e-5] Steps:  74%|███████▍  | 11145/15001 [7:09:23<2:01:15,  1.89s/it, loss=0.102, lr=1e-5]Steps:  74%|███████▍  | 11145/15001 [7:09:23<2:01:15,  1.89s/it, loss=0.0799, lr=1e-5]Steps:  74%|███████▍  | 11146/15001 [7:09:25<2:00:06,  1.87s/it, loss=0.0799, lr=1e-5]Steps:  74%|███████▍  | 11146/15001 [7:09:25<2:00:06,  1.87s/it, loss=0.189, lr=1e-5] Steps:  74%|███████▍  | 11147/15001 [7:09:27<2:04:01,  1.93s/it, loss=0.189, lr=1e-5]Steps:  74%|███████▍  | 11147/15001 [7:09:27<2:04:01,  1.93s/it, loss=0.189, lr=1e-5]Steps:  74%|███████▍  | 11148/15001 [7:09:28<2:01:54,  1.90s/it, loss=0.189, lr=1e-5]Steps:  74%|███████▍  | 11148/15001 [7:09:29<2:01:54,  1.90s/it, loss=0.395, lr=1e-5]Steps:  74%|███████▍  | 11149/15001 [7:09:31<2:04:32,  1.94s/it, loss=0.395, lr=1e-5]Steps:  74%|███████▍  | 11149/15001 [7:09:31<2:04:32,  1.94s/it, loss=0.132, lr=1e-5]Steps:  74%|███████▍  | 11150/15001 [7:09:32<2:01:59,  1.90s/it, loss=0.132, lr=1e-5]Steps:  74%|███████▍  | 11150/15001 [7:09:33<2:01:59,  1.90s/it, loss=0.24, lr=1e-5] Steps:  74%|███████▍  | 11151/15001 [7:09:35<2:07:12,  1.98s/it, loss=0.24, lr=1e-5]Steps:  74%|███████▍  | 11151/15001 [7:09:35<2:07:12,  1.98s/it, loss=0.0711, lr=1e-5]Steps:  74%|███████▍  | 11152/15001 [7:09:36<2:00:16,  1.88s/it, loss=0.0711, lr=1e-5]Steps:  74%|███████▍  | 11152/15001 [7:09:36<2:00:16,  1.88s/it, loss=0.23, lr=1e-5]  Steps:  74%|███████▍  | 11153/15001 [7:09:38<1:58:39,  1.85s/it, loss=0.23, lr=1e-5]Steps:  74%|███████▍  | 11153/15001 [7:09:38<1:58:39,  1.85s/it, loss=0.239, lr=1e-5]Steps:  74%|█��█████▍  | 11154/15001 [7:09:40<2:01:58,  1.90s/it, loss=0.239, lr=1e-5]Steps:  74%|███████▍  | 11154/15001 [7:09:40<2:01:58,  1.90s/it, loss=0.125, lr=1e-5]Steps:  74%|███████▍  | 11155/15001 [7:09:42<2:00:19,  1.88s/it, loss=0.125, lr=1e-5]Steps:  74%|███████▍  | 11155/15001 [7:09:42<2:00:19,  1.88s/it, loss=0.259, lr=1e-5]Steps:  74%|███████▍  | 11156/15001 [7:09:43<1:54:24,  1.79s/it, loss=0.259, lr=1e-5]Steps:  74%|███████▍  | 11156/15001 [7:09:44<1:54:24,  1.79s/it, loss=0.116, lr=1e-5]Steps:  74%|███████▍  | 11157/15001 [7:09:45<1:59:08,  1.86s/it, loss=0.116, lr=1e-5]Steps:  74%|███████▍  | 11157/15001 [7:09:45<1:59:08,  1.86s/it, loss=0.236, lr=1e-5]Steps:  74%|███████▍  | 11158/15001 [7:09:47<1:56:31,  1.82s/it, loss=0.236, lr=1e-5]Steps:  74%|███████▍  | 11158/15001 [7:09:47<1:56:31,  1.82s/it, loss=0.176, lr=1e-5]Steps:  74%|███████▍  | 11159/15001 [7:09:49<1:53:09,  1.77s/it, loss=0.176, lr=1e-5]Steps:  74%|███████▍  | 11159/15001 [7:09:49<1:53:09,  1.77s/it, loss=0.0827, lr=1e-5]Steps:  74%|███████▍  | 11160/15001 [7:09:51<1:55:50,  1.81s/it, loss=0.0827, lr=1e-5]Steps:  74%|███████▍  | 11160/15001 [7:09:51<1:55:50,  1.81s/it, loss=0.173, lr=1e-5] Steps:  74%|███████▍  | 11161/15001 [7:09:53<1:58:46,  1.86s/it, loss=0.173, lr=1e-5]Steps:  74%|███████▍  | 11161/15001 [7:09:53<1:58:46,  1.86s/it, loss=0.123, lr=1e-5]Steps:  74%|███████▍  | 11162/15001 [7:09:55<2:01:16,  1.90s/it, loss=0.123, lr=1e-5]Steps:  74%|███████▍  | 11162/15001 [7:09:55<2:01:16,  1.90s/it, loss=0.226, lr=1e-5]Steps:  74%|███████▍  | 11163/15001 [7:09:56<2:00:32,  1.88s/it, loss=0.226, lr=1e-5]Steps:  74%|███████▍  | 11163/15001 [7:09:57<2:00:32,  1.88s/it, loss=0.363, lr=1e-5]Steps:  74%|███████▍  | 11164/15001 [7:09:58<1:58:29,  1.85s/it, loss=0.363, lr=1e-5]Steps:  74%|███████▍  | 11164/15001 [7:09:58<1:58:29,  1.85s/it, loss=0.324, lr=1e-5]Steps:  74%|███████▍  | 11165/15001 [7:10:00<1:52:51,  1.77s/it, loss=0.324, lr=1e-5]Steps:  74%|███████▍  | 11165/15001 [7:10:00<1:52:51,  1.77s/it, loss=0.291, lr=1e-5]Steps:  74%|███████▍  | 11166/15001 [7:10:02<1:52:24,  1.76s/it, loss=0.291, lr=1e-5]Steps:  74%|███████▍  | 11166/15001 [7:10:02<1:52:24,  1.76s/it, loss=0.154, lr=1e-5]Steps:  74%|███████▍  | 11167/15001 [7:10:03<1:54:58,  1.80s/it, loss=0.154, lr=1e-5]Steps:  74%|███████▍  | 11167/15001 [7:10:04<1:54:58,  1.80s/it, loss=0.229, lr=1e-5]Steps:  74%|███████▍  | 11168/15001 [7:10:06<2:01:28,  1.90s/it, loss=0.229, lr=1e-5]Steps:  74%|███████▍  | 11168/15001 [7:10:06<2:01:28,  1.90s/it, loss=0.118, lr=1e-5]Steps:  74%|███████▍  | 11169/15001 [7:10:08<2:09:13,  2.02s/it, loss=0.118, lr=1e-5]Steps:  74%|███████▍  | 11169/15001 [7:10:08<2:09:13,  2.02s/it, loss=0.0917, lr=1e-5]Steps:  74%|███████▍  | 11170/15001 [7:10:10<2:09:57,  2.04s/it, loss=0.0917, lr=1e-5]Steps:  74%|███████▍  | 11170/15001 [7:10:10<2:09:57,  2.04s/it, loss=0.114, lr=1e-5] Steps:  74%|███████▍  | 11171/15001 [7:10:12<2:08:07,  2.01s/it, loss=0.114, lr=1e-5]Steps:  74%|███████▍  | 11171/15001 [7:10:12<2:08:07,  2.01s/it, loss=0.341, lr=1e-5]Steps:  74%|███████▍  | 11172/15001 [7:10:14<2:08:29,  2.01s/it, loss=0.341, lr=1e-5]Steps:  74%|███████▍  | 11172/15001 [7:10:14<2:08:29,  2.01s/it, loss=0.161, lr=1e-5]Steps:  74%|███████▍  | 11173/15001 [7:10:16<2:06:11,  1.98s/it, loss=0.161, lr=1e-5]Steps:  74%|███████▍  | 11173/15001 [7:10:16<2:06:11,  1.98s/it, loss=0.216, lr=1e-5]Steps:  74%|███████▍  | 11174/15001 [7:10:18<2:02:06,  1.91s/it, loss=0.216, lr=1e-5]Steps:  74%|███████▍  | 11174/15001 [7:10:18<2:02:06,  1.91s/it, loss=0.11, lr=1e-5] Steps:  74%|███████▍  | 11175/15001 [7:10:19<2:01:11,  1.90s/it, loss=0.11, lr=1e-5]Steps:  74%|███████▍  | 11175/15001 [7:10:20<2:01:11,  1.90s/it, loss=0.251, lr=1e-5]Steps:  75%|███████▍  | 11176/15001 [7:10:21<1:58:20,  1.86s/it, loss=0.251, lr=1e-5]Steps:  75%|███████▍  | 11176/15001 [7:10:22<1:58:20,  1.86s/it, loss=0.119, lr=1e-5]Steps:  75%|███████▍  | 11177/15001 [7:10:23<2:01:21,  1.90s/it, loss=0.119, lr=1e-5]Steps:  75%|███████▍  | 11177/15001 [7:10:23<2:01:21,  1.90s/it, loss=0.179, lr=1e-5]Steps:  75%|███████▍  | 11178/15001 [7:10:25<1:59:01,  1.87s/it, loss=0.179, lr=1e-5]Steps:  75%|███████▍  | 11178/15001 [7:10:25<1:59:01,  1.87s/it, loss=0.077, lr=1e-5]Steps:  75%|██████��▍  | 11179/15001 [7:10:27<1:58:54,  1.87s/it, loss=0.077, lr=1e-5]Steps:  75%|███████▍  | 11179/15001 [7:10:27<1:58:54,  1.87s/it, loss=0.257, lr=1e-5]Steps:  75%|███████▍  | 11180/15001 [7:10:29<1:56:11,  1.82s/it, loss=0.257, lr=1e-5]Steps:  75%|███████▍  | 11180/15001 [7:10:29<1:56:11,  1.82s/it, loss=0.12, lr=1e-5] Steps:  75%|███████▍  | 11181/15001 [7:10:30<1:54:50,  1.80s/it, loss=0.12, lr=1e-5]Steps:  75%|███████▍  | 11181/15001 [7:10:30<1:54:50,  1.80s/it, loss=0.165, lr=1e-5]Steps:  75%|███████▍  | 11182/15001 [7:10:32<1:53:38,  1.79s/it, loss=0.165, lr=1e-5]Steps:  75%|███████▍  | 11182/15001 [7:10:32<1:53:38,  1.79s/it, loss=0.15, lr=1e-5] Steps:  75%|███████▍  | 11183/15001 [7:10:34<1:54:52,  1.81s/it, loss=0.15, lr=1e-5]Steps:  75%|███████▍  | 11183/15001 [7:10:34<1:54:52,  1.81s/it, loss=0.149, lr=1e-5]Steps:  75%|███████▍  | 11184/15001 [7:10:36<1:53:20,  1.78s/it, loss=0.149, lr=1e-5]Steps:  75%|███████▍  | 11184/15001 [7:10:36<1:53:20,  1.78s/it, loss=0.185, lr=1e-5]Steps:  75%|███████▍  | 11185/15001 [7:10:38<1:55:13,  1.81s/it, loss=0.185, lr=1e-5]Steps:  75%|███████▍  | 11185/15001 [7:10:38<1:55:13,  1.81s/it, loss=0.188, lr=1e-5]Steps:  75%|███████▍  | 11186/15001 [7:10:39<1:53:09,  1.78s/it, loss=0.188, lr=1e-5]Steps:  75%|███████▍  | 11186/15001 [7:10:39<1:53:09,  1.78s/it, loss=0.167, lr=1e-5]Steps:  75%|███████▍  | 11187/15001 [7:10:41<1:55:20,  1.81s/it, loss=0.167, lr=1e-5]Steps:  75%|███████▍  | 11187/15001 [7:10:41<1:55:20,  1.81s/it, loss=0.416, lr=1e-5]Steps:  75%|███████▍  | 11188/15001 [7:10:43<1:53:48,  1.79s/it, loss=0.416, lr=1e-5]Steps:  75%|███████▍  | 11188/15001 [7:10:43<1:53:48,  1.79s/it, loss=0.222, lr=1e-5]Steps:  75%|███████▍  | 11189/15001 [7:10:45<1:55:36,  1.82s/it, loss=0.222, lr=1e-5]Steps:  75%|███████▍  | 11189/15001 [7:10:45<1:55:36,  1.82s/it, loss=0.0616, lr=1e-5]Steps:  75%|███████▍  | 11190/15001 [7:10:47<1:54:15,  1.80s/it, loss=0.0616, lr=1e-5]Steps:  75%|███████▍  | 11190/15001 [7:10:47<1:54:15,  1.80s/it, loss=0.233, lr=1e-5] Steps:  75%|███████▍  | 11191/15001 [7:10:49<1:59:08,  1.88s/it, loss=0.233, lr=1e-5]Steps:  75%|███████▍  | 11191/15001 [7:10:49<1:59:08,  1.88s/it, loss=0.293, lr=1e-5]Steps:  75%|███████▍  | 11192/15001 [7:10:51<2:02:03,  1.92s/it, loss=0.293, lr=1e-5]Steps:  75%|███████▍  | 11192/15001 [7:10:51<2:02:03,  1.92s/it, loss=0.124, lr=1e-5]Steps:  75%|███████▍  | 11193/15001 [7:10:53<2:04:41,  1.96s/it, loss=0.124, lr=1e-5]Steps:  75%|███████▍  | 11193/15001 [7:10:53<2:04:41,  1.96s/it, loss=0.287, lr=1e-5]Steps:  75%|███████▍  | 11194/15001 [7:10:55<2:06:46,  2.00s/it, loss=0.287, lr=1e-5]Steps:  75%|███████▍  | 11194/15001 [7:10:55<2:06:46,  2.00s/it, loss=0.0366, lr=1e-5]Steps:  75%|███████▍  | 11195/15001 [7:10:57<2:02:08,  1.93s/it, loss=0.0366, lr=1e-5]Steps:  75%|███████▍  | 11195/15001 [7:10:57<2:02:08,  1.93s/it, loss=0.0948, lr=1e-5]Steps:  75%|███████▍  | 11196/15001 [7:10:59<2:10:47,  2.06s/it, loss=0.0948, lr=1e-5]Steps:  75%|███████▍  | 11196/15001 [7:10:59<2:10:47,  2.06s/it, loss=0.0836, lr=1e-5]Steps:  75%|███████▍  | 11197/15001 [7:11:01<2:06:10,  1.99s/it, loss=0.0836, lr=1e-5]Steps:  75%|███████▍  | 11197/15001 [7:11:01<2:06:10,  1.99s/it, loss=0.14, lr=1e-5]  Steps:  75%|███████▍  | 11198/15001 [7:11:02<2:01:56,  1.92s/it, loss=0.14, lr=1e-5]Steps:  75%|███████▍  | 11198/15001 [7:11:03<2:01:56,  1.92s/it, loss=0.17, lr=1e-5]Steps:  75%|███████▍  | 11199/15001 [7:11:04<1:54:05,  1.80s/it, loss=0.17, lr=1e-5]Steps:  75%|███████▍  | 11199/15001 [7:11:04<1:54:05,  1.80s/it, loss=0.147, lr=1e-5]Steps:  75%|███████▍  | 11200/15001 [7:11:06<1:58:38,  1.87s/it, loss=0.147, lr=1e-5]Steps:  75%|███████▍  | 11200/15001 [7:11:06<1:58:38,  1.87s/it, loss=0.221, lr=1e-5]Steps:  75%|███████▍  | 11201/15001 [7:11:08<1:55:14,  1.82s/it, loss=0.221, lr=1e-5]Steps:  75%|███████▍  | 11201/15001 [7:11:08<1:55:14,  1.82s/it, loss=0.145, lr=1e-5]Steps:  75%|███████▍  | 11202/15001 [7:11:10<1:55:25,  1.82s/it, loss=0.145, lr=1e-5]Steps:  75%|███████▍  | 11202/15001 [7:11:10<1:55:25,  1.82s/it, loss=0.146, lr=1e-5]Steps:  75%|███████▍  | 11203/15001 [7:11:12<2:03:30,  1.95s/it, loss=0.146, lr=1e-5]Steps:  75%|███████▍  | 11203/15001 [7:11:12<2:03:30,  1.95s/it, loss=0.0225, lr=1e-5]Steps:  75%|███████▍  | 11204/15001 [7:11:14<2:00:47,  1.91s/it, loss=0.0225, lr=1e-5]Steps:  75%|███████▍  | 11204/15001 [7:11:14<2:00:47,  1.91s/it, loss=0.216, lr=1e-5] Steps:  75%|███████▍  | 11205/15001 [7:11:15<1:55:09,  1.82s/it, loss=0.216, lr=1e-5]Steps:  75%|███████▍  | 11205/15001 [7:11:16<1:55:09,  1.82s/it, loss=0.318, lr=1e-5]Steps:  75%|███████▍  | 11206/15001 [7:11:17<1:57:33,  1.86s/it, loss=0.318, lr=1e-5]Steps:  75%|███████▍  | 11206/15001 [7:11:17<1:57:33,  1.86s/it, loss=0.292, lr=1e-5]Steps:  75%|███████▍  | 11207/15001 [7:11:19<1:59:33,  1.89s/it, loss=0.292, lr=1e-5]Steps:  75%|███████▍  | 11207/15001 [7:11:19<1:59:33,  1.89s/it, loss=0.173, lr=1e-5]Steps:  75%|███████▍  | 11208/15001 [7:11:21<1:59:47,  1.89s/it, loss=0.173, lr=1e-5]Steps:  75%|███████▍  | 11208/15001 [7:11:21<1:59:47,  1.89s/it, loss=0.122, lr=1e-5]Steps:  75%|███████▍  | 11209/15001 [7:11:23<1:58:02,  1.87s/it, loss=0.122, lr=1e-5]Steps:  75%|███████▍  | 11209/15001 [7:11:23<1:58:02,  1.87s/it, loss=0.0698, lr=1e-5]Steps:  75%|███████▍  | 11210/15001 [7:11:24<1:48:36,  1.72s/it, loss=0.0698, lr=1e-5]Steps:  75%|███████▍  | 11210/15001 [7:11:25<1:48:36,  1.72s/it, loss=0.117, lr=1e-5] Steps:  75%|███████▍  | 11211/15001 [7:11:26<1:53:49,  1.80s/it, loss=0.117, lr=1e-5]Steps:  75%|███████▍  | 11211/15001 [7:11:27<1:53:49,  1.80s/it, loss=0.193, lr=1e-5]Steps:  75%|███████▍  | 11212/15001 [7:11:28<1:53:37,  1.80s/it, loss=0.193, lr=1e-5]Steps:  75%|███████▍  | 11212/15001 [7:11:28<1:53:37,  1.80s/it, loss=0.0504, lr=1e-5]Steps:  75%|███████▍  | 11213/15001 [7:11:30<1:58:32,  1.88s/it, loss=0.0504, lr=1e-5]Steps:  75%|███████▍  | 11213/15001 [7:11:30<1:58:32,  1.88s/it, loss=0.198, lr=1e-5] Steps:  75%|███████▍  | 11214/15001 [7:11:32<2:01:15,  1.92s/it, loss=0.198, lr=1e-5]Steps:  75%|███████▍  | 11214/15001 [7:11:32<2:01:15,  1.92s/it, loss=0.147, lr=1e-5]Steps:  75%|███████▍  | 11215/15001 [7:11:34<2:03:48,  1.96s/it, loss=0.147, lr=1e-5]Steps:  75%|███████▍  | 11215/15001 [7:11:34<2:03:48,  1.96s/it, loss=0.163, lr=1e-5]Steps:  75%|███████▍  | 11216/15001 [7:11:36<2:00:48,  1.91s/it, loss=0.163, lr=1e-5]Steps:  75%|███████▍  | 11216/15001 [7:11:36<2:00:48,  1.91s/it, loss=0.151, lr=1e-5]Steps:  75%|███████▍  | 11217/15001 [7:11:38<2:04:15,  1.97s/it, loss=0.151, lr=1e-5]Steps:  75%|███████▍  | 11217/15001 [7:11:38<2:04:15,  1.97s/it, loss=0.165, lr=1e-5]Steps:  75%|███████▍  | 11218/15001 [7:11:40<2:07:09,  2.02s/it, loss=0.165, lr=1e-5]Steps:  75%|███████▍  | 11218/15001 [7:11:40<2:07:09,  2.02s/it, loss=0.21, lr=1e-5] Steps:  75%|███████▍  | 11219/15001 [7:11:42<2:02:11,  1.94s/it, loss=0.21, lr=1e-5]Steps:  75%|███████▍  | 11219/15001 [7:11:42<2:02:11,  1.94s/it, loss=0.129, lr=1e-5]Steps:  75%|███████▍  | 11220/15001 [7:11:44<2:04:29,  1.98s/it, loss=0.129, lr=1e-5]Steps:  75%|███████▍  | 11220/15001 [7:11:44<2:04:29,  1.98s/it, loss=0.275, lr=1e-5]Steps:  75%|███████▍  | 11221/15001 [7:11:46<1:59:29,  1.90s/it, loss=0.275, lr=1e-5]Steps:  75%|███████▍  | 11221/15001 [7:11:46<1:59:29,  1.90s/it, loss=0.255, lr=1e-5]Steps:  75%|███████▍  | 11222/15001 [7:11:48<2:01:14,  1.92s/it, loss=0.255, lr=1e-5]Steps:  75%|███████▍  | 11222/15001 [7:11:48<2:01:14,  1.92s/it, loss=0.148, lr=1e-5]Steps:  75%|███████▍  | 11223/15001 [7:11:50<2:00:28,  1.91s/it, loss=0.148, lr=1e-5]Steps:  75%|███████▍  | 11223/15001 [7:11:50<2:00:28,  1.91s/it, loss=0.0649, lr=1e-5]Steps:  75%|███████▍  | 11224/15001 [7:11:51<1:59:04,  1.89s/it, loss=0.0649, lr=1e-5]Steps:  75%|███████▍  | 11224/15001 [7:11:52<1:59:04,  1.89s/it, loss=0.0741, lr=1e-5]Steps:  75%|███████▍  | 11225/15001 [7:11:53<1:55:27,  1.83s/it, loss=0.0741, lr=1e-5]Steps:  75%|███████▍  | 11225/15001 [7:11:53<1:55:27,  1.83s/it, loss=0.298, lr=1e-5] Steps:  75%|███████▍  | 11226/15001 [7:11:55<1:53:59,  1.81s/it, loss=0.298, lr=1e-5]Steps:  75%|███████▍  | 11226/15001 [7:11:55<1:53:59,  1.81s/it, loss=0.274, lr=1e-5]Steps:  75%|███████▍  | 11227/15001 [7:11:57<1:54:20,  1.82s/it, loss=0.274, lr=1e-5]Steps:  75%|███████▍  | 11227/15001 [7:11:57<1:54:20,  1.82s/it, loss=0.157, lr=1e-5]Steps:  75%|███████▍  | 11228/15001 [7:11:59<1:55:02,  1.83s/it, loss=0.157, lr=1e-5]Steps:  75%|███████▍  | 11228/15001 [7:11:59<1:55:02,  1.83s/it, loss=0.49, lr=1e-5] Steps:  75%|███████▍  | 11229/15001 [7:12:00<1:52:27,  1.79s/it, loss=0.49, lr=1e-5]Steps:  75%|███████▍  | 11229/15001 [7:12:01<1:52:27,  1.79s/it, loss=0.237, lr=1e-5]Steps:  75%|███████▍  | 11230/15001 [7:12:02<1:51:55,  1.78s/it, loss=0.237, lr=1e-5]Steps:  75%|███████▍  | 11230/15001 [7:12:02<1:51:55,  1.78s/it, loss=0.0477, lr=1e-5]Steps:  75%|███████▍  | 11231/15001 [7:12:04<1:58:00,  1.88s/it, loss=0.0477, lr=1e-5]Steps:  75%|███████▍  | 11231/15001 [7:12:04<1:58:00,  1.88s/it, loss=0.262, lr=1e-5] Steps:  75%|███████▍  | 11232/15001 [7:12:06<1:54:23,  1.82s/it, loss=0.262, lr=1e-5]Steps:  75%|███████▍  | 11232/15001 [7:12:06<1:54:23,  1.82s/it, loss=0.0586, lr=1e-5]Steps:  75%|███████▍  | 11233/15001 [7:12:08<1:56:50,  1.86s/it, loss=0.0586, lr=1e-5]Steps:  75%|███████▍  | 11233/15001 [7:12:08<1:56:50,  1.86s/it, loss=0.213, lr=1e-5] Steps:  75%|███████▍  | 11234/15001 [7:12:10<1:55:22,  1.84s/it, loss=0.213, lr=1e-5]Steps:  75%|███████▍  | 11234/15001 [7:12:10<1:55:22,  1.84s/it, loss=0.197, lr=1e-5]Steps:  75%|███████▍  | 11235/15001 [7:12:11<1:54:40,  1.83s/it, loss=0.197, lr=1e-5]Steps:  75%|███████▍  | 11235/15001 [7:12:12<1:54:40,  1.83s/it, loss=0.0273, lr=1e-5]Steps:  75%|███████▍  | 11236/15001 [7:12:13<1:55:31,  1.84s/it, loss=0.0273, lr=1e-5]Steps:  75%|███████▍  | 11236/15001 [7:12:13<1:55:31,  1.84s/it, loss=0.308, lr=1e-5] Steps:  75%|███████▍  | 11237/15001 [7:12:15<1:58:19,  1.89s/it, loss=0.308, lr=1e-5]Steps:  75%|███████▍  | 11237/15001 [7:12:15<1:58:19,  1.89s/it, loss=0.292, lr=1e-5]Steps:  75%|███████▍  | 11238/15001 [7:12:17<2:02:47,  1.96s/it, loss=0.292, lr=1e-5]Steps:  75%|███████▍  | 11238/15001 [7:12:17<2:02:47,  1.96s/it, loss=0.396, lr=1e-5]Steps:  75%|███████▍  | 11239/15001 [7:12:19<1:58:30,  1.89s/it, loss=0.396, lr=1e-5]Steps:  75%|███████▍  | 11239/15001 [7:12:19<1:58:30,  1.89s/it, loss=0.171, lr=1e-5]Steps:  75%|███████▍  | 11240/15001 [7:12:21<2:04:03,  1.98s/it, loss=0.171, lr=1e-5]Steps:  75%|███████▍  | 11240/15001 [7:12:21<2:04:03,  1.98s/it, loss=0.173, lr=1e-5]Steps:  75%|███████▍  | 11241/15001 [7:12:23<2:04:43,  1.99s/it, loss=0.173, lr=1e-5]Steps:  75%|███████▍  | 11241/15001 [7:12:23<2:04:43,  1.99s/it, loss=0.117, lr=1e-5]Steps:  75%|███████▍  | 11242/15001 [7:12:25<2:04:26,  1.99s/it, loss=0.117, lr=1e-5]Steps:  75%|███████▍  | 11242/15001 [7:12:25<2:04:26,  1.99s/it, loss=0.23, lr=1e-5] Steps:  75%|███████▍  | 11243/15001 [7:12:27<2:00:20,  1.92s/it, loss=0.23, lr=1e-5]Steps:  75%|███████▍  | 11243/15001 [7:12:27<2:00:20,  1.92s/it, loss=0.0282, lr=1e-5]Steps:  75%|███████▍  | 11244/15001 [7:12:29<1:57:18,  1.87s/it, loss=0.0282, lr=1e-5]Steps:  75%|███████▍  | 11244/15001 [7:12:29<1:57:18,  1.87s/it, loss=0.0914, lr=1e-5]Steps:  75%|███████▍  | 11245/15001 [7:12:31<1:56:44,  1.86s/it, loss=0.0914, lr=1e-5]Steps:  75%|███████▍  | 11245/15001 [7:12:31<1:56:44,  1.86s/it, loss=0.0225, lr=1e-5]Steps:  75%|███████▍  | 11246/15001 [7:12:33<1:57:45,  1.88s/it, loss=0.0225, lr=1e-5]Steps:  75%|███████▍  | 11246/15001 [7:12:33<1:57:45,  1.88s/it, loss=0.0809, lr=1e-5]Steps:  75%|███████▍  | 11247/15001 [7:12:34<1:55:45,  1.85s/it, loss=0.0809, lr=1e-5]Steps:  75%|███████▍  | 11247/15001 [7:12:34<1:55:45,  1.85s/it, loss=0.00935, lr=1e-5]Steps:  75%|███████▍  | 11248/15001 [7:12:36<1:56:15,  1.86s/it, loss=0.00935, lr=1e-5]Steps:  75%|███████▍  | 11248/15001 [7:12:36<1:56:15,  1.86s/it, loss=0.312, lr=1e-5]  Steps:  75%|███████▍  | 11249/15001 [7:12:38<1:55:40,  1.85s/it, loss=0.312, lr=1e-5]Steps:  75%|███████▍  | 11249/15001 [7:12:38<1:55:40,  1.85s/it, loss=0.232, lr=1e-5]Steps:  75%|███████▍  | 11250/15001 [7:12:40<1:50:05,  1.76s/it, loss=0.232, lr=1e-5]Steps:  75%|███████▍  | 11250/15001 [7:12:40<1:50:05,  1.76s/it, loss=0.223, lr=1e-5]Steps:  75%|███████▌  | 11251/15001 [7:12:41<1:52:19,  1.80s/it, loss=0.223, lr=1e-5]Steps:  75%|███████▌  | 11251/15001 [7:12:42<1:52:19,  1.80s/it, loss=0.155, lr=1e-5]Steps:  75%|███████▌  | 11252/15001 [7:12:44<1:57:38,  1.88s/it, loss=0.155, lr=1e-5]Steps:  75%|███████▌  | 11252/15001 [7:12:44<1:57:38,  1.88s/it, loss=0.129, lr=1e-5]Steps:  75%|███████▌  | 11253/15001 [7:12:45<1:53:51,  1.82s/it, loss=0.129, lr=1e-5]Steps:  75%|███████▌  | 11253/15001 [7:12:46<1:53:51,  1.82s/it, loss=0.124, lr=1e-5]Steps:  75%|███████▌  | 11254/15001 [7:12:47<1:55:05,  1.84s/it, loss=0.124, lr=1e-5]Steps:  75%|███████▌  | 11254/15001 [7:12:47<1:55:05,  1.84s/it, loss=0.0472, lr=1e-5]Steps:  75%|███████▌  | 11255/15001 [7:12:49<1:50:37,  1.77s/it, loss=0.0472, lr=1e-5]Steps:  75%|███████▌  | 11255/15001 [7:12:49<1:50:37,  1.77s/it, loss=0.36, lr=1e-5]  Steps:  75%|███████▌  | 11256/15001 [7:12:51<1:53:34,  1.82s/it, loss=0.36, lr=1e-5]Steps:  75%|███████▌  | 11256/15001 [7:12:51<1:53:34,  1.82s/it, loss=0.4, lr=1e-5] Steps:  75%|███████▌  | 11257/15001 [7:12:53<1:54:26,  1.83s/it, loss=0.4, lr=1e-5]Steps:  75%|███████▌  | 11257/15001 [7:12:53<1:54:26,  1.83s/it, loss=0.099, lr=1e-5]Steps:  75%|███████▌  | 11258/15001 [7:12:54<1:53:13,  1.81s/it, loss=0.099, lr=1e-5]Steps:  75%|███████▌  | 11258/15001 [7:12:55<1:53:13,  1.81s/it, loss=0.181, lr=1e-5]Steps:  75%|███████▌  | 11259/15001 [7:12:56<1:54:14,  1.83s/it, loss=0.181, lr=1e-5]Steps:  75%|███████▌  | 11259/15001 [7:12:57<1:54:14,  1.83s/it, loss=0.0379, lr=1e-5]Steps:  75%|███████▌  | 11260/15001 [7:12:59<2:03:34,  1.98s/it, loss=0.0379, lr=1e-5]Steps:  75%|███████▌  | 11260/15001 [7:12:59<2:03:34,  1.98s/it, loss=0.0713, lr=1e-5]Steps:  75%|███████▌  | 11261/15001 [7:13:00<2:00:30,  1.93s/it, loss=0.0713, lr=1e-5]Steps:  75%|███████▌  | 11261/15001 [7:13:01<2:00:30,  1.93s/it, loss=0.0671, lr=1e-5]Steps:  75%|███████▌  | 11262/15001 [7:13:02<2:03:56,  1.99s/it, loss=0.0671, lr=1e-5]Steps:  75%|███████▌  | 11262/15001 [7:13:03<2:03:56,  1.99s/it, loss=0.151, lr=1e-5] Steps:  75%|███████▌  | 11263/15001 [7:13:04<2:00:44,  1.94s/it, loss=0.151, lr=1e-5]Steps:  75%|███████▌  | 11263/15001 [7:13:05<2:00:44,  1.94s/it, loss=0.329, lr=1e-5]Steps:  75%|███████▌  | 11264/15001 [7:13:06<2:03:12,  1.98s/it, loss=0.329, lr=1e-5]Steps:  75%|███████▌  | 11264/15001 [7:13:07<2:03:12,  1.98s/it, loss=0.142, lr=1e-5]Steps:  75%|███████▌  | 11265/15001 [7:13:08<2:03:47,  1.99s/it, loss=0.142, lr=1e-5]Steps:  75%|███████▌  | 11265/15001 [7:13:09<2:03:47,  1.99s/it, loss=0.0554, lr=1e-5]Steps:  75%|███████▌  | 11266/15001 [7:13:10<2:03:15,  1.98s/it, loss=0.0554, lr=1e-5]Steps:  75%|███████▌  | 11266/15001 [7:13:10<2:03:15,  1.98s/it, loss=0.229, lr=1e-5] Steps:  75%|███████▌  | 11267/15001 [7:13:12<1:58:55,  1.91s/it, loss=0.229, lr=1e-5]Steps:  75%|███████▌  | 11267/15001 [7:13:12<1:58:55,  1.91s/it, loss=0.105, lr=1e-5]Steps:  75%|███████▌  | 11268/15001 [7:13:14<1:56:02,  1.87s/it, loss=0.105, lr=1e-5]Steps:  75%|███████▌  | 11268/15001 [7:13:14<1:56:02,  1.87s/it, loss=0.216, lr=1e-5]Steps:  75%|███████▌  | 11269/15001 [7:13:15<1:50:38,  1.78s/it, loss=0.216, lr=1e-5]Steps:  75%|███████▌  | 11269/15001 [7:13:16<1:50:38,  1.78s/it, loss=0.0907, lr=1e-5]Steps:  75%|███████▌  | 11270/15001 [7:13:18<1:57:43,  1.89s/it, loss=0.0907, lr=1e-5]Steps:  75%|███████▌  | 11270/15001 [7:13:18<1:57:43,  1.89s/it, loss=0.285, lr=1e-5] Steps:  75%|███████▌  | 11271/15001 [7:13:19<1:52:50,  1.82s/it, loss=0.285, lr=1e-5]Steps:  75%|███████▌  | 11271/15001 [7:13:20<1:52:50,  1.82s/it, loss=0.14, lr=1e-5] Steps:  75%|███████▌  | 11272/15001 [7:13:21<1:53:02,  1.82s/it, loss=0.14, lr=1e-5]Steps:  75%|███████▌  | 11272/15001 [7:13:22<1:53:02,  1.82s/it, loss=0.0526, lr=1e-5]Steps:  75%|███████▌  | 11273/15001 [7:13:24<2:10:34,  2.10s/it, loss=0.0526, lr=1e-5]Steps:  75%|███████▌  | 11273/15001 [7:13:24<2:10:34,  2.10s/it, loss=0.358, lr=1e-5] Steps:  75%|███████▌  | 11274/15001 [7:13:25<2:02:46,  1.98s/it, loss=0.358, lr=1e-5]Steps:  75%|███████▌  | 11274/15001 [7:13:26<2:02:46,  1.98s/it, loss=0.0646, lr=1e-5]Steps:  75%|███████▌  | 11275/15001 [7:13:27<2:02:10,  1.97s/it, loss=0.0646, lr=1e-5]Steps:  75%|███████▌  | 11275/15001 [7:13:28<2:02:10,  1.97s/it, loss=0.134, lr=1e-5] Steps:  75%|███████▌  | 11276/15001 [7:13:29<2:03:28,  1.99s/it, loss=0.134, lr=1e-5]Steps:  75%|███████▌  | 11276/15001 [7:13:30<2:03:28,  1.99s/it, loss=0.0721, lr=1e-5]Steps:  75%|███████▌  | 11277/15001 [7:13:31<2:01:47,  1.96s/it, loss=0.0721, lr=1e-5]Steps:  75%|███████▌  | 11277/15001 [7:13:31<2:01:47,  1.96s/it, loss=0.111, lr=1e-5] Steps:  75%|███████▌  | 11278/15001 [7:13:33<1:57:59,  1.90s/it, loss=0.111, lr=1e-5]Steps:  75%|███████▌  | 11278/15001 [7:13:33<1:57:59,  1.90s/it, loss=0.075, lr=1e-5]Steps:  75%|███████▌  | 11279/15001 [7:13:35<1:52:33,  1.81s/it, loss=0.075, lr=1e-5]Steps:  75%|███████▌  | 11279/15001 [7:13:35<1:52:33,  1.81s/it, loss=0.117, lr=1e-5]Steps:  75%|███████▌  | 11280/15001 [7:13:37<1:55:15,  1.86s/it, loss=0.117, lr=1e-5]Steps:  75%|███████▌  | 11280/15001 [7:13:37<1:55:15,  1.86s/it, loss=0.265, lr=1e-5]Steps:  75%|███████▌  | 11281/15001 [7:13:39<1:54:38,  1.85s/it, loss=0.265, lr=1e-5]Steps:  75%|███████▌  | 11281/15001 [7:13:39<1:54:38,  1.85s/it, loss=0.117, lr=1e-5]Steps:  75%|███████▌  | 11282/15001 [7:13:40<1:55:52,  1.87s/it, loss=0.117, lr=1e-5]Steps:  75%|███████▌  | 11282/15001 [7:13:40<1:55:52,  1.87s/it, loss=0.139, lr=1e-5]Steps:  75%|███████▌  | 11283/15001 [7:13:42<1:57:24,  1.89s/it, loss=0.139, lr=1e-5]Steps:  75%|███████▌  | 11283/15001 [7:13:43<1:57:24,  1.89s/it, loss=0.0462, lr=1e-5]Steps:  75%|███████▌  | 11284/15001 [7:13:44<1:59:48,  1.93s/it, loss=0.0462, lr=1e-5]Steps:  75%|███████▌  | 11284/15001 [7:13:45<1:59:48,  1.93s/it, loss=0.194, lr=1e-5] Steps:  75%|███████▌  | 11285/15001 [7:13:46<1:59:15,  1.93s/it, loss=0.194, lr=1e-5]Steps:  75%|███████▌  | 11285/15001 [7:13:47<1:59:15,  1.93s/it, loss=0.16, lr=1e-5] Steps:  75%|███████▌  | 11286/15001 [7:13:48<2:01:05,  1.96s/it, loss=0.16, lr=1e-5]Steps:  75%|███████▌  | 11286/15001 [7:13:49<2:01:05,  1.96s/it, loss=0.238, lr=1e-5]Steps:  75%|███████▌  | 11287/15001 [7:13:50<2:00:14,  1.94s/it, loss=0.238, lr=1e-5]Steps:  75%|███████▌  | 11287/15001 [7:13:51<2:00:14,  1.94s/it, loss=0.195, lr=1e-5]Steps:  75%|███████▌  | 11288/15001 [7:13:52<2:02:00,  1.97s/it, loss=0.195, lr=1e-5]Steps:  75%|███████▌  | 11288/15001 [7:13:52<2:02:00,  1.97s/it, loss=0.202, lr=1e-5]Steps:  75%|███████▌  | 11289/15001 [7:13:54<1:54:17,  1.85s/it, loss=0.202, lr=1e-5]Steps:  75%|███████▌  | 11289/15001 [7:13:54<1:54:17,  1.85s/it, loss=0.206, lr=1e-5]Steps:  75%|███████▌  | 11290/15001 [7:13:56<1:54:36,  1.85s/it, loss=0.206, lr=1e-5]Steps:  75%|███████▌  | 11290/15001 [7:13:56<1:54:36,  1.85s/it, loss=0.0293, lr=1e-5]Steps:  75%|███████▌  | 11291/15001 [7:13:58<1:55:20,  1.87s/it, loss=0.0293, lr=1e-5]Steps:  75%|███████▌  | 11291/15001 [7:13:58<1:55:20,  1.87s/it, loss=0.251, lr=1e-5] Steps:  75%|███████▌  | 11292/15001 [7:13:59<1:53:32,  1.84s/it, loss=0.251, lr=1e-5]Steps:  75%|███████▌  | 11292/15001 [7:14:00<1:53:32,  1.84s/it, loss=0.225, lr=1e-5]Steps:  75%|███████▌  | 11293/15001 [7:14:01<1:54:29,  1.85s/it, loss=0.225, lr=1e-5]Steps:  75%|███████▌  | 11293/15001 [7:14:01<1:54:29,  1.85s/it, loss=0.134, lr=1e-5]Steps:  75%|███████▌  | 11294/15001 [7:14:03<1:53:04,  1.83s/it, loss=0.134, lr=1e-5]Steps:  75%|███████▌  | 11294/15001 [7:14:03<1:53:04,  1.83s/it, loss=0.175, lr=1e-5]Steps:  75%|███████▌  | 11295/15001 [7:14:05<1:53:18,  1.83s/it, loss=0.175, lr=1e-5]Steps:  75%|███████▌  | 11295/15001 [7:14:05<1:53:18,  1.83s/it, loss=0.11, lr=1e-5] Steps:  75%|███████▌  | 11296/15001 [7:14:07<1:49:32,  1.77s/it, loss=0.11, lr=1e-5]Steps:  75%|███████▌  | 11296/15001 [7:14:07<1:49:32,  1.77s/it, loss=0.129, lr=1e-5]Steps:  75%|███████▌  | 11297/15001 [7:14:09<1:54:35,  1.86s/it, loss=0.129, lr=1e-5]Steps:  75%|███████▌  | 11297/15001 [7:14:09<1:54:35,  1.86s/it, loss=0.266, lr=1e-5]Steps:  75%|███████▌  | 11298/15001 [7:14:11<2:13:09,  2.16s/it, loss=0.266, lr=1e-5]Steps:  75%|███████▌  | 11298/15001 [7:14:11<2:13:09,  2.16s/it, loss=0.0287, lr=1e-5]Steps:  75%|███████▌  | 11299/15001 [7:14:13<2:01:29,  1.97s/it, loss=0.0287, lr=1e-5]Steps:  75%|███████▌  | 11299/15001 [7:14:13<2:01:29,  1.97s/it, loss=0.152, lr=1e-5] Steps:  75%|███████▌  | 11300/15001 [7:14:15<1:57:43,  1.91s/it, loss=0.152, lr=1e-5]Steps:  75%|███████▌  | 11300/15001 [7:14:15<1:57:43,  1.91s/it, loss=0.055, lr=1e-5]Steps:  75%|███████▌  | 11301/15001 [7:14:17<1:57:53,  1.91s/it, loss=0.055, lr=1e-5]Steps:  75%|███████▌  | 11301/15001 [7:14:17<1:57:53,  1.91s/it, loss=0.17, lr=1e-5] Steps:  75%|███████▌  | 11302/15001 [7:14:18<1:52:14,  1.82s/it, loss=0.17, lr=1e-5]Steps:  75%|███████▌  | 11302/15001 [7:14:19<1:52:14,  1.82s/it, loss=0.0163, lr=1e-5]Steps:  75%|███████▌  | 11303/15001 [7:14:20<1:51:07,  1.80s/it, loss=0.0163, lr=1e-5]Steps:  75%|███████▌  | 11303/15001 [7:14:20<1:51:07,  1.80s/it, loss=0.179, lr=1e-5] Steps:  75%|███████▌  | 11304/15001 [7:14:22<1:53:22,  1.84s/it, loss=0.179, lr=1e-5]Steps:  75%|███████▌  | 11304/15001 [7:14:22<1:53:22,  1.84s/it, loss=0.285, lr=1e-5]Steps:  75%|███████▌  | 11305/15001 [7:14:24<1:57:55,  1.91s/it, loss=0.285, lr=1e-5]Steps:  75%|███████▌  | 11305/15001 [7:14:24<1:57:55,  1.91s/it, loss=0.183, lr=1e-5]Steps:  75%|███████▌  | 11306/15001 [7:14:26<1:57:20,  1.91s/it, loss=0.183, lr=1e-5]Steps:  75%|███████▌  | 11306/15001 [7:14:26<1:57:20,  1.91s/it, loss=0.0609, lr=1e-5]Steps:  75%|███████▌  | 11307/15001 [7:14:28<1:53:35,  1.85s/it, loss=0.0609, lr=1e-5]Steps:  75%|███████▌  | 11307/15001 [7:14:28<1:53:35,  1.85s/it, loss=0.265, lr=1e-5] Steps:  75%|███████▌  | 11308/15001 [7:14:30<2:03:51,  2.01s/it, loss=0.265, lr=1e-5]Steps:  75%|███████▌  | 11308/15001 [7:14:30<2:03:51,  2.01s/it, loss=0.276, lr=1e-5]Steps:  75%|███████▌  | 11309/15001 [7:14:32<2:01:13,  1.97s/it, loss=0.276, lr=1e-5]Steps:  75%|███████▌  | 11309/15001 [7:14:32<2:01:13,  1.97s/it, loss=0.268, lr=1e-5]Steps:  75%|███████▌  | 11310/15001 [7:14:34<2:03:55,  2.01s/it, loss=0.268, lr=1e-5]Steps:  75%|███████▌  | 11310/15001 [7:14:34<2:03:55,  2.01s/it, loss=0.155, lr=1e-5]Steps:  75%|███████▌  | 11311/15001 [7:14:36<1:57:44,  1.91s/it, loss=0.155, lr=1e-5]Steps:  75%|███████▌  | 11311/15001 [7:14:36<1:57:44,  1.91s/it, loss=0.23, lr=1e-5] Steps:  75%|███████▌  | 11312/15001 [7:14:38<1:59:18,  1.94s/it, loss=0.23, lr=1e-5]Steps:  75%|███████▌  | 11312/15001 [7:14:38<1:59:18,  1.94s/it, loss=0.173, lr=1e-5]Steps:  75%|███████▌  | 11313/15001 [7:14:39<1:55:45,  1.88s/it, loss=0.173, lr=1e-5]Steps:  75%|███████▌  | 11313/15001 [7:14:40<1:55:45,  1.88s/it, loss=0.25, lr=1e-5] Steps:  75%|███████▌  | 11314/15001 [7:14:41<1:50:48,  1.80s/it, loss=0.25, lr=1e-5]Steps:  75%|███████▌  | 11314/15001 [7:14:41<1:50:48,  1.80s/it, loss=0.201, lr=1e-5]Steps:  75%|███████▌  | 11315/15001 [7:14:43<1:53:46,  1.85s/it, loss=0.201, lr=1e-5]Steps:  75%|███████▌  | 11315/15001 [7:14:43<1:53:46,  1.85s/it, loss=0.178, lr=1e-5]Steps:  75%|███████▌  | 11316/15001 [7:14:45<1:56:03,  1.89s/it, loss=0.178, lr=1e-5]Steps:  75%|███████▌  | 11316/15001 [7:14:45<1:56:03,  1.89s/it, loss=0.0391, lr=1e-5]Steps:  75%|███████▌  | 11317/15001 [7:14:47<1:57:53,  1.92s/it, loss=0.0391, lr=1e-5]Steps:  75%|███████▌  | 11317/15001 [7:14:47<1:57:53,  1.92s/it, loss=0.0933, lr=1e-5]Steps:  75%|███████▌  | 11318/15001 [7:14:49<1:56:34,  1.90s/it, loss=0.0933, lr=1e-5]Steps:  75%|███████▌  | 11318/15001 [7:14:49<1:56:34,  1.90s/it, loss=0.216, lr=1e-5] Steps:  75%|███████▌  | 11319/15001 [7:14:51<1:54:37,  1.87s/it, loss=0.216, lr=1e-5]Steps:  75%|███████▌  | 11319/15001 [7:14:51<1:54:37,  1.87s/it, loss=0.354, lr=1e-5]Steps:  75%|███████▌  | 11320/15001 [7:14:52<1:52:48,  1.84s/it, loss=0.354, lr=1e-5]Steps:  75%|███████▌  | 11320/15001 [7:14:53<1:52:48,  1.84s/it, loss=0.141, lr=1e-5]Steps:  75%|███████▌  | 11321/15001 [7:14:54<1:52:03,  1.83s/it, loss=0.141, lr=1e-5]Steps:  75%|███████▌  | 11321/15001 [7:14:54<1:52:03,  1.83s/it, loss=0.0985, lr=1e-5]Steps:  75%|███████▌  | 11322/15001 [7:14:56<1:45:11,  1.72s/it, loss=0.0985, lr=1e-5]Steps:  75%|███████▌  | 11322/15001 [7:14:56<1:45:11,  1.72s/it, loss=0.257, lr=1e-5] Steps:  75%|███████▌  | 11323/15001 [7:14:58<1:49:10,  1.78s/it, loss=0.257, lr=1e-5]Steps:  75%|███████▌  | 11323/15001 [7:14:58<1:49:10,  1.78s/it, loss=0.165, lr=1e-5]Steps:  75%|███████▌  | 11324/15001 [7:14:59<1:47:56,  1.76s/it, loss=0.165, lr=1e-5]Steps:  75%|███████▌  | 11324/15001 [7:15:00<1:47:56,  1.76s/it, loss=0.0866, lr=1e-5]Steps:  75%|███████▌  | 11325/15001 [7:15:01<1:52:45,  1.84s/it, loss=0.0866, lr=1e-5]Steps:  75%|███████▌  | 11325/15001 [7:15:02<1:52:45,  1.84s/it, loss=0.181, lr=1e-5] Steps:  76%|███████▌  | 11326/15001 [7:15:03<1:51:51,  1.83s/it, loss=0.181, lr=1e-5]Steps:  76%|███████▌  | 11326/15001 [7:15:03<1:51:51,  1.83s/it, loss=0.0671, lr=1e-5]Steps:  76%|███████▌  | 11327/15001 [7:15:05<1:53:18,  1.85s/it, loss=0.0671, lr=1e-5]Steps:  76%|███████▌  | 11327/15001 [7:15:05<1:53:18,  1.85s/it, loss=0.151, lr=1e-5] Steps:  76%|███████▌  | 11328/15001 [7:15:07<1:55:48,  1.89s/it, loss=0.151, lr=1e-5]Steps:  76%|███████▌  | 11328/15001 [7:15:07<1:55:48,  1.89s/it, loss=0.309, lr=1e-5]Steps:  76%|███████▌  | 11329/15001 [7:15:09<1:54:51,  1.88s/it, loss=0.309, lr=1e-5]Steps:  76%|███████▌  | 11329/15001 [7:15:09<1:54:51,  1.88s/it, loss=0.13, lr=1e-5] Steps:  76%|███████▌  | 11330/15001 [7:15:11<1:53:01,  1.85s/it, loss=0.13, lr=1e-5]Steps:  76%|███████▌  | 11330/15001 [7:15:11<1:53:01,  1.85s/it, loss=0.0717, lr=1e-5]Steps:  76%|███████▌  | 11331/15001 [7:15:13<2:01:52,  1.99s/it, loss=0.0717, lr=1e-5]Steps:  76%|███████▌  | 11331/15001 [7:15:13<2:01:52,  1.99s/it, loss=0.0948, lr=1e-5]Steps:  76%|███████▌  | 11332/15001 [7:15:15<1:58:54,  1.94s/it, loss=0.0948, lr=1e-5]Steps:  76%|███████▌  | 11332/15001 [7:15:15<1:58:54,  1.94s/it, loss=0.163, lr=1e-5] Steps:  76%|███████▌  | 11333/15001 [7:15:17<2:01:23,  1.99s/it, loss=0.163, lr=1e-5]Steps:  76%|███████▌  | 11333/15001 [7:15:17<2:01:23,  1.99s/it, loss=0.151, lr=1e-5]Steps:  76%|███████▌  | 11334/15001 [7:15:19<2:01:55,  1.99s/it, loss=0.151, lr=1e-5]Steps:  76%|███████▌  | 11334/15001 [7:15:19<2:01:55,  1.99s/it, loss=0.168, lr=1e-5]Steps:  76%|███████▌  | 11335/15001 [7:15:21<1:54:55,  1.88s/it, loss=0.168, lr=1e-5]Steps:  76%|███████▌  | 11335/15001 [7:15:21<1:54:55,  1.88s/it, loss=0.248, lr=1e-5]Steps:  76%|███████▌  | 11336/15001 [7:15:22<1:53:33,  1.86s/it, loss=0.248, lr=1e-5]Steps:  76%|███████▌  | 11336/15001 [7:15:23<1:53:33,  1.86s/it, loss=0.162, lr=1e-5]Steps:  76%|███████▌  | 11337/15001 [7:15:24<1:58:09,  1.93s/it, loss=0.162, lr=1e-5]Steps:  76%|███████▌  | 11337/15001 [7:15:25<1:58:09,  1.93s/it, loss=0.064, lr=1e-5]Steps:  76%|███████▌  | 11338/15001 [7:15:26<1:53:22,  1.86s/it, loss=0.064, lr=1e-5]Steps:  76%|███████▌  | 11338/15001 [7:15:26<1:53:22,  1.86s/it, loss=0.206, lr=1e-5]Steps:  76%|███████▌  | 11339/15001 [7:15:28<1:54:30,  1.88s/it, loss=0.206, lr=1e-5]Steps:  76%|███████▌  | 11339/15001 [7:15:28<1:54:30,  1.88s/it, loss=0.218, lr=1e-5]Steps:  76%|███████▌  | 11340/15001 [7:15:30<1:54:11,  1.87s/it, loss=0.218, lr=1e-5]Steps:  76%|███████▌  | 11340/15001 [7:15:30<1:54:11,  1.87s/it, loss=0.113, lr=1e-5]Steps:  76%|███████▌  | 11341/15001 [7:15:31<1:47:29,  1.76s/it, loss=0.113, lr=1e-5]Steps:  76%|███████▌  | 11341/15001 [7:15:32<1:47:29,  1.76s/it, loss=0.181, lr=1e-5]Steps:  76%|███████▌  | 11342/15001 [7:15:33<1:47:16,  1.76s/it, loss=0.181, lr=1e-5]Steps:  76%|███████▌  | 11342/15001 [7:15:34<1:47:16,  1.76s/it, loss=0.0375, lr=1e-5]Steps:  76%|███████▌  | 11343/15001 [7:15:35<1:55:04,  1.89s/it, loss=0.0375, lr=1e-5]Steps:  76%|███████▌  | 11343/15001 [7:15:36<1:55:04,  1.89s/it, loss=0.172, lr=1e-5] Steps:  76%|███████▌  | 11344/15001 [7:15:37<1:52:46,  1.85s/it, loss=0.172, lr=1e-5]Steps:  76%|███████▌  | 11344/15001 [7:15:37<1:52:46,  1.85s/it, loss=0.141, lr=1e-5]Steps:  76%|███████▌  | 11345/15001 [7:15:39<1:55:42,  1.90s/it, loss=0.141, lr=1e-5]Steps:  76%|███████▌  | 11345/15001 [7:15:39<1:55:42,  1.90s/it, loss=0.115, lr=1e-5]Steps:  76%|███████▌  | 11346/15001 [7:15:41<1:53:24,  1.86s/it, loss=0.115, lr=1e-5]Steps:  76%|███████▌  | 11346/15001 [7:15:41<1:53:24,  1.86s/it, loss=0.384, lr=1e-5]Steps:  76%|███████▌  | 11347/15001 [7:15:42<1:48:02,  1.77s/it, loss=0.384, lr=1e-5]Steps:  76%|███████▌  | 11347/15001 [7:15:43<1:48:02,  1.77s/it, loss=0.0409, lr=1e-5]Steps:  76%|███████▌  | 11348/15001 [7:15:44<1:52:00,  1.84s/it, loss=0.0409, lr=1e-5]Steps:  76%|███████▌  | 11348/15001 [7:15:45<1:52:00,  1.84s/it, loss=0.271, lr=1e-5] Steps:  76%|███████▌  | 11349/15001 [7:15:46<1:46:58,  1.76s/it, loss=0.271, lr=1e-5]Steps:  76%|███████▌  | 11349/15001 [7:15:46<1:46:58,  1.76s/it, loss=0.0493, lr=1e-5]Steps:  76%|███████▌  | 11350/15001 [7:15:48<1:51:23,  1.83s/it, loss=0.0493, lr=1e-5]Steps:  76%|███████▌  | 11350/15001 [7:15:48<1:51:23,  1.83s/it, loss=0.0878, lr=1e-5]Steps:  76%|███████▌  | 11351/15001 [7:15:50<1:49:02,  1.79s/it, loss=0.0878, lr=1e-5]Steps:  76%|███████▌  | 11351/15001 [7:15:50<1:49:02,  1.79s/it, loss=0.0413, lr=1e-5]Steps:  76%|███████▌  | 11352/15001 [7:15:52<1:56:55,  1.92s/it, loss=0.0413, lr=1e-5]Steps:  76%|███████▌  | 11352/15001 [7:15:52<1:56:55,  1.92s/it, loss=0.219, lr=1e-5] Steps:  76%|███████▌  | 11353/15001 [7:15:54<1:57:59,  1.94s/it, loss=0.219, lr=1e-5]Steps:  76%|███████▌  | 11353/15001 [7:15:54<1:57:59,  1.94s/it, loss=0.0594, lr=1e-5]Steps:  76%|███████▌  | 11354/15001 [7:15:56<1:57:46,  1.94s/it, loss=0.0594, lr=1e-5]Steps:  76%|███████▌  | 11354/15001 [7:15:56<1:57:46,  1.94s/it, loss=0.192, lr=1e-5] Steps:  76%|███████▌  | 11355/15001 [7:15:58<1:56:36,  1.92s/it, loss=0.192, lr=1e-5]Steps:  76%|███████▌  | 11355/15001 [7:15:58<1:56:36,  1.92s/it, loss=0.233, lr=1e-5]Steps:  76%|███████▌  | 11356/15001 [7:16:00<2:00:47,  1.99s/it, loss=0.233, lr=1e-5]Steps:  76%|███████▌  | 11356/15001 [7:16:00<2:00:47,  1.99s/it, loss=0.117, lr=1e-5]Steps:  76%|███████▌  | 11357/15001 [7:16:02<1:58:30,  1.95s/it, loss=0.117, lr=1e-5]Steps:  76%|███████▌  | 11357/15001 [7:16:02<1:58:30,  1.95s/it, loss=0.152, lr=1e-5]Steps:  76%|███████▌  | 11358/15001 [7:16:03<1:53:06,  1.86s/it, loss=0.152, lr=1e-5]Steps:  76%|███████▌  | 11358/15001 [7:16:04<1:53:06,  1.86s/it, loss=0.196, lr=1e-5]Steps:  76%|███████▌  | 11359/15001 [7:16:05<1:53:54,  1.88s/it, loss=0.196, lr=1e-5]Steps:  76%|███████▌  | 11359/15001 [7:16:06<1:53:54,  1.88s/it, loss=0.121, lr=1e-5]Steps:  76%|███████▌  | 11360/15001 [7:16:07<1:51:19,  1.83s/it, loss=0.121, lr=1e-5]Steps:  76%|███████▌  | 11360/15001 [7:16:07<1:51:19,  1.83s/it, loss=0.18, lr=1e-5] Steps:  76%|███████▌  | 11361/15001 [7:16:09<1:54:15,  1.88s/it, loss=0.18, lr=1e-5]Steps:  76%|███████▌  | 11361/15001 [7:16:09<1:54:15,  1.88s/it, loss=0.299, lr=1e-5]Steps:  76%|███████▌  | 11362/15001 [7:16:11<1:53:11,  1.87s/it, loss=0.299, lr=1e-5]Steps:  76%|███████▌  | 11362/15001 [7:16:11<1:53:11,  1.87s/it, loss=0.182, lr=1e-5]Steps:  76%|███████▌  | 11363/15001 [7:16:13<1:48:46,  1.79s/it, loss=0.182, lr=1e-5]Steps:  76%|███████▌  | 11363/15001 [7:16:13<1:48:46,  1.79s/it, loss=0.0705, lr=1e-5]Steps:  76%|███████▌  | 11364/15001 [7:16:14<1:50:43,  1.83s/it, loss=0.0705, lr=1e-5]Steps:  76%|███████▌  | 11364/15001 [7:16:15<1:50:43,  1.83s/it, loss=0.273, lr=1e-5] Steps:  76%|███████▌  | 11365/15001 [7:16:16<1:48:57,  1.80s/it, loss=0.273, lr=1e-5]Steps:  76%|███████▌  | 11365/15001 [7:16:16<1:48:57,  1.80s/it, loss=0.213, lr=1e-5]Steps:  76%|███████▌  | 11366/15001 [7:16:18<1:50:41,  1.83s/it, loss=0.213, lr=1e-5]Steps:  76%|███████▌  | 11366/15001 [7:16:18<1:50:41,  1.83s/it, loss=0.0934, lr=1e-5]Steps:  76%|███████▌  | 11367/15001 [7:16:20<1:47:05,  1.77s/it, loss=0.0934, lr=1e-5]Steps:  76%|███████▌  | 11367/15001 [7:16:20<1:47:05,  1.77s/it, loss=0.44, lr=1e-5]  Steps:  76%|███████▌  | 11368/15001 [7:16:21<1:45:00,  1.73s/it, loss=0.44, lr=1e-5]Steps:  76%|███████▌  | 11368/15001 [7:16:22<1:45:00,  1.73s/it, loss=0.31, lr=1e-5]Steps:  76%|███████▌  | 11369/15001 [7:16:23<1:50:02,  1.82s/it, loss=0.31, lr=1e-5]Steps:  76%|███████▌  | 11369/15001 [7:16:24<1:50:02,  1.82s/it, loss=0.0652, lr=1e-5]Steps:  76%|███████▌  | 11370/15001 [7:16:25<1:51:24,  1.84s/it, loss=0.0652, lr=1e-5]Steps:  76%|███████▌  | 11370/15001 [7:16:25<1:51:24,  1.84s/it, loss=0.133, lr=1e-5] Steps:  76%|███████▌  | 11371/15001 [7:16:27<1:45:45,  1.75s/it, loss=0.133, lr=1e-5]Steps:  76%|███████▌  | 11371/15001 [7:16:27<1:45:45,  1.75s/it, loss=0.236, lr=1e-5]Steps:  76%|███████▌  | 11372/15001 [7:16:29<1:50:29,  1.83s/it, loss=0.236, lr=1e-5]Steps:  76%|███████▌  | 11372/15001 [7:16:29<1:50:29,  1.83s/it, loss=0.0864, lr=1e-5]Steps:  76%|███████▌  | 11373/15001 [7:16:31<1:51:17,  1.84s/it, loss=0.0864, lr=1e-5]Steps:  76%|███████▌  | 11373/15001 [7:16:31<1:51:17,  1.84s/it, loss=0.0577, lr=1e-5]Steps:  76%|███████▌  | 11374/15001 [7:16:33<1:54:26,  1.89s/it, loss=0.0577, lr=1e-5]Steps:  76%|███████▌  | 11374/15001 [7:16:33<1:54:26,  1.89s/it, loss=0.324, lr=1e-5] Steps:  76%|███████▌  | 11375/15001 [7:16:35<1:55:19,  1.91s/it, loss=0.324, lr=1e-5]Steps:  76%|███████▌  | 11375/15001 [7:16:35<1:55:19,  1.91s/it, loss=0.2, lr=1e-5]  Steps:  76%|███████▌  | 11376/15001 [7:16:37<1:57:53,  1.95s/it, loss=0.2, lr=1e-5]Steps:  76%|███████▌  | 11376/15001 [7:16:37<1:57:53,  1.95s/it, loss=0.0999, lr=1e-5]Steps:  76%|███████▌  | 11377/15001 [7:16:39<1:57:52,  1.95s/it, loss=0.0999, lr=1e-5]Steps:  76%|███████▌  | 11377/15001 [7:16:39<1:57:52,  1.95s/it, loss=0.0363, lr=1e-5]Steps:  76%|███████▌  | 11378/15001 [7:16:40<1:55:04,  1.91s/it, loss=0.0363, lr=1e-5]Steps:  76%|███████▌  | 11378/15001 [7:16:41<1:55:04,  1.91s/it, loss=0.0914, lr=1e-5]Steps:  76%|███████▌  | 11379/15001 [7:16:43<1:58:06,  1.96s/it, loss=0.0914, lr=1e-5]Steps:  76%|███████▌  | 11379/15001 [7:16:43<1:58:06,  1.96s/it, loss=0.0347, lr=1e-5]Steps:  76%|███████▌  | 11380/15001 [7:16:44<1:53:05,  1.87s/it, loss=0.0347, lr=1e-5]Steps:  76%|███████▌  | 11380/15001 [7:16:44<1:53:05,  1.87s/it, loss=0.112, lr=1e-5] Steps:  76%|███████▌  | 11381/15001 [7:16:46<1:54:46,  1.90s/it, loss=0.112, lr=1e-5]Steps:  76%|███████▌  | 11381/15001 [7:16:46<1:54:46,  1.90s/it, loss=0.367, lr=1e-5]Steps:  76%|███████▌  | 11382/15001 [7:16:48<1:50:48,  1.84s/it, loss=0.367, lr=1e-5]Steps:  76%|███████▌  | 11382/15001 [7:16:48<1:50:48,  1.84s/it, loss=0.027, lr=1e-5]Steps:  76%|███████▌  | 11383/15001 [7:16:50<1:52:41,  1.87s/it, loss=0.027, lr=1e-5]Steps:  76%|███████▌  | 11383/15001 [7:16:50<1:52:41,  1.87s/it, loss=0.146, lr=1e-5]Steps:  76%|███████▌  | 11384/15001 [7:16:52<1:50:23,  1.83s/it, loss=0.146, lr=1e-5]Steps:  76%|███████▌  | 11384/15001 [7:16:52<1:50:23,  1.83s/it, loss=0.536, lr=1e-5]Steps:  76%|███████▌  | 11385/15001 [7:16:53<1:51:54,  1.86s/it, loss=0.536, lr=1e-5]Steps:  76%|███████▌  | 11385/15001 [7:16:54<1:51:54,  1.86s/it, loss=0.176, lr=1e-5]Steps:  76%|███████▌  | 11386/15001 [7:16:55<1:48:44,  1.80s/it, loss=0.176, lr=1e-5]Steps:  76%|███████▌  | 11386/15001 [7:16:55<1:48:44,  1.80s/it, loss=0.241, lr=1e-5]Steps:  76%|███████▌  | 11387/15001 [7:16:57<1:48:19,  1.80s/it, loss=0.241, lr=1e-5]Steps:  76%|███████▌  | 11387/15001 [7:16:57<1:48:19,  1.80s/it, loss=0.221, lr=1e-5]Steps:  76%|███████▌  | 11388/15001 [7:16:59<1:50:16,  1.83s/it, loss=0.221, lr=1e-5]Steps:  76%|███████▌  | 11388/15001 [7:16:59<1:50:16,  1.83s/it, loss=0.183, lr=1e-5]Steps:  76%|███████▌  | 11389/15001 [7:17:01<1:49:04,  1.81s/it, loss=0.183, lr=1e-5]Steps:  76%|███████▌  | 11389/15001 [7:17:01<1:49:04,  1.81s/it, loss=0.0357, lr=1e-5]Steps:  76%|███████▌  | 11390/15001 [7:17:03<1:51:03,  1.85s/it, loss=0.0357, lr=1e-5]Steps:  76%|███████▌  | 11390/15001 [7:17:03<1:51:03,  1.85s/it, loss=0.207, lr=1e-5] Steps:  76%|███████▌  | 11391/15001 [7:17:04<1:46:21,  1.77s/it, loss=0.207, lr=1e-5]Steps:  76%|███████▌  | 11391/15001 [7:17:04<1:46:21,  1.77s/it, loss=0.0634, lr=1e-5]Steps:  76%|███████▌  | 11392/15001 [7:17:06<1:51:26,  1.85s/it, loss=0.0634, lr=1e-5]Steps:  76%|███████▌  | 11392/15001 [7:17:06<1:51:26,  1.85s/it, loss=0.0363, lr=1e-5]Steps:  76%|███████▌  | 11393/15001 [7:17:08<1:48:38,  1.81s/it, loss=0.0363, lr=1e-5]Steps:  76%|███████▌  | 11393/15001 [7:17:08<1:48:38,  1.81s/it, loss=0.0718, lr=1e-5]Steps:  76%|███████▌  | 11394/15001 [7:17:10<1:47:22,  1.79s/it, loss=0.0718, lr=1e-5]Steps:  76%|███████▌  | 11394/15001 [7:17:10<1:47:22,  1.79s/it, loss=0.314, lr=1e-5] Steps:  76%|███████▌  | 11395/15001 [7:17:11<1:44:39,  1.74s/it, loss=0.314, lr=1e-5]Steps:  76%|███████▌  | 11395/15001 [7:17:12<1:44:39,  1.74s/it, loss=0.204, lr=1e-5]Steps:  76%|███████▌  | 11396/15001 [7:17:13<1:47:28,  1.79s/it, loss=0.204, lr=1e-5]Steps:  76%|███████▌  | 11396/15001 [7:17:13<1:47:28,  1.79s/it, loss=0.282, lr=1e-5]Steps:  76%|███████▌  | 11397/15001 [7:17:15<1:51:11,  1.85s/it, loss=0.282, lr=1e-5]Steps:  76%|███████▌  | 11397/15001 [7:17:15<1:51:11,  1.85s/it, loss=0.0886, lr=1e-5]Steps:  76%|███████▌  | 11398/15001 [7:17:17<1:52:07,  1.87s/it, loss=0.0886, lr=1e-5]Steps:  76%|███████▌  | 11398/15001 [7:17:17<1:52:07,  1.87s/it, loss=0.351, lr=1e-5] Steps:  76%|███████▌  | 11399/15001 [7:17:19<1:49:30,  1.82s/it, loss=0.351, lr=1e-5]Steps:  76%|███████▌  | 11399/15001 [7:17:19<1:49:30,  1.82s/it, loss=0.127, lr=1e-5]Steps:  76%|███████▌  | 11400/15001 [7:17:21<1:58:45,  1.98s/it, loss=0.127, lr=1e-5]Steps:  76%|███████▌  | 11400/15001 [7:17:21<1:58:45,  1.98s/it, loss=0.0239, lr=1e-5]Steps:  76%|███████▌  | 11401/15001 [7:17:23<1:55:37,  1.93s/it, loss=0.0239, lr=1e-5]Steps:  76%|███████▌  | 11401/15001 [7:17:23<1:55:37,  1.93s/it, loss=0.0202, lr=1e-5]Steps:  76%|███████▌  | 11402/15001 [7:17:25<2:01:00,  2.02s/it, loss=0.0202, lr=1e-5]Steps:  76%|███████▌  | 11402/15001 [7:17:25<2:01:00,  2.02s/it, loss=0.0886, lr=1e-5]Steps:  76%|███████▌  | 11403/15001 [7:17:27<1:57:41,  1.96s/it, loss=0.0886, lr=1e-5]Steps:  76%|███████▌  | 11403/15001 [7:17:27<1:57:41,  1.96s/it, loss=0.217, lr=1e-5] Steps:  76%|███████▌  | 11404/15001 [7:17:29<1:57:00,  1.95s/it, loss=0.217, lr=1e-5]Steps:  76%|███████▌  | 11404/15001 [7:17:29<1:57:00,  1.95s/it, loss=0.124, lr=1e-5]Steps:  76%|███████▌  | 11405/15001 [7:17:31<1:58:13,  1.97s/it, loss=0.124, lr=1e-5]Steps:  76%|███████▌  | 11405/15001 [7:17:31<1:58:13,  1.97s/it, loss=0.244, lr=1e-5]Steps:  76%|███████▌  | 11406/15001 [7:17:33<1:54:35,  1.91s/it, loss=0.244, lr=1e-5]Steps:  76%|███████▌  | 11406/15001 [7:17:33<1:54:35,  1.91s/it, loss=0.0834, lr=1e-5]Steps:  76%|███████▌  | 11407/15001 [7:17:35<1:54:38,  1.91s/it, loss=0.0834, lr=1e-5]Steps:  76%|███████▌  | 11407/15001 [7:17:35<1:54:38,  1.91s/it, loss=0.113, lr=1e-5] Steps:  76%|███████▌  | 11408/15001 [7:17:36<1:47:14,  1.79s/it, loss=0.113, lr=1e-5]Steps:  76%|███████▌  | 11408/15001 [7:17:36<1:47:14,  1.79s/it, loss=0.273, lr=1e-5]Steps:  76%|███████▌  | 11409/15001 [7:17:38<1:53:13,  1.89s/it, loss=0.273, lr=1e-5]Steps:  76%|███████▌  | 11409/15001 [7:17:38<1:53:13,  1.89s/it, loss=0.152, lr=1e-5]Steps:  76%|███████▌  | 11410/15001 [7:17:40<1:50:30,  1.85s/it, loss=0.152, lr=1e-5]Steps:  76%|███████▌  | 11410/15001 [7:17:40<1:50:30,  1.85s/it, loss=0.118, lr=1e-5]Steps:  76%|███████▌  | 11411/15001 [7:17:42<1:49:10,  1.82s/it, loss=0.118, lr=1e-5]Steps:  76%|███████▌  | 11411/15001 [7:17:42<1:49:10,  1.82s/it, loss=0.345, lr=1e-5]Steps:  76%|███████▌  | 11412/15001 [7:17:44<1:49:59,  1.84s/it, loss=0.345, lr=1e-5]Steps:  76%|███████▌  | 11412/15001 [7:17:44<1:49:59,  1.84s/it, loss=0.109, lr=1e-5]Steps:  76%|███████▌  | 11413/15001 [7:17:45<1:50:06,  1.84s/it, loss=0.109, lr=1e-5]Steps:  76%|███████▌  | 11413/15001 [7:17:45<1:50:06,  1.84s/it, loss=0.157, lr=1e-5]Steps:  76%|███████▌  | 11414/15001 [7:17:47<1:47:26,  1.80s/it, loss=0.157, lr=1e-5]Steps:  76%|███████▌  | 11414/15001 [7:17:47<1:47:26,  1.80s/it, loss=0.132, lr=1e-5]Steps:  76%|███████▌  | 11415/15001 [7:17:49<1:50:16,  1.85s/it, loss=0.132, lr=1e-5]Steps:  76%|███████▌  | 11415/15001 [7:17:49<1:50:16,  1.85s/it, loss=0.27, lr=1e-5] Steps:  76%|███████▌  | 11416/15001 [7:17:51<1:46:30,  1.78s/it, loss=0.27, lr=1e-5]Steps:  76%|███████▌  | 11416/15001 [7:17:51<1:46:30,  1.78s/it, loss=0.18, lr=1e-5]Steps:  76%|███████▌  | 11417/15001 [7:17:52<1:45:54,  1.77s/it, loss=0.18, lr=1e-5]Steps:  76%|███████▌  | 11417/15001 [7:17:53<1:45:54,  1.77s/it, loss=0.0964, lr=1e-5]Steps:  76%|███████▌  | 11418/15001 [7:17:54<1:46:22,  1.78s/it, loss=0.0964, lr=1e-5]Steps:  76%|███████▌  | 11418/15001 [7:17:55<1:46:22,  1.78s/it, loss=0.149, lr=1e-5] Steps:  76%|███████▌  | 11419/15001 [7:17:56<1:47:07,  1.79s/it, loss=0.149, lr=1e-5]Steps:  76%|███████▌  | 11419/15001 [7:17:56<1:47:07,  1.79s/it, loss=0.144, lr=1e-5]Steps:  76%|███████▌  | 11420/15001 [7:17:58<1:50:10,  1.85s/it, loss=0.144, lr=1e-5]Steps:  76%|███████▌  | 11420/15001 [7:17:58<1:50:10,  1.85s/it, loss=0.257, lr=1e-5]Steps:  76%|███████▌  | 11421/15001 [7:18:00<1:50:02,  1.84s/it, loss=0.257, lr=1e-5]Steps:  76%|███████▌  | 11421/15001 [7:18:00<1:50:02,  1.84s/it, loss=0.236, lr=1e-5]Steps:  76%|███████▌  | 11422/15001 [7:18:02<1:54:26,  1.92s/it, loss=0.236, lr=1e-5]Steps:  76%|███████▌  | 11422/15001 [7:18:02<1:54:26,  1.92s/it, loss=0.254, lr=1e-5]Steps:  76%|███████▌  | 11423/15001 [7:18:04<1:51:58,  1.88s/it, loss=0.254, lr=1e-5]Steps:  76%|███████▌  | 11423/15001 [7:18:04<1:51:58,  1.88s/it, loss=0.302, lr=1e-5]Steps:  76%|███████▌  | 11424/15001 [7:18:06<1:59:25,  2.00s/it, loss=0.302, lr=1e-5]Steps:  76%|███████▌  | 11424/15001 [7:18:06<1:59:25,  2.00s/it, loss=0.0701, lr=1e-5]Steps:  76%|███████▌  | 11425/15001 [7:18:08<2:00:59,  2.03s/it, loss=0.0701, lr=1e-5]Steps:  76%|███████▌  | 11425/15001 [7:18:08<2:00:59,  2.03s/it, loss=0.0449, lr=1e-5]Steps:  76%|███████▌  | 11426/15001 [7:18:10<1:58:50,  1.99s/it, loss=0.0449, lr=1e-5]Steps:  76%|███████▌  | 11426/15001 [7:18:10<1:58:50,  1.99s/it, loss=0.053, lr=1e-5] Steps:  76%|███████▌  | 11427/15001 [7:18:12<1:58:25,  1.99s/it, loss=0.053, lr=1e-5]Steps:  76%|███████▌  | 11427/15001 [7:18:12<1:58:25,  1.99s/it, loss=0.174, lr=1e-5]Steps:  76%|███████▌  | 11428/15001 [7:18:14<1:53:57,  1.91s/it, loss=0.174, lr=1e-5]Steps:  76%|███████▌  | 11428/15001 [7:18:14<1:53:57,  1.91s/it, loss=0.176, lr=1e-5]Steps:  76%|███████▌  | 11429/15001 [7:18:15<1:48:12,  1.82s/it, loss=0.176, lr=1e-5]Steps:  76%|███████▌  | 11429/15001 [7:18:16<1:48:12,  1.82s/it, loss=0.105, lr=1e-5]Steps:  76%|███████▌  | 11430/15001 [7:18:17<1:52:05,  1.88s/it, loss=0.105, lr=1e-5]Steps:  76%|███████▌  | 11430/15001 [7:18:18<1:52:05,  1.88s/it, loss=0.0651, lr=1e-5]Steps:  76%|███████▌  | 11431/15001 [7:18:19<1:45:29,  1.77s/it, loss=0.0651, lr=1e-5]Steps:  76%|███████▌  | 11431/15001 [7:18:19<1:45:29,  1.77s/it, loss=0.238, lr=1e-5] Steps:  76%|███████▌  | 11432/15001 [7:18:21<1:51:53,  1.88s/it, loss=0.238, lr=1e-5]Steps:  76%|███████▌  | 11432/15001 [7:18:21<1:51:53,  1.88s/it, loss=0.35, lr=1e-5] Steps:  76%|███████▌  | 11433/15001 [7:18:23<1:45:27,  1.77s/it, loss=0.35, lr=1e-5]Steps:  76%|███████▌  | 11433/15001 [7:18:23<1:45:27,  1.77s/it, loss=0.0574, lr=1e-5]Steps:  76%|███████▌  | 11434/15001 [7:18:24<1:43:24,  1.74s/it, loss=0.0574, lr=1e-5]Steps:  76%|███████▌  | 11434/15001 [7:18:25<1:43:24,  1.74s/it, loss=0.158, lr=1e-5] Steps:  76%|███████▌  | 11435/15001 [7:18:26<1:48:10,  1.82s/it, loss=0.158, lr=1e-5]Steps:  76%|███████▌  | 11435/15001 [7:18:26<1:48:10,  1.82s/it, loss=0.0769, lr=1e-5]Steps:  76%|███████▌  | 11436/15001 [7:18:28<1:45:33,  1.78s/it, loss=0.0769, lr=1e-5]Steps:  76%|███████▌  | 11436/15001 [7:18:28<1:45:33,  1.78s/it, loss=0.0781, lr=1e-5]Steps:  76%|███████▌  | 11437/15001 [7:18:30<1:49:12,  1.84s/it, loss=0.0781, lr=1e-5]Steps:  76%|███████▌  | 11437/15001 [7:18:30<1:49:12,  1.84s/it, loss=0.216, lr=1e-5] Steps:  76%|███████▌  | 11438/15001 [7:18:32<1:48:14,  1.82s/it, loss=0.216, lr=1e-5]Steps:  76%|███████▌  | 11438/15001 [7:18:32<1:48:14,  1.82s/it, loss=0.173, lr=1e-5]Steps:  76%|███████▋  | 11439/15001 [7:18:33<1:45:49,  1.78s/it, loss=0.173, lr=1e-5]Steps:  76%|███████▋  | 11439/15001 [7:18:34<1:45:49,  1.78s/it, loss=0.113, lr=1e-5]Steps:  76%|███████▋  | 11440/15001 [7:18:35<1:43:43,  1.75s/it, loss=0.113, lr=1e-5]Steps:  76%|███████▋  | 11440/15001 [7:18:35<1:43:43,  1.75s/it, loss=0.302, lr=1e-5]Steps:  76%|███████▋  | 11441/15001 [7:18:37<1:49:19,  1.84s/it, loss=0.302, lr=1e-5]Steps:  76%|███████▋  | 11441/15001 [7:18:37<1:49:19,  1.84s/it, loss=0.315, lr=1e-5]Steps:  76%|███████▋  | 11442/15001 [7:18:39<1:50:00,  1.85s/it, loss=0.315, lr=1e-5]Steps:  76%|███████▋  | 11442/15001 [7:18:39<1:50:00,  1.85s/it, loss=0.069, lr=1e-5]Steps:  76%|███████▋  | 11443/15001 [7:18:41<1:46:06,  1.79s/it, loss=0.069, lr=1e-5]Steps:  76%|███████▋  | 11443/15001 [7:18:41<1:46:06,  1.79s/it, loss=0.294, lr=1e-5]Steps:  76%|███████▋  | 11444/15001 [7:18:43<1:49:28,  1.85s/it, loss=0.294, lr=1e-5]Steps:  76%|███████▋  | 11444/15001 [7:18:43<1:49:28,  1.85s/it, loss=0.197, lr=1e-5]Steps:  76%|███████▋  | 11445/15001 [7:18:45<1:51:21,  1.88s/it, loss=0.197, lr=1e-5]Steps:  76%|███████▋  | 11445/15001 [7:18:45<1:51:21,  1.88s/it, loss=0.0276, lr=1e-5]Steps:  76%|███████▋  | 11446/15001 [7:18:46<1:51:24,  1.88s/it, loss=0.0276, lr=1e-5]Steps:  76%|███████▋  | 11446/15001 [7:18:47<1:51:24,  1.88s/it, loss=0.236, lr=1e-5] Steps:  76%|███████▋  | 11447/15001 [7:18:49<1:57:15,  1.98s/it, loss=0.236, lr=1e-5]Steps:  76%|███████▋  | 11447/15001 [7:18:49<1:57:15,  1.98s/it, loss=0.226, lr=1e-5]Steps:  76%|███████▋  | 11448/15001 [7:18:51<1:57:01,  1.98s/it, loss=0.226, lr=1e-5]Steps:  76%|███████▋  | 11448/15001 [7:18:51<1:57:01,  1.98s/it, loss=0.195, lr=1e-5]Steps:  76%|███████▋  | 11449/15001 [7:18:52<1:51:52,  1.89s/it, loss=0.195, lr=1e-5]Steps:  76%|███████▋  | 11449/15001 [7:18:53<1:51:52,  1.89s/it, loss=0.14, lr=1e-5] Steps:  76%|███████▋  | 11450/15001 [7:18:54<1:53:58,  1.93s/it, loss=0.14, lr=1e-5]Steps:  76%|███████▋  | 11450/15001 [7:18:54<1:53:58,  1.93s/it, loss=0.137, lr=1e-5]Steps:  76%|███████▋  | 11451/15001 [7:18:56<1:51:47,  1.89s/it, loss=0.137, lr=1e-5]Steps:  76%|███████▋  | 11451/15001 [7:18:56<1:51:47,  1.89s/it, loss=0.168, lr=1e-5]Steps:  76%|███████▋  | 11452/15001 [7:18:58<1:51:45,  1.89s/it, loss=0.168, lr=1e-5]Steps:  76%|███████▋  | 11452/15001 [7:18:58<1:51:45,  1.89s/it, loss=0.0968, lr=1e-5]Steps:  76%|███████▋  | 11453/15001 [7:19:00<1:50:07,  1.86s/it, loss=0.0968, lr=1e-5]Steps:  76%|███████▋  | 11453/15001 [7:19:00<1:50:07,  1.86s/it, loss=0.215, lr=1e-5] Steps:  76%|███████▋  | 11454/15001 [7:19:02<1:49:08,  1.85s/it, loss=0.215, lr=1e-5]Steps:  76%|███████▋  | 11454/15001 [7:19:02<1:49:08,  1.85s/it, loss=0.251, lr=1e-5]Steps:  76%|███████▋  | 11455/15001 [7:19:03<1:48:04,  1.83s/it, loss=0.251, lr=1e-5]Steps:  76%|███████▋  | 11455/15001 [7:19:04<1:48:04,  1.83s/it, loss=0.166, lr=1e-5]Steps:  76%|███████▋  | 11456/15001 [7:19:05<1:44:37,  1.77s/it, loss=0.166, lr=1e-5]Steps:  76%|███████▋  | 11456/15001 [7:19:05<1:44:37,  1.77s/it, loss=0.135, lr=1e-5]Steps:  76%|███████▋  | 11457/15001 [7:19:07<1:52:30,  1.90s/it, loss=0.135, lr=1e-5]Steps:  76%|███████▋  | 11457/15001 [7:19:07<1:52:30,  1.90s/it, loss=0.168, lr=1e-5]Steps:  76%|███████▋  | 11458/15001 [7:19:09<1:47:34,  1.82s/it, loss=0.168, lr=1e-5]Steps:  76%|███████▋  | 11458/15001 [7:19:09<1:47:34,  1.82s/it, loss=0.165, lr=1e-5]Steps:  76%|███████▋  | 11459/15001 [7:19:11<1:49:52,  1.86s/it, loss=0.165, lr=1e-5]Steps:  76%|███████▋  | 11459/15001 [7:19:11<1:49:52,  1.86s/it, loss=0.142, lr=1e-5]Steps:  76%|███████▋  | 11460/15001 [7:19:13<1:51:06,  1.88s/it, loss=0.142, lr=1e-5]Steps:  76%|███████▋  | 11460/15001 [7:19:13<1:51:06,  1.88s/it, loss=0.0878, lr=1e-5]Steps:  76%|███████▋  | 11461/15001 [7:19:15<1:50:09,  1.87s/it, loss=0.0878, lr=1e-5]Steps:  76%|███████▋  | 11461/15001 [7:19:15<1:50:09,  1.87s/it, loss=0.124, lr=1e-5] Steps:  76%|███████▋  | 11462/15001 [7:19:17<1:51:06,  1.88s/it, loss=0.124, lr=1e-5]Steps:  76%|███████▋  | 11462/15001 [7:19:17<1:51:06,  1.88s/it, loss=0.37, lr=1e-5] Steps:  76%|███████▋  | 11463/15001 [7:19:18<1:47:57,  1.83s/it, loss=0.37, lr=1e-5]Steps:  76%|███████▋  | 11463/15001 [7:19:18<1:47:57,  1.83s/it, loss=0.156, lr=1e-5]Steps:  76%|███████▋  | 11464/15001 [7:19:20<1:46:40,  1.81s/it, loss=0.156, lr=1e-5]Steps:  76%|███████▋  | 11464/15001 [7:19:20<1:46:40,  1.81s/it, loss=0.163, lr=1e-5]Steps:  76%|███████▋  | 11465/15001 [7:19:22<1:47:46,  1.83s/it, loss=0.163, lr=1e-5]Steps:  76%|███████▋  | 11465/15001 [7:19:22<1:47:46,  1.83s/it, loss=0.128, lr=1e-5]Steps:  76%|███████▋  | 11466/15001 [7:19:24<1:47:29,  1.82s/it, loss=0.128, lr=1e-5]Steps:  76%|███████▋  | 11466/15001 [7:19:24<1:47:29,  1.82s/it, loss=0.11, lr=1e-5] Steps:  76%|███████▋  | 11467/15001 [7:19:26<1:49:32,  1.86s/it, loss=0.11, lr=1e-5]Steps:  76%|███████▋  | 11467/15001 [7:19:26<1:49:32,  1.86s/it, loss=0.0533, lr=1e-5]Steps:  76%|███████▋  | 11468/15001 [7:19:28<1:54:02,  1.94s/it, loss=0.0533, lr=1e-5]Steps:  76%|███████▋  | 11468/15001 [7:19:28<1:54:02,  1.94s/it, loss=0.144, lr=1e-5] Steps:  76%|███████▋  | 11469/15001 [7:19:30<1:52:55,  1.92s/it, loss=0.144, lr=1e-5]Steps:  76%|███████▋  | 11469/15001 [7:19:30<1:52:55,  1.92s/it, loss=0.205, lr=1e-5]Steps:  76%|███████▋  | 11470/15001 [7:19:32<1:52:49,  1.92s/it, loss=0.205, lr=1e-5]Steps:  76%|███████▋  | 11470/15001 [7:19:32<1:52:49,  1.92s/it, loss=0.15, lr=1e-5] Steps:  76%|███████▋  | 11471/15001 [7:19:34<1:55:50,  1.97s/it, loss=0.15, lr=1e-5]Steps:  76%|███████▋  | 11471/15001 [7:19:34<1:55:50,  1.97s/it, loss=0.185, lr=1e-5]Steps:  76%|███████▋  | 11472/15001 [7:19:36<1:58:59,  2.02s/it, loss=0.185, lr=1e-5]Steps:  76%|███████▋  | 11472/15001 [7:19:36<1:58:59,  2.02s/it, loss=0.188, lr=1e-5]Steps:  76%|███████▋  | 11473/15001 [7:19:38<1:53:24,  1.93s/it, loss=0.188, lr=1e-5]Steps:  76%|███████▋  | 11473/15001 [7:19:38<1:53:24,  1.93s/it, loss=0.202, lr=1e-5]Steps:  76%|███████▋  | 11474/15001 [7:19:39<1:51:37,  1.90s/it, loss=0.202, lr=1e-5]Steps:  76%|███████▋  | 11474/15001 [7:19:40<1:51:37,  1.90s/it, loss=0.11, lr=1e-5] Steps:  76%|███████▋  | 11475/15001 [7:19:41<1:51:51,  1.90s/it, loss=0.11, lr=1e-5]Steps:  76%|███████▋  | 11475/15001 [7:19:41<1:51:51,  1.90s/it, loss=0.106, lr=1e-5]Steps:  77%|███████▋  | 11476/15001 [7:19:43<1:49:06,  1.86s/it, loss=0.106, lr=1e-5]Steps:  77%|███████▋  | 11476/15001 [7:19:43<1:49:06,  1.86s/it, loss=0.115, lr=1e-5]Steps:  77%|███████▋  | 11477/15001 [7:19:45<1:49:43,  1.87s/it, loss=0.115, lr=1e-5]Steps:  77%|███████▋  | 11477/15001 [7:19:45<1:49:43,  1.87s/it, loss=0.217, lr=1e-5]Steps:  77%|███████▋  | 11478/15001 [7:19:46<1:44:42,  1.78s/it, loss=0.217, lr=1e-5]Steps:  77%|███████▋  | 11478/15001 [7:19:47<1:44:42,  1.78s/it, loss=0.128, lr=1e-5]Steps:  77%|███████▋  | 11479/15001 [7:19:48<1:46:35,  1.82s/it, loss=0.128, lr=1e-5]Steps:  77%|███████▋  | 11479/15001 [7:19:48<1:46:35,  1.82s/it, loss=0.242, lr=1e-5]Steps:  77%|███████▋  | 11480/15001 [7:19:50<1:43:52,  1.77s/it, loss=0.242, lr=1e-5]Steps:  77%|███████▋  | 11480/15001 [7:19:50<1:43:52,  1.77s/it, loss=0.261, lr=1e-5]Steps:  77%|███████▋  | 11481/15001 [7:19:52<1:47:02,  1.82s/it, loss=0.261, lr=1e-5]Steps:  77%|███████▋  | 11481/15001 [7:19:52<1:47:02,  1.82s/it, loss=0.0277, lr=1e-5]Steps:  77%|███████▋  | 11482/15001 [7:19:54<1:46:51,  1.82s/it, loss=0.0277, lr=1e-5]Steps:  77%|███████▋  | 11482/15001 [7:19:54<1:46:51,  1.82s/it, loss=0.148, lr=1e-5] Steps:  77%|███████▋  | 11483/15001 [7:19:55<1:43:42,  1.77s/it, loss=0.148, lr=1e-5]Steps:  77%|███████▋  | 11483/15001 [7:19:56<1:43:42,  1.77s/it, loss=0.124, lr=1e-5]Steps:  77%|███████▋  | 11484/15001 [7:19:58<1:49:24,  1.87s/it, loss=0.124, lr=1e-5]Steps:  77%|███████▋  | 11484/15001 [7:19:58<1:49:24,  1.87s/it, loss=0.417, lr=1e-5]Steps:  77%|███████▋  | 11485/15001 [7:19:59<1:43:58,  1.77s/it, loss=0.417, lr=1e-5]Steps:  77%|███████▋  | 11485/15001 [7:20:00<1:43:58,  1.77s/it, loss=0.206, lr=1e-5]Steps:  77%|███████▋  | 11486/15001 [7:20:01<1:47:13,  1.83s/it, loss=0.206, lr=1e-5]Steps:  77%|███████▋  | 11486/15001 [7:20:01<1:47:13,  1.83s/it, loss=0.0871, lr=1e-5]Steps:  77%|███████▋  | 11487/15001 [7:20:03<1:48:19,  1.85s/it, loss=0.0871, lr=1e-5]Steps:  77%|███████▋  | 11487/15001 [7:20:03<1:48:19,  1.85s/it, loss=0.0359, lr=1e-5]Steps:  77%|███████▋  | 11488/15001 [7:20:05<1:45:54,  1.81s/it, loss=0.0359, lr=1e-5]Steps:  77%|███████▋  | 11488/15001 [7:20:05<1:45:54,  1.81s/it, loss=0.115, lr=1e-5] Steps:  77%|███████▋  | 11489/15001 [7:20:07<1:47:29,  1.84s/it, loss=0.115, lr=1e-5]Steps:  77%|███████▋  | 11489/15001 [7:20:07<1:47:29,  1.84s/it, loss=0.215, lr=1e-5]Steps:  77%|███████▋  | 11490/15001 [7:20:09<1:50:31,  1.89s/it, loss=0.215, lr=1e-5]Steps:  77%|███████▋  | 11490/15001 [7:20:09<1:50:31,  1.89s/it, loss=0.134, lr=1e-5]Steps:  77%|███████▋  | 11491/15001 [7:20:11<1:53:26,  1.94s/it, loss=0.134, lr=1e-5]Steps:  77%|███████▋  | 11491/15001 [7:20:11<1:53:26,  1.94s/it, loss=0.0954, lr=1e-5]Steps:  77%|███████▋  | 11492/15001 [7:20:13<1:54:09,  1.95s/it, loss=0.0954, lr=1e-5]Steps:  77%|███████▋  | 11492/15001 [7:20:13<1:54:09,  1.95s/it, loss=0.138, lr=1e-5] Steps:  77%|███████▋  | 11493/15001 [7:20:14<1:51:44,  1.91s/it, loss=0.138, lr=1e-5]Steps:  77%|███████▋  | 11493/15001 [7:20:15<1:51:44,  1.91s/it, loss=0.0589, lr=1e-5]Steps:  77%|███████▋  | 11494/15001 [7:20:16<1:52:24,  1.92s/it, loss=0.0589, lr=1e-5]Steps:  77%|███████▋  | 11494/15001 [7:20:17<1:52:24,  1.92s/it, loss=0.272, lr=1e-5] Steps:  77%|███████▋  | 11495/15001 [7:20:18<1:53:17,  1.94s/it, loss=0.272, lr=1e-5]Steps:  77%|███████▋  | 11495/15001 [7:20:19<1:53:17,  1.94s/it, loss=0.224, lr=1e-5]Steps:  77%|███████▋  | 11496/15001 [7:20:20<1:56:22,  1.99s/it, loss=0.224, lr=1e-5]Steps:  77%|███████▋  | 11496/15001 [7:20:21<1:56:22,  1.99s/it, loss=0.289, lr=1e-5]Steps:  77%|███████▋  | 11497/15001 [7:20:22<1:50:23,  1.89s/it, loss=0.289, lr=1e-5]Steps:  77%|███████▋  | 11497/15001 [7:20:23<1:50:23,  1.89s/it, loss=0.404, lr=1e-5]Steps:  77%|███████▋  | 11498/15001 [7:20:24<1:55:24,  1.98s/it, loss=0.404, lr=1e-5]Steps:  77%|███████▋  | 11498/15001 [7:20:24<1:55:24,  1.98s/it, loss=0.246, lr=1e-5]Steps:  77%|███████▋  | 11499/15001 [7:20:26<1:51:33,  1.91s/it, loss=0.246, lr=1e-5]Steps:  77%|███████▋  | 11499/15001 [7:20:26<1:51:33,  1.91s/it, loss=0.0738, lr=1e-5]Steps:  77%|███████▋  | 11500/15001 [7:20:28<1:44:23,  1.79s/it, loss=0.0738, lr=1e-5]02/04/2024 20:22:47 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 944.73it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  77%|███████▋  | 11500/15001 [7:24:06<1:44:23,  1.79s/it, loss=0.358, lr=1e-5] Steps:  77%|███████▋  | 11501/15001 [7:24:07<65:19:51, 67.20s/it, loss=0.358, lr=1e-5]Steps:  77%|███████▋  | 11501/15001 [7:24:07<65:19:51, 67.20s/it, loss=0.0777, lr=1e-5]Steps:  77%|███████▋  | 11502/15001 [7:24:09<46:15:14, 47.59s/it, loss=0.0777, lr=1e-5]Steps:  77%|███████▋  | 11502/15001 [7:24:09<46:15:14, 47.59s/it, loss=0.147, lr=1e-5] Steps:  77%|███████▋  | 11503/15001 [7:24:11<32:57:52, 33.93s/it, loss=0.147, lr=1e-5]Steps:  77%|███████▋  | 11503/15001 [7:24:11<32:57:52, 33.93s/it, loss=0.21, lr=1e-5] Steps:  77%|███████▋  | 11504/15001 [7:24:13<23:41:16, 24.39s/it, loss=0.21, lr=1e-5]Steps:  77%|███████▋  | 11504/15001 [7:24:14<23:41:16, 24.39s/it, loss=0.161, lr=1e-5]Steps:  77%|███████▋  | 11505/15001 [7:24:15<17:06:50, 17.62s/it, loss=0.161, lr=1e-5]Steps:  77%|███████▋  | 11505/15001 [7:24:15<17:06:50, 17.62s/it, loss=0.165, lr=1e-5]Steps:  77%|███████▋  | 11506/15001 [7:24:17<12:28:56, 12.86s/it, loss=0.165, lr=1e-5]Steps:  77%|███████▋  | 11506/15001 [7:24:17<12:28:56, 12.86s/it, loss=0.243, lr=1e-5]Steps:  77%|███████▋  | 11507/15001 [7:24:19<9:15:00,  9.53s/it, loss=0.243, lr=1e-5] Steps:  77%|███████▋  | 11507/15001 [7:24:19<9:15:00,  9.53s/it, loss=0.236, lr=1e-5]Steps:  77%|███████▋  | 11508/15001 [7:24:21<7:02:50,  7.26s/it, loss=0.236, lr=1e-5]Steps:  77%|███████▋  | 11508/15001 [7:24:21<7:02:50,  7.26s/it, loss=0.0381, lr=1e-5]Steps:  77%|███████▋  | 11509/15001 [7:24:23<5:29:01,  5.65s/it, loss=0.0381, lr=1e-5]Steps:  77%|███████▋  | 11509/15001 [7:24:23<5:29:01,  5.65s/it, loss=0.116, lr=1e-5] Steps:  77%|███████▋  | 11510/15001 [7:24:24<4:22:47,  4.52s/it, loss=0.116, lr=1e-5]Steps:  77%|███████▋  | 11510/15001 [7:24:25<4:22:47,  4.52s/it, loss=0.0374, lr=1e-5]Steps:  77%|███████▋  | 11511/15001 [7:24:26<3:35:36,  3.71s/it, loss=0.0374, lr=1e-5]Steps:  77%|███████▋  | 11511/15001 [7:24:26<3:35:36,  3.71s/it, loss=0.234, lr=1e-5] Steps:  77%|███████▋  | 11512/15001 [7:24:28<3:01:01,  3.11s/it, loss=0.234, lr=1e-5]Steps:  77%|███████▋  | 11512/15001 [7:24:28<3:01:01,  3.11s/it, loss=0.149, lr=1e-5]Steps:  77%|███████▋  | 11513/15001 [7:24:30<2:37:24,  2.71s/it, loss=0.149, lr=1e-5]Steps:  77%|███████▋  | 11513/15001 [7:24:30<2:37:24,  2.71s/it, loss=0.235, lr=1e-5]Steps:  77%|███████▋  | 11514/15001 [7:24:32<2:21:47,  2.44s/it, loss=0.235, lr=1e-5]Steps:  77%|███████▋  | 11514/15001 [7:24:32<2:21:47,  2.44s/it, loss=0.117, lr=1e-5]Steps:  77%|███████▋  | 11515/15001 [7:24:34<2:14:21,  2.31s/it, loss=0.117, lr=1e-5]Steps:  77%|███████▋  | 11515/15001 [7:24:34<2:14:21,  2.31s/it, loss=0.13, lr=1e-5] Steps:  77%|███████▋  | 11516/15001 [7:24:35<2:02:30,  2.11s/it, loss=0.13, lr=1e-5]Steps:  77%|███████▋  | 11516/15001 [7:24:36<2:02:30,  2.11s/it, loss=0.0795, lr=1e-5]Steps:  77%|███████▋  | 11517/15001 [7:24:37<1:56:10,  2.00s/it, loss=0.0795, lr=1e-5]Steps:  77%|███████▋  | 11517/15001 [7:24:37<1:56:10,  2.00s/it, loss=0.0688, lr=1e-5]Steps:  77%|███████▋  | 11518/15001 [7:24:39<1:58:33,  2.04s/it, loss=0.0688, lr=1e-5]Steps:  77%|███████▋  | 11518/15001 [7:24:39<1:58:33,  2.04s/it, loss=0.09, lr=1e-5]  Steps:  77%|███████▋  | 11519/15001 [7:24:41<1:53:55,  1.96s/it, loss=0.09, lr=1e-5]Steps:  77%|███████▋  | 11519/15001 [7:24:41<1:53:55,  1.96s/it, loss=0.112, lr=1e-5]Steps:  77%|███████▋  | 11520/15001 [7:24:43<1:51:39,  1.92s/it, loss=0.112, lr=1e-5]Steps:  77%|███████▋  | 11520/15001 [7:24:43<1:51:39,  1.92s/it, loss=0.145, lr=1e-5]Steps:  77%|███████▋  | 11521/15001 [7:24:44<1:47:24,  1.85s/it, loss=0.145, lr=1e-5]Steps:  77%|███████▋  | 11521/15001 [7:24:45<1:47:24,  1.85s/it, loss=0.155, lr=1e-5]Steps:  77%|███████▋  | 11522/15001 [7:24:46<1:49:35,  1.89s/it, loss=0.155, lr=1e-5]Steps:  77%|███████▋  | 11522/15001 [7:24:47<1:49:35,  1.89s/it, loss=0.077, lr=1e-5]Steps:  77%|███████▋  | 11523/15001 [7:24:48<1:51:50,  1.93s/it, loss=0.077, lr=1e-5]Steps:  77%|███████▋  | 11523/15001 [7:24:49<1:51:50,  1.93s/it, loss=0.276, lr=1e-5]Steps:  77%|███████▋  | 11524/15001 [7:24:50<1:50:54,  1.91s/it, loss=0.276, lr=1e-5]Steps:  77%|███████▋  | 11524/15001 [7:24:51<1:50:54,  1.91s/it, loss=0.263, lr=1e-5]Steps:  77%|███████▋  | 11525/15001 [7:24:52<1:50:42,  1.91s/it, loss=0.263, lr=1e-5]Steps:  77%|███████▋  | 11525/15001 [7:24:52<1:50:42,  1.91s/it, loss=0.137, lr=1e-5]Steps:  77%|███████▋  | 11526/15001 [7:24:54<1:54:51,  1.98s/it, loss=0.137, lr=1e-5]Steps:  77%|███████▋  | 11526/15001 [7:24:54<1:54:51,  1.98s/it, loss=0.0631, lr=1e-5]Steps:  77%|███████▋  | 11527/15001 [7:24:56<1:51:08,  1.92s/it, loss=0.0631, lr=1e-5]Steps:  77%|███████▋  | 11527/15001 [7:24:56<1:51:08,  1.92s/it, loss=0.131, lr=1e-5] Steps:  77%|███████▋  | 11528/15001 [7:24:58<1:53:22,  1.96s/it, loss=0.131, lr=1e-5]Steps:  77%|███████▋  | 11528/15001 [7:24:58<1:53:22,  1.96s/it, loss=0.0111, lr=1e-5]Steps:  77%|███████▋  | 11529/15001 [7:25:00<1:49:25,  1.89s/it, loss=0.0111, lr=1e-5]Steps:  77%|███████▋  | 11529/15001 [7:25:00<1:49:25,  1.89s/it, loss=0.112, lr=1e-5] Steps:  77%|███████▋  | 11530/15001 [7:25:02<1:51:04,  1.92s/it, loss=0.112, lr=1e-5]Steps:  77%|███████▋  | 11530/15001 [7:25:02<1:51:04,  1.92s/it, loss=0.176, lr=1e-5]Steps:  77%|███████▋  | 11531/15001 [7:25:03<1:44:17,  1.80s/it, loss=0.176, lr=1e-5]Steps:  77%|███████▋  | 11531/15001 [7:25:04<1:44:17,  1.80s/it, loss=0.106, lr=1e-5]Steps:  77%|███████▋  | 11532/15001 [7:25:06<1:50:01,  1.90s/it, loss=0.106, lr=1e-5]Steps:  77%|███████▋  | 11532/15001 [7:25:06<1:50:01,  1.90s/it, loss=0.268, lr=1e-5]Steps:  77%|███████▋  | 11533/15001 [7:25:07<1:49:12,  1.89s/it, loss=0.268, lr=1e-5]Steps:  77%|███████▋  | 11533/15001 [7:25:08<1:49:12,  1.89s/it, loss=0.18, lr=1e-5] Steps:  77%|███████▋  | 11534/15001 [7:25:09<1:50:33,  1.91s/it, loss=0.18, lr=1e-5]Steps:  77%|███████▋  | 11534/15001 [7:25:09<1:50:33,  1.91s/it, loss=0.136, lr=1e-5]Steps:  77%|███████▋  | 11535/15001 [7:25:11<1:45:33,  1.83s/it, loss=0.136, lr=1e-5]Steps:  77%|███████▋  | 11535/15001 [7:25:11<1:45:33,  1.83s/it, loss=0.0855, lr=1e-5]Steps:  77%|███████▋  | 11536/15001 [7:25:13<1:47:43,  1.87s/it, loss=0.0855, lr=1e-5]Steps:  77%|███████▋  | 11536/15001 [7:25:13<1:47:43,  1.87s/it, loss=0.162, lr=1e-5] Steps:  77%|███████▋  | 11537/15001 [7:25:15<1:43:19,  1.79s/it, loss=0.162, lr=1e-5]Steps:  77%|███████▋  | 11537/15001 [7:25:15<1:43:19,  1.79s/it, loss=0.0763, lr=1e-5]Steps:  77%|███████▋  | 11538/15001 [7:25:17<1:48:09,  1.87s/it, loss=0.0763, lr=1e-5]Steps:  77%|███████▋  | 11538/15001 [7:25:17<1:48:09,  1.87s/it, loss=0.117, lr=1e-5] Steps:  77%|███████▋  | 11539/15001 [7:25:18<1:46:35,  1.85s/it, loss=0.117, lr=1e-5]Steps:  77%|███████▋  | 11539/15001 [7:25:19<1:46:35,  1.85s/it, loss=0.195, lr=1e-5]Steps:  77%|███████▋  | 11540/15001 [7:25:20<1:44:56,  1.82s/it, loss=0.195, lr=1e-5]Steps:  77%|███████▋  | 11540/15001 [7:25:20<1:44:56,  1.82s/it, loss=0.0547, lr=1e-5]Steps:  77%|███████▋  | 11541/15001 [7:25:22<1:44:15,  1.81s/it, loss=0.0547, lr=1e-5]Steps:  77%|███████▋  | 11541/15001 [7:25:22<1:44:15,  1.81s/it, loss=0.352, lr=1e-5] Steps:  77%|███████▋  | 11542/15001 [7:25:24<1:42:19,  1.77s/it, loss=0.352, lr=1e-5]Steps:  77%|███████▋  | 11542/15001 [7:25:24<1:42:19,  1.77s/it, loss=0.16, lr=1e-5] Steps:  77%|███████▋  | 11543/15001 [7:25:26<1:45:47,  1.84s/it, loss=0.16, lr=1e-5]Steps:  77%|███████▋  | 11543/15001 [7:25:26<1:45:47,  1.84s/it, loss=0.229, lr=1e-5]Steps:  77%|███████▋  | 11544/15001 [7:25:27<1:43:18,  1.79s/it, loss=0.229, lr=1e-5]Steps:  77%|███████▋  | 11544/15001 [7:25:28<1:43:18,  1.79s/it, loss=0.161, lr=1e-5]Steps:  77%|███████▋  | 11545/15001 [7:25:29<1:46:51,  1.86s/it, loss=0.161, lr=1e-5]Steps:  77%|███████▋  | 11545/15001 [7:25:30<1:46:51,  1.86s/it, loss=0.0477, lr=1e-5]Steps:  77%|███████▋  | 11546/15001 [7:25:31<1:49:43,  1.91s/it, loss=0.0477, lr=1e-5]Steps:  77%|███████▋  | 11546/15001 [7:25:32<1:49:43,  1.91s/it, loss=0.24, lr=1e-5]  Steps:  77%|███████▋  | 11547/15001 [7:25:34<1:54:44,  1.99s/it, loss=0.24, lr=1e-5]Steps:  77%|███████▋  | 11547/15001 [7:25:34<1:54:44,  1.99s/it, loss=0.0811, lr=1e-5]Steps:  77%|███████▋  | 11548/15001 [7:25:36<1:53:54,  1.98s/it, loss=0.0811, lr=1e-5]Steps:  77%|███████▋  | 11548/15001 [7:25:36<1:53:54,  1.98s/it, loss=0.134, lr=1e-5] Steps:  77%|███████▋  | 11549/15001 [7:25:38<1:54:39,  1.99s/it, loss=0.134, lr=1e-5]Steps:  77%|███████▋  | 11549/15001 [7:25:38<1:54:39,  1.99s/it, loss=0.157, lr=1e-5]Steps:  77%|███████▋  | 11550/15001 [7:25:40<1:53:59,  1.98s/it, loss=0.157, lr=1e-5]Steps:  77%|███████▋  | 11550/15001 [7:25:40<1:53:59,  1.98s/it, loss=0.037, lr=1e-5]Steps:  77%|███████▋  | 11551/15001 [7:25:41<1:49:39,  1.91s/it, loss=0.037, lr=1e-5]Steps:  77%|███████▋  | 11551/15001 [7:25:41<1:49:39,  1.91s/it, loss=0.12, lr=1e-5] Steps:  77%|███████▋  | 11552/15001 [7:25:43<1:49:57,  1.91s/it, loss=0.12, lr=1e-5]Steps:  77%|███████▋  | 11552/15001 [7:25:43<1:49:57,  1.91s/it, loss=0.259, lr=1e-5]Steps:  77%|███████▋  | 11553/15001 [7:25:45<1:44:40,  1.82s/it, loss=0.259, lr=1e-5]Steps:  77%|███████▋  | 11553/15001 [7:25:45<1:44:40,  1.82s/it, loss=0.17, lr=1e-5] Steps:  77%|███████▋  | 11554/15001 [7:25:47<1:47:19,  1.87s/it, loss=0.17, lr=1e-5]Steps:  77%|███████▋  | 11554/15001 [7:25:47<1:47:19,  1.87s/it, loss=0.162, lr=1e-5]Steps:  77%|███████▋  | 11555/15001 [7:25:48<1:44:48,  1.82s/it, loss=0.162, lr=1e-5]Steps:  77%|███████▋  | 11555/15001 [7:25:49<1:44:48,  1.82s/it, loss=0.153, lr=1e-5]Steps:  77%|███████▋  | 11556/15001 [7:25:50<1:42:49,  1.79s/it, loss=0.153, lr=1e-5]Steps:  77%|███████▋  | 11556/15001 [7:25:50<1:42:49,  1.79s/it, loss=0.295, lr=1e-5]Steps:  77%|███████▋  | 11557/15001 [7:25:52<1:46:24,  1.85s/it, loss=0.295, lr=1e-5]Steps:  77%|███████▋  | 11557/15001 [7:25:52<1:46:24,  1.85s/it, loss=0.0688, lr=1e-5]Steps:  77%|███████▋  | 11558/15001 [7:25:54<1:43:55,  1.81s/it, loss=0.0688, lr=1e-5]Steps:  77%|███████▋  | 11558/15001 [7:25:54<1:43:55,  1.81s/it, loss=0.397, lr=1e-5] Steps:  77%|███████▋  | 11559/15001 [7:25:56<1:42:07,  1.78s/it, loss=0.397, lr=1e-5]Steps:  77%|███████▋  | 11559/15001 [7:25:56<1:42:07,  1.78s/it, loss=0.0782, lr=1e-5]Steps:  77%|███████▋  | 11560/15001 [7:25:58<1:44:31,  1.82s/it, loss=0.0782, lr=1e-5]Steps:  77%|███████▋  | 11560/15001 [7:25:58<1:44:31,  1.82s/it, loss=0.149, lr=1e-5] Steps:  77%|███████▋  | 11561/15001 [7:25:59<1:40:21,  1.75s/it, loss=0.149, lr=1e-5]Steps:  77%|███████▋  | 11561/15001 [7:26:00<1:40:21,  1.75s/it, loss=0.253, lr=1e-5]Steps:  77%|███████▋  | 11562/15001 [7:26:01<1:46:28,  1.86s/it, loss=0.253, lr=1e-5]Steps:  77%|███████▋  | 11562/15001 [7:26:01<1:46:28,  1.86s/it, loss=0.247, lr=1e-5]Steps:  77%|███████▋  | 11563/15001 [7:26:03<1:48:32,  1.89s/it, loss=0.247, lr=1e-5]Steps:  77%|███████▋  | 11563/15001 [7:26:03<1:48:32,  1.89s/it, loss=0.12, lr=1e-5] Steps:  77%|███████▋  | 11564/15001 [7:26:05<1:41:49,  1.78s/it, loss=0.12, lr=1e-5]Steps:  77%|███████▋  | 11564/15001 [7:26:05<1:41:49,  1.78s/it, loss=0.241, lr=1e-5]Steps:  77%|███████▋  | 11565/15001 [7:26:07<1:44:17,  1.82s/it, loss=0.241, lr=1e-5]Steps:  77%|███████▋  | 11565/15001 [7:26:07<1:44:17,  1.82s/it, loss=0.175, lr=1e-5]Steps:  77%|███████▋  | 11566/15001 [7:26:08<1:41:18,  1.77s/it, loss=0.175, lr=1e-5]Steps:  77%|███████▋  | 11566/15001 [7:26:09<1:41:18,  1.77s/it, loss=0.0511, lr=1e-5]Steps:  77%|███████▋  | 11567/15001 [7:26:10<1:42:44,  1.80s/it, loss=0.0511, lr=1e-5]Steps:  77%|███████▋  | 11567/15001 [7:26:10<1:42:44,  1.80s/it, loss=0.262, lr=1e-5] Steps:  77%|███████▋  | 11568/15001 [7:26:12<1:47:21,  1.88s/it, loss=0.262, lr=1e-5]Steps:  77%|███████▋  | 11568/15001 [7:26:12<1:47:21,  1.88s/it, loss=0.232, lr=1e-5]Steps:  77%|███████▋  | 11569/15001 [7:26:14<1:43:52,  1.82s/it, loss=0.232, lr=1e-5]Steps:  77%|███████▋  | 11569/15001 [7:26:14<1:43:52,  1.82s/it, loss=0.23, lr=1e-5] Steps:  77%|███████▋  | 11570/15001 [7:26:16<1:54:21,  2.00s/it, loss=0.23, lr=1e-5]Steps:  77%|███████▋  | 11570/15001 [7:26:16<1:54:21,  2.00s/it, loss=0.236, lr=1e-5]Steps:  77%|███████▋  | 11571/15001 [7:26:18<1:49:01,  1.91s/it, loss=0.236, lr=1e-5]Steps:  77%|███████▋  | 11571/15001 [7:26:18<1:49:01,  1.91s/it, loss=0.329, lr=1e-5]Steps:  77%|███████▋  | 11572/15001 [7:26:20<1:54:35,  2.00s/it, loss=0.329, lr=1e-5]Steps:  77%|███████▋  | 11572/15001 [7:26:20<1:54:35,  2.00s/it, loss=0.19, lr=1e-5] Steps:  77%|███████▋  | 11573/15001 [7:26:22<1:50:47,  1.94s/it, loss=0.19, lr=1e-5]Steps:  77%|███████▋  | 11573/15001 [7:26:22<1:50:47,  1.94s/it, loss=0.0715, lr=1e-5]Steps:  77%|███████▋  | 11574/15001 [7:26:24<1:53:01,  1.98s/it, loss=0.0715, lr=1e-5]Steps:  77%|███████▋  | 11574/15001 [7:26:24<1:53:01,  1.98s/it, loss=0.345, lr=1e-5] Steps:  77%|███████▋  | 11575/15001 [7:26:26<1:49:54,  1.92s/it, loss=0.345, lr=1e-5]Steps:  77%|███████▋  | 11575/15001 [7:26:26<1:49:54,  1.92s/it, loss=0.266, lr=1e-5]Steps:  77%|███████▋  | 11576/15001 [7:26:28<1:48:18,  1.90s/it, loss=0.266, lr=1e-5]Steps:  77%|███████▋  | 11576/15001 [7:26:28<1:48:18,  1.90s/it, loss=0.111, lr=1e-5]Steps:  77%|███████▋  | 11577/15001 [7:26:30<1:47:00,  1.88s/it, loss=0.111, lr=1e-5]Steps:  77%|███████▋  | 11577/15001 [7:26:30<1:47:00,  1.88s/it, loss=0.246, lr=1e-5]Steps:  77%|███████▋  | 11578/15001 [7:26:31<1:43:56,  1.82s/it, loss=0.246, lr=1e-5]Steps:  77%|███████▋  | 11578/15001 [7:26:31<1:43:56,  1.82s/it, loss=0.155, lr=1e-5]Steps:  77%|███████▋  | 11579/15001 [7:26:33<1:41:18,  1.78s/it, loss=0.155, lr=1e-5]Steps:  77%|███████▋  | 11579/15001 [7:26:33<1:41:18,  1.78s/it, loss=0.034, lr=1e-5]Steps:  77%|███████▋  | 11580/15001 [7:26:35<1:47:14,  1.88s/it, loss=0.034, lr=1e-5]Steps:  77%|███████▋  | 11580/15001 [7:26:35<1:47:14,  1.88s/it, loss=0.0358, lr=1e-5]Steps:  77%|███████▋  | 11581/15001 [7:26:37<1:46:17,  1.86s/it, loss=0.0358, lr=1e-5]Steps:  77%|███████▋  | 11581/15001 [7:26:37<1:46:17,  1.86s/it, loss=0.214, lr=1e-5] Steps:  77%|███████▋  | 11582/15001 [7:26:39<1:44:12,  1.83s/it, loss=0.214, lr=1e-5]Steps:  77%|███████▋  | 11582/15001 [7:26:39<1:44:12,  1.83s/it, loss=0.0653, lr=1e-5]Steps:  77%|███████▋  | 11583/15001 [7:26:40<1:42:29,  1.80s/it, loss=0.0653, lr=1e-5]Steps:  77%|███████▋  | 11583/15001 [7:26:40<1:42:29,  1.80s/it, loss=0.0713, lr=1e-5]Steps:  77%|███████▋  | 11584/15001 [7:26:42<1:41:37,  1.78s/it, loss=0.0713, lr=1e-5]Steps:  77%|███████▋  | 11584/15001 [7:26:42<1:41:37,  1.78s/it, loss=0.219, lr=1e-5] Steps:  77%|███████▋  | 11585/15001 [7:26:44<1:43:33,  1.82s/it, loss=0.219, lr=1e-5]Steps:  77%|███████▋  | 11585/15001 [7:26:44<1:43:33,  1.82s/it, loss=0.0245, lr=1e-5]Steps:  77%|███████▋  | 11586/15001 [7:26:46<1:43:05,  1.81s/it, loss=0.0245, lr=1e-5]Steps:  77%|███████▋  | 11586/15001 [7:26:46<1:43:05,  1.81s/it, loss=0.277, lr=1e-5] Steps:  77%|███████▋  | 11587/15001 [7:26:47<1:38:13,  1.73s/it, loss=0.277, lr=1e-5]Steps:  77%|███████▋  | 11587/15001 [7:26:48<1:38:13,  1.73s/it, loss=0.0878, lr=1e-5]Steps:  77%|███████▋  | 11588/15001 [7:26:49<1:37:45,  1.72s/it, loss=0.0878, lr=1e-5]Steps:  77%|███████▋  | 11588/15001 [7:26:49<1:37:45,  1.72s/it, loss=0.0813, lr=1e-5]Steps:  77%|███████▋  | 11589/15001 [7:26:51<1:42:05,  1.80s/it, loss=0.0813, lr=1e-5]Steps:  77%|███████▋  | 11589/15001 [7:26:51<1:42:05,  1.80s/it, loss=0.368, lr=1e-5] Steps:  77%|███████▋  | 11590/15001 [7:26:53<1:41:56,  1.79s/it, loss=0.368, lr=1e-5]Steps:  77%|███████▋  | 11590/15001 [7:26:53<1:41:56,  1.79s/it, loss=0.0993, lr=1e-5]Steps:  77%|███████▋  | 11591/15001 [7:26:55<1:43:04,  1.81s/it, loss=0.0993, lr=1e-5]Steps:  77%|███████▋  | 11591/15001 [7:26:55<1:43:04,  1.81s/it, loss=0.0854, lr=1e-5]Steps:  77%|███████▋  | 11592/15001 [7:26:57<1:49:08,  1.92s/it, loss=0.0854, lr=1e-5]Steps:  77%|███████▋  | 11592/15001 [7:26:57<1:49:08,  1.92s/it, loss=0.287, lr=1e-5] Steps:  77%|███████▋  | 11593/15001 [7:26:59<1:47:40,  1.90s/it, loss=0.287, lr=1e-5]Steps:  77%|███████▋  | 11593/15001 [7:26:59<1:47:40,  1.90s/it, loss=0.153, lr=1e-5]Steps:  77%|███████▋  | 11594/15001 [7:27:01<1:51:48,  1.97s/it, loss=0.153, lr=1e-5]Steps:  77%|███████▋  | 11594/15001 [7:27:01<1:51:48,  1.97s/it, loss=0.249, lr=1e-5]Steps:  77%|███████▋  | 11595/15001 [7:27:03<1:49:43,  1.93s/it, loss=0.249, lr=1e-5]Steps:  77%|███████▋  | 11595/15001 [7:27:03<1:49:43,  1.93s/it, loss=0.173, lr=1e-5]Steps:  77%|███████▋  | 11596/15001 [7:27:05<1:49:26,  1.93s/it, loss=0.173, lr=1e-5]Steps:  77%|███████▋  | 11596/15001 [7:27:05<1:49:26,  1.93s/it, loss=0.338, lr=1e-5]Steps:  77%|███████▋  | 11597/15001 [7:27:07<1:51:51,  1.97s/it, loss=0.338, lr=1e-5]Steps:  77%|███████▋  | 11597/15001 [7:27:07<1:51:51,  1.97s/it, loss=0.115, lr=1e-5]Steps:  77%|███████▋  | 11598/15001 [7:27:08<1:48:08,  1.91s/it, loss=0.115, lr=1e-5]Steps:  77%|███████▋  | 11598/15001 [7:27:09<1:48:08,  1.91s/it, loss=0.235, lr=1e-5]Steps:  77%|███████▋  | 11599/15001 [7:27:10<1:47:40,  1.90s/it, loss=0.235, lr=1e-5]Steps:  77%|███████▋  | 11599/15001 [7:27:10<1:47:40,  1.90s/it, loss=0.315, lr=1e-5]Steps:  77%|███████▋  | 11600/15001 [7:27:12<1:44:11,  1.84s/it, loss=0.315, lr=1e-5]Steps:  77%|███████▋  | 11600/15001 [7:27:12<1:44:11,  1.84s/it, loss=0.0658, lr=1e-5]Steps:  77%|███████▋  | 11601/15001 [7:27:14<1:44:05,  1.84s/it, loss=0.0658, lr=1e-5]Steps:  77%|███████▋  | 11601/15001 [7:27:14<1:44:05,  1.84s/it, loss=0.0641, lr=1e-5]Steps:  77%|███████▋  | 11602/15001 [7:27:16<1:46:10,  1.87s/it, loss=0.0641, lr=1e-5]Steps:  77%|███████▋  | 11602/15001 [7:27:16<1:46:10,  1.87s/it, loss=0.25, lr=1e-5]  Steps:  77%|███████▋  | 11603/15001 [7:27:18<1:48:04,  1.91s/it, loss=0.25, lr=1e-5]Steps:  77%|███████▋  | 11603/15001 [7:27:18<1:48:04,  1.91s/it, loss=0.0515, lr=1e-5]Steps:  77%|███████▋  | 11604/15001 [7:27:20<1:45:42,  1.87s/it, loss=0.0515, lr=1e-5]Steps:  77%|███████▋  | 11604/15001 [7:27:20<1:45:42,  1.87s/it, loss=0.152, lr=1e-5] Steps:  77%|███████▋  | 11605/15001 [7:27:21<1:43:20,  1.83s/it, loss=0.152, lr=1e-5]Steps:  77%|███████▋  | 11605/15001 [7:27:21<1:43:20,  1.83s/it, loss=0.223, lr=1e-5]Steps:  77%|███████▋  | 11606/15001 [7:27:23<1:43:27,  1.83s/it, loss=0.223, lr=1e-5]Steps:  77%|███████▋  | 11606/15001 [7:27:23<1:43:27,  1.83s/it, loss=0.266, lr=1e-5]Steps:  77%|███████▋  | 11607/15001 [7:27:25<1:43:00,  1.82s/it, loss=0.266, lr=1e-5]Steps:  77%|███████▋  | 11607/15001 [7:27:25<1:43:00,  1.82s/it, loss=0.277, lr=1e-5]Steps:  77%|███████▋  | 11608/15001 [7:27:26<1:38:56,  1.75s/it, loss=0.277, lr=1e-5]Steps:  77%|███████▋  | 11608/15001 [7:27:27<1:38:56,  1.75s/it, loss=0.184, lr=1e-5]Steps:  77%|███████▋  | 11609/15001 [7:27:28<1:40:58,  1.79s/it, loss=0.184, lr=1e-5]Steps:  77%|███████▋  | 11609/15001 [7:27:29<1:40:58,  1.79s/it, loss=0.0452, lr=1e-5]Steps:  77%|███████▋  | 11610/15001 [7:27:30<1:43:22,  1.83s/it, loss=0.0452, lr=1e-5]Steps:  77%|███████▋  | 11610/15001 [7:27:30<1:43:22,  1.83s/it, loss=0.118, lr=1e-5] Steps:  77%|███████▋  | 11611/15001 [7:27:32<1:43:52,  1.84s/it, loss=0.118, lr=1e-5]Steps:  77%|███████▋  | 11611/15001 [7:27:32<1:43:52,  1.84s/it, loss=0.0725, lr=1e-5]Steps:  77%|███████▋  | 11612/15001 [7:27:34<1:43:20,  1.83s/it, loss=0.0725, lr=1e-5]Steps:  77%|███████▋  | 11612/15001 [7:27:34<1:43:20,  1.83s/it, loss=0.275, lr=1e-5] Steps:  77%|███████▋  | 11613/15001 [7:27:36<1:41:37,  1.80s/it, loss=0.275, lr=1e-5]Steps:  77%|███████▋  | 11613/15001 [7:27:36<1:41:37,  1.80s/it, loss=0.134, lr=1e-5]Steps:  77%|███████▋  | 11614/15001 [7:27:37<1:40:13,  1.78s/it, loss=0.134, lr=1e-5]Steps:  77%|███████▋  | 11614/15001 [7:27:38<1:40:13,  1.78s/it, loss=0.281, lr=1e-5]Steps:  77%|███████▋  | 11615/15001 [7:27:39<1:45:12,  1.86s/it, loss=0.281, lr=1e-5]Steps:  77%|███████▋  | 11615/15001 [7:27:40<1:45:12,  1.86s/it, loss=0.0719, lr=1e-5]Steps:  77%|███████▋  | 11616/15001 [7:27:41<1:47:27,  1.90s/it, loss=0.0719, lr=1e-5]Steps:  77%|███████▋  | 11616/15001 [7:27:42<1:47:27,  1.90s/it, loss=0.147, lr=1e-5] Steps:  77%|███████▋  | 11617/15001 [7:27:43<1:49:17,  1.94s/it, loss=0.147, lr=1e-5]Steps:  77%|███████▋  | 11617/15001 [7:27:44<1:49:17,  1.94s/it, loss=0.181, lr=1e-5]Steps:  77%|███████▋  | 11618/15001 [7:27:46<1:53:14,  2.01s/it, loss=0.181, lr=1e-5]Steps:  77%|███████▋  | 11618/15001 [7:27:46<1:53:14,  2.01s/it, loss=0.101, lr=1e-5]Steps:  77%|███████▋  | 11619/15001 [7:27:48<1:52:38,  2.00s/it, loss=0.101, lr=1e-5]Steps:  77%|███████▋  | 11619/15001 [7:27:48<1:52:38,  2.00s/it, loss=0.191, lr=1e-5]Steps:  77%|███████▋  | 11620/15001 [7:27:50<1:51:03,  1.97s/it, loss=0.191, lr=1e-5]Steps:  77%|███████▋  | 11620/15001 [7:27:50<1:51:03,  1.97s/it, loss=0.143, lr=1e-5]Steps:  77%|███████▋  | 11621/15001 [7:27:51<1:48:27,  1.93s/it, loss=0.143, lr=1e-5]Steps:  77%|███████▋  | 11621/15001 [7:27:52<1:48:27,  1.93s/it, loss=0.122, lr=1e-5]Steps:  77%|███████▋  | 11622/15001 [7:27:53<1:49:34,  1.95s/it, loss=0.122, lr=1e-5]Steps:  77%|███████▋  | 11622/15001 [7:27:53<1:49:34,  1.95s/it, loss=0.293, lr=1e-5]Steps:  77%|███████▋  | 11623/15001 [7:27:55<1:44:30,  1.86s/it, loss=0.293, lr=1e-5]Steps:  77%|███████▋  | 11623/15001 [7:27:55<1:44:30,  1.86s/it, loss=0.184, lr=1e-5]Steps:  77%|███████▋  | 11624/15001 [7:27:57<1:46:34,  1.89s/it, loss=0.184, lr=1e-5]Steps:  77%|███████▋  | 11624/15001 [7:27:57<1:46:34,  1.89s/it, loss=0.253, lr=1e-5]Steps:  77%|███████▋  | 11625/15001 [7:27:59<1:45:05,  1.87s/it, loss=0.253, lr=1e-5]Steps:  77%|███████▋  | 11625/15001 [7:27:59<1:45:05,  1.87s/it, loss=0.425, lr=1e-5]Steps:  78%|███████▊  | 11626/15001 [7:28:00<1:41:09,  1.80s/it, loss=0.425, lr=1e-5]Steps:  78%|███████▊  | 11626/15001 [7:28:01<1:41:09,  1.80s/it, loss=0.104, lr=1e-5]Steps:  78%|███████▊  | 11627/15001 [7:28:02<1:44:13,  1.85s/it, loss=0.104, lr=1e-5]Steps:  78%|███████▊  | 11627/15001 [7:28:03<1:44:13,  1.85s/it, loss=0.156, lr=1e-5]Steps:  78%|███████▊  | 11628/15001 [7:28:05<1:48:36,  1.93s/it, loss=0.156, lr=1e-5]Steps:  78%|███████▊  | 11628/15001 [7:28:05<1:48:36,  1.93s/it, loss=0.204, lr=1e-5]Steps:  78%|███████▊  | 11629/15001 [7:28:06<1:44:56,  1.87s/it, loss=0.204, lr=1e-5]Steps:  78%|███████▊  | 11629/15001 [7:28:06<1:44:56,  1.87s/it, loss=0.275, lr=1e-5]Steps:  78%|███████▊  | 11630/15001 [7:28:08<1:44:45,  1.86s/it, loss=0.275, lr=1e-5]Steps:  78%|███████▊  | 11630/15001 [7:28:08<1:44:45,  1.86s/it, loss=0.203, lr=1e-5]Steps:  78%|███████▊  | 11631/15001 [7:28:10<1:48:03,  1.92s/it, loss=0.203, lr=1e-5]Steps:  78%|███████▊  | 11631/15001 [7:28:10<1:48:03,  1.92s/it, loss=0.0986, lr=1e-5]Steps:  78%|███████▊  | 11632/15001 [7:28:12<1:46:45,  1.90s/it, loss=0.0986, lr=1e-5]Steps:  78%|███████▊  | 11632/15001 [7:28:12<1:46:45,  1.90s/it, loss=0.305, lr=1e-5] Steps:  78%|███████▊  | 11633/15001 [7:28:14<1:45:01,  1.87s/it, loss=0.305, lr=1e-5]Steps:  78%|███████▊  | 11633/15001 [7:28:14<1:45:01,  1.87s/it, loss=0.246, lr=1e-5]Steps:  78%|███████▊  | 11634/15001 [7:28:16<1:43:06,  1.84s/it, loss=0.246, lr=1e-5]Steps:  78%|███████▊  | 11634/15001 [7:28:16<1:43:06,  1.84s/it, loss=0.206, lr=1e-5]Steps:  78%|███████▊  | 11635/15001 [7:28:17<1:41:44,  1.81s/it, loss=0.206, lr=1e-5]Steps:  78%|███████▊  | 11635/15001 [7:28:17<1:41:44,  1.81s/it, loss=0.127, lr=1e-5]Steps:  78%|███████▊  | 11636/15001 [7:28:19<1:38:32,  1.76s/it, loss=0.127, lr=1e-5]Steps:  78%|███████▊  | 11636/15001 [7:28:19<1:38:32,  1.76s/it, loss=0.302, lr=1e-5]Steps:  78%|███████▊  | 11637/15001 [7:28:21<1:44:08,  1.86s/it, loss=0.302, lr=1e-5]Steps:  78%|███████▊  | 11637/15001 [7:28:21<1:44:08,  1.86s/it, loss=0.0734, lr=1e-5]Steps:  78%|███████▊  | 11638/15001 [7:28:23<1:42:37,  1.83s/it, loss=0.0734, lr=1e-5]Steps:  78%|███████▊  | 11638/15001 [7:28:23<1:42:37,  1.83s/it, loss=0.167, lr=1e-5] Steps:  78%|███████▊  | 11639/15001 [7:28:25<1:50:00,  1.96s/it, loss=0.167, lr=1e-5]Steps:  78%|███████▊  | 11639/15001 [7:28:25<1:50:00,  1.96s/it, loss=0.382, lr=1e-5]Steps:  78%|███████▊  | 11640/15001 [7:28:27<1:47:35,  1.92s/it, loss=0.382, lr=1e-5]Steps:  78%|███████▊  | 11640/15001 [7:28:27<1:47:35,  1.92s/it, loss=0.313, lr=1e-5]Steps:  78%|███████▊  | 11641/15001 [7:28:29<1:52:21,  2.01s/it, loss=0.313, lr=1e-5]Steps:  78%|███████▊  | 11641/15001 [7:28:29<1:52:21,  2.01s/it, loss=0.107, lr=1e-5]Steps:  78%|███████▊  | 11642/15001 [7:28:31<1:47:43,  1.92s/it, loss=0.107, lr=1e-5]Steps:  78%|███████▊  | 11642/15001 [7:28:31<1:47:43,  1.92s/it, loss=0.337, lr=1e-5]Steps:  78%|███████▊  | 11643/15001 [7:28:33<1:51:05,  1.99s/it, loss=0.337, lr=1e-5]Steps:  78%|███████▊  | 11643/15001 [7:28:33<1:51:05,  1.99s/it, loss=0.145, lr=1e-5]Steps:  78%|███████▊  | 11644/15001 [7:28:35<1:47:36,  1.92s/it, loss=0.145, lr=1e-5]Steps:  78%|███████▊  | 11644/15001 [7:28:35<1:47:36,  1.92s/it, loss=0.24, lr=1e-5] Steps:  78%|███████▊  | 11645/15001 [7:28:37<1:46:47,  1.91s/it, loss=0.24, lr=1e-5]Steps:  78%|███████▊  | 11645/15001 [7:28:37<1:46:47,  1.91s/it, loss=0.0817, lr=1e-5]Steps:  78%|███████▊  | 11646/15001 [7:28:38<1:45:50,  1.89s/it, loss=0.0817, lr=1e-5]Steps:  78%|███████▊  | 11646/15001 [7:28:39<1:45:50,  1.89s/it, loss=0.289, lr=1e-5] Steps:  78%|███████▊  | 11647/15001 [7:28:40<1:43:02,  1.84s/it, loss=0.289, lr=1e-5]Steps:  78%|███████▊  | 11647/15001 [7:28:40<1:43:02,  1.84s/it, loss=0.313, lr=1e-5]Steps:  78%|███████▊  | 11648/15001 [7:28:42<1:43:32,  1.85s/it, loss=0.313, lr=1e-5]Steps:  78%|███████▊  | 11648/15001 [7:28:42<1:43:32,  1.85s/it, loss=0.0502, lr=1e-5]Steps:  78%|███████▊  | 11649/15001 [7:28:44<1:43:18,  1.85s/it, loss=0.0502, lr=1e-5]Steps:  78%|███████▊  | 11649/15001 [7:28:44<1:43:18,  1.85s/it, loss=0.282, lr=1e-5] Steps:  78%|███████▊  | 11650/15001 [7:28:45<1:38:42,  1.77s/it, loss=0.282, lr=1e-5]Steps:  78%|███████▊  | 11650/15001 [7:28:46<1:38:42,  1.77s/it, loss=0.125, lr=1e-5]Steps:  78%|███████▊  | 11651/15001 [7:28:47<1:42:45,  1.84s/it, loss=0.125, lr=1e-5]Steps:  78%|███████▊  | 11651/15001 [7:28:48<1:42:45,  1.84s/it, loss=0.1, lr=1e-5]  Steps:  78%|███████▊  | 11652/15001 [7:28:49<1:40:44,  1.80s/it, loss=0.1, lr=1e-5]Steps:  78%|███████▊  | 11652/15001 [7:28:50<1:40:44,  1.80s/it, loss=0.16, lr=1e-5]Steps:  78%|███████▊  | 11653/15001 [7:28:51<1:44:31,  1.87s/it, loss=0.16, lr=1e-5]Steps:  78%|███████▊  | 11653/15001 [7:28:51<1:44:31,  1.87s/it, loss=0.116, lr=1e-5]Steps:  78%|███████▊  | 11654/15001 [7:28:53<1:37:31,  1.75s/it, loss=0.116, lr=1e-5]Steps:  78%|███████▊  | 11654/15001 [7:28:53<1:37:31,  1.75s/it, loss=0.187, lr=1e-5]Steps:  78%|███████▊  | 11655/15001 [7:28:55<1:46:14,  1.91s/it, loss=0.187, lr=1e-5]Steps:  78%|███████▊  | 11655/15001 [7:28:55<1:46:14,  1.91s/it, loss=0.269, lr=1e-5]Steps:  78%|███████▊  | 11656/15001 [7:28:57<1:41:20,  1.82s/it, loss=0.269, lr=1e-5]Steps:  78%|███████▊  | 11656/15001 [7:28:57<1:41:20,  1.82s/it, loss=0.111, lr=1e-5]Steps:  78%|███████▊  | 11657/15001 [7:28:58<1:42:14,  1.83s/it, loss=0.111, lr=1e-5]Steps:  78%|███████▊  | 11657/15001 [7:28:59<1:42:14,  1.83s/it, loss=0.209, lr=1e-5]Steps:  78%|███████▊  | 11658/15001 [7:29:00<1:43:26,  1.86s/it, loss=0.209, lr=1e-5]Steps:  78%|███████▊  | 11658/15001 [7:29:01<1:43:26,  1.86s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11659/15001 [7:29:02<1:42:07,  1.83s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11659/15001 [7:29:03<1:42:07,  1.83s/it, loss=0.328, lr=1e-5]Steps:  78%|███████▊  | 11660/15001 [7:29:04<1:48:48,  1.95s/it, loss=0.328, lr=1e-5]Steps:  78%|███████▊  | 11660/15001 [7:29:04<1:48:48,  1.95s/it, loss=0.246, lr=1e-5]Steps:  78%|███████▊  | 11661/15001 [7:29:06<1:43:20,  1.86s/it, loss=0.246, lr=1e-5]Steps:  78%|███████▊  | 11661/15001 [7:29:06<1:43:20,  1.86s/it, loss=0.0964, lr=1e-5]Steps:  78%|███████▊  | 11662/15001 [7:29:08<1:47:15,  1.93s/it, loss=0.0964, lr=1e-5]Steps:  78%|███████▊  | 11662/15001 [7:29:08<1:47:15,  1.93s/it, loss=0.148, lr=1e-5] Steps:  78%|███████▊  | 11663/15001 [7:29:10<1:48:45,  1.95s/it, loss=0.148, lr=1e-5]Steps:  78%|███████▊  | 11663/15001 [7:29:10<1:48:45,  1.95s/it, loss=0.109, lr=1e-5]Steps:  78%|███████▊  | 11664/15001 [7:29:12<1:53:00,  2.03s/it, loss=0.109, lr=1e-5]Steps:  78%|███████▊  | 11664/15001 [7:29:12<1:53:00,  2.03s/it, loss=0.185, lr=1e-5]Steps:  78%|███████▊  | 11665/15001 [7:29:14<1:53:39,  2.04s/it, loss=0.185, lr=1e-5]Steps:  78%|███████▊  | 11665/15001 [7:29:15<1:53:39,  2.04s/it, loss=0.0172, lr=1e-5]Steps:  78%|███████▊  | 11666/15001 [7:29:16<1:50:41,  1.99s/it, loss=0.0172, lr=1e-5]Steps:  78%|███████▊  | 11666/15001 [7:29:16<1:50:41,  1.99s/it, loss=0.0911, lr=1e-5]Steps:  78%|███████▊  | 11667/15001 [7:29:18<1:47:47,  1.94s/it, loss=0.0911, lr=1e-5]Steps:  78%|███████▊  | 11667/15001 [7:29:18<1:47:47,  1.94s/it, loss=0.269, lr=1e-5] Steps:  78%|███████▊  | 11668/15001 [7:29:20<1:45:27,  1.90s/it, loss=0.269, lr=1e-5]Steps:  78%|███████▊  | 11668/15001 [7:29:20<1:45:27,  1.90s/it, loss=0.0335, lr=1e-5]Steps:  78%|███████▊  | 11669/15001 [7:29:22<1:42:47,  1.85s/it, loss=0.0335, lr=1e-5]Steps:  78%|███████▊  | 11669/15001 [7:29:22<1:42:47,  1.85s/it, loss=0.153, lr=1e-5] Steps:  78%|███████▊  | 11670/15001 [7:29:23<1:41:41,  1.83s/it, loss=0.153, lr=1e-5]Steps:  78%|███████▊  | 11670/15001 [7:29:24<1:41:41,  1.83s/it, loss=0.27, lr=1e-5] Steps:  78%|███████▊  | 11671/15001 [7:29:25<1:42:02,  1.84s/it, loss=0.27, lr=1e-5]Steps:  78%|███████▊  | 11671/15001 [7:29:25<1:42:02,  1.84s/it, loss=0.0677, lr=1e-5]Steps:  78%|███████▊  | 11672/15001 [7:29:27<1:39:49,  1.80s/it, loss=0.0677, lr=1e-5]Steps:  78%|███████▊  | 11672/15001 [7:29:27<1:39:49,  1.80s/it, loss=0.173, lr=1e-5] Steps:  78%|███████▊  | 11673/15001 [7:29:29<1:40:48,  1.82s/it, loss=0.173, lr=1e-5]Steps:  78%|███████▊  | 11673/15001 [7:29:29<1:40:48,  1.82s/it, loss=0.233, lr=1e-5]Steps:  78%|███████▊  | 11674/15001 [7:29:31<1:40:40,  1.82s/it, loss=0.233, lr=1e-5]Steps:  78%|██���████▊  | 11674/15001 [7:29:31<1:40:40,  1.82s/it, loss=0.0527, lr=1e-5]Steps:  78%|███████▊  | 11675/15001 [7:29:32<1:37:33,  1.76s/it, loss=0.0527, lr=1e-5]Steps:  78%|███████▊  | 11675/15001 [7:29:33<1:37:33,  1.76s/it, loss=0.0438, lr=1e-5]Steps:  78%|███████▊  | 11676/15001 [7:29:34<1:41:00,  1.82s/it, loss=0.0438, lr=1e-5]Steps:  78%|███████▊  | 11676/15001 [7:29:35<1:41:00,  1.82s/it, loss=0.171, lr=1e-5] Steps:  78%|███████▊  | 11677/15001 [7:29:36<1:47:10,  1.93s/it, loss=0.171, lr=1e-5]Steps:  78%|███████▊  | 11677/15001 [7:29:37<1:47:10,  1.93s/it, loss=0.219, lr=1e-5]Steps:  78%|███████▊  | 11678/15001 [7:29:38<1:42:48,  1.86s/it, loss=0.219, lr=1e-5]Steps:  78%|███████▊  | 11678/15001 [7:29:38<1:42:48,  1.86s/it, loss=0.176, lr=1e-5]Steps:  78%|███████▊  | 11679/15001 [7:29:40<1:41:31,  1.83s/it, loss=0.176, lr=1e-5]Steps:  78%|███████▊  | 11679/15001 [7:29:40<1:41:31,  1.83s/it, loss=0.318, lr=1e-5]Steps:  78%|███████▊  | 11680/15001 [7:29:42<1:38:01,  1.77s/it, loss=0.318, lr=1e-5]Steps:  78%|███████▊  | 11680/15001 [7:29:42<1:38:01,  1.77s/it, loss=0.072, lr=1e-5]Steps:  78%|███████▊  | 11681/15001 [7:29:43<1:39:32,  1.80s/it, loss=0.072, lr=1e-5]Steps:  78%|███████▊  | 11681/15001 [7:29:44<1:39:32,  1.80s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11682/15001 [7:29:45<1:39:12,  1.79s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11682/15001 [7:29:46<1:39:12,  1.79s/it, loss=0.223, lr=1e-5]Steps:  78%|███████▊  | 11683/15001 [7:29:47<1:42:07,  1.85s/it, loss=0.223, lr=1e-5]Steps:  78%|███████▊  | 11683/15001 [7:29:47<1:42:07,  1.85s/it, loss=0.247, lr=1e-5]Steps:  78%|███████▊  | 11684/15001 [7:29:49<1:43:36,  1.87s/it, loss=0.247, lr=1e-5]Steps:  78%|███████▊  | 11684/15001 [7:29:50<1:43:36,  1.87s/it, loss=0.0962, lr=1e-5]Steps:  78%|███████▊  | 11685/15001 [7:29:51<1:51:18,  2.01s/it, loss=0.0962, lr=1e-5]Steps:  78%|███████▊  | 11685/15001 [7:29:52<1:51:18,  2.01s/it, loss=0.298, lr=1e-5] Steps:  78%|███████▊  | 11686/15001 [7:29:53<1:49:36,  1.98s/it, loss=0.298, lr=1e-5]Steps:  78%|███████▊  | 11686/15001 [7:29:53<1:49:36,  1.98s/it, loss=0.243, lr=1e-5]Steps:  78%|███████▊  | 11687/15001 [7:29:55<1:43:49,  1.88s/it, loss=0.243, lr=1e-5]Steps:  78%|███████▊  | 11687/15001 [7:29:55<1:43:49,  1.88s/it, loss=0.263, lr=1e-5]Steps:  78%|███████▊  | 11688/15001 [7:29:57<1:49:46,  1.99s/it, loss=0.263, lr=1e-5]Steps:  78%|███████▊  | 11688/15001 [7:29:57<1:49:46,  1.99s/it, loss=0.215, lr=1e-5]Steps:  78%|███████▊  | 11689/15001 [7:29:59<1:44:04,  1.89s/it, loss=0.215, lr=1e-5]Steps:  78%|███████▊  | 11689/15001 [7:29:59<1:44:04,  1.89s/it, loss=0.126, lr=1e-5]Steps:  78%|███████▊  | 11690/15001 [7:30:01<1:45:08,  1.91s/it, loss=0.126, lr=1e-5]Steps:  78%|███████▊  | 11690/15001 [7:30:01<1:45:08,  1.91s/it, loss=0.131, lr=1e-5]Steps:  78%|███████▊  | 11691/15001 [7:30:03<1:41:43,  1.84s/it, loss=0.131, lr=1e-5]Steps:  78%|███████▊  | 11691/15001 [7:30:03<1:41:43,  1.84s/it, loss=0.342, lr=1e-5]Steps:  78%|███████▊  | 11692/15001 [7:30:04<1:42:29,  1.86s/it, loss=0.342, lr=1e-5]Steps:  78%|███████▊  | 11692/15001 [7:30:05<1:42:29,  1.86s/it, loss=0.214, lr=1e-5]Steps:  78%|███████▊  | 11693/15001 [7:30:06<1:39:46,  1.81s/it, loss=0.214, lr=1e-5]Steps:  78%|███████▊  | 11693/15001 [7:30:06<1:39:46,  1.81s/it, loss=0.126, lr=1e-5]Steps:  78%|███████▊  | 11694/15001 [7:30:08<1:41:18,  1.84s/it, loss=0.126, lr=1e-5]Steps:  78%|███████▊  | 11694/15001 [7:30:08<1:41:18,  1.84s/it, loss=0.301, lr=1e-5]Steps:  78%|███████▊  | 11695/15001 [7:30:10<1:43:10,  1.87s/it, loss=0.301, lr=1e-5]Steps:  78%|███████▊  | 11695/15001 [7:30:10<1:43:10,  1.87s/it, loss=0.121, lr=1e-5]Steps:  78%|███████▊  | 11696/15001 [7:30:12<1:41:52,  1.85s/it, loss=0.121, lr=1e-5]Steps:  78%|███████▊  | 11696/15001 [7:30:12<1:41:52,  1.85s/it, loss=0.0493, lr=1e-5]Steps:  78%|███████▊  | 11697/15001 [7:30:14<1:40:25,  1.82s/it, loss=0.0493, lr=1e-5]Steps:  78%|███████▊  | 11697/15001 [7:30:14<1:40:25,  1.82s/it, loss=0.202, lr=1e-5] Steps:  78%|███████▊  | 11698/15001 [7:30:15<1:40:48,  1.83s/it, loss=0.202, lr=1e-5]Steps:  78%|███████▊  | 11698/15001 [7:30:16<1:40:48,  1.83s/it, loss=0.252, lr=1e-5]Steps:  78%|███████▊  | 11699/15001 [7:30:17<1:43:11,  1.88s/it, loss=0.252, lr=1e-5]Steps:  78%|█████���█▊  | 11699/15001 [7:30:17<1:43:11,  1.88s/it, loss=0.143, lr=1e-5]Steps:  78%|███████▊  | 11700/15001 [7:30:19<1:42:16,  1.86s/it, loss=0.143, lr=1e-5]Steps:  78%|███████▊  | 11700/15001 [7:30:19<1:42:16,  1.86s/it, loss=0.0981, lr=1e-5]Steps:  78%|███████▊  | 11701/15001 [7:30:21<1:41:45,  1.85s/it, loss=0.0981, lr=1e-5]Steps:  78%|███████▊  | 11701/15001 [7:30:21<1:41:45,  1.85s/it, loss=0.248, lr=1e-5] Steps:  78%|███████▊  | 11702/15001 [7:30:23<1:37:35,  1.78s/it, loss=0.248, lr=1e-5]Steps:  78%|███████▊  | 11702/15001 [7:30:23<1:37:35,  1.78s/it, loss=0.0423, lr=1e-5]Steps:  78%|███████▊  | 11703/15001 [7:30:25<1:40:12,  1.82s/it, loss=0.0423, lr=1e-5]Steps:  78%|███████▊  | 11703/15001 [7:30:25<1:40:12,  1.82s/it, loss=0.115, lr=1e-5] Steps:  78%|███████▊  | 11704/15001 [7:30:26<1:41:49,  1.85s/it, loss=0.115, lr=1e-5]Steps:  78%|███████▊  | 11704/15001 [7:30:27<1:41:49,  1.85s/it, loss=0.204, lr=1e-5]Steps:  78%|███████▊  | 11705/15001 [7:30:28<1:40:56,  1.84s/it, loss=0.204, lr=1e-5]Steps:  78%|███████▊  | 11705/15001 [7:30:28<1:40:56,  1.84s/it, loss=0.187, lr=1e-5]Steps:  78%|███████▊  | 11706/15001 [7:30:30<1:43:01,  1.88s/it, loss=0.187, lr=1e-5]Steps:  78%|███████▊  | 11706/15001 [7:30:30<1:43:01,  1.88s/it, loss=0.169, lr=1e-5]Steps:  78%|███████▊  | 11707/15001 [7:30:32<1:42:59,  1.88s/it, loss=0.169, lr=1e-5]Steps:  78%|███████▊  | 11707/15001 [7:30:32<1:42:59,  1.88s/it, loss=0.174, lr=1e-5]Steps:  78%|███████▊  | 11708/15001 [7:30:34<1:44:14,  1.90s/it, loss=0.174, lr=1e-5]Steps:  78%|███████▊  | 11708/15001 [7:30:34<1:44:14,  1.90s/it, loss=0.184, lr=1e-5]Steps:  78%|███████▊  | 11709/15001 [7:30:36<1:50:01,  2.01s/it, loss=0.184, lr=1e-5]Steps:  78%|███████▊  | 11709/15001 [7:30:36<1:50:01,  2.01s/it, loss=0.136, lr=1e-5]Steps:  78%|███████▊  | 11710/15001 [7:30:38<1:48:25,  1.98s/it, loss=0.136, lr=1e-5]Steps:  78%|███████▊  | 11710/15001 [7:30:38<1:48:25,  1.98s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11711/15001 [7:30:40<1:48:38,  1.98s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11711/15001 [7:30:40<1:48:38,  1.98s/it, loss=0.0809, lr=1e-5]Steps:  78%|███████▊  | 11712/15001 [7:30:42<1:45:42,  1.93s/it, loss=0.0809, lr=1e-5]Steps:  78%|███████▊  | 11712/15001 [7:30:42<1:45:42,  1.93s/it, loss=0.198, lr=1e-5] Steps:  78%|███████▊  | 11713/15001 [7:30:44<1:41:33,  1.85s/it, loss=0.198, lr=1e-5]Steps:  78%|███████▊  | 11713/15001 [7:30:44<1:41:33,  1.85s/it, loss=0.373, lr=1e-5]Steps:  78%|███████▊  | 11714/15001 [7:30:46<1:41:26,  1.85s/it, loss=0.373, lr=1e-5]Steps:  78%|███████▊  | 11714/15001 [7:30:46<1:41:26,  1.85s/it, loss=0.182, lr=1e-5]Steps:  78%|███████▊  | 11715/15001 [7:30:47<1:39:22,  1.81s/it, loss=0.182, lr=1e-5]Steps:  78%|███████▊  | 11715/15001 [7:30:48<1:39:22,  1.81s/it, loss=0.184, lr=1e-5]Steps:  78%|███████▊  | 11716/15001 [7:30:49<1:38:41,  1.80s/it, loss=0.184, lr=1e-5]Steps:  78%|███████▊  | 11716/15001 [7:30:49<1:38:41,  1.80s/it, loss=0.182, lr=1e-5]Steps:  78%|███████▊  | 11717/15001 [7:30:51<1:37:31,  1.78s/it, loss=0.182, lr=1e-5]Steps:  78%|███████▊  | 11717/15001 [7:30:51<1:37:31,  1.78s/it, loss=0.266, lr=1e-5]Steps:  78%|███████▊  | 11718/15001 [7:30:53<1:41:50,  1.86s/it, loss=0.266, lr=1e-5]Steps:  78%|███████▊  | 11718/15001 [7:30:53<1:41:50,  1.86s/it, loss=0.167, lr=1e-5]Steps:  78%|███████▊  | 11719/15001 [7:30:55<1:39:06,  1.81s/it, loss=0.167, lr=1e-5]Steps:  78%|███████▊  | 11719/15001 [7:30:55<1:39:06,  1.81s/it, loss=0.111, lr=1e-5]Steps:  78%|███████▊  | 11720/15001 [7:30:56<1:37:30,  1.78s/it, loss=0.111, lr=1e-5]Steps:  78%|███████▊  | 11720/15001 [7:30:57<1:37:30,  1.78s/it, loss=0.183, lr=1e-5]Steps:  78%|███████▊  | 11721/15001 [7:30:58<1:39:22,  1.82s/it, loss=0.183, lr=1e-5]Steps:  78%|███████▊  | 11721/15001 [7:30:58<1:39:22,  1.82s/it, loss=0.0813, lr=1e-5]Steps:  78%|███████▊  | 11722/15001 [7:31:00<1:41:42,  1.86s/it, loss=0.0813, lr=1e-5]Steps:  78%|███████▊  | 11722/15001 [7:31:00<1:41:42,  1.86s/it, loss=0.0317, lr=1e-5]Steps:  78%|███████▊  | 11723/15001 [7:31:02<1:36:05,  1.76s/it, loss=0.0317, lr=1e-5]Steps:  78%|███████▊  | 11723/15001 [7:31:02<1:36:05,  1.76s/it, loss=0.203, lr=1e-5] Steps:  78%|███████▊  | 11724/15001 [7:31:04<1:40:47,  1.85s/it, loss=0.203, lr=1e-5]Steps:  78%|███████���  | 11724/15001 [7:31:04<1:40:47,  1.85s/it, loss=0.138, lr=1e-5]Steps:  78%|███████▊  | 11725/15001 [7:31:05<1:37:40,  1.79s/it, loss=0.138, lr=1e-5]Steps:  78%|███████▊  | 11725/15001 [7:31:06<1:37:40,  1.79s/it, loss=0.0477, lr=1e-5]Steps:  78%|███████▊  | 11726/15001 [7:31:07<1:36:14,  1.76s/it, loss=0.0477, lr=1e-5]Steps:  78%|███████▊  | 11726/15001 [7:31:07<1:36:14,  1.76s/it, loss=0.362, lr=1e-5] Steps:  78%|███████▊  | 11727/15001 [7:31:09<1:38:40,  1.81s/it, loss=0.362, lr=1e-5]Steps:  78%|███████▊  | 11727/15001 [7:31:09<1:38:40,  1.81s/it, loss=0.07, lr=1e-5] Steps:  78%|███████▊  | 11728/15001 [7:31:11<1:37:16,  1.78s/it, loss=0.07, lr=1e-5]Steps:  78%|███████▊  | 11728/15001 [7:31:11<1:37:16,  1.78s/it, loss=0.225, lr=1e-5]Steps:  78%|███████▊  | 11729/15001 [7:31:13<1:44:09,  1.91s/it, loss=0.225, lr=1e-5]Steps:  78%|███████▊  | 11729/15001 [7:31:13<1:44:09,  1.91s/it, loss=0.157, lr=1e-5]Steps:  78%|███████▊  | 11730/15001 [7:31:15<1:41:26,  1.86s/it, loss=0.157, lr=1e-5]Steps:  78%|███████▊  | 11730/15001 [7:31:15<1:41:26,  1.86s/it, loss=0.202, lr=1e-5]Steps:  78%|███████▊  | 11731/15001 [7:31:17<1:45:34,  1.94s/it, loss=0.202, lr=1e-5]Steps:  78%|███████▊  | 11731/15001 [7:31:17<1:45:34,  1.94s/it, loss=0.0578, lr=1e-5]Steps:  78%|███████▊  | 11732/15001 [7:31:19<1:45:17,  1.93s/it, loss=0.0578, lr=1e-5]Steps:  78%|███████▊  | 11732/15001 [7:31:19<1:45:17,  1.93s/it, loss=0.209, lr=1e-5] Steps:  78%|███████▊  | 11733/15001 [7:31:21<1:45:04,  1.93s/it, loss=0.209, lr=1e-5]Steps:  78%|███████▊  | 11733/15001 [7:31:21<1:45:04,  1.93s/it, loss=0.178, lr=1e-5]Steps:  78%|███████▊  | 11734/15001 [7:31:23<1:55:30,  2.12s/it, loss=0.178, lr=1e-5]Steps:  78%|███████▊  | 11734/15001 [7:31:23<1:55:30,  2.12s/it, loss=0.0669, lr=1e-5]Steps:  78%|███████▊  | 11735/15001 [7:31:25<1:49:18,  2.01s/it, loss=0.0669, lr=1e-5]Steps:  78%|███████▊  | 11735/15001 [7:31:25<1:49:18,  2.01s/it, loss=0.145, lr=1e-5] Steps:  78%|███████▊  | 11736/15001 [7:31:27<1:46:55,  1.96s/it, loss=0.145, lr=1e-5]Steps:  78%|███████▊  | 11736/15001 [7:31:27<1:46:55,  1.96s/it, loss=0.18, lr=1e-5] Steps:  78%|███████▊  | 11737/15001 [7:31:29<1:44:18,  1.92s/it, loss=0.18, lr=1e-5]Steps:  78%|███████▊  | 11737/15001 [7:31:29<1:44:18,  1.92s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11738/15001 [7:31:31<1:44:46,  1.93s/it, loss=0.112, lr=1e-5]Steps:  78%|███████▊  | 11738/15001 [7:31:31<1:44:46,  1.93s/it, loss=0.106, lr=1e-5]Steps:  78%|███████▊  | 11739/15001 [7:31:32<1:43:00,  1.89s/it, loss=0.106, lr=1e-5]Steps:  78%|███████▊  | 11739/15001 [7:31:32<1:43:00,  1.89s/it, loss=0.0771, lr=1e-5]Steps:  78%|███████▊  | 11740/15001 [7:31:34<1:41:15,  1.86s/it, loss=0.0771, lr=1e-5]Steps:  78%|███████▊  | 11740/15001 [7:31:34<1:41:15,  1.86s/it, loss=0.0601, lr=1e-5]Steps:  78%|███████▊  | 11741/15001 [7:31:36<1:36:55,  1.78s/it, loss=0.0601, lr=1e-5]Steps:  78%|███████▊  | 11741/15001 [7:31:36<1:36:55,  1.78s/it, loss=0.149, lr=1e-5] Steps:  78%|███████▊  | 11742/15001 [7:31:38<1:39:21,  1.83s/it, loss=0.149, lr=1e-5]Steps:  78%|███████▊  | 11742/15001 [7:31:38<1:39:21,  1.83s/it, loss=0.189, lr=1e-5]Steps:  78%|███████▊  | 11743/15001 [7:31:40<1:41:14,  1.86s/it, loss=0.189, lr=1e-5]Steps:  78%|███████▊  | 11743/15001 [7:31:40<1:41:14,  1.86s/it, loss=0.0988, lr=1e-5]Steps:  78%|███████▊  | 11744/15001 [7:31:41<1:38:30,  1.81s/it, loss=0.0988, lr=1e-5]Steps:  78%|███████▊  | 11744/15001 [7:31:41<1:38:30,  1.81s/it, loss=0.226, lr=1e-5] Steps:  78%|███████▊  | 11745/15001 [7:31:43<1:32:56,  1.71s/it, loss=0.226, lr=1e-5]Steps:  78%|███████▊  | 11745/15001 [7:31:43<1:32:56,  1.71s/it, loss=0.0153, lr=1e-5]Steps:  78%|███████▊  | 11746/15001 [7:31:45<1:39:01,  1.83s/it, loss=0.0153, lr=1e-5]Steps:  78%|███████▊  | 11746/15001 [7:31:45<1:39:01,  1.83s/it, loss=0.156, lr=1e-5] Steps:  78%|███████▊  | 11747/15001 [7:31:47<1:41:57,  1.88s/it, loss=0.156, lr=1e-5]Steps:  78%|███████▊  | 11747/15001 [7:31:47<1:41:57,  1.88s/it, loss=0.126, lr=1e-5]Steps:  78%|███████▊  | 11748/15001 [7:31:49<1:38:42,  1.82s/it, loss=0.126, lr=1e-5]Steps:  78%|███████▊  | 11748/15001 [7:31:49<1:38:42,  1.82s/it, loss=0.176, lr=1e-5]Steps:  78%|███████▊  | 11749/15001 [7:31:50<1:40:31,  1.85s/it, loss=0.176, lr=1e-5]Steps:  78%|███████▊  | 11749/15001 [7:31:51<1:40:31,  1.85s/it, loss=0.0217, lr=1e-5]Steps:  78%|███████▊  | 11750/15001 [7:31:52<1:40:43,  1.86s/it, loss=0.0217, lr=1e-5]Steps:  78%|███████▊  | 11750/15001 [7:31:53<1:40:43,  1.86s/it, loss=0.0414, lr=1e-5]Steps:  78%|███████▊  | 11751/15001 [7:31:54<1:40:05,  1.85s/it, loss=0.0414, lr=1e-5]Steps:  78%|███████▊  | 11751/15001 [7:31:54<1:40:05,  1.85s/it, loss=0.182, lr=1e-5] Steps:  78%|███████▊  | 11752/15001 [7:31:56<1:43:10,  1.91s/it, loss=0.182, lr=1e-5]Steps:  78%|███████▊  | 11752/15001 [7:31:56<1:43:10,  1.91s/it, loss=0.128, lr=1e-5]Steps:  78%|███████▊  | 11753/15001 [7:31:58<1:45:42,  1.95s/it, loss=0.128, lr=1e-5]Steps:  78%|███████▊  | 11753/15001 [7:31:59<1:45:42,  1.95s/it, loss=0.169, lr=1e-5]Steps:  78%|███████▊  | 11754/15001 [7:32:00<1:48:20,  2.00s/it, loss=0.169, lr=1e-5]Steps:  78%|███████▊  | 11754/15001 [7:32:01<1:48:20,  2.00s/it, loss=0.201, lr=1e-5]Steps:  78%|███████▊  | 11755/15001 [7:32:03<1:50:01,  2.03s/it, loss=0.201, lr=1e-5]Steps:  78%|███████▊  | 11755/15001 [7:32:03<1:50:01,  2.03s/it, loss=0.124, lr=1e-5]Steps:  78%|███████▊  | 11756/15001 [7:32:05<1:49:41,  2.03s/it, loss=0.124, lr=1e-5]Steps:  78%|███████▊  | 11756/15001 [7:32:05<1:49:41,  2.03s/it, loss=0.0932, lr=1e-5]Steps:  78%|███████▊  | 11757/15001 [7:32:06<1:48:25,  2.01s/it, loss=0.0932, lr=1e-5]Steps:  78%|███████▊  | 11757/15001 [7:32:07<1:48:25,  2.01s/it, loss=0.242, lr=1e-5] Steps:  78%|███████▊  | 11758/15001 [7:32:08<1:42:00,  1.89s/it, loss=0.242, lr=1e-5]Steps:  78%|███████▊  | 11758/15001 [7:32:08<1:42:00,  1.89s/it, loss=0.0401, lr=1e-5]Steps:  78%|███████▊  | 11759/15001 [7:32:10<1:41:33,  1.88s/it, loss=0.0401, lr=1e-5]Steps:  78%|███████▊  | 11759/15001 [7:32:10<1:41:33,  1.88s/it, loss=0.192, lr=1e-5] Steps:  78%|███████▊  | 11760/15001 [7:32:12<1:42:35,  1.90s/it, loss=0.192, lr=1e-5]Steps:  78%|███████▊  | 11760/15001 [7:32:12<1:42:35,  1.90s/it, loss=0.123, lr=1e-5]Steps:  78%|███████▊  | 11761/15001 [7:32:14<1:42:40,  1.90s/it, loss=0.123, lr=1e-5]Steps:  78%|███████▊  | 11761/15001 [7:32:14<1:42:40,  1.90s/it, loss=0.178, lr=1e-5]Steps:  78%|███████▊  | 11762/15001 [7:32:16<1:39:29,  1.84s/it, loss=0.178, lr=1e-5]Steps:  78%|███████▊  | 11762/15001 [7:32:16<1:39:29,  1.84s/it, loss=0.142, lr=1e-5]Steps:  78%|███████▊  | 11763/15001 [7:32:17<1:40:22,  1.86s/it, loss=0.142, lr=1e-5]Steps:  78%|███████▊  | 11763/15001 [7:32:18<1:40:22,  1.86s/it, loss=0.19, lr=1e-5] Steps:  78%|███████▊  | 11764/15001 [7:32:19<1:37:25,  1.81s/it, loss=0.19, lr=1e-5]Steps:  78%|███████▊  | 11764/15001 [7:32:19<1:37:25,  1.81s/it, loss=0.0876, lr=1e-5]Steps:  78%|███████▊  | 11765/15001 [7:32:21<1:36:46,  1.79s/it, loss=0.0876, lr=1e-5]Steps:  78%|███████▊  | 11765/15001 [7:32:21<1:36:46,  1.79s/it, loss=0.0579, lr=1e-5]Steps:  78%|███████▊  | 11766/15001 [7:32:23<1:34:50,  1.76s/it, loss=0.0579, lr=1e-5]Steps:  78%|███████▊  | 11766/15001 [7:32:23<1:34:50,  1.76s/it, loss=0.257, lr=1e-5] Steps:  78%|███████▊  | 11767/15001 [7:32:24<1:34:50,  1.76s/it, loss=0.257, lr=1e-5]Steps:  78%|███████▊  | 11767/15001 [7:32:25<1:34:50,  1.76s/it, loss=0.0314, lr=1e-5]Steps:  78%|███████▊  | 11768/15001 [7:32:26<1:38:00,  1.82s/it, loss=0.0314, lr=1e-5]Steps:  78%|███████▊  | 11768/15001 [7:32:27<1:38:00,  1.82s/it, loss=0.0723, lr=1e-5]Steps:  78%|███████▊  | 11769/15001 [7:32:28<1:38:11,  1.82s/it, loss=0.0723, lr=1e-5]Steps:  78%|███████▊  | 11769/15001 [7:32:28<1:38:11,  1.82s/it, loss=0.31, lr=1e-5]  Steps:  78%|███████▊  | 11770/15001 [7:32:30<1:41:23,  1.88s/it, loss=0.31, lr=1e-5]Steps:  78%|███████▊  | 11770/15001 [7:32:30<1:41:23,  1.88s/it, loss=0.0377, lr=1e-5]Steps:  78%|███████▊  | 11771/15001 [7:32:32<1:38:15,  1.83s/it, loss=0.0377, lr=1e-5]Steps:  78%|███████▊  | 11771/15001 [7:32:32<1:38:15,  1.83s/it, loss=0.0967, lr=1e-5]Steps:  78%|███████▊  | 11772/15001 [7:32:34<1:38:59,  1.84s/it, loss=0.0967, lr=1e-5]Steps:  78%|███████▊  | 11772/15001 [7:32:34<1:38:59,  1.84s/it, loss=0.0749, lr=1e-5]Steps:  78%|███████▊  | 11773/15001 [7:32:35<1:37:48,  1.82s/it, loss=0.0749, lr=1e-5]Steps:  78%|███████▊  | 11773/15001 [7:32:36<1:37:48,  1.82s/it, loss=0.335, lr=1e-5] Steps:  78%|███████▊  | 11774/15001 [7:32:38<1:42:52,  1.91s/it, loss=0.335, lr=1e-5]Steps:  78%|███████▊  | 11774/15001 [7:32:38<1:42:52,  1.91s/it, loss=0.261, lr=1e-5]Steps:  78%|███████▊  | 11775/15001 [7:32:39<1:42:16,  1.90s/it, loss=0.261, lr=1e-5]Steps:  78%|███████▊  | 11775/15001 [7:32:40<1:42:16,  1.90s/it, loss=0.227, lr=1e-5]Steps:  79%|███████▊  | 11776/15001 [7:32:41<1:41:01,  1.88s/it, loss=0.227, lr=1e-5]Steps:  79%|███████▊  | 11776/15001 [7:32:42<1:41:01,  1.88s/it, loss=0.119, lr=1e-5]Steps:  79%|███████▊  | 11777/15001 [7:32:43<1:44:51,  1.95s/it, loss=0.119, lr=1e-5]Steps:  79%|███████▊  | 11777/15001 [7:32:44<1:44:51,  1.95s/it, loss=0.197, lr=1e-5]Steps:  79%|███████▊  | 11778/15001 [7:32:45<1:44:18,  1.94s/it, loss=0.197, lr=1e-5]Steps:  79%|███████▊  | 11778/15001 [7:32:45<1:44:18,  1.94s/it, loss=0.0432, lr=1e-5]Steps:  79%|███████▊  | 11779/15001 [7:32:47<1:44:58,  1.95s/it, loss=0.0432, lr=1e-5]Steps:  79%|███████▊  | 11779/15001 [7:32:47<1:44:58,  1.95s/it, loss=0.0317, lr=1e-5]Steps:  79%|███████▊  | 11780/15001 [7:32:49<1:42:17,  1.91s/it, loss=0.0317, lr=1e-5]Steps:  79%|███████▊  | 11780/15001 [7:32:49<1:42:17,  1.91s/it, loss=0.12, lr=1e-5]  Steps:  79%|███████▊  | 11781/15001 [7:32:51<1:43:55,  1.94s/it, loss=0.12, lr=1e-5]Steps:  79%|███████▊  | 11781/15001 [7:32:51<1:43:55,  1.94s/it, loss=0.19, lr=1e-5]Steps:  79%|███████▊  | 11782/15001 [7:32:53<1:39:40,  1.86s/it, loss=0.19, lr=1e-5]Steps:  79%|███████▊  | 11782/15001 [7:32:53<1:39:40,  1.86s/it, loss=0.0932, lr=1e-5]Steps:  79%|███████▊  | 11783/15001 [7:32:55<1:39:22,  1.85s/it, loss=0.0932, lr=1e-5]Steps:  79%|███████▊  | 11783/15001 [7:32:55<1:39:22,  1.85s/it, loss=0.126, lr=1e-5] Steps:  79%|███████▊  | 11784/15001 [7:32:56<1:37:02,  1.81s/it, loss=0.126, lr=1e-5]Steps:  79%|███████▊  | 11784/15001 [7:32:57<1:37:02,  1.81s/it, loss=0.293, lr=1e-5]Steps:  79%|███████▊  | 11785/15001 [7:32:58<1:37:29,  1.82s/it, loss=0.293, lr=1e-5]Steps:  79%|███████▊  | 11785/15001 [7:32:58<1:37:29,  1.82s/it, loss=0.304, lr=1e-5]Steps:  79%|███████▊  | 11786/15001 [7:33:00<1:41:04,  1.89s/it, loss=0.304, lr=1e-5]Steps:  79%|███████▊  | 11786/15001 [7:33:00<1:41:04,  1.89s/it, loss=0.166, lr=1e-5]Steps:  79%|███████▊  | 11787/15001 [7:33:02<1:35:59,  1.79s/it, loss=0.166, lr=1e-5]Steps:  79%|███████▊  | 11787/15001 [7:33:02<1:35:59,  1.79s/it, loss=0.18, lr=1e-5] Steps:  79%|███████▊  | 11788/15001 [7:33:04<1:39:52,  1.87s/it, loss=0.18, lr=1e-5]Steps:  79%|███████▊  | 11788/15001 [7:33:04<1:39:52,  1.87s/it, loss=0.187, lr=1e-5]Steps:  79%|███████▊  | 11789/15001 [7:33:06<1:37:30,  1.82s/it, loss=0.187, lr=1e-5]Steps:  79%|███████▊  | 11789/15001 [7:33:06<1:37:30,  1.82s/it, loss=0.16, lr=1e-5] Steps:  79%|███████▊  | 11790/15001 [7:33:07<1:36:59,  1.81s/it, loss=0.16, lr=1e-5]Steps:  79%|███████▊  | 11790/15001 [7:33:07<1:36:59,  1.81s/it, loss=0.246, lr=1e-5]Steps:  79%|███████▊  | 11791/15001 [7:33:09<1:37:34,  1.82s/it, loss=0.246, lr=1e-5]Steps:  79%|███████▊  | 11791/15001 [7:33:09<1:37:34,  1.82s/it, loss=0.0365, lr=1e-5]Steps:  79%|███████▊  | 11792/15001 [7:33:11<1:37:08,  1.82s/it, loss=0.0365, lr=1e-5]Steps:  79%|███████▊  | 11792/15001 [7:33:11<1:37:08,  1.82s/it, loss=0.202, lr=1e-5] Steps:  79%|███████▊  | 11793/15001 [7:33:13<1:34:12,  1.76s/it, loss=0.202, lr=1e-5]Steps:  79%|███████▊  | 11793/15001 [7:33:13<1:34:12,  1.76s/it, loss=0.0962, lr=1e-5]Steps:  79%|███████▊  | 11794/15001 [7:33:14<1:31:37,  1.71s/it, loss=0.0962, lr=1e-5]Steps:  79%|███████▊  | 11794/15001 [7:33:15<1:31:37,  1.71s/it, loss=0.197, lr=1e-5] Steps:  79%|███████▊  | 11795/15001 [7:33:16<1:36:12,  1.80s/it, loss=0.197, lr=1e-5]Steps:  79%|███████▊  | 11795/15001 [7:33:16<1:36:12,  1.80s/it, loss=0.163, lr=1e-5]Steps:  79%|███████▊  | 11796/15001 [7:33:18<1:36:37,  1.81s/it, loss=0.163, lr=1e-5]Steps:  79%|███████▊  | 11796/15001 [7:33:18<1:36:37,  1.81s/it, loss=0.077, lr=1e-5]Steps:  79%|███████▊  | 11797/15001 [7:33:20<1:34:31,  1.77s/it, loss=0.077, lr=1e-5]Steps:  79%|███████▊  | 11797/15001 [7:33:20<1:34:31,  1.77s/it, loss=0.0651, lr=1e-5]Steps:  79%|███████▊  | 11798/15001 [7:33:22<1:40:35,  1.88s/it, loss=0.0651, lr=1e-5]Steps:  79%|███████▊  | 11798/15001 [7:33:22<1:40:35,  1.88s/it, loss=0.159, lr=1e-5] Steps:  79%|███████▊  | 11799/15001 [7:33:24<1:42:54,  1.93s/it, loss=0.159, lr=1e-5]Steps:  79%|███████▊  | 11799/15001 [7:33:24<1:42:54,  1.93s/it, loss=0.136, lr=1e-5]Steps:  79%|███████▊  | 11800/15001 [7:33:26<1:45:45,  1.98s/it, loss=0.136, lr=1e-5]Steps:  79%|███████▊  | 11800/15001 [7:33:26<1:45:45,  1.98s/it, loss=0.0547, lr=1e-5]Steps:  79%|███████▊  | 11801/15001 [7:33:28<1:40:37,  1.89s/it, loss=0.0547, lr=1e-5]Steps:  79%|███████▊  | 11801/15001 [7:33:28<1:40:37,  1.89s/it, loss=0.0573, lr=1e-5]Steps:  79%|███████▊  | 11802/15001 [7:33:30<1:47:41,  2.02s/it, loss=0.0573, lr=1e-5]Steps:  79%|███████▊  | 11802/15001 [7:33:30<1:47:41,  2.02s/it, loss=0.105, lr=1e-5] Steps:  79%|███████▊  | 11803/15001 [7:33:32<1:45:17,  1.98s/it, loss=0.105, lr=1e-5]Steps:  79%|███████▊  | 11803/15001 [7:33:32<1:45:17,  1.98s/it, loss=0.332, lr=1e-5]Steps:  79%|███████▊  | 11804/15001 [7:33:34<1:41:39,  1.91s/it, loss=0.332, lr=1e-5]Steps:  79%|███████▊  | 11804/15001 [7:33:34<1:41:39,  1.91s/it, loss=0.157, lr=1e-5]Steps:  79%|███████▊  | 11805/15001 [7:33:36<1:41:11,  1.90s/it, loss=0.157, lr=1e-5]Steps:  79%|███████▊  | 11805/15001 [7:33:36<1:41:11,  1.90s/it, loss=0.0715, lr=1e-5]Steps:  79%|███████▊  | 11806/15001 [7:33:37<1:40:14,  1.88s/it, loss=0.0715, lr=1e-5]Steps:  79%|███████▊  | 11806/15001 [7:33:37<1:40:14,  1.88s/it, loss=0.0356, lr=1e-5]Steps:  79%|███████▊  | 11807/15001 [7:33:39<1:37:16,  1.83s/it, loss=0.0356, lr=1e-5]Steps:  79%|███████▊  | 11807/15001 [7:33:39<1:37:16,  1.83s/it, loss=0.138, lr=1e-5] Steps:  79%|███████▊  | 11808/15001 [7:33:41<1:35:57,  1.80s/it, loss=0.138, lr=1e-5]Steps:  79%|███████▊  | 11808/15001 [7:33:41<1:35:57,  1.80s/it, loss=0.0939, lr=1e-5]Steps:  79%|███████▊  | 11809/15001 [7:33:42<1:33:12,  1.75s/it, loss=0.0939, lr=1e-5]Steps:  79%|███████▊  | 11809/15001 [7:33:43<1:33:12,  1.75s/it, loss=0.0692, lr=1e-5]Steps:  79%|███████▊  | 11810/15001 [7:33:45<1:39:48,  1.88s/it, loss=0.0692, lr=1e-5]Steps:  79%|███████▊  | 11810/15001 [7:33:45<1:39:48,  1.88s/it, loss=0.161, lr=1e-5] Steps:  79%|███████▊  | 11811/15001 [7:33:46<1:35:50,  1.80s/it, loss=0.161, lr=1e-5]Steps:  79%|███████▊  | 11811/15001 [7:33:47<1:35:50,  1.80s/it, loss=0.156, lr=1e-5]Steps:  79%|███████▊  | 11812/15001 [7:33:48<1:39:54,  1.88s/it, loss=0.156, lr=1e-5]Steps:  79%|███████▊  | 11812/15001 [7:33:48<1:39:54,  1.88s/it, loss=0.246, lr=1e-5]Steps:  79%|███████▊  | 11813/15001 [7:33:50<1:38:42,  1.86s/it, loss=0.246, lr=1e-5]Steps:  79%|███████▊  | 11813/15001 [7:33:50<1:38:42,  1.86s/it, loss=0.199, lr=1e-5]Steps:  79%|███████▉  | 11814/15001 [7:33:52<1:37:26,  1.83s/it, loss=0.199, lr=1e-5]Steps:  79%|███████▉  | 11814/15001 [7:33:52<1:37:26,  1.83s/it, loss=0.374, lr=1e-5]Steps:  79%|███████▉  | 11815/15001 [7:33:54<1:35:58,  1.81s/it, loss=0.374, lr=1e-5]Steps:  79%|███████▉  | 11815/15001 [7:33:54<1:35:58,  1.81s/it, loss=0.131, lr=1e-5]Steps:  79%|███████▉  | 11816/15001 [7:33:55<1:34:20,  1.78s/it, loss=0.131, lr=1e-5]Steps:  79%|███████▉  | 11816/15001 [7:33:56<1:34:20,  1.78s/it, loss=0.262, lr=1e-5]Steps:  79%|███████▉  | 11817/15001 [7:33:57<1:36:04,  1.81s/it, loss=0.262, lr=1e-5]Steps:  79%|███████▉  | 11817/15001 [7:33:57<1:36:04,  1.81s/it, loss=0.23, lr=1e-5] Steps:  79%|███████▉  | 11818/15001 [7:33:59<1:35:00,  1.79s/it, loss=0.23, lr=1e-5]Steps:  79%|███████▉  | 11818/15001 [7:33:59<1:35:00,  1.79s/it, loss=0.283, lr=1e-5]Steps:  79%|███████▉  | 11819/15001 [7:34:01<1:36:04,  1.81s/it, loss=0.283, lr=1e-5]Steps:  79%|███████▉  | 11819/15001 [7:34:01<1:36:04,  1.81s/it, loss=0.241, lr=1e-5]Steps:  79%|███████▉  | 11820/15001 [7:34:03<1:35:00,  1.79s/it, loss=0.241, lr=1e-5]Steps:  79%|███████▉  | 11820/15001 [7:34:03<1:35:00,  1.79s/it, loss=0.151, lr=1e-5]Steps:  79%|███████▉  | 11821/15001 [7:34:05<1:37:43,  1.84s/it, loss=0.151, lr=1e-5]Steps:  79%|███████▉  | 11821/15001 [7:34:05<1:37:43,  1.84s/it, loss=0.137, lr=1e-5]Steps:  79%|███████▉  | 11822/15001 [7:34:07<1:42:19,  1.93s/it, loss=0.137, lr=1e-5]Steps:  79%|███████▉  | 11822/15001 [7:34:07<1:42:19,  1.93s/it, loss=0.167, lr=1e-5]Steps:  79%|███████▉  | 11823/15001 [7:34:09<1:43:21,  1.95s/it, loss=0.167, lr=1e-5]Steps:  79%|███████▉  | 11823/15001 [7:34:09<1:43:21,  1.95s/it, loss=0.213, lr=1e-5]Steps:  79%|███████▉  | 11824/15001 [7:34:11<1:42:13,  1.93s/it, loss=0.213, lr=1e-5]Steps:  79%|███████▉  | 11824/15001 [7:34:11<1:42:13,  1.93s/it, loss=0.111, lr=1e-5]Steps:  79%|███████▉  | 11825/15001 [7:34:13<1:43:40,  1.96s/it, loss=0.111, lr=1e-5]Steps:  79%|███████▉  | 11825/15001 [7:34:13<1:43:40,  1.96s/it, loss=0.214, lr=1e-5]Steps:  79%|███████▉  | 11826/15001 [7:34:15<1:47:20,  2.03s/it, loss=0.214, lr=1e-5]Steps:  79%|███████▉  | 11826/15001 [7:34:15<1:47:20,  2.03s/it, loss=0.172, lr=1e-5]Steps:  79%|███████▉  | 11827/15001 [7:34:16<1:40:18,  1.90s/it, loss=0.172, lr=1e-5]Steps:  79%|███████▉  | 11827/15001 [7:34:17<1:40:18,  1.90s/it, loss=0.134, lr=1e-5]Steps:  79%|███████▉  | 11828/15001 [7:34:18<1:39:16,  1.88s/it, loss=0.134, lr=1e-5]Steps:  79%|███████▉  | 11828/15001 [7:34:19<1:39:16,  1.88s/it, loss=0.0348, lr=1e-5]Steps:  79%|███████▉  | 11829/15001 [7:34:20<1:38:54,  1.87s/it, loss=0.0348, lr=1e-5]Steps:  79%|███████▉  | 11829/15001 [7:34:20<1:38:54,  1.87s/it, loss=0.321, lr=1e-5] Steps:  79%|███████▉  | 11830/15001 [7:34:22<1:41:11,  1.91s/it, loss=0.321, lr=1e-5]Steps:  79%|███████▉  | 11830/15001 [7:34:22<1:41:11,  1.91s/it, loss=0.0784, lr=1e-5]Steps:  79%|███████▉  | 11831/15001 [7:34:24<1:39:05,  1.88s/it, loss=0.0784, lr=1e-5]Steps:  79%|███████▉  | 11831/15001 [7:34:24<1:39:05,  1.88s/it, loss=0.219, lr=1e-5] Steps:  79%|███████▉  | 11832/15001 [7:34:26<1:39:29,  1.88s/it, loss=0.219, lr=1e-5]Steps:  79%|███████▉  | 11832/15001 [7:34:26<1:39:29,  1.88s/it, loss=0.149, lr=1e-5]Steps:  79%|███████▉  | 11833/15001 [7:34:28<1:39:11,  1.88s/it, loss=0.149, lr=1e-5]Steps:  79%|███████▉  | 11833/15001 [7:34:28<1:39:11,  1.88s/it, loss=0.122, lr=1e-5]Steps:  79%|███████▉  | 11834/15001 [7:34:29<1:37:58,  1.86s/it, loss=0.122, lr=1e-5]Steps:  79%|███████▉  | 11834/15001 [7:34:30<1:37:58,  1.86s/it, loss=0.128, lr=1e-5]Steps:  79%|███████▉  | 11835/15001 [7:34:31<1:34:02,  1.78s/it, loss=0.128, lr=1e-5]Steps:  79%|███████▉  | 11835/15001 [7:34:31<1:34:02,  1.78s/it, loss=0.185, lr=1e-5]Steps:  79%|███████▉  | 11836/15001 [7:34:33<1:33:59,  1.78s/it, loss=0.185, lr=1e-5]Steps:  79%|███████▉  | 11836/15001 [7:34:33<1:33:59,  1.78s/it, loss=0.285, lr=1e-5]Steps:  79%|███████▉  | 11837/15001 [7:34:35<1:34:36,  1.79s/it, loss=0.285, lr=1e-5]Steps:  79%|███████▉  | 11837/15001 [7:34:35<1:34:36,  1.79s/it, loss=0.226, lr=1e-5]Steps:  79%|███████▉  | 11838/15001 [7:34:37<1:37:40,  1.85s/it, loss=0.226, lr=1e-5]Steps:  79%|███████▉  | 11838/15001 [7:34:37<1:37:40,  1.85s/it, loss=0.331, lr=1e-5]Steps:  79%|███████▉  | 11839/15001 [7:34:38<1:37:39,  1.85s/it, loss=0.331, lr=1e-5]Steps:  79%|███████▉  | 11839/15001 [7:34:39<1:37:39,  1.85s/it, loss=0.0787, lr=1e-5]Steps:  79%|███████▉  | 11840/15001 [7:34:40<1:38:16,  1.87s/it, loss=0.0787, lr=1e-5]Steps:  79%|███████▉  | 11840/15001 [7:34:40<1:38:16,  1.87s/it, loss=0.349, lr=1e-5] Steps:  79%|███████▉  | 11841/15001 [7:34:42<1:36:21,  1.83s/it, loss=0.349, lr=1e-5]Steps:  79%|███████▉  | 11841/15001 [7:34:42<1:36:21,  1.83s/it, loss=0.186, lr=1e-5]Steps:  79%|███████▉  | 11842/15001 [7:34:44<1:36:55,  1.84s/it, loss=0.186, lr=1e-5]Steps:  79%|███████▉  | 11842/15001 [7:34:44<1:36:55,  1.84s/it, loss=0.0323, lr=1e-5]Steps:  79%|███████▉  | 11843/15001 [7:34:46<1:39:11,  1.88s/it, loss=0.0323, lr=1e-5]Steps:  79%|███████▉  | 11843/15001 [7:34:46<1:39:11,  1.88s/it, loss=0.126, lr=1e-5] Steps:  79%|███████▉  | 11844/15001 [7:34:48<1:36:14,  1.83s/it, loss=0.126, lr=1e-5]Steps:  79%|███████▉  | 11844/15001 [7:34:48<1:36:14,  1.83s/it, loss=0.363, lr=1e-5]Steps:  79%|███████▉  | 11845/15001 [7:34:50<1:45:57,  2.01s/it, loss=0.363, lr=1e-5]Steps:  79%|███████▉  | 11845/15001 [7:34:50<1:45:57,  2.01s/it, loss=0.117, lr=1e-5]Steps:  79%|███████▉  | 11846/15001 [7:34:52<1:44:24,  1.99s/it, loss=0.117, lr=1e-5]Steps:  79%|███████▉  | 11846/15001 [7:34:52<1:44:24,  1.99s/it, loss=0.045, lr=1e-5]Steps:  79%|███████▉  | 11847/15001 [7:34:54<1:42:26,  1.95s/it, loss=0.045, lr=1e-5]Steps:  79%|███████▉  | 11847/15001 [7:34:54<1:42:26,  1.95s/it, loss=0.153, lr=1e-5]Steps:  79%|███████▉  | 11848/15001 [7:34:56<1:45:05,  2.00s/it, loss=0.153, lr=1e-5]Steps:  79%|███████▉  | 11848/15001 [7:34:56<1:45:05,  2.00s/it, loss=0.0864, lr=1e-5]Steps:  79%|███████▉  | 11849/15001 [7:34:58<1:44:58,  2.00s/it, loss=0.0864, lr=1e-5]Steps:  79%|███████▉  | 11849/15001 [7:34:58<1:44:58,  2.00s/it, loss=0.16, lr=1e-5]  Steps:  79%|███████▉  | 11850/15001 [7:35:00<1:39:54,  1.90s/it, loss=0.16, lr=1e-5]Steps:  79%|███████▉  | 11850/15001 [7:35:00<1:39:54,  1.90s/it, loss=0.151, lr=1e-5]Steps:  79%|███████▉  | 11851/15001 [7:35:02<1:41:29,  1.93s/it, loss=0.151, lr=1e-5]Steps:  79%|███████▉  | 11851/15001 [7:35:02<1:41:29,  1.93s/it, loss=0.258, lr=1e-5]Steps:  79%|███████▉  | 11852/15001 [7:35:03<1:38:54,  1.88s/it, loss=0.258, lr=1e-5]Steps:  79%|███████▉  | 11852/15001 [7:35:04<1:38:54,  1.88s/it, loss=0.109, lr=1e-5]Steps:  79%|███████▉  | 11853/15001 [7:35:06<1:43:10,  1.97s/it, loss=0.109, lr=1e-5]Steps:  79%|███████▉  | 11853/15001 [7:35:06<1:43:10,  1.97s/it, loss=0.246, lr=1e-5]Steps:  79%|███████▉  | 11854/15001 [7:35:07<1:39:34,  1.90s/it, loss=0.246, lr=1e-5]Steps:  79%|███████▉  | 11854/15001 [7:35:07<1:39:34,  1.90s/it, loss=0.135, lr=1e-5]Steps:  79%|███████▉  | 11855/15001 [7:35:09<1:38:42,  1.88s/it, loss=0.135, lr=1e-5]Steps:  79%|███████▉  | 11855/15001 [7:35:09<1:38:42,  1.88s/it, loss=0.122, lr=1e-5]Steps:  79%|███████▉  | 11856/15001 [7:35:11<1:38:56,  1.89s/it, loss=0.122, lr=1e-5]Steps:  79%|███████▉  | 11856/15001 [7:35:11<1:38:56,  1.89s/it, loss=0.265, lr=1e-5]Steps:  79%|███████▉  | 11857/15001 [7:35:13<1:39:13,  1.89s/it, loss=0.265, lr=1e-5]Steps:  79%|███████▉  | 11857/15001 [7:35:13<1:39:13,  1.89s/it, loss=0.194, lr=1e-5]Steps:  79%|███████▉  | 11858/15001 [7:35:15<1:36:20,  1.84s/it, loss=0.194, lr=1e-5]Steps:  79%|███████▉  | 11858/15001 [7:35:15<1:36:20,  1.84s/it, loss=0.15, lr=1e-5] Steps:  79%|███████▉  | 11859/15001 [7:35:16<1:35:22,  1.82s/it, loss=0.15, lr=1e-5]Steps:  79%|███████▉  | 11859/15001 [7:35:17<1:35:22,  1.82s/it, loss=0.197, lr=1e-5]Steps:  79%|███████▉  | 11860/15001 [7:35:18<1:33:35,  1.79s/it, loss=0.197, lr=1e-5]Steps:  79%|███████▉  | 11860/15001 [7:35:18<1:33:35,  1.79s/it, loss=0.136, lr=1e-5]Steps:  79%|███████▉  | 11861/15001 [7:35:20<1:31:58,  1.76s/it, loss=0.136, lr=1e-5]Steps:  79%|███████▉  | 11861/15001 [7:35:20<1:31:58,  1.76s/it, loss=0.128, lr=1e-5]Steps:  79%|███████▉  | 11862/15001 [7:35:22<1:30:29,  1.73s/it, loss=0.128, lr=1e-5]Steps:  79%|███████▉  | 11862/15001 [7:35:22<1:30:29,  1.73s/it, loss=0.0509, lr=1e-5]Steps:  79%|███████▉  | 11863/15001 [7:35:23<1:32:57,  1.78s/it, loss=0.0509, lr=1e-5]Steps:  79%|███████▉  | 11863/15001 [7:35:24<1:32:57,  1.78s/it, loss=0.297, lr=1e-5] Steps:  79%|███████▉  | 11864/15001 [7:35:25<1:34:35,  1.81s/it, loss=0.297, lr=1e-5]Steps:  79%|███████▉  | 11864/15001 [7:35:25<1:34:35,  1.81s/it, loss=0.225, lr=1e-5]Steps:  79%|███████▉  | 11865/15001 [7:35:27<1:35:55,  1.84s/it, loss=0.225, lr=1e-5]Steps:  79%|███████▉  | 11865/15001 [7:35:27<1:35:55,  1.84s/it, loss=0.0867, lr=1e-5]Steps:  79%|███████▉  | 11866/15001 [7:35:29<1:36:50,  1.85s/it, loss=0.0867, lr=1e-5]Steps:  79%|███████▉  | 11866/15001 [7:35:29<1:36:50,  1.85s/it, loss=0.305, lr=1e-5] Steps:  79%|███████▉  | 11867/15001 [7:35:31<1:35:06,  1.82s/it, loss=0.305, lr=1e-5]Steps:  79%|███████▉  | 11867/15001 [7:35:31<1:35:06,  1.82s/it, loss=0.166, lr=1e-5]Steps:  79%|███████▉  | 11868/15001 [7:35:33<1:38:04,  1.88s/it, loss=0.166, lr=1e-5]Steps:  79%|███████▉  | 11868/15001 [7:35:33<1:38:04,  1.88s/it, loss=0.0891, lr=1e-5]Steps:  79%|███████▉  | 11869/15001 [7:35:35<1:41:57,  1.95s/it, loss=0.0891, lr=1e-5]Steps:  79%|███████▉  | 11869/15001 [7:35:35<1:41:57,  1.95s/it, loss=0.23, lr=1e-5]  Steps:  79%|███████▉  | 11870/15001 [7:35:37<1:38:06,  1.88s/it, loss=0.23, lr=1e-5]Steps:  79%|███████▉  | 11870/15001 [7:35:37<1:38:06,  1.88s/it, loss=0.136, lr=1e-5]Steps:  79%|███████▉  | 11871/15001 [7:35:39<1:41:20,  1.94s/it, loss=0.136, lr=1e-5]Steps:  79%|███████▉  | 11871/15001 [7:35:39<1:41:20,  1.94s/it, loss=0.418, lr=1e-5]Steps:  79%|███████▉  | 11872/15001 [7:35:41<1:43:09,  1.98s/it, loss=0.418, lr=1e-5]Steps:  79%|███████▉  | 11872/15001 [7:35:41<1:43:09,  1.98s/it, loss=0.147, lr=1e-5]Steps:  79%|███████▉  | 11873/15001 [7:35:43<1:42:06,  1.96s/it, loss=0.147, lr=1e-5]Steps:  79%|███████▉  | 11873/15001 [7:35:43<1:42:06,  1.96s/it, loss=0.0842, lr=1e-5]Steps:  79%|███████▉  | 11874/15001 [7:35:45<1:40:10,  1.92s/it, loss=0.0842, lr=1e-5]Steps:  79%|███████▉  | 11874/15001 [7:35:45<1:40:10,  1.92s/it, loss=0.287, lr=1e-5] Steps:  79%|███████▉  | 11875/15001 [7:35:46<1:36:04,  1.84s/it, loss=0.287, lr=1e-5]Steps:  79%|███████▉  | 11875/15001 [7:35:46<1:36:04,  1.84s/it, loss=0.0986, lr=1e-5]Steps:  79%|███████▉  | 11876/15001 [7:35:48<1:35:37,  1.84s/it, loss=0.0986, lr=1e-5]Steps:  79%|███████▉  | 11876/15001 [7:35:48<1:35:37,  1.84s/it, loss=0.0957, lr=1e-5]Steps:  79%|███████▉  | 11877/15001 [7:35:50<1:33:36,  1.80s/it, loss=0.0957, lr=1e-5]Steps:  79%|███████▉  | 11877/15001 [7:35:50<1:33:36,  1.80s/it, loss=0.187, lr=1e-5] Steps:  79%|███████▉  | 11878/15001 [7:35:52<1:34:08,  1.81s/it, loss=0.187, lr=1e-5]Steps:  79%|███████▉  | 11878/15001 [7:35:52<1:34:08,  1.81s/it, loss=0.0747, lr=1e-5]Steps:  79%|███████▉  | 11879/15001 [7:35:53<1:34:21,  1.81s/it, loss=0.0747, lr=1e-5]Steps:  79%|███████▉  | 11879/15001 [7:35:54<1:34:21,  1.81s/it, loss=0.0524, lr=1e-5]Steps:  79%|███████▉  | 11880/15001 [7:35:55<1:35:46,  1.84s/it, loss=0.0524, lr=1e-5]Steps:  79%|███████▉  | 11880/15001 [7:35:56<1:35:46,  1.84s/it, loss=0.0199, lr=1e-5]Steps:  79%|███████▉  | 11881/15001 [7:35:57<1:34:52,  1.82s/it, loss=0.0199, lr=1e-5]Steps:  79%|███████▉  | 11881/15001 [7:35:57<1:34:52,  1.82s/it, loss=0.208, lr=1e-5] Steps:  79%|███████▉  | 11882/15001 [7:35:59<1:33:20,  1.80s/it, loss=0.208, lr=1e-5]Steps:  79%|███████▉  | 11882/15001 [7:35:59<1:33:20,  1.80s/it, loss=0.192, lr=1e-5]Steps:  79%|███████▉  | 11883/15001 [7:36:01<1:31:23,  1.76s/it, loss=0.192, lr=1e-5]Steps:  79%|███████▉  | 11883/15001 [7:36:01<1:31:23,  1.76s/it, loss=0.273, lr=1e-5]Steps:  79%|███████▉  | 11884/15001 [7:36:03<1:34:38,  1.82s/it, loss=0.273, lr=1e-5]Steps:  79%|███████▉  | 11884/15001 [7:36:03<1:34:38,  1.82s/it, loss=0.109, lr=1e-5]Steps:  79%|███████▉  | 11885/15001 [7:36:04<1:34:19,  1.82s/it, loss=0.109, lr=1e-5]Steps:  79%|███████▉  | 11885/15001 [7:36:04<1:34:19,  1.82s/it, loss=0.162, lr=1e-5]Steps:  79%|███████▉  | 11886/15001 [7:36:06<1:34:17,  1.82s/it, loss=0.162, lr=1e-5]Steps:  79%|███████▉  | 11886/15001 [7:36:06<1:34:17,  1.82s/it, loss=0.337, lr=1e-5]Steps:  79%|███████▉  | 11887/15001 [7:36:08<1:32:40,  1.79s/it, loss=0.337, lr=1e-5]Steps:  79%|███████▉  | 11887/15001 [7:36:08<1:32:40,  1.79s/it, loss=0.182, lr=1e-5]Steps:  79%|███████▉  | 11888/15001 [7:36:10<1:38:38,  1.90s/it, loss=0.182, lr=1e-5]Steps:  79%|███████▉  | 11888/15001 [7:36:10<1:38:38,  1.90s/it, loss=0.164, lr=1e-5]Steps:  79%|███████▉  | 11889/15001 [7:36:12<1:37:24,  1.88s/it, loss=0.164, lr=1e-5]Steps:  79%|███████▉  | 11889/15001 [7:36:12<1:37:24,  1.88s/it, loss=0.225, lr=1e-5]Steps:  79%|███████▉  | 11890/15001 [7:36:14<1:36:56,  1.87s/it, loss=0.225, lr=1e-5]Steps:  79%|███████▉  | 11890/15001 [7:36:14<1:36:56,  1.87s/it, loss=0.28, lr=1e-5] Steps:  79%|███████▉  | 11891/15001 [7:36:16<1:42:05,  1.97s/it, loss=0.28, lr=1e-5]Steps:  79%|███████▉  | 11891/15001 [7:36:16<1:42:05,  1.97s/it, loss=0.303, lr=1e-5]Steps:  79%|███████▉  | 11892/15001 [7:36:18<1:37:43,  1.89s/it, loss=0.303, lr=1e-5]Steps:  79%|███████▉  | 11892/15001 [7:36:18<1:37:43,  1.89s/it, loss=0.188, lr=1e-5]Steps:  79%|███████▉  | 11893/15001 [7:36:20<1:42:01,  1.97s/it, loss=0.188, lr=1e-5]Steps:  79%|███████▉  | 11893/15001 [7:36:20<1:42:01,  1.97s/it, loss=0.0879, lr=1e-5]Steps:  79%|███████▉  | 11894/15001 [7:36:22<1:45:45,  2.04s/it, loss=0.0879, lr=1e-5]Steps:  79%|███████▉  | 11894/15001 [7:36:22<1:45:45,  2.04s/it, loss=0.112, lr=1e-5] Steps:  79%|███████▉  | 11895/15001 [7:36:24<1:44:30,  2.02s/it, loss=0.112, lr=1e-5]Steps:  79%|███████▉  | 11895/15001 [7:36:24<1:44:30,  2.02s/it, loss=0.122, lr=1e-5]Steps:  79%|███████▉  | 11896/15001 [7:36:26<1:43:30,  2.00s/it, loss=0.122, lr=1e-5]Steps:  79%|███████▉  | 11896/15001 [7:36:26<1:43:30,  2.00s/it, loss=0.132, lr=1e-5]Steps:  79%|███████▉  | 11897/15001 [7:36:28<1:38:51,  1.91s/it, loss=0.132, lr=1e-5]Steps:  79%|███████▉  | 11897/15001 [7:36:28<1:38:51,  1.91s/it, loss=0.187, lr=1e-5]Steps:  79%|███████▉  | 11898/15001 [7:36:29<1:35:55,  1.85s/it, loss=0.187, lr=1e-5]Steps:  79%|███████▉  | 11898/15001 [7:36:30<1:35:55,  1.85s/it, loss=0.174, lr=1e-5]Steps:  79%|███████▉  | 11899/15001 [7:36:31<1:34:05,  1.82s/it, loss=0.174, lr=1e-5]Steps:  79%|███████▉  | 11899/15001 [7:36:31<1:34:05,  1.82s/it, loss=0.155, lr=1e-5]Steps:  79%|███████▉  | 11900/15001 [7:36:33<1:33:44,  1.81s/it, loss=0.155, lr=1e-5]Steps:  79%|███████▉  | 11900/15001 [7:36:33<1:33:44,  1.81s/it, loss=0.161, lr=1e-5]Steps:  79%|███████▉  | 11901/15001 [7:36:35<1:33:29,  1.81s/it, loss=0.161, lr=1e-5]Steps:  79%|███████▉  | 11901/15001 [7:36:35<1:33:29,  1.81s/it, loss=0.174, lr=1e-5]Steps:  79%|███████▉  | 11902/15001 [7:36:36<1:32:12,  1.79s/it, loss=0.174, lr=1e-5]Steps:  79%|███████▉  | 11902/15001 [7:36:37<1:32:12,  1.79s/it, loss=0.106, lr=1e-5]Steps:  79%|███████▉  | 11903/15001 [7:36:38<1:33:49,  1.82s/it, loss=0.106, lr=1e-5]Steps:  79%|███████▉  | 11903/15001 [7:36:39<1:33:49,  1.82s/it, loss=0.129, lr=1e-5]Steps:  79%|███████▉  | 11904/15001 [7:36:40<1:35:40,  1.85s/it, loss=0.129, lr=1e-5]Steps:  79%|███████▉  | 11904/15001 [7:36:40<1:35:40,  1.85s/it, loss=0.142, lr=1e-5]Steps:  79%|███████▉  | 11905/15001 [7:36:42<1:33:49,  1.82s/it, loss=0.142, lr=1e-5]Steps:  79%|███████▉  | 11905/15001 [7:36:42<1:33:49,  1.82s/it, loss=0.144, lr=1e-5]Steps:  79%|███████▉  | 11906/15001 [7:36:44<1:39:21,  1.93s/it, loss=0.144, lr=1e-5]Steps:  79%|███████▉  | 11906/15001 [7:36:44<1:39:21,  1.93s/it, loss=0.221, lr=1e-5]Steps:  79%|███████▉  | 11907/15001 [7:36:46<1:35:08,  1.84s/it, loss=0.221, lr=1e-5]Steps:  79%|███████▉  | 11907/15001 [7:36:46<1:35:08,  1.84s/it, loss=0.116, lr=1e-5]Steps:  79%|███████▉  | 11908/15001 [7:36:48<1:34:28,  1.83s/it, loss=0.116, lr=1e-5]Steps:  79%|███████▉  | 11908/15001 [7:36:48<1:34:28,  1.83s/it, loss=0.205, lr=1e-5]Steps:  79%|███████▉  | 11909/15001 [7:36:49<1:31:13,  1.77s/it, loss=0.205, lr=1e-5]Steps:  79%|███████▉  | 11909/15001 [7:36:50<1:31:13,  1.77s/it, loss=0.0738, lr=1e-5]Steps:  79%|███████▉  | 11910/15001 [7:36:51<1:35:32,  1.85s/it, loss=0.0738, lr=1e-5]Steps:  79%|███████▉  | 11910/15001 [7:36:51<1:35:32,  1.85s/it, loss=0.0771, lr=1e-5]Steps:  79%|███████▉  | 11911/15001 [7:36:53<1:36:21,  1.87s/it, loss=0.0771, lr=1e-5]Steps:  79%|███████▉  | 11911/15001 [7:36:53<1:36:21,  1.87s/it, loss=0.142, lr=1e-5] Steps:  79%|███████▉  | 11912/15001 [7:36:55<1:33:36,  1.82s/it, loss=0.142, lr=1e-5]Steps:  79%|███████▉  | 11912/15001 [7:36:55<1:33:36,  1.82s/it, loss=0.229, lr=1e-5]Steps:  79%|███████▉  | 11913/15001 [7:36:57<1:36:37,  1.88s/it, loss=0.229, lr=1e-5]Steps:  79%|███████▉  | 11913/15001 [7:36:57<1:36:37,  1.88s/it, loss=0.116, lr=1e-5]Steps:  79%|███████▉  | 11914/15001 [7:36:59<1:35:48,  1.86s/it, loss=0.116, lr=1e-5]Steps:  79%|███████▉  | 11914/15001 [7:36:59<1:35:48,  1.86s/it, loss=0.105, lr=1e-5]Steps:  79%|███████▉  | 11915/15001 [7:37:01<1:37:30,  1.90s/it, loss=0.105, lr=1e-5]Steps:  79%|███████▉  | 11915/15001 [7:37:01<1:37:30,  1.90s/it, loss=0.117, lr=1e-5]Steps:  79%|███████▉  | 11916/15001 [7:37:03<1:38:42,  1.92s/it, loss=0.117, lr=1e-5]Steps:  79%|███████▉  | 11916/15001 [7:37:03<1:38:42,  1.92s/it, loss=0.0904, lr=1e-5]Steps:  79%|███████▉  | 11917/15001 [7:37:05<1:38:34,  1.92s/it, loss=0.0904, lr=1e-5]Steps:  79%|███████▉  | 11917/15001 [7:37:05<1:38:34,  1.92s/it, loss=0.126, lr=1e-5] Steps:  79%|███████▉  | 11918/15001 [7:37:06<1:37:45,  1.90s/it, loss=0.126, lr=1e-5]Steps:  79%|███████▉  | 11918/15001 [7:37:07<1:37:45,  1.90s/it, loss=0.133, lr=1e-5]Steps:  79%|███████▉  | 11919/15001 [7:37:08<1:38:55,  1.93s/it, loss=0.133, lr=1e-5]Steps:  79%|███████▉  | 11919/15001 [7:37:09<1:38:55,  1.93s/it, loss=0.174, lr=1e-5]Steps:  79%|███████▉  | 11920/15001 [7:37:10<1:37:29,  1.90s/it, loss=0.174, lr=1e-5]Steps:  79%|███████▉  | 11920/15001 [7:37:10<1:37:29,  1.90s/it, loss=0.162, lr=1e-5]Steps:  79%|███████▉  | 11921/15001 [7:37:12<1:35:12,  1.85s/it, loss=0.162, lr=1e-5]Steps:  79%|███████▉  | 11921/15001 [7:37:12<1:35:12,  1.85s/it, loss=0.299, lr=1e-5]Steps:  79%|███████▉  | 11922/15001 [7:37:14<1:36:31,  1.88s/it, loss=0.299, lr=1e-5]Steps:  79%|███████▉  | 11922/15001 [7:37:14<1:36:31,  1.88s/it, loss=0.23, lr=1e-5] Steps:  79%|███████▉  | 11923/15001 [7:37:16<1:35:00,  1.85s/it, loss=0.23, lr=1e-5]Steps:  79%|███████▉  | 11923/15001 [7:37:16<1:35:00,  1.85s/it, loss=0.193, lr=1e-5]Steps:  79%|███████▉  | 11924/15001 [7:37:18<1:34:33,  1.84s/it, loss=0.193, lr=1e-5]Steps:  79%|███████▉  | 11924/15001 [7:37:18<1:34:33,  1.84s/it, loss=0.403, lr=1e-5]Steps:  79%|███████▉  | 11925/15001 [7:37:19<1:33:41,  1.83s/it, loss=0.403, lr=1e-5]Steps:  79%|███████▉  | 11925/15001 [7:37:20<1:33:41,  1.83s/it, loss=0.0912, lr=1e-5]Steps:  80%|███████▉  | 11926/15001 [7:37:21<1:33:52,  1.83s/it, loss=0.0912, lr=1e-5]Steps:  80%|███████▉  | 11926/15001 [7:37:21<1:33:52,  1.83s/it, loss=0.0612, lr=1e-5]Steps:  80%|███████▉  | 11927/15001 [7:37:23<1:31:45,  1.79s/it, loss=0.0612, lr=1e-5]Steps:  80%|███████▉  | 11927/15001 [7:37:23<1:31:45,  1.79s/it, loss=0.0253, lr=1e-5]Steps:  80%|███████▉  | 11928/15001 [7:37:25<1:33:08,  1.82s/it, loss=0.0253, lr=1e-5]Steps:  80%|███████▉  | 11928/15001 [7:37:25<1:33:08,  1.82s/it, loss=0.198, lr=1e-5] Steps:  80%|███████▉  | 11929/15001 [7:37:27<1:34:41,  1.85s/it, loss=0.198, lr=1e-5]Steps:  80%|███████▉  | 11929/15001 [7:37:27<1:34:41,  1.85s/it, loss=0.275, lr=1e-5]Steps:  80%|███████▉  | 11930/15001 [7:37:28<1:32:53,  1.81s/it, loss=0.275, lr=1e-5]Steps:  80%|███████▉  | 11930/15001 [7:37:29<1:32:53,  1.81s/it, loss=0.108, lr=1e-5]Steps:  80%|███████▉  | 11931/15001 [7:37:30<1:29:19,  1.75s/it, loss=0.108, lr=1e-5]Steps:  80%|███████▉  | 11931/15001 [7:37:30<1:29:19,  1.75s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11932/15001 [7:37:32<1:34:27,  1.85s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11932/15001 [7:37:32<1:34:27,  1.85s/it, loss=0.178, lr=1e-5]Steps:  80%|███████▉  | 11933/15001 [7:37:34<1:32:26,  1.81s/it, loss=0.178, lr=1e-5]Steps:  80%|███████▉  | 11933/15001 [7:37:34<1:32:26,  1.81s/it, loss=0.214, lr=1e-5]Steps:  80%|███████▉  | 11934/15001 [7:37:36<1:35:23,  1.87s/it, loss=0.214, lr=1e-5]Steps:  80%|███████▉  | 11934/15001 [7:37:36<1:35:23,  1.87s/it, loss=0.099, lr=1e-5]Steps:  80%|███████▉  | 11935/15001 [7:37:37<1:32:25,  1.81s/it, loss=0.099, lr=1e-5]Steps:  80%|███████▉  | 11935/15001 [7:37:38<1:32:25,  1.81s/it, loss=0.0913, lr=1e-5]Steps:  80%|███████▉  | 11936/15001 [7:37:40<1:36:35,  1.89s/it, loss=0.0913, lr=1e-5]Steps:  80%|███████▉  | 11936/15001 [7:37:40<1:36:35,  1.89s/it, loss=0.0937, lr=1e-5]Steps:  80%|███████▉  | 11937/15001 [7:37:42<1:38:10,  1.92s/it, loss=0.0937, lr=1e-5]Steps:  80%|███████▉  | 11937/15001 [7:37:42<1:38:10,  1.92s/it, loss=0.239, lr=1e-5] Steps:  80%|███████▉  | 11938/15001 [7:37:44<1:40:47,  1.97s/it, loss=0.239, lr=1e-5]Steps:  80%|███████▉  | 11938/15001 [7:37:44<1:40:47,  1.97s/it, loss=0.105, lr=1e-5]Steps:  80%|███████▉  | 11939/15001 [7:37:46<1:40:11,  1.96s/it, loss=0.105, lr=1e-5]Steps:  80%|███████▉  | 11939/15001 [7:37:46<1:40:11,  1.96s/it, loss=0.181, lr=1e-5]Steps:  80%|███████▉  | 11940/15001 [7:37:47<1:37:46,  1.92s/it, loss=0.181, lr=1e-5]Steps:  80%|███████▉  | 11940/15001 [7:37:48<1:37:46,  1.92s/it, loss=0.235, lr=1e-5]Steps:  80%|███████▉  | 11941/15001 [7:37:50<1:42:36,  2.01s/it, loss=0.235, lr=1e-5]Steps:  80%|███████▉  | 11941/15001 [7:37:50<1:42:36,  2.01s/it, loss=0.175, lr=1e-5]Steps:  80%|███████▉  | 11942/15001 [7:37:51<1:37:35,  1.91s/it, loss=0.175, lr=1e-5]Steps:  80%|███████▉  | 11942/15001 [7:37:51<1:37:35,  1.91s/it, loss=0.187, lr=1e-5]Steps:  80%|███████▉  | 11943/15001 [7:37:53<1:34:24,  1.85s/it, loss=0.187, lr=1e-5]Steps:  80%|███████▉  | 11943/15001 [7:37:53<1:34:24,  1.85s/it, loss=0.342, lr=1e-5]Steps:  80%|███████▉  | 11944/15001 [7:37:55<1:34:55,  1.86s/it, loss=0.342, lr=1e-5]Steps:  80%|███████▉  | 11944/15001 [7:37:55<1:34:55,  1.86s/it, loss=0.0968, lr=1e-5]Steps:  80%|███████▉  | 11945/15001 [7:37:57<1:36:04,  1.89s/it, loss=0.0968, lr=1e-5]Steps:  80%|███████▉  | 11945/15001 [7:37:57<1:36:04,  1.89s/it, loss=0.117, lr=1e-5] Steps:  80%|███████▉  | 11946/15001 [7:37:59<1:32:49,  1.82s/it, loss=0.117, lr=1e-5]Steps:  80%|███████▉  | 11946/15001 [7:37:59<1:32:49,  1.82s/it, loss=0.193, lr=1e-5]Steps:  80%|███████▉  | 11947/15001 [7:38:00<1:31:24,  1.80s/it, loss=0.193, lr=1e-5]Steps:  80%|███████▉  | 11947/15001 [7:38:01<1:31:24,  1.80s/it, loss=0.238, lr=1e-5]Steps:  80%|███████▉  | 11948/15001 [7:38:02<1:36:57,  1.91s/it, loss=0.238, lr=1e-5]Steps:  80%|███████▉  | 11948/15001 [7:38:02<1:36:57,  1.91s/it, loss=0.163, lr=1e-5]Steps:  80%|███████▉  | 11949/15001 [7:38:04<1:36:06,  1.89s/it, loss=0.163, lr=1e-5]Steps:  80%|███████▉  | 11949/15001 [7:38:04<1:36:06,  1.89s/it, loss=0.173, lr=1e-5]Steps:  80%|███████▉  | 11950/15001 [7:38:06<1:28:52,  1.75s/it, loss=0.173, lr=1e-5]Steps:  80%|███████▉  | 11950/15001 [7:38:06<1:28:52,  1.75s/it, loss=0.206, lr=1e-5]Steps:  80%|███████▉  | 11951/15001 [7:38:08<1:30:41,  1.78s/it, loss=0.206, lr=1e-5]Steps:  80%|███████▉  | 11951/15001 [7:38:08<1:30:41,  1.78s/it, loss=0.0903, lr=1e-5]Steps:  80%|███████▉  | 11952/15001 [7:38:10<1:36:19,  1.90s/it, loss=0.0903, lr=1e-5]Steps:  80%|███████▉  | 11952/15001 [7:38:10<1:36:19,  1.90s/it, loss=0.179, lr=1e-5] Steps:  80%|███████▉  | 11953/15001 [7:38:11<1:32:08,  1.81s/it, loss=0.179, lr=1e-5]Steps:  80%|███████▉  | 11953/15001 [7:38:12<1:32:08,  1.81s/it, loss=0.298, lr=1e-5]Steps:  80%|███████▉  | 11954/15001 [7:38:13<1:31:35,  1.80s/it, loss=0.298, lr=1e-5]Steps:  80%|███████▉  | 11954/15001 [7:38:13<1:31:35,  1.80s/it, loss=0.208, lr=1e-5]Steps:  80%|███████▉  | 11955/15001 [7:38:15<1:32:26,  1.82s/it, loss=0.208, lr=1e-5]Steps:  80%|███████▉  | 11955/15001 [7:38:15<1:32:26,  1.82s/it, loss=0.148, lr=1e-5]Steps:  80%|███████▉  | 11956/15001 [7:38:17<1:33:52,  1.85s/it, loss=0.148, lr=1e-5]Steps:  80%|███████▉  | 11956/15001 [7:38:17<1:33:52,  1.85s/it, loss=0.122, lr=1e-5]Steps:  80%|███████▉  | 11957/15001 [7:38:19<1:39:26,  1.96s/it, loss=0.122, lr=1e-5]Steps:  80%|███████▉  | 11957/15001 [7:38:19<1:39:26,  1.96s/it, loss=0.222, lr=1e-5]Steps:  80%|███████▉  | 11958/15001 [7:38:21<1:38:40,  1.95s/it, loss=0.222, lr=1e-5]Steps:  80%|███████▉  | 11958/15001 [7:38:21<1:38:40,  1.95s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11959/15001 [7:38:23<1:38:09,  1.94s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11959/15001 [7:38:23<1:38:09,  1.94s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11960/15001 [7:38:25<1:33:48,  1.85s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11960/15001 [7:38:25<1:33:48,  1.85s/it, loss=0.143, lr=1e-5]Steps:  80%|███████▉  | 11961/15001 [7:38:27<1:40:32,  1.98s/it, loss=0.143, lr=1e-5]Steps:  80%|███████▉  | 11961/15001 [7:38:27<1:40:32,  1.98s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11962/15001 [7:38:29<1:42:11,  2.02s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11962/15001 [7:38:29<1:42:11,  2.02s/it, loss=0.0508, lr=1e-5]Steps:  80%|███████▉  | 11963/15001 [7:38:31<1:39:03,  1.96s/it, loss=0.0508, lr=1e-5]Steps:  80%|███████▉  | 11963/15001 [7:38:31<1:39:03,  1.96s/it, loss=0.223, lr=1e-5] Steps:  80%|███████▉  | 11964/15001 [7:38:33<1:40:40,  1.99s/it, loss=0.223, lr=1e-5]Steps:  80%|███████▉  | 11964/15001 [7:38:33<1:40:40,  1.99s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11965/15001 [7:38:34<1:33:03,  1.84s/it, loss=0.169, lr=1e-5]Steps:  80%|███████▉  | 11965/15001 [7:38:35<1:33:03,  1.84s/it, loss=0.226, lr=1e-5]Steps:  80%|███████▉  | 11966/15001 [7:38:36<1:31:30,  1.81s/it, loss=0.226, lr=1e-5]Steps:  80%|███████▉  | 11966/15001 [7:38:37<1:31:30,  1.81s/it, loss=0.246, lr=1e-5]Steps:  80%|███████▉  | 11967/15001 [7:38:38<1:32:43,  1.83s/it, loss=0.246, lr=1e-5]Steps:  80%|███████▉  | 11967/15001 [7:38:38<1:32:43,  1.83s/it, loss=0.217, lr=1e-5]Steps:  80%|███████▉  | 11968/15001 [7:38:40<1:37:00,  1.92s/it, loss=0.217, lr=1e-5]Steps:  80%|███████▉  | 11968/15001 [7:38:40<1:37:00,  1.92s/it, loss=0.167, lr=1e-5]Steps:  80%|███████▉  | 11969/15001 [7:38:42<1:34:00,  1.86s/it, loss=0.167, lr=1e-5]Steps:  80%|███████▉  | 11969/15001 [7:38:42<1:34:00,  1.86s/it, loss=0.303, lr=1e-5]Steps:  80%|███████▉  | 11970/15001 [7:38:44<1:32:14,  1.83s/it, loss=0.303, lr=1e-5]Steps:  80%|███████▉  | 11970/15001 [7:38:44<1:32:14,  1.83s/it, loss=0.118, lr=1e-5]Steps:  80%|███████▉  | 11971/15001 [7:38:46<1:35:27,  1.89s/it, loss=0.118, lr=1e-5]Steps:  80%|███████▉  | 11971/15001 [7:38:46<1:35:27,  1.89s/it, loss=0.406, lr=1e-5]Steps:  80%|███████▉  | 11972/15001 [7:38:47<1:33:11,  1.85s/it, loss=0.406, lr=1e-5]Steps:  80%|███████▉  | 11972/15001 [7:38:47<1:33:11,  1.85s/it, loss=0.0963, lr=1e-5]Steps:  80%|███████▉  | 11973/15001 [7:38:49<1:32:41,  1.84s/it, loss=0.0963, lr=1e-5]Steps:  80%|███████▉  | 11973/15001 [7:38:49<1:32:41,  1.84s/it, loss=0.0563, lr=1e-5]Steps:  80%|███████▉  | 11974/15001 [7:38:51<1:33:38,  1.86s/it, loss=0.0563, lr=1e-5]Steps:  80%|███████▉  | 11974/15001 [7:38:51<1:33:38,  1.86s/it, loss=0.047, lr=1e-5] Steps:  80%|███████▉  | 11975/15001 [7:38:53<1:32:18,  1.83s/it, loss=0.047, lr=1e-5]Steps:  80%|███████▉  | 11975/15001 [7:38:53<1:32:18,  1.83s/it, loss=0.109, lr=1e-5]Steps:  80%|███████▉  | 11976/15001 [7:38:54<1:29:01,  1.77s/it, loss=0.109, lr=1e-5]Steps:  80%|███████▉  | 11976/15001 [7:38:55<1:29:01,  1.77s/it, loss=0.153, lr=1e-5]Steps:  80%|███████▉  | 11977/15001 [7:38:56<1:32:20,  1.83s/it, loss=0.153, lr=1e-5]Steps:  80%|███████▉  | 11977/15001 [7:38:57<1:32:20,  1.83s/it, loss=0.118, lr=1e-5]Steps:  80%|███████▉  | 11978/15001 [7:38:58<1:31:26,  1.82s/it, loss=0.118, lr=1e-5]Steps:  80%|███████▉  | 11978/15001 [7:38:58<1:31:26,  1.82s/it, loss=0.162, lr=1e-5]Steps:  80%|███████▉  | 11979/15001 [7:39:00<1:29:19,  1.77s/it, loss=0.162, lr=1e-5]Steps:  80%|███████▉  | 11979/15001 [7:39:00<1:29:19,  1.77s/it, loss=0.263, lr=1e-5]Steps:  80%|███████▉  | 11980/15001 [7:39:02<1:30:45,  1.80s/it, loss=0.263, lr=1e-5]Steps:  80%|███████▉  | 11980/15001 [7:39:02<1:30:45,  1.80s/it, loss=0.217, lr=1e-5]Steps:  80%|███████▉  | 11981/15001 [7:39:04<1:33:20,  1.85s/it, loss=0.217, lr=1e-5]Steps:  80%|███████▉  | 11981/15001 [7:39:04<1:33:20,  1.85s/it, loss=0.179, lr=1e-5]Steps:  80%|███████▉  | 11982/15001 [7:39:06<1:32:43,  1.84s/it, loss=0.179, lr=1e-5]Steps:  80%|███████▉  | 11982/15001 [7:39:06<1:32:43,  1.84s/it, loss=0.302, lr=1e-5]Steps:  80%|███████▉  | 11983/15001 [7:39:08<1:40:07,  1.99s/it, loss=0.302, lr=1e-5]Steps:  80%|███████▉  | 11983/15001 [7:39:08<1:40:07,  1.99s/it, loss=0.168, lr=1e-5]Steps:  80%|███████▉  | 11984/15001 [7:39:10<1:40:34,  2.00s/it, loss=0.168, lr=1e-5]Steps:  80%|███████▉  | 11984/15001 [7:39:10<1:40:34,  2.00s/it, loss=0.185, lr=1e-5]Steps:  80%|███████▉  | 11985/15001 [7:39:12<1:39:32,  1.98s/it, loss=0.185, lr=1e-5]Steps:  80%|███████▉  | 11985/15001 [7:39:12<1:39:32,  1.98s/it, loss=0.191, lr=1e-5]Steps:  80%|███████▉  | 11986/15001 [7:39:14<1:40:28,  2.00s/it, loss=0.191, lr=1e-5]Steps:  80%|███████▉  | 11986/15001 [7:39:14<1:40:28,  2.00s/it, loss=0.0908, lr=1e-5]Steps:  80%|███████▉  | 11987/15001 [7:39:16<1:40:31,  2.00s/it, loss=0.0908, lr=1e-5]Steps:  80%|███████▉  | 11987/15001 [7:39:16<1:40:31,  2.00s/it, loss=0.249, lr=1e-5] Steps:  80%|███████▉  | 11988/15001 [7:39:18<1:36:48,  1.93s/it, loss=0.249, lr=1e-5]Steps:  80%|███████▉  | 11988/15001 [7:39:18<1:36:48,  1.93s/it, loss=0.167, lr=1e-5]Steps:  80%|███████▉  | 11989/15001 [7:39:20<1:38:37,  1.96s/it, loss=0.167, lr=1e-5]Steps:  80%|███████▉  | 11989/15001 [7:39:20<1:38:37,  1.96s/it, loss=0.115, lr=1e-5]Steps:  80%|███████▉  | 11990/15001 [7:39:21<1:32:53,  1.85s/it, loss=0.115, lr=1e-5]Steps:  80%|███████▉  | 11990/15001 [7:39:21<1:32:53,  1.85s/it, loss=0.18, lr=1e-5] Steps:  80%|███████▉  | 11991/15001 [7:39:23<1:30:10,  1.80s/it, loss=0.18, lr=1e-5]Steps:  80%|███████▉  | 11991/15001 [7:39:23<1:30:10,  1.80s/it, loss=0.267, lr=1e-5]Steps:  80%|███████▉  | 11992/15001 [7:39:25<1:31:57,  1.83s/it, loss=0.267, lr=1e-5]Steps:  80%|███████▉  | 11992/15001 [7:39:25<1:31:57,  1.83s/it, loss=0.254, lr=1e-5]Steps:  80%|███████▉  | 11993/15001 [7:39:27<1:31:06,  1.82s/it, loss=0.254, lr=1e-5]Steps:  80%|███████▉  | 11993/15001 [7:39:27<1:31:06,  1.82s/it, loss=0.226, lr=1e-5]Steps:  80%|███████▉  | 11994/15001 [7:39:28<1:30:19,  1.80s/it, loss=0.226, lr=1e-5]Steps:  80%|███████▉  | 11994/15001 [7:39:29<1:30:19,  1.80s/it, loss=0.226, lr=1e-5]Steps:  80%|███████▉  | 11995/15001 [7:39:30<1:26:42,  1.73s/it, loss=0.226, lr=1e-5]Steps:  80%|███████▉  | 11995/15001 [7:39:30<1:26:42,  1.73s/it, loss=0.0258, lr=1e-5]Steps:  80%|███████▉  | 11996/15001 [7:39:32<1:29:43,  1.79s/it, loss=0.0258, lr=1e-5]Steps:  80%|███████▉  | 11996/15001 [7:39:32<1:29:43,  1.79s/it, loss=0.196, lr=1e-5] Steps:  80%|███████▉  | 11997/15001 [7:39:34<1:31:36,  1.83s/it, loss=0.196, lr=1e-5]Steps:  80%|███████▉  | 11997/15001 [7:39:34<1:31:36,  1.83s/it, loss=0.17, lr=1e-5] Steps:  80%|███████▉  | 11998/15001 [7:39:35<1:28:50,  1.78s/it, loss=0.17, lr=1e-5]Steps:  80%|███████▉  | 11998/15001 [7:39:36<1:28:50,  1.78s/it, loss=0.165, lr=1e-5]Steps:  80%|███████▉  | 11999/15001 [7:39:37<1:27:00,  1.74s/it, loss=0.165, lr=1e-5]Steps:  80%|███████▉  | 11999/15001 [7:39:38<1:27:00,  1.74s/it, loss=0.0565, lr=1e-5]Steps:  80%|███████▉  | 12000/15001 [7:39:39<1:28:28,  1.77s/it, loss=0.0565, lr=1e-5]02/04/2024 20:41:58 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 441.37it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  80%|███████▉  | 12000/15001 [7:43:19<1:28:28,  1.77s/it, loss=0.149, lr=1e-5] Steps:  80%|████████  | 12001/15001 [7:43:20<56:23:35, 67.67s/it, loss=0.149, lr=1e-5]Steps:  80%|████████  | 12001/15001 [7:43:21<56:23:35, 67.67s/it, loss=0.0666, lr=1e-5]Steps:  80%|████████  | 12002/15001 [7:43:22<39:51:44, 47.85s/it, loss=0.0666, lr=1e-5]Steps:  80%|████████  | 12002/15001 [7:43:22<39:51:44, 47.85s/it, loss=0.169, lr=1e-5] Steps:  80%|████████  | 12003/15001 [7:43:24<28:19:32, 34.01s/it, loss=0.169, lr=1e-5]Steps:  80%|████████  | 12003/15001 [7:43:24<28:19:32, 34.01s/it, loss=0.278, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  80%|████████  | 12004/15001 [7:43:26<20:21:42, 24.46s/it, loss=0.278, lr=1e-5]Steps:  80%|████████  | 12004/15001 [7:43:26<20:21:42, 24.46s/it, loss=0.039, lr=1e-5]Steps:  80%|████████  | 12005/15001 [7:43:28<14:42:21, 17.67s/it, loss=0.039, lr=1e-5]Steps:  80%|████████  | 12005/15001 [7:43:28<14:42:21, 17.67s/it, loss=0.0934, lr=1e-5]Steps:  80%|████████  | 12006/15001 [7:43:29<10:43:19, 12.89s/it, loss=0.0934, lr=1e-5]Steps:  80%|████████  | 12006/15001 [7:43:30<10:43:19, 12.89s/it, loss=0.0356, lr=1e-5]Steps:  80%|████████  | 12007/15001 [7:43:31<7:56:09,  9.54s/it, loss=0.0356, lr=1e-5] Steps:  80%|████████  | 12007/15001 [7:43:31<7:56:09,  9.54s/it, loss=0.0449, lr=1e-5]Steps:  80%|████████  | 12008/15001 [7:43:33<6:03:11,  7.28s/it, loss=0.0449, lr=1e-5]Steps:  80%|████████  | 12008/15001 [7:43:33<6:03:11,  7.28s/it, loss=0.108, lr=1e-5] Steps:  80%|████████  | 12009/15001 [7:43:35<4:39:19,  5.60s/it, loss=0.108, lr=1e-5]Steps:  80%|████████  | 12009/15001 [7:43:35<4:39:19,  5.60s/it, loss=0.202, lr=1e-5]Steps:  80%|████████  | 12010/15001 [7:43:37<3:42:34,  4.46s/it, loss=0.202, lr=1e-5]Steps:  80%|████████  | 12010/15001 [7:43:37<3:42:34,  4.46s/it, loss=0.0907, lr=1e-5]Steps:  80%|████████  | 12011/15001 [7:43:38<3:00:20,  3.62s/it, loss=0.0907, lr=1e-5]Steps:  80%|████████  | 12011/15001 [7:43:39<3:00:20,  3.62s/it, loss=0.286, lr=1e-5] Steps:  80%|████████  | 12012/15001 [7:43:40<2:35:58,  3.13s/it, loss=0.286, lr=1e-5]Steps:  80%|████████  | 12012/15001 [7:43:41<2:35:58,  3.13s/it, loss=0.228, lr=1e-5]Steps:  80%|████████  | 12013/15001 [7:43:43<2:21:10,  2.84s/it, loss=0.228, lr=1e-5]Steps:  80%|████████  | 12013/15001 [7:43:43<2:21:10,  2.84s/it, loss=0.184, lr=1e-5]Steps:  80%|████████  | 12014/15001 [7:43:45<2:08:43,  2.59s/it, loss=0.184, lr=1e-5]Steps:  80%|████████  | 12014/15001 [7:43:45<2:08:43,  2.59s/it, loss=0.302, lr=1e-5]Steps:  80%|████████  | 12015/15001 [7:43:46<1:58:44,  2.39s/it, loss=0.302, lr=1e-5]Steps:  80%|████████  | 12015/15001 [7:43:47<1:58:44,  2.39s/it, loss=0.246, lr=1e-5]Steps:  80%|████████  | 12016/15001 [7:43:48<1:51:12,  2.24s/it, loss=0.246, lr=1e-5]Steps:  80%|████████  | 12016/15001 [7:43:49<1:51:12,  2.24s/it, loss=0.247, lr=1e-5]Steps:  80%|████████  | 12017/15001 [7:43:50<1:49:22,  2.20s/it, loss=0.247, lr=1e-5]Steps:  80%|████████  | 12017/15001 [7:43:51<1:49:22,  2.20s/it, loss=0.221, lr=1e-5]Steps:  80%|████████  | 12018/15001 [7:43:52<1:46:20,  2.14s/it, loss=0.221, lr=1e-5]Steps:  80%|████████  | 12018/15001 [7:43:52<1:46:20,  2.14s/it, loss=0.139, lr=1e-5]Steps:  80%|████████  | 12019/15001 [7:43:54<1:39:50,  2.01s/it, loss=0.139, lr=1e-5]Steps:  80%|█���██████  | 12019/15001 [7:43:54<1:39:50,  2.01s/it, loss=0.0572, lr=1e-5]Steps:  80%|████████  | 12020/15001 [7:43:56<1:40:13,  2.02s/it, loss=0.0572, lr=1e-5]Steps:  80%|████████  | 12020/15001 [7:43:56<1:40:13,  2.02s/it, loss=0.274, lr=1e-5] Steps:  80%|████████  | 12021/15001 [7:43:58<1:34:40,  1.91s/it, loss=0.274, lr=1e-5]Steps:  80%|████████  | 12021/15001 [7:43:58<1:34:40,  1.91s/it, loss=0.0814, lr=1e-5]Steps:  80%|████████  | 12022/15001 [7:44:00<1:33:48,  1.89s/it, loss=0.0814, lr=1e-5]Steps:  80%|████████  | 12022/15001 [7:44:00<1:33:48,  1.89s/it, loss=0.369, lr=1e-5] Steps:  80%|████████  | 12023/15001 [7:44:02<1:34:49,  1.91s/it, loss=0.369, lr=1e-5]Steps:  80%|████████  | 12023/15001 [7:44:02<1:34:49,  1.91s/it, loss=0.29, lr=1e-5] Steps:  80%|████████  | 12024/15001 [7:44:03<1:31:19,  1.84s/it, loss=0.29, lr=1e-5]Steps:  80%|████████  | 12024/15001 [7:44:04<1:31:19,  1.84s/it, loss=0.0622, lr=1e-5]Steps:  80%|████████  | 12025/15001 [7:44:05<1:29:15,  1.80s/it, loss=0.0622, lr=1e-5]Steps:  80%|████████  | 12025/15001 [7:44:05<1:29:15,  1.80s/it, loss=0.2, lr=1e-5]   Steps:  80%|████████  | 12026/15001 [7:44:07<1:30:41,  1.83s/it, loss=0.2, lr=1e-5]Steps:  80%|████████  | 12026/15001 [7:44:07<1:30:41,  1.83s/it, loss=0.162, lr=1e-5]Steps:  80%|████████  | 12027/15001 [7:44:09<1:33:02,  1.88s/it, loss=0.162, lr=1e-5]Steps:  80%|████████  | 12027/15001 [7:44:09<1:33:02,  1.88s/it, loss=0.226, lr=1e-5]Steps:  80%|████████  | 12028/15001 [7:44:11<1:31:38,  1.85s/it, loss=0.226, lr=1e-5]Steps:  80%|████████  | 12028/15001 [7:44:11<1:31:38,  1.85s/it, loss=0.15, lr=1e-5] Steps:  80%|████████  | 12029/15001 [7:44:13<1:33:19,  1.88s/it, loss=0.15, lr=1e-5]Steps:  80%|████████  | 12029/15001 [7:44:13<1:33:19,  1.88s/it, loss=0.166, lr=1e-5]Steps:  80%|████████  | 12030/15001 [7:44:14<1:29:54,  1.82s/it, loss=0.166, lr=1e-5]Steps:  80%|████████  | 12030/15001 [7:44:15<1:29:54,  1.82s/it, loss=0.389, lr=1e-5]Steps:  80%|████████  | 12031/15001 [7:44:16<1:32:33,  1.87s/it, loss=0.389, lr=1e-5]Steps:  80%|████████  | 12031/15001 [7:44:16<1:32:33,  1.87s/it, loss=0.252, lr=1e-5]Steps:  80%|████████  | 12032/15001 [7:44:18<1:31:31,  1.85s/it, loss=0.252, lr=1e-5]Steps:  80%|████████  | 12032/15001 [7:44:18<1:31:31,  1.85s/it, loss=0.131, lr=1e-5]Steps:  80%|████████  | 12033/15001 [7:44:20<1:31:54,  1.86s/it, loss=0.131, lr=1e-5]Steps:  80%|████████  | 12033/15001 [7:44:20<1:31:54,  1.86s/it, loss=0.127, lr=1e-5]Steps:  80%|████████  | 12034/15001 [7:44:22<1:30:11,  1.82s/it, loss=0.127, lr=1e-5]Steps:  80%|████████  | 12034/15001 [7:44:22<1:30:11,  1.82s/it, loss=0.094, lr=1e-5]Steps:  80%|████████  | 12035/15001 [7:44:24<1:31:28,  1.85s/it, loss=0.094, lr=1e-5]Steps:  80%|████████  | 12035/15001 [7:44:24<1:31:28,  1.85s/it, loss=0.16, lr=1e-5] Steps:  80%|████████  | 12036/15001 [7:44:26<1:32:17,  1.87s/it, loss=0.16, lr=1e-5]Steps:  80%|████████  | 12036/15001 [7:44:26<1:32:17,  1.87s/it, loss=0.224, lr=1e-5]Steps:  80%|████████  | 12037/15001 [7:44:28<1:33:35,  1.89s/it, loss=0.224, lr=1e-5]Steps:  80%|████████  | 12037/15001 [7:44:28<1:33:35,  1.89s/it, loss=0.0518, lr=1e-5]Steps:  80%|████████  | 12038/15001 [7:44:30<1:35:36,  1.94s/it, loss=0.0518, lr=1e-5]Steps:  80%|████████  | 12038/15001 [7:44:30<1:35:36,  1.94s/it, loss=0.142, lr=1e-5] Steps:  80%|████████  | 12039/15001 [7:44:31<1:33:08,  1.89s/it, loss=0.142, lr=1e-5]Steps:  80%|████████  | 12039/15001 [7:44:32<1:33:08,  1.89s/it, loss=0.0227, lr=1e-5]Steps:  80%|████████  | 12040/15001 [7:44:33<1:34:18,  1.91s/it, loss=0.0227, lr=1e-5]Steps:  80%|████████  | 12040/15001 [7:44:34<1:34:18,  1.91s/it, loss=0.182, lr=1e-5] Steps:  80%|████████  | 12041/15001 [7:44:36<1:40:39,  2.04s/it, loss=0.182, lr=1e-5]Steps:  80%|████████  | 12041/15001 [7:44:36<1:40:39,  2.04s/it, loss=0.131, lr=1e-5]Steps:  80%|████████  | 12042/15001 [7:44:37<1:37:01,  1.97s/it, loss=0.131, lr=1e-5]Steps:  80%|████████  | 12042/15001 [7:44:38<1:37:01,  1.97s/it, loss=0.138, lr=1e-5]Steps:  80%|████████  | 12043/15001 [7:44:39<1:35:20,  1.93s/it, loss=0.138, lr=1e-5]Steps:  80%|████████  | 12043/15001 [7:44:39<1:35:20,  1.93s/it, loss=0.102, lr=1e-5]Steps:  80%|████████  | 12044/15001 [7:44:41<1:33:01,  1.89s/it, loss=0.102, lr=1e-5]Steps:  80%|████��███  | 12044/15001 [7:44:41<1:33:01,  1.89s/it, loss=0.193, lr=1e-5]Steps:  80%|████████  | 12045/15001 [7:44:43<1:31:26,  1.86s/it, loss=0.193, lr=1e-5]Steps:  80%|████████  | 12045/15001 [7:44:43<1:31:26,  1.86s/it, loss=0.179, lr=1e-5]Steps:  80%|████████  | 12046/15001 [7:44:45<1:31:45,  1.86s/it, loss=0.179, lr=1e-5]Steps:  80%|████████  | 12046/15001 [7:44:45<1:31:45,  1.86s/it, loss=0.273, lr=1e-5]Steps:  80%|████████  | 12047/15001 [7:44:47<1:31:03,  1.85s/it, loss=0.273, lr=1e-5]Steps:  80%|████████  | 12047/15001 [7:44:47<1:31:03,  1.85s/it, loss=0.171, lr=1e-5]Steps:  80%|████████  | 12048/15001 [7:44:48<1:30:26,  1.84s/it, loss=0.171, lr=1e-5]Steps:  80%|████████  | 12048/15001 [7:44:48<1:30:26,  1.84s/it, loss=0.0971, lr=1e-5]Steps:  80%|████████  | 12049/15001 [7:44:50<1:30:22,  1.84s/it, loss=0.0971, lr=1e-5]Steps:  80%|████████  | 12049/15001 [7:44:50<1:30:22,  1.84s/it, loss=0.113, lr=1e-5] Steps:  80%|████████  | 12050/15001 [7:44:52<1:30:22,  1.84s/it, loss=0.113, lr=1e-5]Steps:  80%|████████  | 12050/15001 [7:44:52<1:30:22,  1.84s/it, loss=0.248, lr=1e-5]Steps:  80%|████████  | 12051/15001 [7:44:54<1:30:28,  1.84s/it, loss=0.248, lr=1e-5]Steps:  80%|████████  | 12051/15001 [7:44:54<1:30:28,  1.84s/it, loss=0.183, lr=1e-5]Steps:  80%|████████  | 12052/15001 [7:44:56<1:30:40,  1.84s/it, loss=0.183, lr=1e-5]Steps:  80%|████████  | 12052/15001 [7:44:56<1:30:40,  1.84s/it, loss=0.173, lr=1e-5]Steps:  80%|████████  | 12053/15001 [7:44:57<1:27:18,  1.78s/it, loss=0.173, lr=1e-5]Steps:  80%|████████  | 12053/15001 [7:44:58<1:27:18,  1.78s/it, loss=0.0509, lr=1e-5]Steps:  80%|████████  | 12054/15001 [7:44:59<1:29:39,  1.83s/it, loss=0.0509, lr=1e-5]Steps:  80%|████████  | 12054/15001 [7:44:59<1:29:39,  1.83s/it, loss=0.193, lr=1e-5] Steps:  80%|████████  | 12055/15001 [7:45:01<1:27:52,  1.79s/it, loss=0.193, lr=1e-5]Steps:  80%|████████  | 12055/15001 [7:45:01<1:27:52,  1.79s/it, loss=0.199, lr=1e-5]Steps:  80%|████████  | 12056/15001 [7:45:03<1:28:51,  1.81s/it, loss=0.199, lr=1e-5]Steps:  80%|████████  | 12056/15001 [7:45:03<1:28:51,  1.81s/it, loss=0.233, lr=1e-5]Steps:  80%|████████  | 12057/15001 [7:45:05<1:29:20,  1.82s/it, loss=0.233, lr=1e-5]Steps:  80%|████████  | 12057/15001 [7:45:05<1:29:20,  1.82s/it, loss=0.174, lr=1e-5]Steps:  80%|████████  | 12058/15001 [7:45:07<1:30:55,  1.85s/it, loss=0.174, lr=1e-5]Steps:  80%|████████  | 12058/15001 [7:45:07<1:30:55,  1.85s/it, loss=0.0491, lr=1e-5]Steps:  80%|████████  | 12059/15001 [7:45:09<1:31:45,  1.87s/it, loss=0.0491, lr=1e-5]Steps:  80%|████████  | 12059/15001 [7:45:09<1:31:45,  1.87s/it, loss=0.173, lr=1e-5] Steps:  80%|████████  | 12060/15001 [7:45:11<1:33:49,  1.91s/it, loss=0.173, lr=1e-5]Steps:  80%|████████  | 12060/15001 [7:45:11<1:33:49,  1.91s/it, loss=0.152, lr=1e-5]Steps:  80%|████████  | 12061/15001 [7:45:13<1:36:02,  1.96s/it, loss=0.152, lr=1e-5]Steps:  80%|████████  | 12061/15001 [7:45:13<1:36:02,  1.96s/it, loss=0.169, lr=1e-5]Steps:  80%|████████  | 12062/15001 [7:45:15<1:36:13,  1.96s/it, loss=0.169, lr=1e-5]Steps:  80%|████████  | 12062/15001 [7:45:15<1:36:13,  1.96s/it, loss=0.177, lr=1e-5]Steps:  80%|████████  | 12063/15001 [7:45:17<1:36:27,  1.97s/it, loss=0.177, lr=1e-5]Steps:  80%|████████  | 12063/15001 [7:45:17<1:36:27,  1.97s/it, loss=0.315, lr=1e-5]Steps:  80%|████████  | 12064/15001 [7:45:18<1:33:25,  1.91s/it, loss=0.315, lr=1e-5]Steps:  80%|████████  | 12064/15001 [7:45:19<1:33:25,  1.91s/it, loss=0.255, lr=1e-5]Steps:  80%|████████  | 12065/15001 [7:45:20<1:31:45,  1.88s/it, loss=0.255, lr=1e-5]Steps:  80%|████████  | 12065/15001 [7:45:20<1:31:45,  1.88s/it, loss=0.197, lr=1e-5]Steps:  80%|████████  | 12066/15001 [7:45:22<1:29:28,  1.83s/it, loss=0.197, lr=1e-5]Steps:  80%|████████  | 12066/15001 [7:45:22<1:29:28,  1.83s/it, loss=0.0756, lr=1e-5]Steps:  80%|████████  | 12067/15001 [7:45:24<1:29:18,  1.83s/it, loss=0.0756, lr=1e-5]Steps:  80%|████████  | 12067/15001 [7:45:24<1:29:18,  1.83s/it, loss=0.165, lr=1e-5] Steps:  80%|████████  | 12068/15001 [7:45:25<1:28:55,  1.82s/it, loss=0.165, lr=1e-5]Steps:  80%|████████  | 12068/15001 [7:45:26<1:28:55,  1.82s/it, loss=0.309, lr=1e-5]Steps:  80%|████████  | 12069/15001 [7:45:27<1:29:25,  1.83s/it, loss=0.309, lr=1e-5]Steps:  80%|███████���  | 12069/15001 [7:45:28<1:29:25,  1.83s/it, loss=0.315, lr=1e-5]Steps:  80%|████████  | 12070/15001 [7:45:29<1:28:38,  1.81s/it, loss=0.315, lr=1e-5]Steps:  80%|████████  | 12070/15001 [7:45:29<1:28:38,  1.81s/it, loss=0.231, lr=1e-5]Steps:  80%|████████  | 12071/15001 [7:45:31<1:29:13,  1.83s/it, loss=0.231, lr=1e-5]Steps:  80%|████████  | 12071/15001 [7:45:31<1:29:13,  1.83s/it, loss=0.0426, lr=1e-5]Steps:  80%|████████  | 12072/15001 [7:45:33<1:27:08,  1.79s/it, loss=0.0426, lr=1e-5]Steps:  80%|████████  | 12072/15001 [7:45:33<1:27:08,  1.79s/it, loss=0.302, lr=1e-5] Steps:  80%|████████  | 12073/15001 [7:45:35<1:30:03,  1.85s/it, loss=0.302, lr=1e-5]Steps:  80%|████████  | 12073/15001 [7:45:35<1:30:03,  1.85s/it, loss=0.273, lr=1e-5]Steps:  80%|████████  | 12074/15001 [7:45:36<1:29:01,  1.82s/it, loss=0.273, lr=1e-5]Steps:  80%|████████  | 12074/15001 [7:45:37<1:29:01,  1.82s/it, loss=0.189, lr=1e-5]Steps:  80%|████████  | 12075/15001 [7:45:38<1:26:20,  1.77s/it, loss=0.189, lr=1e-5]Steps:  80%|████████  | 12075/15001 [7:45:38<1:26:20,  1.77s/it, loss=0.0895, lr=1e-5]Steps:  81%|████████  | 12076/15001 [7:45:40<1:28:13,  1.81s/it, loss=0.0895, lr=1e-5]Steps:  81%|████████  | 12076/15001 [7:45:40<1:28:13,  1.81s/it, loss=0.0711, lr=1e-5]Steps:  81%|████████  | 12077/15001 [7:45:41<1:23:44,  1.72s/it, loss=0.0711, lr=1e-5]Steps:  81%|████████  | 12077/15001 [7:45:42<1:23:44,  1.72s/it, loss=0.111, lr=1e-5] Steps:  81%|████████  | 12078/15001 [7:45:43<1:27:51,  1.80s/it, loss=0.111, lr=1e-5]Steps:  81%|████████  | 12078/15001 [7:45:44<1:27:51,  1.80s/it, loss=0.205, lr=1e-5]Steps:  81%|████████  | 12079/15001 [7:45:45<1:25:22,  1.75s/it, loss=0.205, lr=1e-5]Steps:  81%|████████  | 12079/15001 [7:45:45<1:25:22,  1.75s/it, loss=0.207, lr=1e-5]Steps:  81%|████████  | 12080/15001 [7:45:47<1:26:50,  1.78s/it, loss=0.207, lr=1e-5]Steps:  81%|████████  | 12080/15001 [7:45:47<1:26:50,  1.78s/it, loss=0.151, lr=1e-5]Steps:  81%|████████  | 12081/15001 [7:45:49<1:32:48,  1.91s/it, loss=0.151, lr=1e-5]Steps:  81%|████████  | 12081/15001 [7:45:49<1:32:48,  1.91s/it, loss=0.131, lr=1e-5]Steps:  81%|████████  | 12082/15001 [7:45:51<1:34:08,  1.94s/it, loss=0.131, lr=1e-5]Steps:  81%|████████  | 12082/15001 [7:45:51<1:34:08,  1.94s/it, loss=0.148, lr=1e-5]Steps:  81%|████████  | 12083/15001 [7:45:53<1:36:47,  1.99s/it, loss=0.148, lr=1e-5]Steps:  81%|████████  | 12083/15001 [7:45:53<1:36:47,  1.99s/it, loss=0.126, lr=1e-5]Steps:  81%|████████  | 12084/15001 [7:45:55<1:37:42,  2.01s/it, loss=0.126, lr=1e-5]Steps:  81%|████████  | 12084/15001 [7:45:56<1:37:42,  2.01s/it, loss=0.0153, lr=1e-5]Steps:  81%|████████  | 12085/15001 [7:45:57<1:38:57,  2.04s/it, loss=0.0153, lr=1e-5]Steps:  81%|████████  | 12085/15001 [7:45:57<1:38:57,  2.04s/it, loss=0.16, lr=1e-5]  Steps:  81%|████████  | 12086/15001 [7:46:00<1:39:44,  2.05s/it, loss=0.16, lr=1e-5]Steps:  81%|████████  | 12086/15001 [7:46:00<1:39:44,  2.05s/it, loss=0.131, lr=1e-5]Steps:  81%|████████  | 12087/15001 [7:46:01<1:33:05,  1.92s/it, loss=0.131, lr=1e-5]Steps:  81%|████████  | 12087/15001 [7:46:01<1:33:05,  1.92s/it, loss=0.363, lr=1e-5]Steps:  81%|████████  | 12088/15001 [7:46:03<1:33:30,  1.93s/it, loss=0.363, lr=1e-5]Steps:  81%|████████  | 12088/15001 [7:46:03<1:33:30,  1.93s/it, loss=0.225, lr=1e-5]Steps:  81%|████████  | 12089/15001 [7:46:05<1:29:17,  1.84s/it, loss=0.225, lr=1e-5]Steps:  81%|████████  | 12089/15001 [7:46:05<1:29:17,  1.84s/it, loss=0.137, lr=1e-5]Steps:  81%|████████  | 12090/15001 [7:46:07<1:29:35,  1.85s/it, loss=0.137, lr=1e-5]Steps:  81%|████████  | 12090/15001 [7:46:07<1:29:35,  1.85s/it, loss=0.139, lr=1e-5]Steps:  81%|████████  | 12091/15001 [7:46:08<1:30:24,  1.86s/it, loss=0.139, lr=1e-5]Steps:  81%|████████  | 12091/15001 [7:46:09<1:30:24,  1.86s/it, loss=0.0253, lr=1e-5]Steps:  81%|████████  | 12092/15001 [7:46:10<1:28:59,  1.84s/it, loss=0.0253, lr=1e-5]Steps:  81%|████████  | 12092/15001 [7:46:10<1:28:59,  1.84s/it, loss=0.324, lr=1e-5] Steps:  81%|████████  | 12093/15001 [7:46:12<1:21:48,  1.69s/it, loss=0.324, lr=1e-5]Steps:  81%|████████  | 12093/15001 [7:46:12<1:21:48,  1.69s/it, loss=0.266, lr=1e-5]Steps:  81%|████████  | 12094/15001 [7:46:14<1:29:22,  1.84s/it, loss=0.266, lr=1e-5]Steps:  81%|████████  | 12094/15001 [7:46:14<1:29:22,  1.84s/it, loss=0.104, lr=1e-5]Steps:  81%|████████  | 12095/15001 [7:46:16<1:31:11,  1.88s/it, loss=0.104, lr=1e-5]Steps:  81%|████████  | 12095/15001 [7:46:16<1:31:11,  1.88s/it, loss=0.166, lr=1e-5]Steps:  81%|████████  | 12096/15001 [7:46:18<1:29:42,  1.85s/it, loss=0.166, lr=1e-5]Steps:  81%|████████  | 12096/15001 [7:46:18<1:29:42,  1.85s/it, loss=0.187, lr=1e-5]Steps:  81%|████████  | 12097/15001 [7:46:20<1:31:23,  1.89s/it, loss=0.187, lr=1e-5]Steps:  81%|████████  | 12097/15001 [7:46:20<1:31:23,  1.89s/it, loss=0.35, lr=1e-5] Steps:  81%|████████  | 12098/15001 [7:46:21<1:29:46,  1.86s/it, loss=0.35, lr=1e-5]Steps:  81%|████████  | 12098/15001 [7:46:21<1:29:46,  1.86s/it, loss=0.0712, lr=1e-5]Steps:  81%|████████  | 12099/15001 [7:46:23<1:29:35,  1.85s/it, loss=0.0712, lr=1e-5]Steps:  81%|████████  | 12099/15001 [7:46:23<1:29:35,  1.85s/it, loss=0.0823, lr=1e-5]Steps:  81%|████████  | 12100/15001 [7:46:25<1:29:16,  1.85s/it, loss=0.0823, lr=1e-5]Steps:  81%|████████  | 12100/15001 [7:46:25<1:29:16,  1.85s/it, loss=0.146, lr=1e-5] Steps:  81%|████████  | 12101/15001 [7:46:27<1:26:55,  1.80s/it, loss=0.146, lr=1e-5]Steps:  81%|████████  | 12101/15001 [7:46:27<1:26:55,  1.80s/it, loss=0.103, lr=1e-5]Steps:  81%|████████  | 12102/15001 [7:46:28<1:26:01,  1.78s/it, loss=0.103, lr=1e-5]Steps:  81%|████████  | 12102/15001 [7:46:29<1:26:01,  1.78s/it, loss=0.137, lr=1e-5]Steps:  81%|████████  | 12103/15001 [7:46:30<1:27:36,  1.81s/it, loss=0.137, lr=1e-5]Steps:  81%|████████  | 12103/15001 [7:46:31<1:27:36,  1.81s/it, loss=0.197, lr=1e-5]Steps:  81%|████████  | 12104/15001 [7:46:32<1:32:35,  1.92s/it, loss=0.197, lr=1e-5]Steps:  81%|████████  | 12104/15001 [7:46:33<1:32:35,  1.92s/it, loss=0.195, lr=1e-5]Steps:  81%|████████  | 12105/15001 [7:46:34<1:31:45,  1.90s/it, loss=0.195, lr=1e-5]Steps:  81%|████████  | 12105/15001 [7:46:35<1:31:45,  1.90s/it, loss=0.316, lr=1e-5]Steps:  81%|████████  | 12106/15001 [7:46:36<1:33:34,  1.94s/it, loss=0.316, lr=1e-5]Steps:  81%|████████  | 12106/15001 [7:46:37<1:33:34,  1.94s/it, loss=0.275, lr=1e-5]Steps:  81%|████████  | 12107/15001 [7:46:38<1:34:17,  1.95s/it, loss=0.275, lr=1e-5]Steps:  81%|████████  | 12107/15001 [7:46:39<1:34:17,  1.95s/it, loss=0.165, lr=1e-5]Steps:  81%|████████  | 12108/15001 [7:46:40<1:36:32,  2.00s/it, loss=0.165, lr=1e-5]Steps:  81%|████████  | 12108/15001 [7:46:41<1:36:32,  2.00s/it, loss=0.0807, lr=1e-5]Steps:  81%|████████  | 12109/15001 [7:46:42<1:36:02,  1.99s/it, loss=0.0807, lr=1e-5]Steps:  81%|████████  | 12109/15001 [7:46:43<1:36:02,  1.99s/it, loss=0.0659, lr=1e-5]Steps:  81%|████████  | 12110/15001 [7:46:44<1:34:06,  1.95s/it, loss=0.0659, lr=1e-5]Steps:  81%|████████  | 12110/15001 [7:46:44<1:34:06,  1.95s/it, loss=0.0572, lr=1e-5]Steps:  81%|████████  | 12111/15001 [7:46:46<1:32:30,  1.92s/it, loss=0.0572, lr=1e-5]Steps:  81%|████████  | 12111/15001 [7:46:46<1:32:30,  1.92s/it, loss=0.0846, lr=1e-5]Steps:  81%|████████  | 12112/15001 [7:46:48<1:27:18,  1.81s/it, loss=0.0846, lr=1e-5]Steps:  81%|████████  | 12112/15001 [7:46:48<1:27:18,  1.81s/it, loss=0.141, lr=1e-5] Steps:  81%|████████  | 12113/15001 [7:46:50<1:28:04,  1.83s/it, loss=0.141, lr=1e-5]Steps:  81%|████████  | 12113/15001 [7:46:50<1:28:04,  1.83s/it, loss=0.0201, lr=1e-5]Steps:  81%|████████  | 12114/15001 [7:46:52<1:29:59,  1.87s/it, loss=0.0201, lr=1e-5]Steps:  81%|████████  | 12114/15001 [7:46:52<1:29:59,  1.87s/it, loss=0.077, lr=1e-5] Steps:  81%|████████  | 12115/15001 [7:46:53<1:26:33,  1.80s/it, loss=0.077, lr=1e-5]Steps:  81%|████████  | 12115/15001 [7:46:53<1:26:33,  1.80s/it, loss=0.198, lr=1e-5]Steps:  81%|████████  | 12116/15001 [7:46:55<1:24:49,  1.76s/it, loss=0.198, lr=1e-5]Steps:  81%|████████  | 12116/15001 [7:46:55<1:24:49,  1.76s/it, loss=0.202, lr=1e-5]Steps:  81%|████████  | 12117/15001 [7:46:57<1:25:49,  1.79s/it, loss=0.202, lr=1e-5]Steps:  81%|████████  | 12117/15001 [7:46:57<1:25:49,  1.79s/it, loss=0.111, lr=1e-5]Steps:  81%|████████  | 12118/15001 [7:46:59<1:31:44,  1.91s/it, loss=0.111, lr=1e-5]Steps:  81%|████████  | 12118/15001 [7:46:59<1:31:44,  1.91s/it, loss=0.0482, lr=1e-5]Steps:  81%|████████  | 12119/15001 [7:47:00<1:27:03,  1.81s/it, loss=0.0482, lr=1e-5]Steps:  81%|████████  | 12119/15001 [7:47:01<1:27:03,  1.81s/it, loss=0.226, lr=1e-5] Steps:  81%|████████  | 12120/15001 [7:47:02<1:29:18,  1.86s/it, loss=0.226, lr=1e-5]Steps:  81%|████████  | 12120/15001 [7:47:03<1:29:18,  1.86s/it, loss=0.206, lr=1e-5]Steps:  81%|████████  | 12121/15001 [7:47:04<1:28:19,  1.84s/it, loss=0.206, lr=1e-5]Steps:  81%|████████  | 12121/15001 [7:47:04<1:28:19,  1.84s/it, loss=0.164, lr=1e-5]Steps:  81%|████████  | 12122/15001 [7:47:06<1:28:34,  1.85s/it, loss=0.164, lr=1e-5]Steps:  81%|████████  | 12122/15001 [7:47:06<1:28:34,  1.85s/it, loss=0.268, lr=1e-5]Steps:  81%|████████  | 12123/15001 [7:47:08<1:27:35,  1.83s/it, loss=0.268, lr=1e-5]Steps:  81%|████████  | 12123/15001 [7:47:08<1:27:35,  1.83s/it, loss=0.133, lr=1e-5]Steps:  81%|████████  | 12124/15001 [7:47:10<1:27:50,  1.83s/it, loss=0.133, lr=1e-5]Steps:  81%|████████  | 12124/15001 [7:47:10<1:27:50,  1.83s/it, loss=0.0506, lr=1e-5]Steps:  81%|████████  | 12125/15001 [7:47:12<1:27:59,  1.84s/it, loss=0.0506, lr=1e-5]Steps:  81%|████████  | 12125/15001 [7:47:12<1:27:59,  1.84s/it, loss=0.257, lr=1e-5] Steps:  81%|████████  | 12126/15001 [7:47:13<1:28:03,  1.84s/it, loss=0.257, lr=1e-5]Steps:  81%|████████  | 12126/15001 [7:47:14<1:28:03,  1.84s/it, loss=0.161, lr=1e-5]Steps:  81%|████████  | 12127/15001 [7:47:15<1:30:38,  1.89s/it, loss=0.161, lr=1e-5]Steps:  81%|████████  | 12127/15001 [7:47:16<1:30:38,  1.89s/it, loss=0.0615, lr=1e-5]Steps:  81%|████████  | 12128/15001 [7:47:17<1:32:32,  1.93s/it, loss=0.0615, lr=1e-5]Steps:  81%|████████  | 12128/15001 [7:47:18<1:32:32,  1.93s/it, loss=0.0977, lr=1e-5]Steps:  81%|████████  | 12129/15001 [7:47:19<1:34:24,  1.97s/it, loss=0.0977, lr=1e-5]Steps:  81%|████████  | 12129/15001 [7:47:20<1:34:24,  1.97s/it, loss=0.223, lr=1e-5] Steps:  81%|████████  | 12130/15001 [7:47:22<1:36:38,  2.02s/it, loss=0.223, lr=1e-5]Steps:  81%|████████  | 12130/15001 [7:47:22<1:36:38,  2.02s/it, loss=0.341, lr=1e-5]Steps:  81%|████████  | 12131/15001 [7:47:23<1:33:44,  1.96s/it, loss=0.341, lr=1e-5]Steps:  81%|████████  | 12131/15001 [7:47:24<1:33:44,  1.96s/it, loss=0.2, lr=1e-5]  Steps:  81%|████████  | 12132/15001 [7:47:26<1:35:36,  2.00s/it, loss=0.2, lr=1e-5]Steps:  81%|████████  | 12132/15001 [7:47:26<1:35:36,  2.00s/it, loss=0.126, lr=1e-5]Steps:  81%|████████  | 12133/15001 [7:47:27<1:34:16,  1.97s/it, loss=0.126, lr=1e-5]Steps:  81%|████████  | 12133/15001 [7:47:27<1:34:16,  1.97s/it, loss=0.236, lr=1e-5]Steps:  81%|████████  | 12134/15001 [7:47:29<1:30:39,  1.90s/it, loss=0.236, lr=1e-5]Steps:  81%|████████  | 12134/15001 [7:47:29<1:30:39,  1.90s/it, loss=0.137, lr=1e-5]Steps:  81%|████████  | 12135/15001 [7:47:31<1:29:43,  1.88s/it, loss=0.137, lr=1e-5]Steps:  81%|████████  | 12135/15001 [7:47:31<1:29:43,  1.88s/it, loss=0.241, lr=1e-5]Steps:  81%|████████  | 12136/15001 [7:47:33<1:29:54,  1.88s/it, loss=0.241, lr=1e-5]Steps:  81%|████████  | 12136/15001 [7:47:33<1:29:54,  1.88s/it, loss=0.186, lr=1e-5]Steps:  81%|████████  | 12137/15001 [7:47:34<1:25:38,  1.79s/it, loss=0.186, lr=1e-5]Steps:  81%|████████  | 12137/15001 [7:47:35<1:25:38,  1.79s/it, loss=0.211, lr=1e-5]Steps:  81%|████████  | 12138/15001 [7:47:37<1:29:37,  1.88s/it, loss=0.211, lr=1e-5]Steps:  81%|████████  | 12138/15001 [7:47:37<1:29:37,  1.88s/it, loss=0.175, lr=1e-5]Steps:  81%|████████  | 12139/15001 [7:47:38<1:29:02,  1.87s/it, loss=0.175, lr=1e-5]Steps:  81%|████████  | 12139/15001 [7:47:38<1:29:02,  1.87s/it, loss=0.12, lr=1e-5] Steps:  81%|████████  | 12140/15001 [7:47:40<1:26:34,  1.82s/it, loss=0.12, lr=1e-5]Steps:  81%|████████  | 12140/15001 [7:47:40<1:26:34,  1.82s/it, loss=0.169, lr=1e-5]Steps:  81%|████████  | 12141/15001 [7:47:42<1:27:18,  1.83s/it, loss=0.169, lr=1e-5]Steps:  81%|████████  | 12141/15001 [7:47:42<1:27:18,  1.83s/it, loss=0.273, lr=1e-5]Steps:  81%|████████  | 12142/15001 [7:47:44<1:26:42,  1.82s/it, loss=0.273, lr=1e-5]Steps:  81%|████████  | 12142/15001 [7:47:44<1:26:42,  1.82s/it, loss=0.173, lr=1e-5]Steps:  81%|████████  | 12143/15001 [7:47:46<1:27:22,  1.83s/it, loss=0.173, lr=1e-5]Steps:  81%|████████  | 12143/15001 [7:47:46<1:27:22,  1.83s/it, loss=0.0842, lr=1e-5]Steps:  81%|████████  | 12144/15001 [7:47:47<1:24:06,  1.77s/it, loss=0.0842, lr=1e-5]Steps:  81%|████████  | 12144/15001 [7:47:48<1:24:06,  1.77s/it, loss=0.202, lr=1e-5] Steps:  81%|████████  | 12145/15001 [7:47:49<1:27:45,  1.84s/it, loss=0.202, lr=1e-5]Steps:  81%|████████  | 12145/15001 [7:47:49<1:27:45,  1.84s/it, loss=0.0888, lr=1e-5]Steps:  81%|████████  | 12146/15001 [7:47:51<1:27:37,  1.84s/it, loss=0.0888, lr=1e-5]Steps:  81%|████████  | 12146/15001 [7:47:51<1:27:37,  1.84s/it, loss=0.0962, lr=1e-5]Steps:  81%|████████  | 12147/15001 [7:47:53<1:26:31,  1.82s/it, loss=0.0962, lr=1e-5]Steps:  81%|████████  | 12147/15001 [7:47:53<1:26:31,  1.82s/it, loss=0.214, lr=1e-5] Steps:  81%|████████  | 12148/15001 [7:47:55<1:26:11,  1.81s/it, loss=0.214, lr=1e-5]Steps:  81%|████████  | 12148/15001 [7:47:55<1:26:11,  1.81s/it, loss=0.345, lr=1e-5]Steps:  81%|████████  | 12149/15001 [7:47:56<1:23:08,  1.75s/it, loss=0.345, lr=1e-5]Steps:  81%|████████  | 12149/15001 [7:47:57<1:23:08,  1.75s/it, loss=0.403, lr=1e-5]Steps:  81%|████████  | 12150/15001 [7:47:58<1:27:01,  1.83s/it, loss=0.403, lr=1e-5]Steps:  81%|████████  | 12150/15001 [7:47:59<1:27:01,  1.83s/it, loss=0.11, lr=1e-5] Steps:  81%|████████  | 12151/15001 [7:48:01<1:33:18,  1.96s/it, loss=0.11, lr=1e-5]Steps:  81%|████████  | 12151/15001 [7:48:01<1:33:18,  1.96s/it, loss=0.0553, lr=1e-5]Steps:  81%|████████  | 12152/15001 [7:48:03<1:34:23,  1.99s/it, loss=0.0553, lr=1e-5]Steps:  81%|████████  | 12152/15001 [7:48:03<1:34:23,  1.99s/it, loss=0.129, lr=1e-5] Steps:  81%|████████  | 12153/15001 [7:48:05<1:33:07,  1.96s/it, loss=0.129, lr=1e-5]Steps:  81%|████████  | 12153/15001 [7:48:05<1:33:07,  1.96s/it, loss=0.152, lr=1e-5]Steps:  81%|████████  | 12154/15001 [7:48:06<1:33:06,  1.96s/it, loss=0.152, lr=1e-5]Steps:  81%|████████  | 12154/15001 [7:48:07<1:33:06,  1.96s/it, loss=0.152, lr=1e-5]Steps:  81%|████████  | 12155/15001 [7:48:08<1:32:55,  1.96s/it, loss=0.152, lr=1e-5]Steps:  81%|████████  | 12155/15001 [7:48:09<1:32:55,  1.96s/it, loss=0.123, lr=1e-5]Steps:  81%|████████  | 12156/15001 [7:48:10<1:32:06,  1.94s/it, loss=0.123, lr=1e-5]Steps:  81%|████████  | 12156/15001 [7:48:11<1:32:06,  1.94s/it, loss=0.0761, lr=1e-5]Steps:  81%|████████  | 12157/15001 [7:48:12<1:31:33,  1.93s/it, loss=0.0761, lr=1e-5]Steps:  81%|████████  | 12157/15001 [7:48:13<1:31:33,  1.93s/it, loss=0.199, lr=1e-5] Steps:  81%|████████  | 12158/15001 [7:48:14<1:33:03,  1.96s/it, loss=0.199, lr=1e-5]Steps:  81%|████████  | 12158/15001 [7:48:14<1:33:03,  1.96s/it, loss=0.114, lr=1e-5]Steps:  81%|████████  | 12159/15001 [7:48:16<1:27:24,  1.85s/it, loss=0.114, lr=1e-5]Steps:  81%|████████  | 12159/15001 [7:48:16<1:27:24,  1.85s/it, loss=0.105, lr=1e-5]Steps:  81%|████████  | 12160/15001 [7:48:18<1:26:34,  1.83s/it, loss=0.105, lr=1e-5]Steps:  81%|████████  | 12160/15001 [7:48:18<1:26:34,  1.83s/it, loss=0.184, lr=1e-5]Steps:  81%|████████  | 12161/15001 [7:48:20<1:29:57,  1.90s/it, loss=0.184, lr=1e-5]Steps:  81%|████████  | 12161/15001 [7:48:20<1:29:57,  1.90s/it, loss=0.0348, lr=1e-5]Steps:  81%|████████  | 12162/15001 [7:48:21<1:26:10,  1.82s/it, loss=0.0348, lr=1e-5]Steps:  81%|████████  | 12162/15001 [7:48:22<1:26:10,  1.82s/it, loss=0.152, lr=1e-5] Steps:  81%|████████  | 12163/15001 [7:48:23<1:28:55,  1.88s/it, loss=0.152, lr=1e-5]Steps:  81%|████████  | 12163/15001 [7:48:23<1:28:55,  1.88s/it, loss=0.132, lr=1e-5]Steps:  81%|████████  | 12164/15001 [7:48:25<1:25:54,  1.82s/it, loss=0.132, lr=1e-5]Steps:  81%|████████  | 12164/15001 [7:48:25<1:25:54,  1.82s/it, loss=0.263, lr=1e-5]Steps:  81%|████████  | 12165/15001 [7:48:27<1:26:46,  1.84s/it, loss=0.263, lr=1e-5]Steps:  81%|████████  | 12165/15001 [7:48:27<1:26:46,  1.84s/it, loss=0.298, lr=1e-5]Steps:  81%|████████  | 12166/15001 [7:48:29<1:27:31,  1.85s/it, loss=0.298, lr=1e-5]Steps:  81%|████████  | 12166/15001 [7:48:29<1:27:31,  1.85s/it, loss=0.0782, lr=1e-5]Steps:  81%|████████  | 12167/15001 [7:48:30<1:25:12,  1.80s/it, loss=0.0782, lr=1e-5]Steps:  81%|████████  | 12167/15001 [7:48:31<1:25:12,  1.80s/it, loss=0.212, lr=1e-5] Steps:  81%|████████  | 12168/15001 [7:48:33<1:28:46,  1.88s/it, loss=0.212, lr=1e-5]Steps:  81%|████████  | 12168/15001 [7:48:33<1:28:46,  1.88s/it, loss=0.183, lr=1e-5]Steps:  81%|████████  | 12169/15001 [7:48:34<1:26:00,  1.82s/it, loss=0.183, lr=1e-5]Steps:  81%|████████  | 12169/15001 [7:48:34<1:26:00,  1.82s/it, loss=0.203, lr=1e-5]Steps:  81%|████████  | 12170/15001 [7:48:36<1:27:12,  1.85s/it, loss=0.203, lr=1e-5]Steps:  81%|████████  | 12170/15001 [7:48:36<1:27:12,  1.85s/it, loss=0.113, lr=1e-5]Steps:  81%|████████  | 12171/15001 [7:48:38<1:27:18,  1.85s/it, loss=0.113, lr=1e-5]Steps:  81%|████████  | 12171/15001 [7:48:38<1:27:18,  1.85s/it, loss=0.213, lr=1e-5]Steps:  81%|████████  | 12172/15001 [7:48:40<1:25:59,  1.82s/it, loss=0.213, lr=1e-5]Steps:  81%|████████  | 12172/15001 [7:48:40<1:25:59,  1.82s/it, loss=0.22, lr=1e-5] Steps:  81%|████████  | 12173/15001 [7:48:42<1:26:12,  1.83s/it, loss=0.22, lr=1e-5]Steps:  81%|████████  | 12173/15001 [7:48:42<1:26:12,  1.83s/it, loss=0.259, lr=1e-5]Steps:  81%|████████  | 12174/15001 [7:48:44<1:29:35,  1.90s/it, loss=0.259, lr=1e-5]Steps:  81%|████████  | 12174/15001 [7:48:44<1:29:35,  1.90s/it, loss=0.0933, lr=1e-5]Steps:  81%|████████  | 12175/15001 [7:48:46<1:33:52,  1.99s/it, loss=0.0933, lr=1e-5]Steps:  81%|████████  | 12175/15001 [7:48:46<1:33:52,  1.99s/it, loss=0.211, lr=1e-5] Steps:  81%|████████  | 12176/15001 [7:48:48<1:34:55,  2.02s/it, loss=0.211, lr=1e-5]Steps:  81%|████████  | 12176/15001 [7:48:48<1:34:55,  2.02s/it, loss=0.0957, lr=1e-5]Steps:  81%|████████  | 12177/15001 [7:48:50<1:35:32,  2.03s/it, loss=0.0957, lr=1e-5]Steps:  81%|████████  | 12177/15001 [7:48:50<1:35:32,  2.03s/it, loss=0.189, lr=1e-5] Steps:  81%|████████  | 12178/15001 [7:48:52<1:31:45,  1.95s/it, loss=0.189, lr=1e-5]Steps:  81%|████████  | 12178/15001 [7:48:52<1:31:45,  1.95s/it, loss=0.112, lr=1e-5]Steps:  81%|████████  | 12179/15001 [7:48:54<1:31:52,  1.95s/it, loss=0.112, lr=1e-5]Steps:  81%|████████  | 12179/15001 [7:48:54<1:31:52,  1.95s/it, loss=0.191, lr=1e-5]Steps:  81%|████████  | 12180/15001 [7:48:56<1:32:07,  1.96s/it, loss=0.191, lr=1e-5]Steps:  81%|████████  | 12180/15001 [7:48:56<1:32:07,  1.96s/it, loss=0.192, lr=1e-5]Steps:  81%|████████  | 12181/15001 [7:48:57<1:27:38,  1.86s/it, loss=0.192, lr=1e-5]Steps:  81%|████████  | 12181/15001 [7:48:57<1:27:38,  1.86s/it, loss=0.296, lr=1e-5]Steps:  81%|████████  | 12182/15001 [7:48:59<1:25:56,  1.83s/it, loss=0.296, lr=1e-5]Steps:  81%|████████  | 12182/15001 [7:48:59<1:25:56,  1.83s/it, loss=0.263, lr=1e-5]Steps:  81%|████████  | 12183/15001 [7:49:01<1:28:22,  1.88s/it, loss=0.263, lr=1e-5]Steps:  81%|████████  | 12183/15001 [7:49:01<1:28:22,  1.88s/it, loss=0.012, lr=1e-5]Steps:  81%|████████  | 12184/15001 [7:49:03<1:23:10,  1.77s/it, loss=0.012, lr=1e-5]Steps:  81%|████████  | 12184/15001 [7:49:03<1:23:10,  1.77s/it, loss=0.15, lr=1e-5] Steps:  81%|████████  | 12185/15001 [7:49:04<1:24:21,  1.80s/it, loss=0.15, lr=1e-5]Steps:  81%|████████  | 12185/15001 [7:49:05<1:24:21,  1.80s/it, loss=0.15, lr=1e-5]Steps:  81%|████████  | 12186/15001 [7:49:06<1:25:18,  1.82s/it, loss=0.15, lr=1e-5]Steps:  81%|████████  | 12186/15001 [7:49:07<1:25:18,  1.82s/it, loss=0.0437, lr=1e-5]Steps:  81%|████████  | 12187/15001 [7:49:08<1:26:24,  1.84s/it, loss=0.0437, lr=1e-5]Steps:  81%|████████  | 12187/15001 [7:49:08<1:26:24,  1.84s/it, loss=0.0789, lr=1e-5]Steps:  81%|████████  | 12188/15001 [7:49:10<1:25:43,  1.83s/it, loss=0.0789, lr=1e-5]Steps:  81%|████████  | 12188/15001 [7:49:10<1:25:43,  1.83s/it, loss=0.24, lr=1e-5]  Steps:  81%|████████▏ | 12189/15001 [7:49:12<1:25:08,  1.82s/it, loss=0.24, lr=1e-5]Steps:  81%|████████▏ | 12189/15001 [7:49:12<1:25:08,  1.82s/it, loss=0.166, lr=1e-5]Steps:  81%|████████▏ | 12190/15001 [7:49:14<1:26:57,  1.86s/it, loss=0.166, lr=1e-5]Steps:  81%|████████▏ | 12190/15001 [7:49:14<1:26:57,  1.86s/it, loss=0.181, lr=1e-5]Steps:  81%|████████▏ | 12191/15001 [7:49:15<1:21:32,  1.74s/it, loss=0.181, lr=1e-5]Steps:  81%|████████▏ | 12191/15001 [7:49:16<1:21:32,  1.74s/it, loss=0.124, lr=1e-5]Steps:  81%|████████▏ | 12192/15001 [7:49:17<1:25:33,  1.83s/it, loss=0.124, lr=1e-5]Steps:  81%|████████▏ | 12192/15001 [7:49:17<1:25:33,  1.83s/it, loss=0.104, lr=1e-5]Steps:  81%|████████▏ | 12193/15001 [7:49:19<1:27:42,  1.87s/it, loss=0.104, lr=1e-5]Steps:  81%|████████▏ | 12193/15001 [7:49:19<1:27:42,  1.87s/it, loss=0.138, lr=1e-5]Steps:  81%|████████▏ | 12194/15001 [7:49:21<1:25:12,  1.82s/it, loss=0.138, lr=1e-5]Steps:  81%|████████▏ | 12194/15001 [7:49:21<1:25:12,  1.82s/it, loss=0.0769, lr=1e-5]Steps:  81%|████████▏ | 12195/15001 [7:49:23<1:27:27,  1.87s/it, loss=0.0769, lr=1e-5]Steps:  81%|████████▏ | 12195/15001 [7:49:23<1:27:27,  1.87s/it, loss=0.213, lr=1e-5] Steps:  81%|████████▏ | 12196/15001 [7:49:25<1:32:09,  1.97s/it, loss=0.213, lr=1e-5]Steps:  81%|████████▏ | 12196/15001 [7:49:25<1:32:09,  1.97s/it, loss=0.208, lr=1e-5]Steps:  81%|████████▏ | 12197/15001 [7:49:27<1:31:45,  1.96s/it, loss=0.208, lr=1e-5]Steps:  81%|████████▏ | 12197/15001 [7:49:27<1:31:45,  1.96s/it, loss=0.226, lr=1e-5]Steps:  81%|████████▏ | 12198/15001 [7:49:29<1:31:47,  1.97s/it, loss=0.226, lr=1e-5]Steps:  81%|████████▏ | 12198/15001 [7:49:30<1:31:47,  1.97s/it, loss=0.285, lr=1e-5]Steps:  81%|████████▏ | 12199/15001 [7:49:31<1:32:57,  1.99s/it, loss=0.285, lr=1e-5]Steps:  81%|████████▏ | 12199/15001 [7:49:32<1:32:57,  1.99s/it, loss=0.235, lr=1e-5]Steps:  81%|████████▏ | 12200/15001 [7:49:33<1:36:10,  2.06s/it, loss=0.235, lr=1e-5]Steps:  81%|████████▏ | 12200/15001 [7:49:34<1:36:10,  2.06s/it, loss=0.448, lr=1e-5]Steps:  81%|████████▏ | 12201/15001 [7:49:35<1:36:29,  2.07s/it, loss=0.448, lr=1e-5]Steps:  81%|████████▏ | 12201/15001 [7:49:36<1:36:29,  2.07s/it, loss=0.154, lr=1e-5]Steps:  81%|████████▏ | 12202/15001 [7:49:37<1:33:22,  2.00s/it, loss=0.154, lr=1e-5]Steps:  81%|████████▏ | 12202/15001 [7:49:37<1:33:22,  2.00s/it, loss=0.068, lr=1e-5]Steps:  81%|████████▏ | 12203/15001 [7:49:39<1:26:38,  1.86s/it, loss=0.068, lr=1e-5]Steps:  81%|████████▏ | 12203/15001 [7:49:39<1:26:38,  1.86s/it, loss=0.19, lr=1e-5] Steps:  81%|████████▏ | 12204/15001 [7:49:41<1:28:29,  1.90s/it, loss=0.19, lr=1e-5]Steps:  81%|████████▏ | 12204/15001 [7:49:41<1:28:29,  1.90s/it, loss=0.119, lr=1e-5]Steps:  81%|████████▏ | 12205/15001 [7:49:43<1:27:14,  1.87s/it, loss=0.119, lr=1e-5]Steps:  81%|████████▏ | 12205/15001 [7:49:43<1:27:14,  1.87s/it, loss=0.198, lr=1e-5]Steps:  81%|████████▏ | 12206/15001 [7:49:44<1:26:05,  1.85s/it, loss=0.198, lr=1e-5]Steps:  81%|████████▏ | 12206/15001 [7:49:45<1:26:05,  1.85s/it, loss=0.196, lr=1e-5]Steps:  81%|████████▏ | 12207/15001 [7:49:46<1:26:01,  1.85s/it, loss=0.196, lr=1e-5]Steps:  81%|████████▏ | 12207/15001 [7:49:46<1:26:01,  1.85s/it, loss=0.11, lr=1e-5] Steps:  81%|████████▏ | 12208/15001 [7:49:48<1:23:57,  1.80s/it, loss=0.11, lr=1e-5]Steps:  81%|████████▏ | 12208/15001 [7:49:48<1:23:57,  1.80s/it, loss=0.212, lr=1e-5]Steps:  81%|████████▏ | 12209/15001 [7:49:50<1:25:40,  1.84s/it, loss=0.212, lr=1e-5]Steps:  81%|████████▏ | 12209/15001 [7:49:50<1:25:40,  1.84s/it, loss=0.257, lr=1e-5]Steps:  81%|████████▏ | 12210/15001 [7:49:52<1:25:29,  1.84s/it, loss=0.257, lr=1e-5]Steps:  81%|████████▏ | 12210/15001 [7:49:52<1:25:29,  1.84s/it, loss=0.14, lr=1e-5] Steps:  81%|████████▏ | 12211/15001 [7:49:53<1:21:49,  1.76s/it, loss=0.14, lr=1e-5]Steps:  81%|████████▏ | 12211/15001 [7:49:54<1:21:49,  1.76s/it, loss=0.147, lr=1e-5]Steps:  81%|████████▏ | 12212/15001 [7:49:55<1:22:22,  1.77s/it, loss=0.147, lr=1e-5]Steps:  81%|████████▏ | 12212/15001 [7:49:56<1:22:22,  1.77s/it, loss=0.247, lr=1e-5]Steps:  81%|████████▏ | 12213/15001 [7:49:57<1:27:33,  1.88s/it, loss=0.247, lr=1e-5]Steps:  81%|████████▏ | 12213/15001 [7:49:57<1:27:33,  1.88s/it, loss=0.201, lr=1e-5]Steps:  81%|████████▏ | 12214/15001 [7:49:59<1:27:14,  1.88s/it, loss=0.201, lr=1e-5]Steps:  81%|████████▏ | 12214/15001 [7:49:59<1:27:14,  1.88s/it, loss=0.168, lr=1e-5]Steps:  81%|████████▏ | 12215/15001 [7:50:01<1:25:05,  1.83s/it, loss=0.168, lr=1e-5]Steps:  81%|████████▏ | 12215/15001 [7:50:01<1:25:05,  1.83s/it, loss=0.181, lr=1e-5]Steps:  81%|████████▏ | 12216/15001 [7:50:03<1:25:11,  1.84s/it, loss=0.181, lr=1e-5]Steps:  81%|████████▏ | 12216/15001 [7:50:03<1:25:11,  1.84s/it, loss=0.0347, lr=1e-5]Steps:  81%|████████▏ | 12217/15001 [7:50:04<1:24:15,  1.82s/it, loss=0.0347, lr=1e-5]Steps:  81%|████████▏ | 12217/15001 [7:50:05<1:24:15,  1.82s/it, loss=0.166, lr=1e-5] Steps:  81%|████████▏ | 12218/15001 [7:50:07<1:29:18,  1.93s/it, loss=0.166, lr=1e-5]Steps:  81%|████████▏ | 12218/15001 [7:50:07<1:29:18,  1.93s/it, loss=0.174, lr=1e-5]Steps:  81%|████████▏ | 12219/15001 [7:50:08<1:28:17,  1.90s/it, loss=0.174, lr=1e-5]Steps:  81%|████████▏ | 12219/15001 [7:50:09<1:28:17,  1.90s/it, loss=0.216, lr=1e-5]Steps:  81%|████████▏ | 12220/15001 [7:50:10<1:29:44,  1.94s/it, loss=0.216, lr=1e-5]Steps:  81%|████████▏ | 12220/15001 [7:50:11<1:29:44,  1.94s/it, loss=0.0937, lr=1e-5]Steps:  81%|████████▏ | 12221/15001 [7:50:12<1:30:09,  1.95s/it, loss=0.0937, lr=1e-5]Steps:  81%|████████▏ | 12221/15001 [7:50:13<1:30:09,  1.95s/it, loss=0.304, lr=1e-5] Steps:  81%|████████▏ | 12222/15001 [7:50:14<1:30:22,  1.95s/it, loss=0.304, lr=1e-5]Steps:  81%|████████▏ | 12222/15001 [7:50:15<1:30:22,  1.95s/it, loss=0.251, lr=1e-5]Steps:  81%|████████▏ | 12223/15001 [7:50:16<1:32:20,  1.99s/it, loss=0.251, lr=1e-5]Steps:  81%|████████▏ | 12223/15001 [7:50:17<1:32:20,  1.99s/it, loss=0.0858, lr=1e-5]Steps:  81%|████████▏ | 12224/15001 [7:50:18<1:25:57,  1.86s/it, loss=0.0858, lr=1e-5]Steps:  81%|████████▏ | 12224/15001 [7:50:18<1:25:57,  1.86s/it, loss=0.381, lr=1e-5] Steps:  81%|████████▏ | 12225/15001 [7:50:20<1:25:59,  1.86s/it, loss=0.381, lr=1e-5]Steps:  81%|████████▏ | 12225/15001 [7:50:20<1:25:59,  1.86s/it, loss=0.0565, lr=1e-5]Steps:  82%|████████▏ | 12226/15001 [7:50:22<1:29:09,  1.93s/it, loss=0.0565, lr=1e-5]Steps:  82%|████████▏ | 12226/15001 [7:50:22<1:29:09,  1.93s/it, loss=0.206, lr=1e-5] Steps:  82%|████████▏ | 12227/15001 [7:50:24<1:28:01,  1.90s/it, loss=0.206, lr=1e-5]Steps:  82%|████████▏ | 12227/15001 [7:50:24<1:28:01,  1.90s/it, loss=0.12, lr=1e-5] Steps:  82%|████████▏ | 12228/15001 [7:50:26<1:26:50,  1.88s/it, loss=0.12, lr=1e-5]Steps:  82%|████████▏ | 12228/15001 [7:50:26<1:26:50,  1.88s/it, loss=0.226, lr=1e-5]Steps:  82%|████████▏ | 12229/15001 [7:50:27<1:24:48,  1.84s/it, loss=0.226, lr=1e-5]Steps:  82%|████████▏ | 12229/15001 [7:50:27<1:24:48,  1.84s/it, loss=0.189, lr=1e-5]Steps:  82%|████████▏ | 12230/15001 [7:50:29<1:23:50,  1.82s/it, loss=0.189, lr=1e-5]Steps:  82%|████████▏ | 12230/15001 [7:50:29<1:23:50,  1.82s/it, loss=0.167, lr=1e-5]Steps:  82%|████████▏ | 12231/15001 [7:50:31<1:25:56,  1.86s/it, loss=0.167, lr=1e-5]Steps:  82%|████████▏ | 12231/15001 [7:50:31<1:25:56,  1.86s/it, loss=0.104, lr=1e-5]Steps:  82%|████████▏ | 12232/15001 [7:50:33<1:22:06,  1.78s/it, loss=0.104, lr=1e-5]Steps:  82%|████████▏ | 12232/15001 [7:50:33<1:22:06,  1.78s/it, loss=0.199, lr=1e-5]Steps:  82%|████████▏ | 12233/15001 [7:50:35<1:25:01,  1.84s/it, loss=0.199, lr=1e-5]Steps:  82%|████████▏ | 12233/15001 [7:50:35<1:25:01,  1.84s/it, loss=0.1, lr=1e-5]  Steps:  82%|████████▏ | 12234/15001 [7:50:37<1:25:41,  1.86s/it, loss=0.1, lr=1e-5]Steps:  82%|████████▏ | 12234/15001 [7:50:37<1:25:41,  1.86s/it, loss=0.22, lr=1e-5]Steps:  82%|████████▏ | 12235/15001 [7:50:38<1:23:16,  1.81s/it, loss=0.22, lr=1e-5]Steps:  82%|████████▏ | 12235/15001 [7:50:39<1:23:16,  1.81s/it, loss=0.139, lr=1e-5]Steps:  82%|████████▏ | 12236/15001 [7:50:40<1:21:44,  1.77s/it, loss=0.139, lr=1e-5]Steps:  82%|████████▏ | 12236/15001 [7:50:40<1:21:44,  1.77s/it, loss=0.0577, lr=1e-5]Steps:  82%|████████▏ | 12237/15001 [7:50:42<1:25:31,  1.86s/it, loss=0.0577, lr=1e-5]Steps:  82%|████████▏ | 12237/15001 [7:50:42<1:25:31,  1.86s/it, loss=0.193, lr=1e-5] Steps:  82%|████████▏ | 12238/15001 [7:50:44<1:26:00,  1.87s/it, loss=0.193, lr=1e-5]Steps:  82%|████████▏ | 12238/15001 [7:50:44<1:26:00,  1.87s/it, loss=0.132, lr=1e-5]Steps:  82%|████████▏ | 12239/15001 [7:50:46<1:26:16,  1.87s/it, loss=0.132, lr=1e-5]Steps:  82%|████████▏ | 12239/15001 [7:50:46<1:26:16,  1.87s/it, loss=0.253, lr=1e-5]Steps:  82%|████████▏ | 12240/15001 [7:50:47<1:21:12,  1.76s/it, loss=0.253, lr=1e-5]Steps:  82%|████████▏ | 12240/15001 [7:50:48<1:21:12,  1.76s/it, loss=0.19, lr=1e-5] Steps:  82%|████████▏ | 12241/15001 [7:50:49<1:26:24,  1.88s/it, loss=0.19, lr=1e-5]Steps:  82%|████████▏ | 12241/15001 [7:50:50<1:26:24,  1.88s/it, loss=0.125, lr=1e-5]Steps:  82%|████████▏ | 12242/15001 [7:50:51<1:26:21,  1.88s/it, loss=0.125, lr=1e-5]Steps:  82%|████████▏ | 12242/15001 [7:50:52<1:26:21,  1.88s/it, loss=0.232, lr=1e-5]Steps:  82%|████████▏ | 12243/15001 [7:50:53<1:27:01,  1.89s/it, loss=0.232, lr=1e-5]Steps:  82%|████████▏ | 12243/15001 [7:50:54<1:27:01,  1.89s/it, loss=0.188, lr=1e-5]Steps:  82%|████████▏ | 12244/15001 [7:50:55<1:31:06,  1.98s/it, loss=0.188, lr=1e-5]Steps:  82%|████████▏ | 12244/15001 [7:50:56<1:31:06,  1.98s/it, loss=0.155, lr=1e-5]Steps:  82%|████████▏ | 12245/15001 [7:50:57<1:29:53,  1.96s/it, loss=0.155, lr=1e-5]Steps:  82%|████████▏ | 12245/15001 [7:50:58<1:29:53,  1.96s/it, loss=0.0778, lr=1e-5]Steps:  82%|████████▏ | 12246/15001 [7:50:59<1:31:52,  2.00s/it, loss=0.0778, lr=1e-5]Steps:  82%|████████▏ | 12246/15001 [7:51:00<1:31:52,  2.00s/it, loss=0.211, lr=1e-5] Steps:  82%|████████▏ | 12247/15001 [7:51:01<1:28:01,  1.92s/it, loss=0.211, lr=1e-5]Steps:  82%|████████▏ | 12247/15001 [7:51:01<1:28:01,  1.92s/it, loss=0.123, lr=1e-5]Steps:  82%|████████▏ | 12248/15001 [7:51:03<1:28:06,  1.92s/it, loss=0.123, lr=1e-5]Steps:  82%|████████▏ | 12248/15001 [7:51:03<1:28:06,  1.92s/it, loss=0.239, lr=1e-5]Steps:  82%|████████▏ | 12249/15001 [7:51:05<1:27:51,  1.92s/it, loss=0.239, lr=1e-5]Steps:  82%|████████▏ | 12249/15001 [7:51:05<1:27:51,  1.92s/it, loss=0.145, lr=1e-5]Steps:  82%|████████▏ | 12250/15001 [7:51:07<1:25:31,  1.87s/it, loss=0.145, lr=1e-5]Steps:  82%|████████▏ | 12250/15001 [7:51:07<1:25:31,  1.87s/it, loss=0.119, lr=1e-5]Steps:  82%|████████▏ | 12251/15001 [7:51:08<1:23:03,  1.81s/it, loss=0.119, lr=1e-5]Steps:  82%|████████▏ | 12251/15001 [7:51:09<1:23:03,  1.81s/it, loss=0.223, lr=1e-5]Steps:  82%|████████▏ | 12252/15001 [7:51:10<1:25:02,  1.86s/it, loss=0.223, lr=1e-5]Steps:  82%|████████▏ | 12252/15001 [7:51:11<1:25:02,  1.86s/it, loss=0.139, lr=1e-5]Steps:  82%|████████▏ | 12253/15001 [7:51:12<1:24:16,  1.84s/it, loss=0.139, lr=1e-5]Steps:  82%|████████▏ | 12253/15001 [7:51:12<1:24:16,  1.84s/it, loss=0.234, lr=1e-5]Steps:  82%|████████▏ | 12254/15001 [7:51:14<1:21:53,  1.79s/it, loss=0.234, lr=1e-5]Steps:  82%|████████▏ | 12254/15001 [7:51:14<1:21:53,  1.79s/it, loss=0.0578, lr=1e-5]Steps:  82%|████████▏ | 12255/15001 [7:51:16<1:22:32,  1.80s/it, loss=0.0578, lr=1e-5]Steps:  82%|████████▏ | 12255/15001 [7:51:16<1:22:32,  1.80s/it, loss=0.15, lr=1e-5]  Steps:  82%|████████▏ | 12256/15001 [7:51:18<1:24:36,  1.85s/it, loss=0.15, lr=1e-5]Steps:  82%|████████▏ | 12256/15001 [7:51:18<1:24:36,  1.85s/it, loss=0.231, lr=1e-5]Steps:  82%|████████▏ | 12257/15001 [7:51:20<1:24:32,  1.85s/it, loss=0.231, lr=1e-5]Steps:  82%|████████▏ | 12257/15001 [7:51:20<1:24:32,  1.85s/it, loss=0.0851, lr=1e-5]Steps:  82%|████████▏ | 12258/15001 [7:51:21<1:22:37,  1.81s/it, loss=0.0851, lr=1e-5]Steps:  82%|████████▏ | 12258/15001 [7:51:22<1:22:37,  1.81s/it, loss=0.366, lr=1e-5] Steps:  82%|████████▏ | 12259/15001 [7:51:23<1:26:49,  1.90s/it, loss=0.366, lr=1e-5]Steps:  82%|████████▏ | 12259/15001 [7:51:23<1:26:49,  1.90s/it, loss=0.0813, lr=1e-5]Steps:  82%|████████▏ | 12260/15001 [7:51:25<1:25:15,  1.87s/it, loss=0.0813, lr=1e-5]Steps:  82%|████████▏ | 12260/15001 [7:51:25<1:25:15,  1.87s/it, loss=0.265, lr=1e-5] Steps:  82%|████████▏ | 12261/15001 [7:51:27<1:21:10,  1.78s/it, loss=0.265, lr=1e-5]Steps:  82%|████████▏ | 12261/15001 [7:51:27<1:21:10,  1.78s/it, loss=0.0272, lr=1e-5]Steps:  82%|████████▏ | 12262/15001 [7:51:29<1:22:56,  1.82s/it, loss=0.0272, lr=1e-5]Steps:  82%|████████▏ | 12262/15001 [7:51:29<1:22:56,  1.82s/it, loss=0.053, lr=1e-5] Steps:  82%|████████▏ | 12263/15001 [7:51:31<1:24:00,  1.84s/it, loss=0.053, lr=1e-5]Steps:  82%|████████▏ | 12263/15001 [7:51:31<1:24:00,  1.84s/it, loss=0.103, lr=1e-5]Steps:  82%|████████▏ | 12264/15001 [7:51:33<1:31:02,  2.00s/it, loss=0.103, lr=1e-5]Steps:  82%|████████▏ | 12264/15001 [7:51:33<1:31:02,  2.00s/it, loss=0.232, lr=1e-5]Steps:  82%|████████▏ | 12265/15001 [7:51:35<1:27:48,  1.93s/it, loss=0.232, lr=1e-5]Steps:  82%|████████▏ | 12265/15001 [7:51:35<1:27:48,  1.93s/it, loss=0.161, lr=1e-5]Steps:  82%|████████▏ | 12266/15001 [7:51:37<1:31:05,  2.00s/it, loss=0.161, lr=1e-5]Steps:  82%|████████▏ | 12266/15001 [7:51:37<1:31:05,  2.00s/it, loss=0.0526, lr=1e-5]Steps:  82%|████████▏ | 12267/15001 [7:51:39<1:30:35,  1.99s/it, loss=0.0526, lr=1e-5]Steps:  82%|████████▏ | 12267/15001 [7:51:39<1:30:35,  1.99s/it, loss=0.0821, lr=1e-5]Steps:  82%|████████▏ | 12268/15001 [7:51:41<1:30:57,  2.00s/it, loss=0.0821, lr=1e-5]Steps:  82%|████████▏ | 12268/15001 [7:51:41<1:30:57,  2.00s/it, loss=0.328, lr=1e-5] Steps:  82%|████████▏ | 12269/15001 [7:51:43<1:28:55,  1.95s/it, loss=0.328, lr=1e-5]Steps:  82%|████████▏ | 12269/15001 [7:51:43<1:28:55,  1.95s/it, loss=0.279, lr=1e-5]Steps:  82%|████████▏ | 12270/15001 [7:51:44<1:27:39,  1.93s/it, loss=0.279, lr=1e-5]Steps:  82%|████████▏ | 12270/15001 [7:51:45<1:27:39,  1.93s/it, loss=0.275, lr=1e-5]Steps:  82%|████████▏ | 12271/15001 [7:51:46<1:25:22,  1.88s/it, loss=0.275, lr=1e-5]Steps:  82%|████████▏ | 12271/15001 [7:51:46<1:25:22,  1.88s/it, loss=0.131, lr=1e-5]Steps:  82%|████████▏ | 12272/15001 [7:51:48<1:21:39,  1.80s/it, loss=0.131, lr=1e-5]Steps:  82%|████████▏ | 12272/15001 [7:51:48<1:21:39,  1.80s/it, loss=0.21, lr=1e-5] Steps:  82%|████████▏ | 12273/15001 [7:51:50<1:24:40,  1.86s/it, loss=0.21, lr=1e-5]Steps:  82%|████████▏ | 12273/15001 [7:51:50<1:24:40,  1.86s/it, loss=0.122, lr=1e-5]Steps:  82%|████████▏ | 12274/15001 [7:51:52<1:23:56,  1.85s/it, loss=0.122, lr=1e-5]Steps:  82%|████████▏ | 12274/15001 [7:51:52<1:23:56,  1.85s/it, loss=0.158, lr=1e-5]Steps:  82%|████████▏ | 12275/15001 [7:51:53<1:22:15,  1.81s/it, loss=0.158, lr=1e-5]Steps:  82%|████████▏ | 12275/15001 [7:51:54<1:22:15,  1.81s/it, loss=0.107, lr=1e-5]Steps:  82%|████████▏ | 12276/15001 [7:51:56<1:26:07,  1.90s/it, loss=0.107, lr=1e-5]Steps:  82%|████████▏ | 12276/15001 [7:51:56<1:26:07,  1.90s/it, loss=0.307, lr=1e-5]Steps:  82%|████████▏ | 12277/15001 [7:51:57<1:26:01,  1.89s/it, loss=0.307, lr=1e-5]Steps:  82%|████████▏ | 12277/15001 [7:51:57<1:26:01,  1.89s/it, loss=0.215, lr=1e-5]Steps:  82%|████████▏ | 12278/15001 [7:51:59<1:21:52,  1.80s/it, loss=0.215, lr=1e-5]Steps:  82%|████████▏ | 12278/15001 [7:51:59<1:21:52,  1.80s/it, loss=0.241, lr=1e-5]Steps:  82%|████████▏ | 12279/15001 [7:52:01<1:22:07,  1.81s/it, loss=0.241, lr=1e-5]Steps:  82%|████████▏ | 12279/15001 [7:52:01<1:22:07,  1.81s/it, loss=0.0735, lr=1e-5]Steps:  82%|████████▏ | 12280/15001 [7:52:03<1:21:18,  1.79s/it, loss=0.0735, lr=1e-5]Steps:  82%|████████▏ | 12280/15001 [7:52:03<1:21:18,  1.79s/it, loss=0.177, lr=1e-5] Steps:  82%|████████▏ | 12281/15001 [7:52:04<1:22:40,  1.82s/it, loss=0.177, lr=1e-5]Steps:  82%|████████▏ | 12281/15001 [7:52:05<1:22:40,  1.82s/it, loss=0.0676, lr=1e-5]Steps:  82%|████████▏ | 12282/15001 [7:52:06<1:23:15,  1.84s/it, loss=0.0676, lr=1e-5]Steps:  82%|████████▏ | 12282/15001 [7:52:07<1:23:15,  1.84s/it, loss=0.134, lr=1e-5] Steps:  82%|████████▏ | 12283/15001 [7:52:08<1:21:17,  1.79s/it, loss=0.134, lr=1e-5]Steps:  82%|████████▏ | 12283/15001 [7:52:08<1:21:17,  1.79s/it, loss=0.12, lr=1e-5] Steps:  82%|████████▏ | 12284/15001 [7:52:10<1:20:36,  1.78s/it, loss=0.12, lr=1e-5]Steps:  82%|████████▏ | 12284/15001 [7:52:10<1:20:36,  1.78s/it, loss=0.0378, lr=1e-5]Steps:  82%|████████▏ | 12285/15001 [7:52:12<1:27:27,  1.93s/it, loss=0.0378, lr=1e-5]Steps:  82%|████████▏ | 12285/15001 [7:52:12<1:27:27,  1.93s/it, loss=0.11, lr=1e-5]  Steps:  82%|████████▏ | 12286/15001 [7:52:14<1:22:34,  1.82s/it, loss=0.11, lr=1e-5]Steps:  82%|████████▏ | 12286/15001 [7:52:14<1:22:34,  1.82s/it, loss=0.454, lr=1e-5]Steps:  82%|████████▏ | 12287/15001 [7:52:16<1:26:11,  1.91s/it, loss=0.454, lr=1e-5]Steps:  82%|████████▏ | 12287/15001 [7:52:16<1:26:11,  1.91s/it, loss=0.209, lr=1e-5]Steps:  82%|████████▏ | 12288/15001 [7:52:18<1:28:49,  1.96s/it, loss=0.209, lr=1e-5]Steps:  82%|████████▏ | 12288/15001 [7:52:18<1:28:49,  1.96s/it, loss=0.117, lr=1e-5]Steps:  82%|████████▏ | 12289/15001 [7:52:20<1:29:03,  1.97s/it, loss=0.117, lr=1e-5]Steps:  82%|████████▏ | 12289/15001 [7:52:20<1:29:03,  1.97s/it, loss=0.194, lr=1e-5]Steps:  82%|████████▏ | 12290/15001 [7:52:21<1:24:33,  1.87s/it, loss=0.194, lr=1e-5]Steps:  82%|████████▏ | 12290/15001 [7:52:22<1:24:33,  1.87s/it, loss=0.147, lr=1e-5]Steps:  82%|████████▏ | 12291/15001 [7:52:24<1:29:48,  1.99s/it, loss=0.147, lr=1e-5]Steps:  82%|████████▏ | 12291/15001 [7:52:24<1:29:48,  1.99s/it, loss=0.304, lr=1e-5]Steps:  82%|████████▏ | 12292/15001 [7:52:25<1:26:04,  1.91s/it, loss=0.304, lr=1e-5]Steps:  82%|████████▏ | 12292/15001 [7:52:26<1:26:04,  1.91s/it, loss=0.311, lr=1e-5]Steps:  82%|████████▏ | 12293/15001 [7:52:27<1:25:09,  1.89s/it, loss=0.311, lr=1e-5]Steps:  82%|████████▏ | 12293/15001 [7:52:28<1:25:09,  1.89s/it, loss=0.0514, lr=1e-5]Steps:  82%|████████▏ | 12294/15001 [7:52:29<1:27:22,  1.94s/it, loss=0.0514, lr=1e-5]Steps:  82%|████████▏ | 12294/15001 [7:52:29<1:27:22,  1.94s/it, loss=0.294, lr=1e-5] Steps:  82%|████████▏ | 12295/15001 [7:52:31<1:26:16,  1.91s/it, loss=0.294, lr=1e-5]Steps:  82%|████████▏ | 12295/15001 [7:52:31<1:26:16,  1.91s/it, loss=0.0553, lr=1e-5]Steps:  82%|████████▏ | 12296/15001 [7:52:33<1:20:25,  1.78s/it, loss=0.0553, lr=1e-5]Steps:  82%|████████▏ | 12296/15001 [7:52:33<1:20:25,  1.78s/it, loss=0.236, lr=1e-5] Steps:  82%|████████▏ | 12297/15001 [7:52:34<1:20:33,  1.79s/it, loss=0.236, lr=1e-5]Steps:  82%|████████▏ | 12297/15001 [7:52:35<1:20:33,  1.79s/it, loss=0.153, lr=1e-5]Steps:  82%|████████▏ | 12298/15001 [7:52:37<1:27:12,  1.94s/it, loss=0.153, lr=1e-5]Steps:  82%|████████▏ | 12298/15001 [7:52:37<1:27:12,  1.94s/it, loss=0.36, lr=1e-5] Steps:  82%|████████▏ | 12299/15001 [7:52:39<1:25:27,  1.90s/it, loss=0.36, lr=1e-5]Steps:  82%|████████▏ | 12299/15001 [7:52:39<1:25:27,  1.90s/it, loss=0.482, lr=1e-5]Steps:  82%|████████▏ | 12300/15001 [7:52:40<1:22:01,  1.82s/it, loss=0.482, lr=1e-5]Steps:  82%|████████▏ | 12300/15001 [7:52:40<1:22:01,  1.82s/it, loss=0.237, lr=1e-5]Steps:  82%|████████▏ | 12301/15001 [7:52:42<1:19:10,  1.76s/it, loss=0.237, lr=1e-5]Steps:  82%|████████▏ | 12301/15001 [7:52:42<1:19:10,  1.76s/it, loss=0.14, lr=1e-5] Steps:  82%|████████▏ | 12302/15001 [7:52:44<1:23:21,  1.85s/it, loss=0.14, lr=1e-5]Steps:  82%|████████▏ | 12302/15001 [7:52:44<1:23:21,  1.85s/it, loss=0.0946, lr=1e-5]Steps:  82%|████████▏ | 12303/15001 [7:52:45<1:18:50,  1.75s/it, loss=0.0946, lr=1e-5]Steps:  82%|████████▏ | 12303/15001 [7:52:46<1:18:50,  1.75s/it, loss=0.0869, lr=1e-5]Steps:  82%|████████▏ | 12304/15001 [7:52:47<1:21:55,  1.82s/it, loss=0.0869, lr=1e-5]Steps:  82%|████████▏ | 12304/15001 [7:52:48<1:21:55,  1.82s/it, loss=0.148, lr=1e-5] Steps:  82%|████████▏ | 12305/15001 [7:52:49<1:23:18,  1.85s/it, loss=0.148, lr=1e-5]Steps:  82%|████████▏ | 12305/15001 [7:52:50<1:23:18,  1.85s/it, loss=0.126, lr=1e-5]Steps:  82%|████████▏ | 12306/15001 [7:52:51<1:22:52,  1.85s/it, loss=0.126, lr=1e-5]Steps:  82%|████████▏ | 12306/15001 [7:52:51<1:22:52,  1.85s/it, loss=0.0864, lr=1e-5]Steps:  82%|████████▏ | 12307/15001 [7:52:53<1:25:36,  1.91s/it, loss=0.0864, lr=1e-5]Steps:  82%|████████▏ | 12307/15001 [7:52:53<1:25:36,  1.91s/it, loss=0.244, lr=1e-5] Steps:  82%|████████▏ | 12308/15001 [7:52:55<1:24:54,  1.89s/it, loss=0.244, lr=1e-5]Steps:  82%|████████▏ | 12308/15001 [7:52:55<1:24:54,  1.89s/it, loss=0.197, lr=1e-5]Steps:  82%|████████▏ | 12309/15001 [7:52:57<1:19:54,  1.78s/it, loss=0.197, lr=1e-5]Steps:  82%|████████▏ | 12309/15001 [7:52:57<1:19:54,  1.78s/it, loss=0.0621, lr=1e-5]Steps:  82%|████████▏ | 12310/15001 [7:52:59<1:24:31,  1.88s/it, loss=0.0621, lr=1e-5]Steps:  82%|████████▏ | 12310/15001 [7:52:59<1:24:31,  1.88s/it, loss=0.387, lr=1e-5] Steps:  82%|████████▏ | 12311/15001 [7:53:01<1:29:21,  1.99s/it, loss=0.387, lr=1e-5]Steps:  82%|████████▏ | 12311/15001 [7:53:01<1:29:21,  1.99s/it, loss=0.212, lr=1e-5]Steps:  82%|████████▏ | 12312/15001 [7:53:03<1:27:18,  1.95s/it, loss=0.212, lr=1e-5]Steps:  82%|████████▏ | 12312/15001 [7:53:03<1:27:18,  1.95s/it, loss=0.134, lr=1e-5]Steps:  82%|████████▏ | 12313/15001 [7:53:05<1:28:12,  1.97s/it, loss=0.134, lr=1e-5]Steps:  82%|████████▏ | 12313/15001 [7:53:05<1:28:12,  1.97s/it, loss=0.37, lr=1e-5] Steps:  82%|████████▏ | 12314/15001 [7:53:07<1:25:40,  1.91s/it, loss=0.37, lr=1e-5]Steps:  82%|████████▏ | 12314/15001 [7:53:07<1:25:40,  1.91s/it, loss=0.343, lr=1e-5]Steps:  82%|████████▏ | 12315/15001 [7:53:09<1:27:41,  1.96s/it, loss=0.343, lr=1e-5]Steps:  82%|████████▏ | 12315/15001 [7:53:09<1:27:41,  1.96s/it, loss=0.0976, lr=1e-5]Steps:  82%|████████▏ | 12316/15001 [7:53:11<1:27:39,  1.96s/it, loss=0.0976, lr=1e-5]Steps:  82%|████████▏ | 12316/15001 [7:53:11<1:27:39,  1.96s/it, loss=0.107, lr=1e-5] Steps:  82%|████████▏ | 12317/15001 [7:53:13<1:29:13,  1.99s/it, loss=0.107, lr=1e-5]Steps:  82%|████████▏ | 12317/15001 [7:53:13<1:29:13,  1.99s/it, loss=0.39, lr=1e-5] Steps:  82%|████████▏ | 12318/15001 [7:53:14<1:23:40,  1.87s/it, loss=0.39, lr=1e-5]Steps:  82%|████████▏ | 12318/15001 [7:53:15<1:23:40,  1.87s/it, loss=0.187, lr=1e-5]Steps:  82%|████████▏ | 12319/15001 [7:53:16<1:23:30,  1.87s/it, loss=0.187, lr=1e-5]Steps:  82%|████████▏ | 12319/15001 [7:53:16<1:23:30,  1.87s/it, loss=0.0474, lr=1e-5]Steps:  82%|████████▏ | 12320/15001 [7:53:18<1:21:31,  1.82s/it, loss=0.0474, lr=1e-5]Steps:  82%|████████▏ | 12320/15001 [7:53:18<1:21:31,  1.82s/it, loss=0.285, lr=1e-5] Steps:  82%|████████▏ | 12321/15001 [7:53:20<1:20:50,  1.81s/it, loss=0.285, lr=1e-5]Steps:  82%|████████▏ | 12321/15001 [7:53:20<1:20:50,  1.81s/it, loss=0.0391, lr=1e-5]Steps:  82%|████████▏ | 12322/15001 [7:53:22<1:23:10,  1.86s/it, loss=0.0391, lr=1e-5]Steps:  82%|████████▏ | 12322/15001 [7:53:22<1:23:10,  1.86s/it, loss=0.364, lr=1e-5] Steps:  82%|████████▏ | 12323/15001 [7:53:23<1:21:53,  1.83s/it, loss=0.364, lr=1e-5]Steps:  82%|████████▏ | 12323/15001 [7:53:24<1:21:53,  1.83s/it, loss=0.0962, lr=1e-5]Steps:  82%|████████▏ | 12324/15001 [7:53:25<1:20:34,  1.81s/it, loss=0.0962, lr=1e-5]Steps:  82%|████████▏ | 12324/15001 [7:53:26<1:20:34,  1.81s/it, loss=0.234, lr=1e-5] Steps:  82%|████████▏ | 12325/15001 [7:53:27<1:23:23,  1.87s/it, loss=0.234, lr=1e-5]Steps:  82%|████████▏ | 12325/15001 [7:53:27<1:23:23,  1.87s/it, loss=0.166, lr=1e-5]Steps:  82%|████████▏ | 12326/15001 [7:53:29<1:22:50,  1.86s/it, loss=0.166, lr=1e-5]Steps:  82%|████████▏ | 12326/15001 [7:53:29<1:22:50,  1.86s/it, loss=0.153, lr=1e-5]Steps:  82%|████████▏ | 12327/15001 [7:53:31<1:20:04,  1.80s/it, loss=0.153, lr=1e-5]Steps:  82%|████████▏ | 12327/15001 [7:53:31<1:20:04,  1.80s/it, loss=0.145, lr=1e-5]Steps:  82%|████████▏ | 12328/15001 [7:53:32<1:20:58,  1.82s/it, loss=0.145, lr=1e-5]Steps:  82%|████████▏ | 12328/15001 [7:53:33<1:20:58,  1.82s/it, loss=0.0949, lr=1e-5]Steps:  82%|████████▏ | 12329/15001 [7:53:34<1:20:33,  1.81s/it, loss=0.0949, lr=1e-5]Steps:  82%|████████▏ | 12329/15001 [7:53:35<1:20:33,  1.81s/it, loss=0.126, lr=1e-5] Steps:  82%|████████▏ | 12330/15001 [7:53:36<1:25:26,  1.92s/it, loss=0.126, lr=1e-5]Steps:  82%|████████▏ | 12330/15001 [7:53:37<1:25:26,  1.92s/it, loss=0.0804, lr=1e-5]Steps:  82%|████████▏ | 12331/15001 [7:53:38<1:23:58,  1.89s/it, loss=0.0804, lr=1e-5]Steps:  82%|████████▏ | 12331/15001 [7:53:38<1:23:58,  1.89s/it, loss=0.215, lr=1e-5] Steps:  82%|████████▏ | 12332/15001 [7:53:40<1:21:53,  1.84s/it, loss=0.215, lr=1e-5]Steps:  82%|████████▏ | 12332/15001 [7:53:40<1:21:53,  1.84s/it, loss=0.1, lr=1e-5]  Steps:  82%|████████▏ | 12333/15001 [7:53:42<1:20:13,  1.80s/it, loss=0.1, lr=1e-5]Steps:  82%|████████▏ | 12333/15001 [7:53:42<1:20:13,  1.80s/it, loss=0.148, lr=1e-5]Steps:  82%|████████▏ | 12334/15001 [7:53:44<1:22:09,  1.85s/it, loss=0.148, lr=1e-5]Steps:  82%|████████▏ | 12334/15001 [7:53:44<1:22:09,  1.85s/it, loss=0.209, lr=1e-5]Steps:  82%|████████▏ | 12335/15001 [7:53:46<1:30:13,  2.03s/it, loss=0.209, lr=1e-5]Steps:  82%|████████▏ | 12335/15001 [7:53:46<1:30:13,  2.03s/it, loss=0.0139, lr=1e-5]Steps:  82%|████████▏ | 12336/15001 [7:53:48<1:29:18,  2.01s/it, loss=0.0139, lr=1e-5]Steps:  82%|████████▏ | 12336/15001 [7:53:48<1:29:18,  2.01s/it, loss=0.113, lr=1e-5] Steps:  82%|████████▏ | 12337/15001 [7:53:50<1:27:41,  1.98s/it, loss=0.113, lr=1e-5]Steps:  82%|████████▏ | 12337/15001 [7:53:50<1:27:41,  1.98s/it, loss=0.134, lr=1e-5]Steps:  82%|████████▏ | 12338/15001 [7:53:52<1:27:34,  1.97s/it, loss=0.134, lr=1e-5]Steps:  82%|████████▏ | 12338/15001 [7:53:52<1:27:34,  1.97s/it, loss=0.0539, lr=1e-5]Steps:  82%|████████▏ | 12339/15001 [7:53:54<1:27:09,  1.96s/it, loss=0.0539, lr=1e-5]Steps:  82%|████████▏ | 12339/15001 [7:53:54<1:27:09,  1.96s/it, loss=0.146, lr=1e-5] Steps:  82%|████████▏ | 12340/15001 [7:53:56<1:24:55,  1.92s/it, loss=0.146, lr=1e-5]Steps:  82%|████████▏ | 12340/15001 [7:53:56<1:24:55,  1.92s/it, loss=0.387, lr=1e-5]Steps:  82%|████████▏ | 12341/15001 [7:53:57<1:21:39,  1.84s/it, loss=0.387, lr=1e-5]Steps:  82%|████████▏ | 12341/15001 [7:53:58<1:21:39,  1.84s/it, loss=0.108, lr=1e-5]Steps:  82%|████████▏ | 12342/15001 [7:53:59<1:24:11,  1.90s/it, loss=0.108, lr=1e-5]Steps:  82%|████████▏ | 12342/15001 [7:54:00<1:24:11,  1.90s/it, loss=0.167, lr=1e-5]Steps:  82%|████████▏ | 12343/15001 [7:54:01<1:20:28,  1.82s/it, loss=0.167, lr=1e-5]Steps:  82%|████████▏ | 12343/15001 [7:54:01<1:20:28,  1.82s/it, loss=0.395, lr=1e-5]Steps:  82%|████████▏ | 12344/15001 [7:54:03<1:20:51,  1.83s/it, loss=0.395, lr=1e-5]Steps:  82%|████████▏ | 12344/15001 [7:54:03<1:20:51,  1.83s/it, loss=0.137, lr=1e-5]Steps:  82%|████████▏ | 12345/15001 [7:54:05<1:21:31,  1.84s/it, loss=0.137, lr=1e-5]Steps:  82%|████████▏ | 12345/15001 [7:54:05<1:21:31,  1.84s/it, loss=0.172, lr=1e-5]Steps:  82%|████████▏ | 12346/15001 [7:54:07<1:22:44,  1.87s/it, loss=0.172, lr=1e-5]Steps:  82%|████████▏ | 12346/15001 [7:54:07<1:22:44,  1.87s/it, loss=0.222, lr=1e-5]Steps:  82%|████████▏ | 12347/15001 [7:54:09<1:23:31,  1.89s/it, loss=0.222, lr=1e-5]Steps:  82%|████████▏ | 12347/15001 [7:54:09<1:23:31,  1.89s/it, loss=0.0887, lr=1e-5]Steps:  82%|████████▏ | 12348/15001 [7:54:10<1:21:44,  1.85s/it, loss=0.0887, lr=1e-5]Steps:  82%|████████▏ | 12348/15001 [7:54:10<1:21:44,  1.85s/it, loss=0.183, lr=1e-5] Steps:  82%|████████▏ | 12349/15001 [7:54:12<1:19:05,  1.79s/it, loss=0.183, lr=1e-5]Steps:  82%|████████▏ | 12349/15001 [7:54:12<1:19:05,  1.79s/it, loss=0.216, lr=1e-5]Steps:  82%|████████▏ | 12350/15001 [7:54:14<1:17:21,  1.75s/it, loss=0.216, lr=1e-5]Steps:  82%|████████▏ | 12350/15001 [7:54:14<1:17:21,  1.75s/it, loss=0.118, lr=1e-5]Steps:  82%|████████▏ | 12351/15001 [7:54:16<1:19:49,  1.81s/it, loss=0.118, lr=1e-5]Steps:  82%|████████▏ | 12351/15001 [7:54:16<1:19:49,  1.81s/it, loss=0.0883, lr=1e-5]Steps:  82%|████████▏ | 12352/15001 [7:54:18<1:21:36,  1.85s/it, loss=0.0883, lr=1e-5]Steps:  82%|████████▏ | 12352/15001 [7:54:18<1:21:36,  1.85s/it, loss=0.222, lr=1e-5] Steps:  82%|████████▏ | 12353/15001 [7:54:20<1:24:43,  1.92s/it, loss=0.222, lr=1e-5]Steps:  82%|████████▏ | 12353/15001 [7:54:20<1:24:43,  1.92s/it, loss=0.178, lr=1e-5]Steps:  82%|████████▏ | 12354/15001 [7:54:21<1:20:02,  1.81s/it, loss=0.178, lr=1e-5]Steps:  82%|████████▏ | 12354/15001 [7:54:21<1:20:02,  1.81s/it, loss=0.184, lr=1e-5]Steps:  82%|████████▏ | 12355/15001 [7:54:23<1:21:14,  1.84s/it, loss=0.184, lr=1e-5]Steps:  82%|████████▏ | 12355/15001 [7:54:23<1:21:14,  1.84s/it, loss=0.0634, lr=1e-5]Steps:  82%|████████▏ | 12356/15001 [7:54:25<1:22:44,  1.88s/it, loss=0.0634, lr=1e-5]Steps:  82%|████████▏ | 12356/15001 [7:54:25<1:22:44,  1.88s/it, loss=0.173, lr=1e-5] Steps:  82%|████████▏ | 12357/15001 [7:54:27<1:25:35,  1.94s/it, loss=0.173, lr=1e-5]Steps:  82%|████████▏ | 12357/15001 [7:54:27<1:25:35,  1.94s/it, loss=0.113, lr=1e-5]Steps:  82%|████████▏ | 12358/15001 [7:54:29<1:23:39,  1.90s/it, loss=0.113, lr=1e-5]Steps:  82%|████████▏ | 12358/15001 [7:54:29<1:23:39,  1.90s/it, loss=0.184, lr=1e-5]Steps:  82%|████████▏ | 12359/15001 [7:54:31<1:24:33,  1.92s/it, loss=0.184, lr=1e-5]Steps:  82%|████████▏ | 12359/15001 [7:54:31<1:24:33,  1.92s/it, loss=0.14, lr=1e-5] Steps:  82%|████████▏ | 12360/15001 [7:54:33<1:28:34,  2.01s/it, loss=0.14, lr=1e-5]Steps:  82%|████████▏ | 12360/15001 [7:54:33<1:28:34,  2.01s/it, loss=0.218, lr=1e-5]Steps:  82%|████████▏ | 12361/15001 [7:54:35<1:26:17,  1.96s/it, loss=0.218, lr=1e-5]Steps:  82%|████████▏ | 12361/15001 [7:54:35<1:26:17,  1.96s/it, loss=0.332, lr=1e-5]Steps:  82%|████████▏ | 12362/15001 [7:54:37<1:26:27,  1.97s/it, loss=0.332, lr=1e-5]Steps:  82%|████████▏ | 12362/15001 [7:54:37<1:26:27,  1.97s/it, loss=0.0693, lr=1e-5]Steps:  82%|████████▏ | 12363/15001 [7:54:39<1:23:53,  1.91s/it, loss=0.0693, lr=1e-5]Steps:  82%|████████▏ | 12363/15001 [7:54:39<1:23:53,  1.91s/it, loss=0.0866, lr=1e-5]Steps:  82%|████████▏ | 12364/15001 [7:54:41<1:22:56,  1.89s/it, loss=0.0866, lr=1e-5]Steps:  82%|████████▏ | 12364/15001 [7:54:41<1:22:56,  1.89s/it, loss=0.195, lr=1e-5] Steps:  82%|████████▏ | 12365/15001 [7:54:42<1:19:18,  1.81s/it, loss=0.195, lr=1e-5]Steps:  82%|████████▏ | 12365/15001 [7:54:42<1:19:18,  1.81s/it, loss=0.221, lr=1e-5]Steps:  82%|████████▏ | 12366/15001 [7:54:44<1:20:19,  1.83s/it, loss=0.221, lr=1e-5]Steps:  82%|██████��█▏ | 12366/15001 [7:54:44<1:20:19,  1.83s/it, loss=0.173, lr=1e-5]Steps:  82%|████████▏ | 12367/15001 [7:54:46<1:21:35,  1.86s/it, loss=0.173, lr=1e-5]Steps:  82%|████████▏ | 12367/15001 [7:54:46<1:21:35,  1.86s/it, loss=0.161, lr=1e-5]Steps:  82%|████████▏ | 12368/15001 [7:54:48<1:18:18,  1.78s/it, loss=0.161, lr=1e-5]Steps:  82%|████████▏ | 12368/15001 [7:54:48<1:18:18,  1.78s/it, loss=0.166, lr=1e-5]Steps:  82%|████████▏ | 12369/15001 [7:54:50<1:19:58,  1.82s/it, loss=0.166, lr=1e-5]Steps:  82%|████████▏ | 12369/15001 [7:54:50<1:19:58,  1.82s/it, loss=0.145, lr=1e-5]Steps:  82%|████████▏ | 12370/15001 [7:54:51<1:17:45,  1.77s/it, loss=0.145, lr=1e-5]Steps:  82%|████████▏ | 12370/15001 [7:54:52<1:17:45,  1.77s/it, loss=0.182, lr=1e-5]Steps:  82%|████████▏ | 12371/15001 [7:54:53<1:22:41,  1.89s/it, loss=0.182, lr=1e-5]Steps:  82%|████████▏ | 12371/15001 [7:54:53<1:22:41,  1.89s/it, loss=0.281, lr=1e-5]Steps:  82%|████████▏ | 12372/15001 [7:54:55<1:21:06,  1.85s/it, loss=0.281, lr=1e-5]Steps:  82%|████████▏ | 12372/15001 [7:54:55<1:21:06,  1.85s/it, loss=0.139, lr=1e-5]Steps:  82%|████████▏ | 12373/15001 [7:54:57<1:22:22,  1.88s/it, loss=0.139, lr=1e-5]Steps:  82%|████████▏ | 12373/15001 [7:54:57<1:22:22,  1.88s/it, loss=0.133, lr=1e-5]Steps:  82%|████████▏ | 12374/15001 [7:54:59<1:21:05,  1.85s/it, loss=0.133, lr=1e-5]Steps:  82%|████████▏ | 12374/15001 [7:54:59<1:21:05,  1.85s/it, loss=0.225, lr=1e-5]Steps:  82%|████████▏ | 12375/15001 [7:55:01<1:19:58,  1.83s/it, loss=0.225, lr=1e-5]Steps:  82%|████████▏ | 12375/15001 [7:55:01<1:19:58,  1.83s/it, loss=0.219, lr=1e-5]Steps:  83%|████████▎ | 12376/15001 [7:55:02<1:19:02,  1.81s/it, loss=0.219, lr=1e-5]Steps:  83%|████████▎ | 12376/15001 [7:55:03<1:19:02,  1.81s/it, loss=0.333, lr=1e-5]Steps:  83%|████████▎ | 12377/15001 [7:55:04<1:22:09,  1.88s/it, loss=0.333, lr=1e-5]Steps:  83%|████████▎ | 12377/15001 [7:55:05<1:22:09,  1.88s/it, loss=0.204, lr=1e-5]Steps:  83%|████████▎ | 12378/15001 [7:55:06<1:20:31,  1.84s/it, loss=0.204, lr=1e-5]Steps:  83%|████████▎ | 12378/15001 [7:55:07<1:20:31,  1.84s/it, loss=0.279, lr=1e-5]Steps:  83%|████████▎ | 12379/15001 [7:55:08<1:24:53,  1.94s/it, loss=0.279, lr=1e-5]Steps:  83%|████████▎ | 12379/15001 [7:55:08<1:24:53,  1.94s/it, loss=0.231, lr=1e-5]Steps:  83%|████████▎ | 12380/15001 [7:55:10<1:24:33,  1.94s/it, loss=0.231, lr=1e-5]Steps:  83%|████████▎ | 12380/15001 [7:55:10<1:24:33,  1.94s/it, loss=0.222, lr=1e-5]Steps:  83%|████████▎ | 12381/15001 [7:55:12<1:25:44,  1.96s/it, loss=0.222, lr=1e-5]Steps:  83%|████████▎ | 12381/15001 [7:55:12<1:25:44,  1.96s/it, loss=0.077, lr=1e-5]Steps:  83%|████████▎ | 12382/15001 [7:55:14<1:23:30,  1.91s/it, loss=0.077, lr=1e-5]Steps:  83%|████████▎ | 12382/15001 [7:55:15<1:23:30,  1.91s/it, loss=0.154, lr=1e-5]Steps:  83%|████████▎ | 12383/15001 [7:55:16<1:27:40,  2.01s/it, loss=0.154, lr=1e-5]Steps:  83%|████████▎ | 12383/15001 [7:55:17<1:27:40,  2.01s/it, loss=0.223, lr=1e-5]Steps:  83%|████████▎ | 12384/15001 [7:55:18<1:26:45,  1.99s/it, loss=0.223, lr=1e-5]Steps:  83%|████████▎ | 12384/15001 [7:55:19<1:26:45,  1.99s/it, loss=0.124, lr=1e-5]Steps:  83%|████████▎ | 12385/15001 [7:55:20<1:21:37,  1.87s/it, loss=0.124, lr=1e-5]Steps:  83%|████████▎ | 12385/15001 [7:55:20<1:21:37,  1.87s/it, loss=0.221, lr=1e-5]Steps:  83%|████████▎ | 12386/15001 [7:55:22<1:25:10,  1.95s/it, loss=0.221, lr=1e-5]Steps:  83%|████████▎ | 12386/15001 [7:55:22<1:25:10,  1.95s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12387/15001 [7:55:24<1:24:11,  1.93s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12387/15001 [7:55:24<1:24:11,  1.93s/it, loss=0.0651, lr=1e-5]Steps:  83%|████████▎ | 12388/15001 [7:55:25<1:17:10,  1.77s/it, loss=0.0651, lr=1e-5]Steps:  83%|████████▎ | 12388/15001 [7:55:26<1:17:10,  1.77s/it, loss=0.117, lr=1e-5] Steps:  83%|████████▎ | 12389/15001 [7:55:28<1:23:39,  1.92s/it, loss=0.117, lr=1e-5]Steps:  83%|████████▎ | 12389/15001 [7:55:28<1:23:39,  1.92s/it, loss=0.145, lr=1e-5]Steps:  83%|████████▎ | 12390/15001 [7:55:30<1:24:38,  1.95s/it, loss=0.145, lr=1e-5]Steps:  83%|████████▎ | 12390/15001 [7:55:30<1:24:38,  1.95s/it, loss=0.175, lr=1e-5]Steps:  83%|████████▎ | 12391/15001 [7:55:31<1:19:47,  1.83s/it, loss=0.175, lr=1e-5]Steps:  83%|████████▎ | 12391/15001 [7:55:32<1:19:47,  1.83s/it, loss=0.0415, lr=1e-5]Steps:  83%|████████▎ | 12392/15001 [7:55:33<1:22:45,  1.90s/it, loss=0.0415, lr=1e-5]Steps:  83%|████████▎ | 12392/15001 [7:55:34<1:22:45,  1.90s/it, loss=0.221, lr=1e-5] Steps:  83%|████████▎ | 12393/15001 [7:55:35<1:24:26,  1.94s/it, loss=0.221, lr=1e-5]Steps:  83%|████████▎ | 12393/15001 [7:55:35<1:24:26,  1.94s/it, loss=0.232, lr=1e-5]Steps:  83%|████████▎ | 12394/15001 [7:55:37<1:21:34,  1.88s/it, loss=0.232, lr=1e-5]Steps:  83%|████████▎ | 12394/15001 [7:55:37<1:21:34,  1.88s/it, loss=0.321, lr=1e-5]Steps:  83%|████████▎ | 12395/15001 [7:55:39<1:19:48,  1.84s/it, loss=0.321, lr=1e-5]Steps:  83%|████████▎ | 12395/15001 [7:55:39<1:19:48,  1.84s/it, loss=0.129, lr=1e-5]Steps:  83%|████████▎ | 12396/15001 [7:55:40<1:17:35,  1.79s/it, loss=0.129, lr=1e-5]Steps:  83%|████████▎ | 12396/15001 [7:55:41<1:17:35,  1.79s/it, loss=0.0781, lr=1e-5]Steps:  83%|████████▎ | 12397/15001 [7:55:42<1:17:13,  1.78s/it, loss=0.0781, lr=1e-5]Steps:  83%|████████▎ | 12397/15001 [7:55:43<1:17:13,  1.78s/it, loss=0.28, lr=1e-5]  Steps:  83%|████████▎ | 12398/15001 [7:55:44<1:21:46,  1.89s/it, loss=0.28, lr=1e-5]Steps:  83%|████████▎ | 12398/15001 [7:55:44<1:21:46,  1.89s/it, loss=0.22, lr=1e-5]Steps:  83%|████████▎ | 12399/15001 [7:55:46<1:17:53,  1.80s/it, loss=0.22, lr=1e-5]Steps:  83%|████████▎ | 12399/15001 [7:55:46<1:17:53,  1.80s/it, loss=0.208, lr=1e-5]Steps:  83%|████████▎ | 12400/15001 [7:55:48<1:19:09,  1.83s/it, loss=0.208, lr=1e-5]Steps:  83%|████████▎ | 12400/15001 [7:55:48<1:19:09,  1.83s/it, loss=0.21, lr=1e-5] Steps:  83%|████████▎ | 12401/15001 [7:55:50<1:20:36,  1.86s/it, loss=0.21, lr=1e-5]Steps:  83%|████████▎ | 12401/15001 [7:55:50<1:20:36,  1.86s/it, loss=0.168, lr=1e-5]Steps:  83%|████████▎ | 12402/15001 [7:55:52<1:24:37,  1.95s/it, loss=0.168, lr=1e-5]Steps:  83%|████████▎ | 12402/15001 [7:55:52<1:24:37,  1.95s/it, loss=0.247, lr=1e-5]Steps:  83%|████████▎ | 12403/15001 [7:55:54<1:23:16,  1.92s/it, loss=0.247, lr=1e-5]Steps:  83%|████████▎ | 12403/15001 [7:55:54<1:23:16,  1.92s/it, loss=0.204, lr=1e-5]Steps:  83%|████████▎ | 12404/15001 [7:55:56<1:25:33,  1.98s/it, loss=0.204, lr=1e-5]Steps:  83%|████████▎ | 12404/15001 [7:55:56<1:25:33,  1.98s/it, loss=0.188, lr=1e-5]Steps:  83%|████████▎ | 12405/15001 [7:55:58<1:26:01,  1.99s/it, loss=0.188, lr=1e-5]Steps:  83%|████████▎ | 12405/15001 [7:55:58<1:26:01,  1.99s/it, loss=0.177, lr=1e-5]Steps:  83%|████████▎ | 12406/15001 [7:56:00<1:26:10,  1.99s/it, loss=0.177, lr=1e-5]Steps:  83%|████████▎ | 12406/15001 [7:56:00<1:26:10,  1.99s/it, loss=0.0939, lr=1e-5]Steps:  83%|████████▎ | 12407/15001 [7:56:02<1:24:55,  1.96s/it, loss=0.0939, lr=1e-5]Steps:  83%|████████▎ | 12407/15001 [7:56:02<1:24:55,  1.96s/it, loss=0.134, lr=1e-5] Steps:  83%|████████▎ | 12408/15001 [7:56:03<1:21:06,  1.88s/it, loss=0.134, lr=1e-5]Steps:  83%|████████▎ | 12408/15001 [7:56:04<1:21:06,  1.88s/it, loss=0.275, lr=1e-5]Steps:  83%|████████▎ | 12409/15001 [7:56:05<1:20:36,  1.87s/it, loss=0.275, lr=1e-5]Steps:  83%|████████▎ | 12409/15001 [7:56:05<1:20:36,  1.87s/it, loss=0.213, lr=1e-5]Steps:  83%|████████▎ | 12410/15001 [7:56:07<1:19:30,  1.84s/it, loss=0.213, lr=1e-5]Steps:  83%|████████▎ | 12410/15001 [7:56:07<1:19:30,  1.84s/it, loss=0.182, lr=1e-5]Steps:  83%|████████▎ | 12411/15001 [7:56:09<1:16:55,  1.78s/it, loss=0.182, lr=1e-5]Steps:  83%|████████▎ | 12411/15001 [7:56:09<1:16:55,  1.78s/it, loss=0.0194, lr=1e-5]Steps:  83%|████████▎ | 12412/15001 [7:56:10<1:16:44,  1.78s/it, loss=0.0194, lr=1e-5]Steps:  83%|████████▎ | 12412/15001 [7:56:11<1:16:44,  1.78s/it, loss=0.043, lr=1e-5] Steps:  83%|████████▎ | 12413/15001 [7:56:13<1:20:32,  1.87s/it, loss=0.043, lr=1e-5]Steps:  83%|████████▎ | 12413/15001 [7:56:13<1:20:32,  1.87s/it, loss=0.0402, lr=1e-5]Steps:  83%|████████▎ | 12414/15001 [7:56:14<1:17:02,  1.79s/it, loss=0.0402, lr=1e-5]Steps:  83%|████████▎ | 12414/15001 [7:56:14<1:17:02,  1.79s/it, loss=0.195, lr=1e-5] Steps:  83%|████████▎ | 12415/15001 [7:56:16<1:17:02,  1.79s/it, loss=0.195, lr=1e-5]Steps:  83%|████████▎ | 12415/15001 [7:56:16<1:17:02,  1.79s/it, loss=0.217, lr=1e-5]Steps:  83%|████████▎ | 12416/15001 [7:56:18<1:20:14,  1.86s/it, loss=0.217, lr=1e-5]Steps:  83%|████████▎ | 12416/15001 [7:56:18<1:20:14,  1.86s/it, loss=0.202, lr=1e-5]Steps:  83%|████████▎ | 12417/15001 [7:56:20<1:17:01,  1.79s/it, loss=0.202, lr=1e-5]Steps:  83%|████████▎ | 12417/15001 [7:56:20<1:17:01,  1.79s/it, loss=0.0686, lr=1e-5]Steps:  83%|████████▎ | 12418/15001 [7:56:22<1:20:12,  1.86s/it, loss=0.0686, lr=1e-5]Steps:  83%|████████▎ | 12418/15001 [7:56:22<1:20:12,  1.86s/it, loss=0.224, lr=1e-5] Steps:  83%|████████▎ | 12419/15001 [7:56:24<1:20:36,  1.87s/it, loss=0.224, lr=1e-5]Steps:  83%|████████▎ | 12419/15001 [7:56:24<1:20:36,  1.87s/it, loss=0.236, lr=1e-5]Steps:  83%|████████▎ | 12420/15001 [7:56:25<1:18:34,  1.83s/it, loss=0.236, lr=1e-5]Steps:  83%|████████▎ | 12420/15001 [7:56:26<1:18:34,  1.83s/it, loss=0.147, lr=1e-5]Steps:  83%|████████▎ | 12421/15001 [7:56:27<1:23:22,  1.94s/it, loss=0.147, lr=1e-5]Steps:  83%|████████▎ | 12421/15001 [7:56:28<1:23:22,  1.94s/it, loss=0.0328, lr=1e-5]Steps:  83%|████████▎ | 12422/15001 [7:56:29<1:20:29,  1.87s/it, loss=0.0328, lr=1e-5]Steps:  83%|████████▎ | 12422/15001 [7:56:29<1:20:29,  1.87s/it, loss=0.292, lr=1e-5] Steps:  83%|████████▎ | 12423/15001 [7:56:31<1:20:41,  1.88s/it, loss=0.292, lr=1e-5]Steps:  83%|████████▎ | 12423/15001 [7:56:31<1:20:41,  1.88s/it, loss=0.101, lr=1e-5]Steps:  83%|████████▎ | 12424/15001 [7:56:33<1:21:04,  1.89s/it, loss=0.101, lr=1e-5]Steps:  83%|████████▎ | 12424/15001 [7:56:33<1:21:04,  1.89s/it, loss=0.17, lr=1e-5] Steps:  83%|████████▎ | 12425/15001 [7:56:35<1:22:33,  1.92s/it, loss=0.17, lr=1e-5]Steps:  83%|████████▎ | 12425/15001 [7:56:35<1:22:33,  1.92s/it, loss=0.183, lr=1e-5]Steps:  83%|████████▎ | 12426/15001 [7:56:37<1:22:22,  1.92s/it, loss=0.183, lr=1e-5]Steps:  83%|████████▎ | 12426/15001 [7:56:37<1:22:22,  1.92s/it, loss=0.108, lr=1e-5]Steps:  83%|████████▎ | 12427/15001 [7:56:39<1:24:32,  1.97s/it, loss=0.108, lr=1e-5]Steps:  83%|████████▎ | 12427/15001 [7:56:39<1:24:32,  1.97s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12428/15001 [7:56:41<1:24:30,  1.97s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12428/15001 [7:56:41<1:24:30,  1.97s/it, loss=0.172, lr=1e-5]Steps:  83%|████████▎ | 12429/15001 [7:56:43<1:28:05,  2.05s/it, loss=0.172, lr=1e-5]Steps:  83%|████████▎ | 12429/15001 [7:56:43<1:28:05,  2.05s/it, loss=0.0793, lr=1e-5]Steps:  83%|████████▎ | 12430/15001 [7:56:45<1:25:46,  2.00s/it, loss=0.0793, lr=1e-5]Steps:  83%|████████▎ | 12430/15001 [7:56:45<1:25:46,  2.00s/it, loss=0.115, lr=1e-5] Steps:  83%|████████▎ | 12431/15001 [7:56:47<1:20:33,  1.88s/it, loss=0.115, lr=1e-5]Steps:  83%|████████▎ | 12431/15001 [7:56:47<1:20:33,  1.88s/it, loss=0.277, lr=1e-5]Steps:  83%|████████▎ | 12432/15001 [7:56:49<1:21:05,  1.89s/it, loss=0.277, lr=1e-5]Steps:  83%|████████▎ | 12432/15001 [7:56:49<1:21:05,  1.89s/it, loss=0.263, lr=1e-5]Steps:  83%|████████▎ | 12433/15001 [7:56:50<1:18:55,  1.84s/it, loss=0.263, lr=1e-5]Steps:  83%|████████▎ | 12433/15001 [7:56:51<1:18:55,  1.84s/it, loss=0.035, lr=1e-5]Steps:  83%|████████▎ | 12434/15001 [7:56:52<1:18:13,  1.83s/it, loss=0.035, lr=1e-5]Steps:  83%|████████▎ | 12434/15001 [7:56:52<1:18:13,  1.83s/it, loss=0.0722, lr=1e-5]Steps:  83%|████████▎ | 12435/15001 [7:56:54<1:15:47,  1.77s/it, loss=0.0722, lr=1e-5]Steps:  83%|████████▎ | 12435/15001 [7:56:54<1:15:47,  1.77s/it, loss=0.138, lr=1e-5] Steps:  83%|████████▎ | 12436/15001 [7:56:55<1:14:57,  1.75s/it, loss=0.138, lr=1e-5]Steps:  83%|████████▎ | 12436/15001 [7:56:56<1:14:57,  1.75s/it, loss=0.115, lr=1e-5]Steps:  83%|████████▎ | 12437/15001 [7:56:57<1:17:27,  1.81s/it, loss=0.115, lr=1e-5]Steps:  83%|████████▎ | 12437/15001 [7:56:58<1:17:27,  1.81s/it, loss=0.119, lr=1e-5]Steps:  83%|████████▎ | 12438/15001 [7:56:59<1:16:10,  1.78s/it, loss=0.119, lr=1e-5]Steps:  83%|████████▎ | 12438/15001 [7:56:59<1:16:10,  1.78s/it, loss=0.149, lr=1e-5]Steps:  83%|████████▎ | 12439/15001 [7:57:01<1:18:05,  1.83s/it, loss=0.149, lr=1e-5]Steps:  83%|████████▎ | 12439/15001 [7:57:01<1:18:05,  1.83s/it, loss=0.229, lr=1e-5]Steps:  83%|████████▎ | 12440/15001 [7:57:03<1:19:47,  1.87s/it, loss=0.229, lr=1e-5]Steps:  83%|████████▎ | 12440/15001 [7:57:03<1:19:47,  1.87s/it, loss=0.332, lr=1e-5]Steps:  83%|████████▎ | 12441/15001 [7:57:05<1:17:08,  1.81s/it, loss=0.332, lr=1e-5]Steps:  83%|████████▎ | 12441/15001 [7:57:05<1:17:08,  1.81s/it, loss=0.17, lr=1e-5] Steps:  83%|████████▎ | 12442/15001 [7:57:07<1:18:32,  1.84s/it, loss=0.17, lr=1e-5]Steps:  83%|████████▎ | 12442/15001 [7:57:07<1:18:32,  1.84s/it, loss=0.231, lr=1e-5]Steps:  83%|████████▎ | 12443/15001 [7:57:08<1:17:47,  1.82s/it, loss=0.231, lr=1e-5]Steps:  83%|████████▎ | 12443/15001 [7:57:09<1:17:47,  1.82s/it, loss=0.345, lr=1e-5]Steps:  83%|████████▎ | 12444/15001 [7:57:10<1:15:09,  1.76s/it, loss=0.345, lr=1e-5]Steps:  83%|████████▎ | 12444/15001 [7:57:10<1:15:09,  1.76s/it, loss=0.26, lr=1e-5] Steps:  83%|████████▎ | 12445/15001 [7:57:12<1:15:15,  1.77s/it, loss=0.26, lr=1e-5]Steps:  83%|████████▎ | 12445/15001 [7:57:12<1:15:15,  1.77s/it, loss=0.343, lr=1e-5]Steps:  83%|████████▎ | 12446/15001 [7:57:14<1:18:39,  1.85s/it, loss=0.343, lr=1e-5]Steps:  83%|████████▎ | 12446/15001 [7:57:14<1:18:39,  1.85s/it, loss=0.132, lr=1e-5]Steps:  83%|████████▎ | 12447/15001 [7:57:15<1:14:37,  1.75s/it, loss=0.132, lr=1e-5]Steps:  83%|████████▎ | 12447/15001 [7:57:16<1:14:37,  1.75s/it, loss=0.128, lr=1e-5]Steps:  83%|████████▎ | 12448/15001 [7:57:18<1:21:29,  1.92s/it, loss=0.128, lr=1e-5]Steps:  83%|████████▎ | 12448/15001 [7:57:18<1:21:29,  1.92s/it, loss=0.321, lr=1e-5]Steps:  83%|████████▎ | 12449/15001 [7:57:20<1:22:58,  1.95s/it, loss=0.321, lr=1e-5]Steps:  83%|████████▎ | 12449/15001 [7:57:20<1:22:58,  1.95s/it, loss=0.0315, lr=1e-5]Steps:  83%|████████▎ | 12450/15001 [7:57:22<1:21:15,  1.91s/it, loss=0.0315, lr=1e-5]Steps:  83%|████████▎ | 12450/15001 [7:57:22<1:21:15,  1.91s/it, loss=0.207, lr=1e-5] Steps:  83%|████████▎ | 12451/15001 [7:57:24<1:24:56,  2.00s/it, loss=0.207, lr=1e-5]Steps:  83%|████████▎ | 12451/15001 [7:57:24<1:24:56,  2.00s/it, loss=0.119, lr=1e-5]Steps:  83%|████████▎ | 12452/15001 [7:57:26<1:23:52,  1.97s/it, loss=0.119, lr=1e-5]Steps:  83%|████████▎ | 12452/15001 [7:57:26<1:23:52,  1.97s/it, loss=0.242, lr=1e-5]Steps:  83%|████████▎ | 12453/15001 [7:57:28<1:22:39,  1.95s/it, loss=0.242, lr=1e-5]Steps:  83%|████████▎ | 12453/15001 [7:57:28<1:22:39,  1.95s/it, loss=0.0858, lr=1e-5]Steps:  83%|████████▎ | 12454/15001 [7:57:29<1:20:25,  1.89s/it, loss=0.0858, lr=1e-5]Steps:  83%|████████▎ | 12454/15001 [7:57:29<1:20:25,  1.89s/it, loss=0.126, lr=1e-5] Steps:  83%|████████▎ | 12455/15001 [7:57:31<1:18:02,  1.84s/it, loss=0.126, lr=1e-5]Steps:  83%|████████▎ | 12455/15001 [7:57:31<1:18:02,  1.84s/it, loss=0.163, lr=1e-5]Steps:  83%|████████▎ | 12456/15001 [7:57:33<1:17:16,  1.82s/it, loss=0.163, lr=1e-5]Steps:  83%|████████▎ | 12456/15001 [7:57:33<1:17:16,  1.82s/it, loss=0.253, lr=1e-5]Steps:  83%|████████▎ | 12457/15001 [7:57:34<1:13:48,  1.74s/it, loss=0.253, lr=1e-5]Steps:  83%|████████▎ | 12457/15001 [7:57:35<1:13:48,  1.74s/it, loss=0.164, lr=1e-5]Steps:  83%|████████▎ | 12458/15001 [7:57:36<1:14:41,  1.76s/it, loss=0.164, lr=1e-5]Steps:  83%|████████▎ | 12458/15001 [7:57:36<1:14:41,  1.76s/it, loss=0.177, lr=1e-5]Steps:  83%|████████▎ | 12459/15001 [7:57:38<1:17:36,  1.83s/it, loss=0.177, lr=1e-5]Steps:  83%|████████▎ | 12459/15001 [7:57:38<1:17:36,  1.83s/it, loss=0.199, lr=1e-5]Steps:  83%|████████▎ | 12460/15001 [7:57:40<1:16:50,  1.81s/it, loss=0.199, lr=1e-5]Steps:  83%|████████▎ | 12460/15001 [7:57:40<1:16:50,  1.81s/it, loss=0.0831, lr=1e-5]Steps:  83%|████████▎ | 12461/15001 [7:57:42<1:16:17,  1.80s/it, loss=0.0831, lr=1e-5]Steps:  83%|████████▎ | 12461/15001 [7:57:42<1:16:17,  1.80s/it, loss=0.136, lr=1e-5] Steps:  83%|████████▎ | 12462/15001 [7:57:44<1:17:41,  1.84s/it, loss=0.136, lr=1e-5]Steps:  83%|████████▎ | 12462/15001 [7:57:44<1:17:41,  1.84s/it, loss=0.184, lr=1e-5]Steps:  83%|████████▎ | 12463/15001 [7:57:45<1:14:55,  1.77s/it, loss=0.184, lr=1e-5]Steps:  83%|████████▎ | 12463/15001 [7:57:45<1:14:55,  1.77s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12464/15001 [7:57:47<1:14:32,  1.76s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12464/15001 [7:57:47<1:14:32,  1.76s/it, loss=0.0774, lr=1e-5]Steps:  83%|████████▎ | 12465/15001 [7:57:49<1:18:42,  1.86s/it, loss=0.0774, lr=1e-5]Steps:  83%|████████▎ | 12465/15001 [7:57:49<1:18:42,  1.86s/it, loss=0.0314, lr=1e-5]Steps:  83%|████████▎ | 12466/15001 [7:57:51<1:16:14,  1.80s/it, loss=0.0314, lr=1e-5]Steps:  83%|████████▎ | 12466/15001 [7:57:51<1:16:14,  1.80s/it, loss=0.0784, lr=1e-5]Steps:  83%|████████▎ | 12467/15001 [7:57:52<1:14:26,  1.76s/it, loss=0.0784, lr=1e-5]Steps:  83%|████████▎ | 12467/15001 [7:57:53<1:14:26,  1.76s/it, loss=0.161, lr=1e-5] Steps:  83%|████████▎ | 12468/15001 [7:57:54<1:17:28,  1.84s/it, loss=0.161, lr=1e-5]Steps:  83%|████████▎ | 12468/15001 [7:57:54<1:17:28,  1.84s/it, loss=0.0699, lr=1e-5]Steps:  83%|████████▎ | 12469/15001 [7:57:56<1:16:00,  1.80s/it, loss=0.0699, lr=1e-5]Steps:  83%|████████▎ | 12469/15001 [7:57:56<1:16:00,  1.80s/it, loss=0.0188, lr=1e-5]Steps:  83%|████████▎ | 12470/15001 [7:57:58<1:16:17,  1.81s/it, loss=0.0188, lr=1e-5]Steps:  83%|████████▎ | 12470/15001 [7:57:58<1:16:17,  1.81s/it, loss=0.0969, lr=1e-5]Steps:  83%|████████▎ | 12471/15001 [7:58:00<1:18:27,  1.86s/it, loss=0.0969, lr=1e-5]Steps:  83%|████████▎ | 12471/15001 [7:58:00<1:18:27,  1.86s/it, loss=0.241, lr=1e-5] Steps:  83%|████████▎ | 12472/15001 [7:58:02<1:20:00,  1.90s/it, loss=0.241, lr=1e-5]Steps:  83%|████████▎ | 12472/15001 [7:58:02<1:20:00,  1.90s/it, loss=0.271, lr=1e-5]Steps:  83%|████████▎ | 12473/15001 [7:58:04<1:16:39,  1.82s/it, loss=0.271, lr=1e-5]Steps:  83%|████████▎ | 12473/15001 [7:58:04<1:16:39,  1.82s/it, loss=0.42, lr=1e-5] Steps:  83%|████████▎ | 12474/15001 [7:58:06<1:22:02,  1.95s/it, loss=0.42, lr=1e-5]Steps:  83%|████████▎ | 12474/15001 [7:58:06<1:22:02,  1.95s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12475/15001 [7:58:08<1:21:13,  1.93s/it, loss=0.113, lr=1e-5]Steps:  83%|████████▎ | 12475/15001 [7:58:08<1:21:13,  1.93s/it, loss=0.0785, lr=1e-5]Steps:  83%|████████▎ | 12476/15001 [7:58:10<1:22:43,  1.97s/it, loss=0.0785, lr=1e-5]Steps:  83%|████████▎ | 12476/15001 [7:58:10<1:22:43,  1.97s/it, loss=0.138, lr=1e-5] Steps:  83%|████████▎ | 12477/15001 [7:58:12<1:20:15,  1.91s/it, loss=0.138, lr=1e-5]Steps:  83%|████████▎ | 12477/15001 [7:58:12<1:20:15,  1.91s/it, loss=0.21, lr=1e-5] Steps:  83%|████████▎ | 12478/15001 [7:58:13<1:16:16,  1.81s/it, loss=0.21, lr=1e-5]Steps:  83%|████████▎ | 12478/15001 [7:58:14<1:16:16,  1.81s/it, loss=0.0975, lr=1e-5]Steps:  83%|████████▎ | 12479/15001 [7:58:15<1:20:23,  1.91s/it, loss=0.0975, lr=1e-5]Steps:  83%|████████▎ | 12479/15001 [7:58:15<1:20:23,  1.91s/it, loss=0.217, lr=1e-5] Steps:  83%|████████▎ | 12480/15001 [7:58:17<1:18:36,  1.87s/it, loss=0.217, lr=1e-5]Steps:  83%|████████▎ | 12480/15001 [7:58:17<1:18:36,  1.87s/it, loss=0.35, lr=1e-5] Steps:  83%|████████▎ | 12481/15001 [7:58:18<1:12:22,  1.72s/it, loss=0.35, lr=1e-5]Steps:  83%|████████▎ | 12481/15001 [7:58:19<1:12:22,  1.72s/it, loss=0.147, lr=1e-5]Steps:  83%|████████▎ | 12482/15001 [7:58:21<1:17:32,  1.85s/it, loss=0.147, lr=1e-5]Steps:  83%|████████▎ | 12482/15001 [7:58:21<1:17:32,  1.85s/it, loss=0.288, lr=1e-5]Steps:  83%|████████▎ | 12483/15001 [7:58:22<1:15:06,  1.79s/it, loss=0.288, lr=1e-5]Steps:  83%|████████▎ | 12483/15001 [7:58:23<1:15:06,  1.79s/it, loss=0.143, lr=1e-5]Steps:  83%|████████▎ | 12484/15001 [7:58:24<1:18:10,  1.86s/it, loss=0.143, lr=1e-5]Steps:  83%|████████▎ | 12484/15001 [7:58:24<1:18:10,  1.86s/it, loss=0.0916, lr=1e-5]Steps:  83%|████████▎ | 12485/15001 [7:58:26<1:14:57,  1.79s/it, loss=0.0916, lr=1e-5]Steps:  83%|████████▎ | 12485/15001 [7:58:26<1:14:57,  1.79s/it, loss=0.0986, lr=1e-5]Steps:  83%|████████▎ | 12486/15001 [7:58:28<1:16:26,  1.82s/it, loss=0.0986, lr=1e-5]Steps:  83%|████████▎ | 12486/15001 [7:58:28<1:16:26,  1.82s/it, loss=0.331, lr=1e-5] Steps:  83%|████████▎ | 12487/15001 [7:58:30<1:16:05,  1.82s/it, loss=0.331, lr=1e-5]Steps:  83%|████████▎ | 12487/15001 [7:58:30<1:16:05,  1.82s/it, loss=0.172, lr=1e-5]Steps:  83%|████████▎ | 12488/15001 [7:58:31<1:15:21,  1.80s/it, loss=0.172, lr=1e-5]Steps:  83%|████████▎ | 12488/15001 [7:58:32<1:15:21,  1.80s/it, loss=0.125, lr=1e-5]Steps:  83%|████████▎ | 12489/15001 [7:58:33<1:16:34,  1.83s/it, loss=0.125, lr=1e-5]Steps:  83%|████████▎ | 12489/15001 [7:58:33<1:16:34,  1.83s/it, loss=0.0663, lr=1e-5]Steps:  83%|████████▎ | 12490/15001 [7:58:35<1:15:11,  1.80s/it, loss=0.0663, lr=1e-5]Steps:  83%|████████▎ | 12490/15001 [7:58:35<1:15:11,  1.80s/it, loss=0.388, lr=1e-5] Steps:  83%|████████▎ | 12491/15001 [7:58:37<1:17:43,  1.86s/it, loss=0.388, lr=1e-5]Steps:  83%|████████▎ | 12491/15001 [7:58:37<1:17:43,  1.86s/it, loss=0.122, lr=1e-5]Steps:  83%|████████▎ | 12492/15001 [7:58:39<1:16:05,  1.82s/it, loss=0.122, lr=1e-5]Steps:  83%|████████▎ | 12492/15001 [7:58:39<1:16:05,  1.82s/it, loss=0.138, lr=1e-5]Steps:  83%|████████▎ | 12493/15001 [7:58:41<1:16:31,  1.83s/it, loss=0.138, lr=1e-5]Steps:  83%|████████▎ | 12493/15001 [7:58:41<1:16:31,  1.83s/it, loss=0.11, lr=1e-5] Steps:  83%|████████▎ | 12494/15001 [7:58:43<1:18:42,  1.88s/it, loss=0.11, lr=1e-5]Steps:  83%|████████▎ | 12494/15001 [7:58:43<1:18:42,  1.88s/it, loss=0.167, lr=1e-5]Steps:  83%|████████▎ | 12495/15001 [7:58:44<1:19:18,  1.90s/it, loss=0.167, lr=1e-5]Steps:  83%|████████▎ | 12495/15001 [7:58:45<1:19:18,  1.90s/it, loss=0.208, lr=1e-5]Steps:  83%|████████▎ | 12496/15001 [7:58:46<1:18:39,  1.88s/it, loss=0.208, lr=1e-5]Steps:  83%|████████▎ | 12496/15001 [7:58:47<1:18:39,  1.88s/it, loss=0.119, lr=1e-5]Steps:  83%|████████▎ | 12497/15001 [7:58:48<1:22:23,  1.97s/it, loss=0.119, lr=1e-5]Steps:  83%|████████▎ | 12497/15001 [7:58:49<1:22:23,  1.97s/it, loss=0.129, lr=1e-5]Steps:  83%|████████▎ | 12498/15001 [7:58:51<1:25:34,  2.05s/it, loss=0.129, lr=1e-5]Steps:  83%|████████▎ | 12498/15001 [7:58:51<1:25:34,  2.05s/it, loss=0.159, lr=1e-5]Steps:  83%|████████▎ | 12499/15001 [7:58:53<1:22:38,  1.98s/it, loss=0.159, lr=1e-5]Steps:  83%|████████▎ | 12499/15001 [7:58:53<1:22:38,  1.98s/it, loss=0.122, lr=1e-5]Steps:  83%|████████▎ | 12500/15001 [7:58:55<1:25:18,  2.05s/it, loss=0.122, lr=1e-5]02/04/2024 21:01:14 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1670.93it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  83%|████████▎ | 12500/15001 [8:02:34<1:25:18,  2.05s/it, loss=0.112, lr=1e-5]Steps:  83%|████████▎ | 12501/15001 [8:02:35<46:53:42, 67.53s/it, loss=0.112, lr=1e-5]Steps:  83%|████████▎ | 12501/15001 [8:02:35<46:53:42, 67.53s/it, loss=0.0829, lr=1e-5]Steps:  83%|████████▎ | 12502/15001 [8:02:37<33:10:59, 47.80s/it, loss=0.0829, lr=1e-5]Steps:  83%|████████▎ | 12502/15001 [8:02:37<33:10:59, 47.80s/it, loss=0.205, lr=1e-5] Steps:  83%|████████▎ | 12503/15001 [8:02:38<23:33:01, 33.94s/it, loss=0.205, lr=1e-5]Steps:  83%|████████▎ | 12503/15001 [8:02:39<23:33:01, 33.94s/it, loss=0.192, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  83%|████████▎ | 12504/15001 [8:02:41<16:56:03, 24.41s/it, loss=0.192, lr=1e-5]Steps:  83%|████████▎ | 12504/15001 [8:02:41<16:56:03, 24.41s/it, loss=0.012, lr=1e-5]Steps:  83%|████████▎ | 12505/15001 [8:02:42<12:11:42, 17.59s/it, loss=0.012, lr=1e-5]Steps:  83%|████████▎ | 12505/15001 [8:02:43<12:11:42, 17.59s/it, loss=0.213, lr=1e-5]Steps:  83%|████████▎ | 12506/15001 [8:02:45<9:02:22, 13.04s/it, loss=0.213, lr=1e-5] Steps:  83%|████████▎ | 12506/15001 [8:02:45<9:02:22, 13.04s/it, loss=0.178, lr=1e-5]Steps:  83%|████████▎ | 12507/15001 [8:02:47<6:45:51,  9.76s/it, loss=0.178, lr=1e-5]Steps:  83%|████████▎ | 12507/15001 [8:02:47<6:45:51,  9.76s/it, loss=0.336, lr=1e-5]Steps:  83%|████████▎ | 12508/15001 [8:02:50<5:24:15,  7.80s/it, loss=0.336, lr=1e-5]Steps:  83%|████████▎ | 12508/15001 [8:02:50<5:24:15,  7.80s/it, loss=0.13, lr=1e-5] Steps:  83%|████████▎ | 12509/15001 [8:02:52<4:09:51,  6.02s/it, loss=0.13, lr=1e-5]Steps:  83%|████████▎ | 12509/15001 [8:02:52<4:09:51,  6.02s/it, loss=0.224, lr=1e-5]Steps:  83%|████████▎ | 12510/15001 [8:02:53<3:13:24,  4.66s/it, loss=0.224, lr=1e-5]Steps:  83%|████████▎ | 12510/15001 [8:02:54<3:13:24,  4.66s/it, loss=0.22, lr=1e-5] Steps:  83%|████████▎ | 12511/15001 [8:02:55<2:39:16,  3.84s/it, loss=0.22, lr=1e-5]Steps:  83%|████████▎ | 12511/15001 [8:02:56<2:39:16,  3.84s/it, loss=0.082, lr=1e-5]Steps:  83%|████████▎ | 12512/15001 [8:02:57<2:13:07,  3.21s/it, loss=0.082, lr=1e-5]Steps:  83%|████████▎ | 12512/15001 [8:02:57<2:13:07,  3.21s/it, loss=0.133, lr=1e-5]Steps:  83%|████████▎ | 12513/15001 [8:02:59<1:55:56,  2.80s/it, loss=0.133, lr=1e-5]Steps:  83%|████████▎ | 12513/15001 [8:02:59<1:55:56,  2.80s/it, loss=0.118, lr=1e-5]Steps:  83%|████████▎ | 12514/15001 [8:03:01<1:45:02,  2.53s/it, loss=0.118, lr=1e-5]Steps:  83%|████████▎ | 12514/15001 [8:03:01<1:45:02,  2.53s/it, loss=0.378, lr=1e-5]Steps:  83%|████████▎ | 12515/15001 [8:03:02<1:33:15,  2.25s/it, loss=0.378, lr=1e-5]Steps:  83%|████████▎ | 12515/15001 [8:03:03<1:33:15,  2.25s/it, loss=0.24, lr=1e-5] Steps:  83%|████████▎ | 12516/15001 [8:03:04<1:31:04,  2.20s/it, loss=0.24, lr=1e-5]Steps:  83%|████████▎ | 12516/15001 [8:03:05<1:31:04,  2.20s/it, loss=0.13, lr=1e-5]Steps:  83%|████████▎ | 12517/15001 [8:03:06<1:26:41,  2.09s/it, loss=0.13, lr=1e-5]Steps:  83%|████████▎ | 12517/15001 [8:03:06<1:26:41,  2.09s/it, loss=0.033, lr=1e-5]Steps:  83%|████████▎ | 12518/15001 [8:03:08<1:22:52,  2.00s/it, loss=0.033, lr=1e-5]Steps:  83%|████████▎ | 12518/15001 [8:03:08<1:22:52,  2.00s/it, loss=0.0495, lr=1e-5]Steps:  83%|████████▎ | 12519/15001 [8:03:10<1:19:47,  1.93s/it, loss=0.0495, lr=1e-5]Steps:  83%|████████▎ | 12519/15001 [8:03:10<1:19:47,  1.93s/it, loss=0.184, lr=1e-5] Steps:  83%|████████▎ | 12520/15001 [8:03:12<1:18:05,  1.89s/it, loss=0.184, lr=1e-5]Steps:  83%|████████▎ | 12520/15001 [8:03:12<1:18:05,  1.89s/it, loss=0.0288, lr=1e-5]Steps:  83%|████████▎ | 12521/15001 [8:03:14<1:18:36,  1.90s/it, loss=0.0288, lr=1e-5]Steps:  83%|████████▎ | 12521/15001 [8:03:14<1:18:36,  1.90s/it, loss=0.114, lr=1e-5] Steps:  83%|████████▎ | 12522/15001 [8:03:15<1:17:33,  1.88s/it, loss=0.114, lr=1e-5]Steps:  83%|████████▎ | 12522/15001 [8:03:15<1:17:33,  1.88s/it, loss=0.0195, lr=1e-5]Steps:  83%|████████▎ | 12523/15001 [8:03:17<1:13:09,  1.77s/it, loss=0.0195, lr=1e-5]Steps:  83%|████████▎ | 12523/15001 [8:03:17<1:13:09,  1.77s/it, loss=0.289, lr=1e-5] Steps:  83%|████████▎ | 12524/15001 [8:03:19<1:16:55,  1.86s/it, loss=0.289, lr=1e-5]Steps:  83%|████████▎ | 12524/15001 [8:03:19<1:16:55,  1.86s/it, loss=0.34, lr=1e-5] Steps:  83%|████████▎ | 12525/15001 [8:03:20<1:11:28,  1.73s/it, loss=0.34, lr=1e-5]Steps:  83%|████████▎ | 12525/15001 [8:03:21<1:11:28,  1.73s/it, loss=0.404, lr=1e-5]Steps:  84%|████████▎ | 12526/15001 [8:03:23<1:16:11,  1.85s/it, loss=0.404, lr=1e-5]Steps:  84%|████████▎ | 12526/15001 [8:03:23<1:16:11,  1.85s/it, loss=0.091, lr=1e-5]Steps:  84%|████████▎ | 12527/15001 [8:03:24<1:15:52,  1.84s/it, loss=0.091, lr=1e-5]Steps:  84%|████████▎ | 12527/15001 [8:03:25<1:15:52,  1.84s/it, loss=0.0293, lr=1e-5]Steps:  84%|████████▎ | 12528/15001 [8:03:26<1:15:54,  1.84s/it, loss=0.0293, lr=1e-5]Steps:  84%|████████▎ | 12528/15001 [8:03:27<1:15:54,  1.84s/it, loss=0.0911, lr=1e-5]Steps:  84%|████████▎ | 12529/15001 [8:03:29<1:21:29,  1.98s/it, loss=0.0911, lr=1e-5]Steps:  84%|████████▎ | 12529/15001 [8:03:29<1:21:29,  1.98s/it, loss=0.181, lr=1e-5] Steps:  84%|████████▎ | 12530/15001 [8:03:30<1:20:49,  1.96s/it, loss=0.181, lr=1e-5]Steps:  84%|████████▎ | 12530/15001 [8:03:31<1:20:49,  1.96s/it, loss=0.0877, lr=1e-5]Steps:  84%|████████▎ | 12531/15001 [8:03:32<1:19:12,  1.92s/it, loss=0.0877, lr=1e-5]Steps:  84%|████████▎ | 12531/15001 [8:03:33<1:19:12,  1.92s/it, loss=0.0333, lr=1e-5]Steps:  84%|████████▎ | 12532/15001 [8:03:34<1:20:07,  1.95s/it, loss=0.0333, lr=1e-5]Steps:  84%|████████▎ | 12532/15001 [8:03:34<1:20:07,  1.95s/it, loss=0.235, lr=1e-5] Steps:  84%|████████▎ | 12533/15001 [8:03:36<1:18:27,  1.91s/it, loss=0.235, lr=1e-5]Steps:  84%|████████▎ | 12533/15001 [8:03:36<1:18:27,  1.91s/it, loss=0.141, lr=1e-5]Steps:  84%|████████▎ | 12534/15001 [8:03:38<1:18:23,  1.91s/it, loss=0.141, lr=1e-5]Steps:  84%|████████▎ | 12534/15001 [8:03:38<1:18:23,  1.91s/it, loss=0.125, lr=1e-5]Steps:  84%|████████▎ | 12535/15001 [8:03:40<1:16:16,  1.86s/it, loss=0.125, lr=1e-5]Steps:  84%|████████▎ | 12535/15001 [8:03:40<1:16:16,  1.86s/it, loss=0.0891, lr=1e-5]Steps:  84%|████████▎ | 12536/15001 [8:03:42<1:16:13,  1.86s/it, loss=0.0891, lr=1e-5]Steps:  84%|████████▎ | 12536/15001 [8:03:42<1:16:13,  1.86s/it, loss=0.101, lr=1e-5] Steps:  84%|████████▎ | 12537/15001 [8:03:43<1:14:01,  1.80s/it, loss=0.101, lr=1e-5]Steps:  84%|████████▎ | 12537/15001 [8:03:43<1:14:01,  1.80s/it, loss=0.205, lr=1e-5]Steps:  84%|████████▎ | 12538/15001 [8:03:45<1:13:03,  1.78s/it, loss=0.205, lr=1e-5]Steps:  84%|████████▎ | 12538/15001 [8:03:45<1:13:03,  1.78s/it, loss=0.327, lr=1e-5]Steps:  84%|████████▎ | 12539/15001 [8:03:47<1:13:18,  1.79s/it, loss=0.327, lr=1e-5]Steps:  84%|████████▎ | 12539/15001 [8:03:47<1:13:18,  1.79s/it, loss=0.163, lr=1e-5]Steps:  84%|████████▎ | 12540/15001 [8:03:49<1:14:55,  1.83s/it, loss=0.163, lr=1e-5]Steps:  84%|████████▎ | 12540/15001 [8:03:49<1:14:55,  1.83s/it, loss=0.0572, lr=1e-5]Steps:  84%|████████▎ | 12541/15001 [8:03:51<1:14:39,  1.82s/it, loss=0.0572, lr=1e-5]Steps:  84%|████████▎ | 12541/15001 [8:03:51<1:14:39,  1.82s/it, loss=0.277, lr=1e-5] Steps:  84%|████████▎ | 12542/15001 [8:03:52<1:12:50,  1.78s/it, loss=0.277, lr=1e-5]Steps:  84%|████████▎ | 12542/15001 [8:03:52<1:12:50,  1.78s/it, loss=0.295, lr=1e-5]Steps:  84%|████████▎ | 12543/15001 [8:03:54<1:10:15,  1.72s/it, loss=0.295, lr=1e-5]Steps:  84%|████████▎ | 12543/15001 [8:03:54<1:10:15,  1.72s/it, loss=0.2, lr=1e-5]  Steps:  84%|████████▎ | 12544/15001 [8:03:56<1:12:39,  1.77s/it, loss=0.2, lr=1e-5]Steps:  84%|████████▎ | 12544/15001 [8:03:56<1:12:39,  1.77s/it, loss=0.255, lr=1e-5]Steps:  84%|████████▎ | 12545/15001 [8:03:58<1:13:37,  1.80s/it, loss=0.255, lr=1e-5]Steps:  84%|████████▎ | 12545/15001 [8:03:58<1:13:37,  1.80s/it, loss=0.194, lr=1e-5]Steps:  84%|████████▎ | 12546/15001 [8:03:59<1:12:00,  1.76s/it, loss=0.194, lr=1e-5]Steps:  84%|████████▎ | 12546/15001 [8:03:59<1:12:00,  1.76s/it, loss=0.25, lr=1e-5] Steps:  84%|████████▎ | 12547/15001 [8:04:01<1:14:21,  1.82s/it, loss=0.25, lr=1e-5]Steps:  84%|████████▎ | 12547/15001 [8:04:01<1:14:21,  1.82s/it, loss=0.125, lr=1e-5]Steps:  84%|████████▎ | 12548/15001 [8:04:03<1:14:59,  1.83s/it, loss=0.125, lr=1e-5]Steps:  84%|████████▎ | 12548/15001 [8:04:03<1:14:59,  1.83s/it, loss=0.204, lr=1e-5]Steps:  84%|████████▎ | 12549/15001 [8:04:05<1:14:53,  1.83s/it, loss=0.204, lr=1e-5]Steps:  84%|████████▎ | 12549/15001 [8:04:05<1:14:53,  1.83s/it, loss=0.263, lr=1e-5]Steps:  84%|████████▎ | 12550/15001 [8:04:07<1:16:44,  1.88s/it, loss=0.263, lr=1e-5]Steps:  84%|████████▎ | 12550/15001 [8:04:07<1:16:44,  1.88s/it, loss=0.095, lr=1e-5]Steps:  84%|████████▎ | 12551/15001 [8:04:09<1:20:44,  1.98s/it, loss=0.095, lr=1e-5]Steps:  84%|████████▎ | 12551/15001 [8:04:09<1:20:44,  1.98s/it, loss=0.041, lr=1e-5]Steps:  84%|████████▎ | 12552/15001 [8:04:11<1:17:44,  1.90s/it, loss=0.041, lr=1e-5]Steps:  84%|████████▎ | 12552/15001 [8:04:11<1:17:44,  1.90s/it, loss=0.356, lr=1e-5]Steps:  84%|████████▎ | 12553/15001 [8:04:13<1:19:01,  1.94s/it, loss=0.356, lr=1e-5]Steps:  84%|████████▎ | 12553/15001 [8:04:13<1:19:01,  1.94s/it, loss=0.155, lr=1e-5]Steps:  84%|████████▎ | 12554/15001 [8:04:15<1:22:17,  2.02s/it, loss=0.155, lr=1e-5]Steps:  84%|████████▎ | 12554/15001 [8:04:15<1:22:17,  2.02s/it, loss=0.337, lr=1e-5]Steps:  84%|████████▎ | 12555/15001 [8:04:17<1:21:25,  2.00s/it, loss=0.337, lr=1e-5]Steps:  84%|████████▎ | 12555/15001 [8:04:17<1:21:25,  2.00s/it, loss=0.273, lr=1e-5]Steps:  84%|████████▎ | 12556/15001 [8:04:19<1:18:34,  1.93s/it, loss=0.273, lr=1e-5]Steps:  84%|████████▎ | 12556/15001 [8:04:19<1:18:34,  1.93s/it, loss=0.275, lr=1e-5]Steps:  84%|████████▎ | 12557/15001 [8:04:20<1:16:27,  1.88s/it, loss=0.275, lr=1e-5]Steps:  84%|████████▎ | 12557/15001 [8:04:21<1:16:27,  1.88s/it, loss=0.0879, lr=1e-5]Steps:  84%|████████▎ | 12558/15001 [8:04:22<1:15:29,  1.85s/it, loss=0.0879, lr=1e-5]Steps:  84%|████████▎ | 12558/15001 [8:04:23<1:15:29,  1.85s/it, loss=0.0658, lr=1e-5]Steps:  84%|████████▎ | 12559/15001 [8:04:24<1:16:48,  1.89s/it, loss=0.0658, lr=1e-5]Steps:  84%|████████▎ | 12559/15001 [8:04:24<1:16:48,  1.89s/it, loss=0.309, lr=1e-5] Steps:  84%|████████▎ | 12560/15001 [8:04:26<1:15:50,  1.86s/it, loss=0.309, lr=1e-5]Steps:  84%|████████▎ | 12560/15001 [8:04:26<1:15:50,  1.86s/it, loss=0.195, lr=1e-5]Steps:  84%|████████▎ | 12561/15001 [8:04:28<1:14:00,  1.82s/it, loss=0.195, lr=1e-5]Steps:  84%|████████▎ | 12561/15001 [8:04:28<1:14:00,  1.82s/it, loss=0.111, lr=1e-5]Steps:  84%|████████▎ | 12562/15001 [8:04:30<1:18:20,  1.93s/it, loss=0.111, lr=1e-5]Steps:  84%|████████▎ | 12562/15001 [8:04:30<1:18:20,  1.93s/it, loss=0.116, lr=1e-5]Steps:  84%|████████▎ | 12563/15001 [8:04:31<1:13:32,  1.81s/it, loss=0.116, lr=1e-5]Steps:  84%|████████▎ | 12563/15001 [8:04:32<1:13:32,  1.81s/it, loss=0.0744, lr=1e-5]Steps:  84%|████████▍ | 12564/15001 [8:04:33<1:14:42,  1.84s/it, loss=0.0744, lr=1e-5]Steps:  84%|████████▍ | 12564/15001 [8:04:34<1:14:42,  1.84s/it, loss=0.0561, lr=1e-5]Steps:  84%|████████▍ | 12565/15001 [8:04:35<1:13:19,  1.81s/it, loss=0.0561, lr=1e-5]Steps:  84%|████████▍ | 12565/15001 [8:04:35<1:13:19,  1.81s/it, loss=0.0745, lr=1e-5]Steps:  84%|████████▍ | 12566/15001 [8:04:37<1:15:37,  1.86s/it, loss=0.0745, lr=1e-5]Steps:  84%|████████▍ | 12566/15001 [8:04:37<1:15:37,  1.86s/it, loss=0.138, lr=1e-5] Steps:  84%|████████▍ | 12567/15001 [8:04:39<1:15:05,  1.85s/it, loss=0.138, lr=1e-5]Steps:  84%|████████▍ | 12567/15001 [8:04:39<1:15:05,  1.85s/it, loss=0.102, lr=1e-5]Steps:  84%|████████▍ | 12568/15001 [8:04:41<1:12:38,  1.79s/it, loss=0.102, lr=1e-5]Steps:  84%|████████▍ | 12568/15001 [8:04:41<1:12:38,  1.79s/it, loss=0.0931, lr=1e-5]Steps:  84%|████████▍ | 12569/15001 [8:04:43<1:15:31,  1.86s/it, loss=0.0931, lr=1e-5]Steps:  84%|████████▍ | 12569/15001 [8:04:43<1:15:31,  1.86s/it, loss=0.0897, lr=1e-5]Steps:  84%|████████▍ | 12570/15001 [8:04:44<1:12:57,  1.80s/it, loss=0.0897, lr=1e-5]Steps:  84%|████████▍ | 12570/15001 [8:04:45<1:12:57,  1.80s/it, loss=0.0645, lr=1e-5]Steps:  84%|████████▍ | 12571/15001 [8:04:46<1:11:58,  1.78s/it, loss=0.0645, lr=1e-5]Steps:  84%|████████▍ | 12571/15001 [8:04:46<1:11:58,  1.78s/it, loss=0.0254, lr=1e-5]Steps:  84%|████████▍ | 12572/15001 [8:04:48<1:14:25,  1.84s/it, loss=0.0254, lr=1e-5]Steps:  84%|████████▍ | 12572/15001 [8:04:48<1:14:25,  1.84s/it, loss=0.284, lr=1e-5] Steps:  84%|████████▍ | 12573/15001 [8:04:50<1:13:27,  1.82s/it, loss=0.284, lr=1e-5]Steps:  84%|████████▍ | 12573/15001 [8:04:50<1:13:27,  1.82s/it, loss=0.172, lr=1e-5]Steps:  84%|████████▍ | 12574/15001 [8:04:52<1:17:15,  1.91s/it, loss=0.172, lr=1e-5]Steps:  84%|████████▍ | 12574/15001 [8:04:52<1:17:15,  1.91s/it, loss=0.146, lr=1e-5]Steps:  84%|████████▍ | 12575/15001 [8:04:54<1:14:45,  1.85s/it, loss=0.146, lr=1e-5]Steps:  84%|████████▍ | 12575/15001 [8:04:54<1:14:45,  1.85s/it, loss=0.0707, lr=1e-5]Steps:  84%|████████▍ | 12576/15001 [8:04:56<1:17:02,  1.91s/it, loss=0.0707, lr=1e-5]Steps:  84%|████████▍ | 12576/15001 [8:04:56<1:17:02,  1.91s/it, loss=0.212, lr=1e-5] Steps:  84%|████████▍ | 12577/15001 [8:04:58<1:21:18,  2.01s/it, loss=0.212, lr=1e-5]Steps:  84%|████████▍ | 12577/15001 [8:04:58<1:21:18,  2.01s/it, loss=0.253, lr=1e-5]Steps:  84%|████████▍ | 12578/15001 [8:05:00<1:19:35,  1.97s/it, loss=0.253, lr=1e-5]Steps:  84%|████████▍ | 12578/15001 [8:05:00<1:19:35,  1.97s/it, loss=0.191, lr=1e-5]Steps:  84%|████████▍ | 12579/15001 [8:05:01<1:15:57,  1.88s/it, loss=0.191, lr=1e-5]Steps:  84%|████████▍ | 12579/15001 [8:05:02<1:15:57,  1.88s/it, loss=0.264, lr=1e-5]Steps:  84%|████████▍ | 12580/15001 [8:05:03<1:15:52,  1.88s/it, loss=0.264, lr=1e-5]Steps:  84%|████████▍ | 12580/15001 [8:05:04<1:15:52,  1.88s/it, loss=0.197, lr=1e-5]Steps:  84%|████████▍ | 12581/15001 [8:05:05<1:15:02,  1.86s/it, loss=0.197, lr=1e-5]Steps:  84%|████████▍ | 12581/15001 [8:05:05<1:15:02,  1.86s/it, loss=0.355, lr=1e-5]Steps:  84%|████████▍ | 12582/15001 [8:05:07<1:16:49,  1.91s/it, loss=0.355, lr=1e-5]Steps:  84%|████████▍ | 12582/15001 [8:05:07<1:16:49,  1.91s/it, loss=0.113, lr=1e-5]Steps:  84%|████████▍ | 12583/15001 [8:05:09<1:12:19,  1.79s/it, loss=0.113, lr=1e-5]Steps:  84%|████████▍ | 12583/15001 [8:05:09<1:12:19,  1.79s/it, loss=0.102, lr=1e-5]Steps:  84%|████████▍ | 12584/15001 [8:05:11<1:15:27,  1.87s/it, loss=0.102, lr=1e-5]Steps:  84%|████████▍ | 12584/15001 [8:05:11<1:15:27,  1.87s/it, loss=0.19, lr=1e-5] Steps:  84%|████████▍ | 12585/15001 [8:05:12<1:13:44,  1.83s/it, loss=0.19, lr=1e-5]Steps:  84%|████████▍ | 12585/15001 [8:05:13<1:13:44,  1.83s/it, loss=0.219, lr=1e-5]Steps:  84%|████████▍ | 12586/15001 [8:05:14<1:13:30,  1.83s/it, loss=0.219, lr=1e-5]Steps:  84%|████████▍ | 12586/15001 [8:05:15<1:13:30,  1.83s/it, loss=0.0285, lr=1e-5]Steps:  84%|████████▍ | 12587/15001 [8:05:16<1:15:06,  1.87s/it, loss=0.0285, lr=1e-5]Steps:  84%|████████▍ | 12587/15001 [8:05:16<1:15:06,  1.87s/it, loss=0.0322, lr=1e-5]Steps:  84%|████████▍ | 12588/15001 [8:05:18<1:13:29,  1.83s/it, loss=0.0322, lr=1e-5]Steps:  84%|████████▍ | 12588/15001 [8:05:18<1:13:29,  1.83s/it, loss=0.317, lr=1e-5] Steps:  84%|████████▍ | 12589/15001 [8:05:20<1:16:28,  1.90s/it, loss=0.317, lr=1e-5]Steps:  84%|████████▍ | 12589/15001 [8:05:20<1:16:28,  1.90s/it, loss=0.221, lr=1e-5]Steps:  84%|████████▍ | 12590/15001 [8:05:22<1:16:05,  1.89s/it, loss=0.221, lr=1e-5]Steps:  84%|████████▍ | 12590/15001 [8:05:22<1:16:05,  1.89s/it, loss=0.265, lr=1e-5]Steps:  84%|████████▍ | 12591/15001 [8:05:24<1:14:33,  1.86s/it, loss=0.265, lr=1e-5]Steps:  84%|████████▍ | 12591/15001 [8:05:24<1:14:33,  1.86s/it, loss=0.169, lr=1e-5]Steps:  84%|████████▍ | 12592/15001 [8:05:25<1:13:30,  1.83s/it, loss=0.169, lr=1e-5]Steps:  84%|████████▍ | 12592/15001 [8:05:26<1:13:30,  1.83s/it, loss=0.0224, lr=1e-5]Steps:  84%|████████▍ | 12593/15001 [8:05:27<1:13:10,  1.82s/it, loss=0.0224, lr=1e-5]Steps:  84%|████████▍ | 12593/15001 [8:05:27<1:13:10,  1.82s/it, loss=0.215, lr=1e-5] Steps:  84%|████████▍ | 12594/15001 [8:05:29<1:10:58,  1.77s/it, loss=0.215, lr=1e-5]Steps:  84%|████████▍ | 12594/15001 [8:05:29<1:10:58,  1.77s/it, loss=0.215, lr=1e-5]Steps:  84%|████████▍ | 12595/15001 [8:05:31<1:14:41,  1.86s/it, loss=0.215, lr=1e-5]Steps:  84%|████████▍ | 12595/15001 [8:05:31<1:14:41,  1.86s/it, loss=0.0796, lr=1e-5]Steps:  84%|████████▍ | 12596/15001 [8:05:33<1:13:51,  1.84s/it, loss=0.0796, lr=1e-5]Steps:  84%|████████▍ | 12596/15001 [8:05:33<1:13:51,  1.84s/it, loss=0.22, lr=1e-5]  Steps:  84%|████████▍ | 12597/15001 [8:05:35<1:15:49,  1.89s/it, loss=0.22, lr=1e-5]Steps:  84%|████████▍ | 12597/15001 [8:05:35<1:15:49,  1.89s/it, loss=0.216, lr=1e-5]Steps:  84%|████████▍ | 12598/15001 [8:05:37<1:15:47,  1.89s/it, loss=0.216, lr=1e-5]Steps:  84%|████████▍ | 12598/15001 [8:05:37<1:15:47,  1.89s/it, loss=0.0915, lr=1e-5]Steps:  84%|████████▍ | 12599/15001 [8:05:39<1:16:55,  1.92s/it, loss=0.0915, lr=1e-5]Steps:  84%|████████▍ | 12599/15001 [8:05:39<1:16:55,  1.92s/it, loss=0.206, lr=1e-5] Steps:  84%|████████▍ | 12600/15001 [8:05:40<1:15:28,  1.89s/it, loss=0.206, lr=1e-5]Steps:  84%|████████▍ | 12600/15001 [8:05:41<1:15:28,  1.89s/it, loss=0.142, lr=1e-5]Steps:  84%|████████▍ | 12601/15001 [8:05:43<1:17:51,  1.95s/it, loss=0.142, lr=1e-5]Steps:  84%|████████▍ | 12601/15001 [8:05:43<1:17:51,  1.95s/it, loss=0.466, lr=1e-5]Steps:  84%|████████▍ | 12602/15001 [8:05:44<1:16:49,  1.92s/it, loss=0.466, lr=1e-5]Steps:  84%|████████▍ | 12602/15001 [8:05:45<1:16:49,  1.92s/it, loss=0.413, lr=1e-5]Steps:  84%|████████▍ | 12603/15001 [8:05:46<1:14:45,  1.87s/it, loss=0.413, lr=1e-5]Steps:  84%|████████▍ | 12603/15001 [8:05:46<1:14:45,  1.87s/it, loss=0.155, lr=1e-5]Steps:  84%|████████▍ | 12604/15001 [8:05:48<1:14:49,  1.87s/it, loss=0.155, lr=1e-5]Steps:  84%|████████▍ | 12604/15001 [8:05:48<1:14:49,  1.87s/it, loss=0.239, lr=1e-5]Steps:  84%|████████▍ | 12605/15001 [8:05:50<1:15:12,  1.88s/it, loss=0.239, lr=1e-5]Steps:  84%|████████▍ | 12605/15001 [8:05:50<1:15:12,  1.88s/it, loss=0.305, lr=1e-5]Steps:  84%|████████▍ | 12606/15001 [8:05:52<1:13:13,  1.83s/it, loss=0.305, lr=1e-5]Steps:  84%|████████▍ | 12606/15001 [8:05:52<1:13:13,  1.83s/it, loss=0.22, lr=1e-5] Steps:  84%|████████▍ | 12607/15001 [8:05:53<1:11:50,  1.80s/it, loss=0.22, lr=1e-5]Steps:  84%|████████▍ | 12607/15001 [8:05:54<1:11:50,  1.80s/it, loss=0.0448, lr=1e-5]Steps:  84%|████████▍ | 12608/15001 [8:05:55<1:13:27,  1.84s/it, loss=0.0448, lr=1e-5]Steps:  84%|████████▍ | 12608/15001 [8:05:55<1:13:27,  1.84s/it, loss=0.182, lr=1e-5] Steps:  84%|████████▍ | 12609/15001 [8:05:57<1:10:45,  1.78s/it, loss=0.182, lr=1e-5]Steps:  84%|████████▍ | 12609/15001 [8:05:57<1:10:45,  1.78s/it, loss=0.281, lr=1e-5]Steps:  84%|████████▍ | 12610/15001 [8:05:59<1:13:25,  1.84s/it, loss=0.281, lr=1e-5]Steps:  84%|████████▍ | 12610/15001 [8:05:59<1:13:25,  1.84s/it, loss=0.314, lr=1e-5]Steps:  84%|████████▍ | 12611/15001 [8:06:01<1:14:49,  1.88s/it, loss=0.314, lr=1e-5]Steps:  84%|████████▍ | 12611/15001 [8:06:01<1:14:49,  1.88s/it, loss=0.213, lr=1e-5]Steps:  84%|████████▍ | 12612/15001 [8:06:03<1:12:34,  1.82s/it, loss=0.213, lr=1e-5]Steps:  84%|████████▍ | 12612/15001 [8:06:03<1:12:34,  1.82s/it, loss=0.055, lr=1e-5]Steps:  84%|████████▍ | 12613/15001 [8:06:04<1:12:26,  1.82s/it, loss=0.055, lr=1e-5]Steps:  84%|████████▍ | 12613/15001 [8:06:05<1:12:26,  1.82s/it, loss=0.219, lr=1e-5]Steps:  84%|████████▍ | 12614/15001 [8:06:06<1:12:53,  1.83s/it, loss=0.219, lr=1e-5]Steps:  84%|████████▍ | 12614/15001 [8:06:06<1:12:53,  1.83s/it, loss=0.111, lr=1e-5]Steps:  84%|████████▍ | 12615/15001 [8:06:08<1:13:03,  1.84s/it, loss=0.111, lr=1e-5]Steps:  84%|████████▍ | 12615/15001 [8:06:08<1:13:03,  1.84s/it, loss=0.283, lr=1e-5]Steps:  84%|████████▍ | 12616/15001 [8:06:10<1:13:01,  1.84s/it, loss=0.283, lr=1e-5]Steps:  84%|████████▍ | 12616/15001 [8:06:10<1:13:01,  1.84s/it, loss=0.154, lr=1e-5]Steps:  84%|████████▍ | 12617/15001 [8:06:12<1:12:37,  1.83s/it, loss=0.154, lr=1e-5]Steps:  84%|████████▍ | 12617/15001 [8:06:12<1:12:37,  1.83s/it, loss=0.118, lr=1e-5]Steps:  84%|████████▍ | 12618/15001 [8:06:13<1:09:48,  1.76s/it, loss=0.118, lr=1e-5]Steps:  84%|████████▍ | 12618/15001 [8:06:14<1:09:48,  1.76s/it, loss=0.193, lr=1e-5]Steps:  84%|████████▍ | 12619/15001 [8:06:15<1:13:03,  1.84s/it, loss=0.193, lr=1e-5]Steps:  84%|████████▍ | 12619/15001 [8:06:16<1:13:03,  1.84s/it, loss=0.233, lr=1e-5]Steps:  84%|████████▍ | 12620/15001 [8:06:18<1:20:21,  2.03s/it, loss=0.233, lr=1e-5]Steps:  84%|████████▍ | 12620/15001 [8:06:18<1:20:21,  2.03s/it, loss=0.131, lr=1e-5]Steps:  84%|████████▍ | 12621/15001 [8:06:20<1:15:57,  1.92s/it, loss=0.131, lr=1e-5]Steps:  84%|████████▍ | 12621/15001 [8:06:20<1:15:57,  1.92s/it, loss=0.0942, lr=1e-5]Steps:  84%|████████▍ | 12622/15001 [8:06:22<1:19:21,  2.00s/it, loss=0.0942, lr=1e-5]Steps:  84%|████████▍ | 12622/15001 [8:06:22<1:19:21,  2.00s/it, loss=0.237, lr=1e-5] Steps:  84%|████████▍ | 12623/15001 [8:06:24<1:23:10,  2.10s/it, loss=0.237, lr=1e-5]Steps:  84%|████████▍ | 12623/15001 [8:06:24<1:23:10,  2.10s/it, loss=0.303, lr=1e-5]Steps:  84%|████████▍ | 12624/15001 [8:06:26<1:21:21,  2.05s/it, loss=0.303, lr=1e-5]Steps:  84%|████████▍ | 12624/15001 [8:06:26<1:21:21,  2.05s/it, loss=0.0461, lr=1e-5]Steps:  84%|████████▍ | 12625/15001 [8:06:28<1:17:03,  1.95s/it, loss=0.0461, lr=1e-5]Steps:  84%|████████▍ | 12625/15001 [8:06:28<1:17:03,  1.95s/it, loss=0.152, lr=1e-5] Steps:  84%|████████▍ | 12626/15001 [8:06:30<1:15:13,  1.90s/it, loss=0.152, lr=1e-5]Steps:  84%|████████▍ | 12626/15001 [8:06:30<1:15:13,  1.90s/it, loss=0.331, lr=1e-5]Steps:  84%|████████▍ | 12627/15001 [8:06:31<1:15:28,  1.91s/it, loss=0.331, lr=1e-5]Steps:  84%|████████▍ | 12627/15001 [8:06:32<1:15:28,  1.91s/it, loss=0.224, lr=1e-5]Steps:  84%|████████▍ | 12628/15001 [8:06:33<1:15:52,  1.92s/it, loss=0.224, lr=1e-5]Steps:  84%|████████▍ | 12628/15001 [8:06:34<1:15:52,  1.92s/it, loss=0.0719, lr=1e-5]Steps:  84%|████████▍ | 12629/15001 [8:06:35<1:16:08,  1.93s/it, loss=0.0719, lr=1e-5]Steps:  84%|████████▍ | 12629/15001 [8:06:35<1:16:08,  1.93s/it, loss=0.241, lr=1e-5] Steps:  84%|████████▍ | 12630/15001 [8:06:37<1:13:51,  1.87s/it, loss=0.241, lr=1e-5]Steps:  84%|████████▍ | 12630/15001 [8:06:37<1:13:51,  1.87s/it, loss=0.0187, lr=1e-5]Steps:  84%|████████▍ | 12631/15001 [8:06:39<1:14:19,  1.88s/it, loss=0.0187, lr=1e-5]Steps:  84%|████████▍ | 12631/15001 [8:06:39<1:14:19,  1.88s/it, loss=0.169, lr=1e-5] Steps:  84%|████████▍ | 12632/15001 [8:06:41<1:11:45,  1.82s/it, loss=0.169, lr=1e-5]Steps:  84%|████████▍ | 12632/15001 [8:06:41<1:11:45,  1.82s/it, loss=0.328, lr=1e-5]Steps:  84%|████████▍ | 12633/15001 [8:06:42<1:11:12,  1.80s/it, loss=0.328, lr=1e-5]Steps:  84%|████████▍ | 12633/15001 [8:06:43<1:11:12,  1.80s/it, loss=0.0899, lr=1e-5]Steps:  84%|████████▍ | 12634/15001 [8:06:44<1:11:50,  1.82s/it, loss=0.0899, lr=1e-5]Steps:  84%|████████▍ | 12634/15001 [8:06:44<1:11:50,  1.82s/it, loss=0.272, lr=1e-5] Steps:  84%|████████▍ | 12635/15001 [8:06:46<1:11:45,  1.82s/it, loss=0.272, lr=1e-5]Steps:  84%|████████▍ | 12635/15001 [8:06:46<1:11:45,  1.82s/it, loss=0.221, lr=1e-5]Steps:  84%|████████▍ | 12636/15001 [8:06:48<1:11:01,  1.80s/it, loss=0.221, lr=1e-5]Steps:  84%|████████▍ | 12636/15001 [8:06:48<1:11:01,  1.80s/it, loss=0.127, lr=1e-5]Steps:  84%|████████▍ | 12637/15001 [8:06:50<1:14:38,  1.89s/it, loss=0.127, lr=1e-5]Steps:  84%|████████▍ | 12637/15001 [8:06:50<1:14:38,  1.89s/it, loss=0.0343, lr=1e-5]Steps:  84%|████████▍ | 12638/15001 [8:06:52<1:13:03,  1.86s/it, loss=0.0343, lr=1e-5]Steps:  84%|████████▍ | 12638/15001 [8:06:52<1:13:03,  1.86s/it, loss=0.0488, lr=1e-5]Steps:  84%|████████▍ | 12639/15001 [8:06:54<1:12:25,  1.84s/it, loss=0.0488, lr=1e-5]Steps:  84%|████████▍ | 12639/15001 [8:06:54<1:12:25,  1.84s/it, loss=0.189, lr=1e-5] Steps:  84%|████████▍ | 12640/15001 [8:06:55<1:10:51,  1.80s/it, loss=0.189, lr=1e-5]Steps:  84%|████████▍ | 12640/15001 [8:06:56<1:10:51,  1.80s/it, loss=0.196, lr=1e-5]Steps:  84%|████████▍ | 12641/15001 [8:06:57<1:13:29,  1.87s/it, loss=0.196, lr=1e-5]Steps:  84%|████████▍ | 12641/15001 [8:06:57<1:13:29,  1.87s/it, loss=0.159, lr=1e-5]Steps:  84%|████████▍ | 12642/15001 [8:06:59<1:13:19,  1.87s/it, loss=0.159, lr=1e-5]Steps:  84%|████████▍ | 12642/15001 [8:06:59<1:13:19,  1.87s/it, loss=0.2, lr=1e-5]  Steps:  84%|████████▍ | 12643/15001 [8:07:01<1:15:41,  1.93s/it, loss=0.2, lr=1e-5]Steps:  84%|████████▍ | 12643/15001 [8:07:01<1:15:41,  1.93s/it, loss=0.31, lr=1e-5]Steps:  84%|████████▍ | 12644/15001 [8:07:03<1:14:56,  1.91s/it, loss=0.31, lr=1e-5]Steps:  84%|████████▍ | 12644/15001 [8:07:03<1:14:56,  1.91s/it, loss=0.114, lr=1e-5]Steps:  84%|████████▍ | 12645/15001 [8:07:05<1:15:47,  1.93s/it, loss=0.114, lr=1e-5]Steps:  84%|████████▍ | 12645/15001 [8:07:05<1:15:47,  1.93s/it, loss=0.209, lr=1e-5]Steps:  84%|████████▍ | 12646/15001 [8:07:07<1:17:31,  1.98s/it, loss=0.209, lr=1e-5]Steps:  84%|████████▍ | 12646/15001 [8:07:07<1:17:31,  1.98s/it, loss=0.24, lr=1e-5] Steps:  84%|████████▍ | 12647/15001 [8:07:09<1:15:17,  1.92s/it, loss=0.24, lr=1e-5]Steps:  84%|████████▍ | 12647/15001 [8:07:09<1:15:17,  1.92s/it, loss=0.423, lr=1e-5]Steps:  84%|████████▍ | 12648/15001 [8:07:11<1:11:52,  1.83s/it, loss=0.423, lr=1e-5]Steps:  84%|████████▍ | 12648/15001 [8:07:11<1:11:52,  1.83s/it, loss=0.138, lr=1e-5]Steps:  84%|████████▍ | 12649/15001 [8:07:12<1:12:10,  1.84s/it, loss=0.138, lr=1e-5]Steps:  84%|████████▍ | 12649/15001 [8:07:13<1:12:10,  1.84s/it, loss=0.104, lr=1e-5]Steps:  84%|████████▍ | 12650/15001 [8:07:14<1:14:41,  1.91s/it, loss=0.104, lr=1e-5]Steps:  84%|████████▍ | 12650/15001 [8:07:15<1:14:41,  1.91s/it, loss=0.047, lr=1e-5]Steps:  84%|████████▍ | 12651/15001 [8:07:16<1:10:50,  1.81s/it, loss=0.047, lr=1e-5]Steps:  84%|████████▍ | 12651/15001 [8:07:16<1:10:50,  1.81s/it, loss=0.246, lr=1e-5]Steps:  84%|████████▍ | 12652/15001 [8:07:18<1:09:02,  1.76s/it, loss=0.246, lr=1e-5]Steps:  84%|████████▍ | 12652/15001 [8:07:18<1:09:02,  1.76s/it, loss=0.0297, lr=1e-5]Steps:  84%|████████▍ | 12653/15001 [8:07:19<1:08:57,  1.76s/it, loss=0.0297, lr=1e-5]Steps:  84%|████████▍ | 12653/15001 [8:07:20<1:08:57,  1.76s/it, loss=0.276, lr=1e-5] Steps:  84%|████████▍ | 12654/15001 [8:07:22<1:12:37,  1.86s/it, loss=0.276, lr=1e-5]Steps:  84%|████████▍ | 12654/15001 [8:07:22<1:12:37,  1.86s/it, loss=0.242, lr=1e-5]Steps:  84%|████████▍ | 12655/15001 [8:07:23<1:12:06,  1.84s/it, loss=0.242, lr=1e-5]Steps:  84%|████████▍ | 12655/15001 [8:07:23<1:12:06,  1.84s/it, loss=0.217, lr=1e-5]Steps:  84%|████████▍ | 12656/15001 [8:07:25<1:09:51,  1.79s/it, loss=0.217, lr=1e-5]Steps:  84%|████████▍ | 12656/15001 [8:07:25<1:09:51,  1.79s/it, loss=0.117, lr=1e-5]Steps:  84%|████████▍ | 12657/15001 [8:07:27<1:12:29,  1.86s/it, loss=0.117, lr=1e-5]Steps:  84%|████████▍ | 12657/15001 [8:07:27<1:12:29,  1.86s/it, loss=0.189, lr=1e-5]Steps:  84%|████████▍ | 12658/15001 [8:07:29<1:10:57,  1.82s/it, loss=0.189, lr=1e-5]Steps:  84%|████████▍ | 12658/15001 [8:07:29<1:10:57,  1.82s/it, loss=0.0898, lr=1e-5]Steps:  84%|████████▍ | 12659/15001 [8:07:31<1:11:59,  1.84s/it, loss=0.0898, lr=1e-5]Steps:  84%|████████▍ | 12659/15001 [8:07:31<1:11:59,  1.84s/it, loss=0.0144, lr=1e-5]Steps:  84%|████████▍ | 12660/15001 [8:07:33<1:12:33,  1.86s/it, loss=0.0144, lr=1e-5]Steps:  84%|████████▍ | 12660/15001 [8:07:33<1:12:33,  1.86s/it, loss=0.128, lr=1e-5] Steps:  84%|████████▍ | 12661/15001 [8:07:34<1:12:03,  1.85s/it, loss=0.128, lr=1e-5]Steps:  84%|████████▍ | 12661/15001 [8:07:34<1:12:03,  1.85s/it, loss=0.181, lr=1e-5]Steps:  84%|████████▍ | 12662/15001 [8:07:36<1:09:03,  1.77s/it, loss=0.181, lr=1e-5]Steps:  84%|████████▍ | 12662/15001 [8:07:36<1:09:03,  1.77s/it, loss=0.229, lr=1e-5]Steps:  84%|████████▍ | 12663/15001 [8:07:38<1:08:23,  1.76s/it, loss=0.229, lr=1e-5]Steps:  84%|████████▍ | 12663/15001 [8:07:38<1:08:23,  1.76s/it, loss=0.167, lr=1e-5]Steps:  84%|████████▍ | 12664/15001 [8:07:40<1:12:15,  1.86s/it, loss=0.167, lr=1e-5]Steps:  84%|████████▍ | 12664/15001 [8:07:40<1:12:15,  1.86s/it, loss=0.149, lr=1e-5]Steps:  84%|████████▍ | 12665/15001 [8:07:42<1:12:09,  1.85s/it, loss=0.149, lr=1e-5]Steps:  84%|████████▍ | 12665/15001 [8:07:42<1:12:09,  1.85s/it, loss=0.172, lr=1e-5]Steps:  84%|████████▍ | 12666/15001 [8:07:44<1:14:00,  1.90s/it, loss=0.172, lr=1e-5]Steps:  84%|████████▍ | 12666/15001 [8:07:44<1:14:00,  1.90s/it, loss=0.153, lr=1e-5]Steps:  84%|████████▍ | 12667/15001 [8:07:46<1:14:59,  1.93s/it, loss=0.153, lr=1e-5]Steps:  84%|████████▍ | 12667/15001 [8:07:46<1:14:59,  1.93s/it, loss=0.069, lr=1e-5]Steps:  84%|████████▍ | 12668/15001 [8:07:47<1:12:19,  1.86s/it, loss=0.069, lr=1e-5]Steps:  84%|████████▍ | 12668/15001 [8:07:48<1:12:19,  1.86s/it, loss=0.144, lr=1e-5]Steps:  84%|████████▍ | 12669/15001 [8:07:49<1:15:19,  1.94s/it, loss=0.144, lr=1e-5]Steps:  84%|████████▍ | 12669/15001 [8:07:50<1:15:19,  1.94s/it, loss=0.127, lr=1e-5]Steps:  84%|████████▍ | 12670/15001 [8:07:52<1:17:59,  2.01s/it, loss=0.127, lr=1e-5]Steps:  84%|████████▍ | 12670/15001 [8:07:52<1:17:59,  2.01s/it, loss=0.267, lr=1e-5]Steps:  84%|████████▍ | 12671/15001 [8:07:54<1:17:02,  1.98s/it, loss=0.267, lr=1e-5]Steps:  84%|████████▍ | 12671/15001 [8:07:54<1:17:02,  1.98s/it, loss=0.0271, lr=1e-5]Steps:  84%|████████▍ | 12672/15001 [8:07:55<1:12:27,  1.87s/it, loss=0.0271, lr=1e-5]Steps:  84%|████████▍ | 12672/15001 [8:07:55<1:12:27,  1.87s/it, loss=0.171, lr=1e-5] Steps:  84%|████████▍ | 12673/15001 [8:07:57<1:13:00,  1.88s/it, loss=0.171, lr=1e-5]Steps:  84%|████████▍ | 12673/15001 [8:07:57<1:13:00,  1.88s/it, loss=0.015, lr=1e-5]Steps:  84%|████████▍ | 12674/15001 [8:07:59<1:11:05,  1.83s/it, loss=0.015, lr=1e-5]Steps:  84%|████████▍ | 12674/15001 [8:07:59<1:11:05,  1.83s/it, loss=0.219, lr=1e-5]Steps:  84%|████████▍ | 12675/15001 [8:08:01<1:12:08,  1.86s/it, loss=0.219, lr=1e-5]Steps:  84%|████████▍ | 12675/15001 [8:08:01<1:12:08,  1.86s/it, loss=0.153, lr=1e-5]Steps:  85%|████████▍ | 12676/15001 [8:08:03<1:12:37,  1.87s/it, loss=0.153, lr=1e-5]Steps:  85%|████████▍ | 12676/15001 [8:08:03<1:12:37,  1.87s/it, loss=0.0772, lr=1e-5]Steps:  85%|████████▍ | 12677/15001 [8:08:04<1:07:58,  1.75s/it, loss=0.0772, lr=1e-5]Steps:  85%|████████▍ | 12677/15001 [8:08:06<1:07:58,  1.75s/it, loss=0.151, lr=1e-5] Steps:  85%|████████▍ | 12678/15001 [8:08:07<1:25:39,  2.21s/it, loss=0.151, lr=1e-5]Steps:  85%|████████▍ | 12678/15001 [8:08:07<1:25:39,  2.21s/it, loss=0.145, lr=1e-5]Steps:  85%|████████▍ | 12679/15001 [8:08:09<1:20:26,  2.08s/it, loss=0.145, lr=1e-5]Steps:  85%|████████▍ | 12679/15001 [8:08:09<1:20:26,  2.08s/it, loss=0.433, lr=1e-5]Steps:  85%|████████▍ | 12680/15001 [8:08:11<1:16:29,  1.98s/it, loss=0.433, lr=1e-5]Steps:  85%|███���████▍ | 12680/15001 [8:08:11<1:16:29,  1.98s/it, loss=0.0878, lr=1e-5]Steps:  85%|████████▍ | 12681/15001 [8:08:13<1:13:09,  1.89s/it, loss=0.0878, lr=1e-5]Steps:  85%|████████▍ | 12681/15001 [8:08:13<1:13:09,  1.89s/it, loss=0.125, lr=1e-5] Steps:  85%|████████▍ | 12682/15001 [8:08:14<1:11:27,  1.85s/it, loss=0.125, lr=1e-5]Steps:  85%|████████▍ | 12682/15001 [8:08:15<1:11:27,  1.85s/it, loss=0.0765, lr=1e-5]Steps:  85%|████████▍ | 12683/15001 [8:08:17<1:16:55,  1.99s/it, loss=0.0765, lr=1e-5]Steps:  85%|████████▍ | 12683/15001 [8:08:17<1:16:55,  1.99s/it, loss=0.0927, lr=1e-5]Steps:  85%|████████▍ | 12684/15001 [8:08:18<1:11:17,  1.85s/it, loss=0.0927, lr=1e-5]Steps:  85%|████████▍ | 12684/15001 [8:08:19<1:11:17,  1.85s/it, loss=0.274, lr=1e-5] Steps:  85%|████████▍ | 12685/15001 [8:08:20<1:13:48,  1.91s/it, loss=0.274, lr=1e-5]Steps:  85%|████████▍ | 12685/15001 [8:08:20<1:13:48,  1.91s/it, loss=0.284, lr=1e-5]Steps:  85%|████████▍ | 12686/15001 [8:08:22<1:12:36,  1.88s/it, loss=0.284, lr=1e-5]Steps:  85%|████████▍ | 12686/15001 [8:08:22<1:12:36,  1.88s/it, loss=0.177, lr=1e-5]Steps:  85%|████████▍ | 12687/15001 [8:08:24<1:16:10,  1.98s/it, loss=0.177, lr=1e-5]Steps:  85%|████████▍ | 12687/15001 [8:08:24<1:16:10,  1.98s/it, loss=0.0291, lr=1e-5]Steps:  85%|████████▍ | 12688/15001 [8:08:26<1:16:18,  1.98s/it, loss=0.0291, lr=1e-5]Steps:  85%|████████▍ | 12688/15001 [8:08:26<1:16:18,  1.98s/it, loss=0.104, lr=1e-5] Steps:  85%|████████▍ | 12689/15001 [8:08:28<1:14:52,  1.94s/it, loss=0.104, lr=1e-5]Steps:  85%|████████▍ | 12689/15001 [8:08:28<1:14:52,  1.94s/it, loss=0.127, lr=1e-5]Steps:  85%|████████▍ | 12690/15001 [8:08:30<1:16:08,  1.98s/it, loss=0.127, lr=1e-5]Steps:  85%|████████▍ | 12690/15001 [8:08:30<1:16:08,  1.98s/it, loss=0.0721, lr=1e-5]Steps:  85%|████████▍ | 12691/15001 [8:08:32<1:15:03,  1.95s/it, loss=0.0721, lr=1e-5]Steps:  85%|████████▍ | 12691/15001 [8:08:32<1:15:03,  1.95s/it, loss=0.0826, lr=1e-5]Steps:  85%|████████▍ | 12692/15001 [8:08:34<1:15:52,  1.97s/it, loss=0.0826, lr=1e-5]Steps:  85%|████████▍ | 12692/15001 [8:08:34<1:15:52,  1.97s/it, loss=0.236, lr=1e-5] Steps:  85%|████████▍ | 12693/15001 [8:08:36<1:14:10,  1.93s/it, loss=0.236, lr=1e-5]Steps:  85%|████████▍ | 12693/15001 [8:08:36<1:14:10,  1.93s/it, loss=0.145, lr=1e-5]Steps:  85%|████████▍ | 12694/15001 [8:08:38<1:15:28,  1.96s/it, loss=0.145, lr=1e-5]Steps:  85%|████████▍ | 12694/15001 [8:08:38<1:15:28,  1.96s/it, loss=0.235, lr=1e-5]Steps:  85%|████████▍ | 12695/15001 [8:08:40<1:14:41,  1.94s/it, loss=0.235, lr=1e-5]Steps:  85%|████████▍ | 12695/15001 [8:08:40<1:14:41,  1.94s/it, loss=0.383, lr=1e-5]Steps:  85%|████████▍ | 12696/15001 [8:08:42<1:13:14,  1.91s/it, loss=0.383, lr=1e-5]Steps:  85%|████████▍ | 12696/15001 [8:08:42<1:13:14,  1.91s/it, loss=0.223, lr=1e-5]Steps:  85%|████████▍ | 12697/15001 [8:08:44<1:14:20,  1.94s/it, loss=0.223, lr=1e-5]Steps:  85%|████████▍ | 12697/15001 [8:08:44<1:14:20,  1.94s/it, loss=0.148, lr=1e-5]Steps:  85%|████████▍ | 12698/15001 [8:08:45<1:12:57,  1.90s/it, loss=0.148, lr=1e-5]Steps:  85%|████████▍ | 12698/15001 [8:08:45<1:12:57,  1.90s/it, loss=0.133, lr=1e-5]Steps:  85%|████████▍ | 12699/15001 [8:08:47<1:11:32,  1.86s/it, loss=0.133, lr=1e-5]Steps:  85%|████████▍ | 12699/15001 [8:08:47<1:11:32,  1.86s/it, loss=0.09, lr=1e-5] Steps:  85%|████████▍ | 12700/15001 [8:08:49<1:10:57,  1.85s/it, loss=0.09, lr=1e-5]Steps:  85%|████████▍ | 12700/15001 [8:08:49<1:10:57,  1.85s/it, loss=0.205, lr=1e-5]Steps:  85%|████████▍ | 12701/15001 [8:08:51<1:11:02,  1.85s/it, loss=0.205, lr=1e-5]Steps:  85%|████████▍ | 12701/15001 [8:08:51<1:11:02,  1.85s/it, loss=0.108, lr=1e-5]Steps:  85%|████████▍ | 12702/15001 [8:08:52<1:07:16,  1.76s/it, loss=0.108, lr=1e-5]Steps:  85%|████████▍ | 12702/15001 [8:08:53<1:07:16,  1.76s/it, loss=0.0763, lr=1e-5]Steps:  85%|████████▍ | 12703/15001 [8:08:54<1:08:16,  1.78s/it, loss=0.0763, lr=1e-5]Steps:  85%|████████▍ | 12703/15001 [8:08:55<1:08:16,  1.78s/it, loss=0.286, lr=1e-5] Steps:  85%|████████▍ | 12704/15001 [8:08:56<1:10:25,  1.84s/it, loss=0.286, lr=1e-5]Steps:  85%|████████▍ | 12704/15001 [8:08:56<1:10:25,  1.84s/it, loss=0.255, lr=1e-5]Steps:  85%|█████���██▍ | 12705/15001 [8:08:58<1:10:50,  1.85s/it, loss=0.255, lr=1e-5]Steps:  85%|████████▍ | 12705/15001 [8:08:58<1:10:50,  1.85s/it, loss=0.216, lr=1e-5]Steps:  85%|████████▍ | 12706/15001 [8:09:00<1:09:23,  1.81s/it, loss=0.216, lr=1e-5]Steps:  85%|████████▍ | 12706/15001 [8:09:00<1:09:23,  1.81s/it, loss=0.155, lr=1e-5]Steps:  85%|████████▍ | 12707/15001 [8:09:02<1:08:49,  1.80s/it, loss=0.155, lr=1e-5]Steps:  85%|████████▍ | 12707/15001 [8:09:02<1:08:49,  1.80s/it, loss=0.242, lr=1e-5]Steps:  85%|████████▍ | 12708/15001 [8:09:03<1:08:33,  1.79s/it, loss=0.242, lr=1e-5]Steps:  85%|████████▍ | 12708/15001 [8:09:04<1:08:33,  1.79s/it, loss=0.0489, lr=1e-5]Steps:  85%|████████▍ | 12709/15001 [8:09:05<1:11:21,  1.87s/it, loss=0.0489, lr=1e-5]Steps:  85%|████████▍ | 12709/15001 [8:09:06<1:11:21,  1.87s/it, loss=0.235, lr=1e-5] Steps:  85%|████████▍ | 12710/15001 [8:09:07<1:10:42,  1.85s/it, loss=0.235, lr=1e-5]Steps:  85%|████████▍ | 12710/15001 [8:09:08<1:10:42,  1.85s/it, loss=0.17, lr=1e-5] Steps:  85%|████████▍ | 12711/15001 [8:09:10<1:15:33,  1.98s/it, loss=0.17, lr=1e-5]Steps:  85%|████████▍ | 12711/15001 [8:09:10<1:15:33,  1.98s/it, loss=0.149, lr=1e-5]Steps:  85%|████████▍ | 12712/15001 [8:09:12<1:18:42,  2.06s/it, loss=0.149, lr=1e-5]Steps:  85%|████████▍ | 12712/15001 [8:09:12<1:18:42,  2.06s/it, loss=0.0767, lr=1e-5]Steps:  85%|████████▍ | 12713/15001 [8:09:14<1:15:11,  1.97s/it, loss=0.0767, lr=1e-5]Steps:  85%|████████▍ | 12713/15001 [8:09:14<1:15:11,  1.97s/it, loss=0.155, lr=1e-5] Steps:  85%|████████▍ | 12714/15001 [8:09:15<1:14:57,  1.97s/it, loss=0.155, lr=1e-5]Steps:  85%|████████▍ | 12714/15001 [8:09:16<1:14:57,  1.97s/it, loss=0.107, lr=1e-5]Steps:  85%|████████▍ | 12715/15001 [8:09:17<1:12:45,  1.91s/it, loss=0.107, lr=1e-5]Steps:  85%|████████▍ | 12715/15001 [8:09:18<1:12:45,  1.91s/it, loss=0.192, lr=1e-5]Steps:  85%|████████▍ | 12716/15001 [8:09:20<1:17:48,  2.04s/it, loss=0.192, lr=1e-5]Steps:  85%|████████▍ | 12716/15001 [8:09:20<1:17:48,  2.04s/it, loss=0.11, lr=1e-5] Steps:  85%|████████▍ | 12717/15001 [8:09:21<1:15:19,  1.98s/it, loss=0.11, lr=1e-5]Steps:  85%|████████▍ | 12717/15001 [8:09:22<1:15:19,  1.98s/it, loss=0.278, lr=1e-5]Steps:  85%|████████▍ | 12718/15001 [8:09:23<1:12:40,  1.91s/it, loss=0.278, lr=1e-5]Steps:  85%|████████▍ | 12718/15001 [8:09:23<1:12:40,  1.91s/it, loss=0.19, lr=1e-5] Steps:  85%|████████▍ | 12719/15001 [8:09:25<1:12:32,  1.91s/it, loss=0.19, lr=1e-5]Steps:  85%|████████▍ | 12719/15001 [8:09:25<1:12:32,  1.91s/it, loss=0.0276, lr=1e-5]Steps:  85%|████████▍ | 12720/15001 [8:09:27<1:11:50,  1.89s/it, loss=0.0276, lr=1e-5]Steps:  85%|████████▍ | 12720/15001 [8:09:27<1:11:50,  1.89s/it, loss=0.25, lr=1e-5]  Steps:  85%|████████▍ | 12721/15001 [8:09:29<1:08:35,  1.81s/it, loss=0.25, lr=1e-5]Steps:  85%|████████▍ | 12721/15001 [8:09:29<1:08:35,  1.81s/it, loss=0.2, lr=1e-5] Steps:  85%|████████▍ | 12722/15001 [8:09:30<1:07:44,  1.78s/it, loss=0.2, lr=1e-5]Steps:  85%|████████▍ | 12722/15001 [8:09:31<1:07:44,  1.78s/it, loss=0.0649, lr=1e-5]Steps:  85%|████████▍ | 12723/15001 [8:09:32<1:10:48,  1.87s/it, loss=0.0649, lr=1e-5]Steps:  85%|████████▍ | 12723/15001 [8:09:33<1:10:48,  1.87s/it, loss=0.122, lr=1e-5] Steps:  85%|████████▍ | 12724/15001 [8:09:34<1:07:34,  1.78s/it, loss=0.122, lr=1e-5]Steps:  85%|████████▍ | 12724/15001 [8:09:34<1:07:34,  1.78s/it, loss=0.0344, lr=1e-5]Steps:  85%|████████▍ | 12725/15001 [8:09:36<1:08:46,  1.81s/it, loss=0.0344, lr=1e-5]Steps:  85%|████████▍ | 12725/15001 [8:09:36<1:08:46,  1.81s/it, loss=0.391, lr=1e-5] Steps:  85%|████████▍ | 12726/15001 [8:09:38<1:09:58,  1.85s/it, loss=0.391, lr=1e-5]Steps:  85%|████████▍ | 12726/15001 [8:09:38<1:09:58,  1.85s/it, loss=0.165, lr=1e-5]Steps:  85%|████████▍ | 12727/15001 [8:09:40<1:10:01,  1.85s/it, loss=0.165, lr=1e-5]Steps:  85%|████████▍ | 12727/15001 [8:09:40<1:10:01,  1.85s/it, loss=0.291, lr=1e-5]Steps:  85%|████████▍ | 12728/15001 [8:09:41<1:06:41,  1.76s/it, loss=0.291, lr=1e-5]Steps:  85%|████████▍ | 12728/15001 [8:09:42<1:06:41,  1.76s/it, loss=0.206, lr=1e-5]Steps:  85%|████████▍ | 12729/15001 [8:09:43<1:10:40,  1.87s/it, loss=0.206, lr=1e-5]Steps:  85%|████████▍ | 12729/15001 [8:09:43<1:10:40,  1.87s/it, loss=0.0189, lr=1e-5]Steps:  85%|████████▍ | 12730/15001 [8:09:45<1:12:48,  1.92s/it, loss=0.0189, lr=1e-5]Steps:  85%|████████▍ | 12730/15001 [8:09:45<1:12:48,  1.92s/it, loss=0.204, lr=1e-5] Steps:  85%|████████▍ | 12731/15001 [8:09:47<1:10:35,  1.87s/it, loss=0.204, lr=1e-5]Steps:  85%|████████▍ | 12731/15001 [8:09:47<1:10:35,  1.87s/it, loss=0.22, lr=1e-5] Steps:  85%|████████▍ | 12732/15001 [8:09:49<1:06:25,  1.76s/it, loss=0.22, lr=1e-5]Steps:  85%|████████▍ | 12732/15001 [8:09:49<1:06:25,  1.76s/it, loss=0.117, lr=1e-5]Steps:  85%|████████▍ | 12733/15001 [8:09:51<1:09:03,  1.83s/it, loss=0.117, lr=1e-5]Steps:  85%|████████▍ | 12733/15001 [8:09:51<1:09:03,  1.83s/it, loss=0.144, lr=1e-5]Steps:  85%|████████▍ | 12734/15001 [8:09:52<1:08:45,  1.82s/it, loss=0.144, lr=1e-5]Steps:  85%|████████▍ | 12734/15001 [8:09:53<1:08:45,  1.82s/it, loss=0.157, lr=1e-5]Steps:  85%|████████▍ | 12735/15001 [8:09:55<1:13:45,  1.95s/it, loss=0.157, lr=1e-5]Steps:  85%|████████▍ | 12735/15001 [8:09:55<1:13:45,  1.95s/it, loss=0.0976, lr=1e-5]Steps:  85%|████████▍ | 12736/15001 [8:09:57<1:15:13,  1.99s/it, loss=0.0976, lr=1e-5]Steps:  85%|████████▍ | 12736/15001 [8:09:57<1:15:13,  1.99s/it, loss=0.329, lr=1e-5] Steps:  85%|████████▍ | 12737/15001 [8:09:59<1:14:02,  1.96s/it, loss=0.329, lr=1e-5]Steps:  85%|████████▍ | 12737/15001 [8:09:59<1:14:02,  1.96s/it, loss=0.305, lr=1e-5]Steps:  85%|████████▍ | 12738/15001 [8:10:01<1:14:23,  1.97s/it, loss=0.305, lr=1e-5]Steps:  85%|████████▍ | 12738/15001 [8:10:01<1:14:23,  1.97s/it, loss=0.18, lr=1e-5] Steps:  85%|████████▍ | 12739/15001 [8:10:03<1:14:11,  1.97s/it, loss=0.18, lr=1e-5]Steps:  85%|████████▍ | 12739/15001 [8:10:03<1:14:11,  1.97s/it, loss=0.176, lr=1e-5]Steps:  85%|████████▍ | 12740/15001 [8:10:04<1:12:49,  1.93s/it, loss=0.176, lr=1e-5]Steps:  85%|████████▍ | 12740/15001 [8:10:05<1:12:49,  1.93s/it, loss=0.33, lr=1e-5] Steps:  85%|████████▍ | 12741/15001 [8:10:06<1:11:44,  1.90s/it, loss=0.33, lr=1e-5]Steps:  85%|████████▍ | 12741/15001 [8:10:06<1:11:44,  1.90s/it, loss=0.0713, lr=1e-5]Steps:  85%|████████▍ | 12742/15001 [8:10:08<1:10:47,  1.88s/it, loss=0.0713, lr=1e-5]Steps:  85%|████████▍ | 12742/15001 [8:10:08<1:10:47,  1.88s/it, loss=0.161, lr=1e-5] Steps:  85%|████████▍ | 12743/15001 [8:10:10<1:08:06,  1.81s/it, loss=0.161, lr=1e-5]Steps:  85%|████████▍ | 12743/15001 [8:10:10<1:08:06,  1.81s/it, loss=0.202, lr=1e-5]Steps:  85%|████████▍ | 12744/15001 [8:10:12<1:08:50,  1.83s/it, loss=0.202, lr=1e-5]Steps:  85%|████████▍ | 12744/15001 [8:10:12<1:08:50,  1.83s/it, loss=0.346, lr=1e-5]Steps:  85%|████████▍ | 12745/15001 [8:10:13<1:09:33,  1.85s/it, loss=0.346, lr=1e-5]Steps:  85%|████████▍ | 12745/15001 [8:10:14<1:09:33,  1.85s/it, loss=0.338, lr=1e-5]Steps:  85%|████████▍ | 12746/15001 [8:10:15<1:08:24,  1.82s/it, loss=0.338, lr=1e-5]Steps:  85%|████████▍ | 12746/15001 [8:10:15<1:08:24,  1.82s/it, loss=0.13, lr=1e-5] Steps:  85%|████████▍ | 12747/15001 [8:10:17<1:09:12,  1.84s/it, loss=0.13, lr=1e-5]Steps:  85%|████████▍ | 12747/15001 [8:10:17<1:09:12,  1.84s/it, loss=0.143, lr=1e-5]Steps:  85%|████████▍ | 12748/15001 [8:10:19<1:09:27,  1.85s/it, loss=0.143, lr=1e-5]Steps:  85%|████████▍ | 12748/15001 [8:10:19<1:09:27,  1.85s/it, loss=0.0601, lr=1e-5]Steps:  85%|████████▍ | 12749/15001 [8:10:21<1:07:37,  1.80s/it, loss=0.0601, lr=1e-5]Steps:  85%|████████▍ | 12749/15001 [8:10:21<1:07:37,  1.80s/it, loss=0.0937, lr=1e-5]Steps:  85%|████████▍ | 12750/15001 [8:10:22<1:07:21,  1.80s/it, loss=0.0937, lr=1e-5]Steps:  85%|████████▍ | 12750/15001 [8:10:23<1:07:21,  1.80s/it, loss=0.117, lr=1e-5] Steps:  85%|████████▌ | 12751/15001 [8:10:24<1:07:11,  1.79s/it, loss=0.117, lr=1e-5]Steps:  85%|████████▌ | 12751/15001 [8:10:25<1:07:11,  1.79s/it, loss=0.367, lr=1e-5]Steps:  85%|████████▌ | 12752/15001 [8:10:26<1:08:26,  1.83s/it, loss=0.367, lr=1e-5]Steps:  85%|████████▌ | 12752/15001 [8:10:26<1:08:26,  1.83s/it, loss=0.148, lr=1e-5]Steps:  85%|████████▌ | 12753/15001 [8:10:28<1:09:30,  1.86s/it, loss=0.148, lr=1e-5]Steps:  85%|████████▌ | 12753/15001 [8:10:28<1:09:30,  1.86s/it, loss=0.145, lr=1e-5]Steps:  85%|████████▌ | 12754/15001 [8:10:30<1:09:19,  1.85s/it, loss=0.145, lr=1e-5]Steps:  85%|████████▌ | 12754/15001 [8:10:30<1:09:19,  1.85s/it, loss=0.403, lr=1e-5]Steps:  85%|████████▌ | 12755/15001 [8:10:32<1:10:46,  1.89s/it, loss=0.403, lr=1e-5]Steps:  85%|████████▌ | 12755/15001 [8:10:32<1:10:46,  1.89s/it, loss=0.0356, lr=1e-5]Steps:  85%|████████▌ | 12756/15001 [8:10:34<1:12:22,  1.93s/it, loss=0.0356, lr=1e-5]Steps:  85%|████████▌ | 12756/15001 [8:10:34<1:12:22,  1.93s/it, loss=0.125, lr=1e-5] Steps:  85%|████████▌ | 12757/15001 [8:10:36<1:11:44,  1.92s/it, loss=0.125, lr=1e-5]Steps:  85%|████████▌ | 12757/15001 [8:10:36<1:11:44,  1.92s/it, loss=0.229, lr=1e-5]Steps:  85%|████████▌ | 12758/15001 [8:10:38<1:12:18,  1.93s/it, loss=0.229, lr=1e-5]Steps:  85%|████████▌ | 12758/15001 [8:10:38<1:12:18,  1.93s/it, loss=0.0496, lr=1e-5]Steps:  85%|████████▌ | 12759/15001 [8:10:40<1:13:41,  1.97s/it, loss=0.0496, lr=1e-5]Steps:  85%|████████▌ | 12759/15001 [8:10:40<1:13:41,  1.97s/it, loss=0.0476, lr=1e-5]Steps:  85%|████████▌ | 12760/15001 [8:10:42<1:15:27,  2.02s/it, loss=0.0476, lr=1e-5]Steps:  85%|████████▌ | 12760/15001 [8:10:42<1:15:27,  2.02s/it, loss=0.18, lr=1e-5]  Steps:  85%|████████▌ | 12761/15001 [8:10:44<1:14:49,  2.00s/it, loss=0.18, lr=1e-5]Steps:  85%|████████▌ | 12761/15001 [8:10:44<1:14:49,  2.00s/it, loss=0.097, lr=1e-5]Steps:  85%|████████▌ | 12762/15001 [8:10:46<1:11:06,  1.91s/it, loss=0.097, lr=1e-5]Steps:  85%|████████▌ | 12762/15001 [8:10:46<1:11:06,  1.91s/it, loss=0.236, lr=1e-5]Steps:  85%|████████▌ | 12763/15001 [8:10:47<1:09:41,  1.87s/it, loss=0.236, lr=1e-5]Steps:  85%|████████▌ | 12763/15001 [8:10:48<1:09:41,  1.87s/it, loss=0.237, lr=1e-5]Steps:  85%|████████▌ | 12764/15001 [8:10:49<1:08:26,  1.84s/it, loss=0.237, lr=1e-5]Steps:  85%|████████▌ | 12764/15001 [8:10:49<1:08:26,  1.84s/it, loss=0.118, lr=1e-5]Steps:  85%|████████▌ | 12765/15001 [8:10:51<1:08:59,  1.85s/it, loss=0.118, lr=1e-5]Steps:  85%|████████▌ | 12765/15001 [8:10:51<1:08:59,  1.85s/it, loss=0.162, lr=1e-5]Steps:  85%|████████▌ | 12766/15001 [8:10:53<1:08:39,  1.84s/it, loss=0.162, lr=1e-5]Steps:  85%|████████▌ | 12766/15001 [8:10:53<1:08:39,  1.84s/it, loss=0.228, lr=1e-5]Steps:  85%|████████▌ | 12767/15001 [8:10:55<1:08:37,  1.84s/it, loss=0.228, lr=1e-5]Steps:  85%|████████▌ | 12767/15001 [8:10:55<1:08:37,  1.84s/it, loss=0.273, lr=1e-5]Steps:  85%|████████▌ | 12768/15001 [8:10:56<1:07:25,  1.81s/it, loss=0.273, lr=1e-5]Steps:  85%|████████▌ | 12768/15001 [8:10:57<1:07:25,  1.81s/it, loss=0.0323, lr=1e-5]Steps:  85%|████████▌ | 12769/15001 [8:10:58<1:06:21,  1.78s/it, loss=0.0323, lr=1e-5]Steps:  85%|████████▌ | 12769/15001 [8:10:58<1:06:21,  1.78s/it, loss=0.0735, lr=1e-5]Steps:  85%|████████▌ | 12770/15001 [8:11:00<1:07:42,  1.82s/it, loss=0.0735, lr=1e-5]Steps:  85%|████████▌ | 12770/15001 [8:11:00<1:07:42,  1.82s/it, loss=0.143, lr=1e-5] Steps:  85%|████████▌ | 12771/15001 [8:11:02<1:07:28,  1.82s/it, loss=0.143, lr=1e-5]Steps:  85%|████████▌ | 12771/15001 [8:11:02<1:07:28,  1.82s/it, loss=0.0413, lr=1e-5]Steps:  85%|████████▌ | 12772/15001 [8:11:03<1:04:37,  1.74s/it, loss=0.0413, lr=1e-5]Steps:  85%|████████▌ | 12772/15001 [8:11:04<1:04:37,  1.74s/it, loss=0.151, lr=1e-5] Steps:  85%|████████▌ | 12773/15001 [8:11:05<1:04:46,  1.74s/it, loss=0.151, lr=1e-5]Steps:  85%|████████▌ | 12773/15001 [8:11:05<1:04:46,  1.74s/it, loss=0.0984, lr=1e-5]Steps:  85%|████████▌ | 12774/15001 [8:11:07<1:06:43,  1.80s/it, loss=0.0984, lr=1e-5]Steps:  85%|████████▌ | 12774/15001 [8:11:07<1:06:43,  1.80s/it, loss=0.283, lr=1e-5] Steps:  85%|████████▌ | 12775/15001 [8:11:09<1:08:56,  1.86s/it, loss=0.283, lr=1e-5]Steps:  85%|████████▌ | 12775/15001 [8:11:09<1:08:56,  1.86s/it, loss=0.0781, lr=1e-5]Steps:  85%|████████▌ | 12776/15001 [8:11:11<1:08:58,  1.86s/it, loss=0.0781, lr=1e-5]Steps:  85%|████████▌ | 12776/15001 [8:11:11<1:08:58,  1.86s/it, loss=0.121, lr=1e-5] Steps:  85%|████████▌ | 12777/15001 [8:11:13<1:07:21,  1.82s/it, loss=0.121, lr=1e-5]Steps:  85%|████████▌ | 12777/15001 [8:11:13<1:07:21,  1.82s/it, loss=0.162, lr=1e-5]Steps:  85%|████████▌ | 12778/15001 [8:11:14<1:06:03,  1.78s/it, loss=0.162, lr=1e-5]Steps:  85%|████████▌ | 12778/15001 [8:11:15<1:06:03,  1.78s/it, loss=0.144, lr=1e-5]Steps:  85%|████████▌ | 12779/15001 [8:11:17<1:10:10,  1.89s/it, loss=0.144, lr=1e-5]Steps:  85%|████████▌ | 12779/15001 [8:11:17<1:10:10,  1.89s/it, loss=0.148, lr=1e-5]Steps:  85%|████████▌ | 12780/15001 [8:11:18<1:08:10,  1.84s/it, loss=0.148, lr=1e-5]Steps:  85%|████████▌ | 12780/15001 [8:11:19<1:08:10,  1.84s/it, loss=0.0791, lr=1e-5]Steps:  85%|████████▌ | 12781/15001 [8:11:21<1:13:19,  1.98s/it, loss=0.0791, lr=1e-5]Steps:  85%|████████▌ | 12781/15001 [8:11:21<1:13:19,  1.98s/it, loss=0.0256, lr=1e-5]Steps:  85%|████████▌ | 12782/15001 [8:11:23<1:13:03,  1.98s/it, loss=0.0256, lr=1e-5]Steps:  85%|████████▌ | 12782/15001 [8:11:23<1:13:03,  1.98s/it, loss=0.243, lr=1e-5] Steps:  85%|████████▌ | 12783/15001 [8:11:24<1:10:15,  1.90s/it, loss=0.243, lr=1e-5]Steps:  85%|████████▌ | 12783/15001 [8:11:25<1:10:15,  1.90s/it, loss=0.0854, lr=1e-5]Steps:  85%|████████▌ | 12784/15001 [8:11:26<1:12:27,  1.96s/it, loss=0.0854, lr=1e-5]Steps:  85%|████████▌ | 12784/15001 [8:11:26<1:12:27,  1.96s/it, loss=0.142, lr=1e-5] Steps:  85%|████████▌ | 12785/15001 [8:11:28<1:09:17,  1.88s/it, loss=0.142, lr=1e-5]Steps:  85%|████████▌ | 12785/15001 [8:11:28<1:09:17,  1.88s/it, loss=0.098, lr=1e-5]Steps:  85%|████████▌ | 12786/15001 [8:11:30<1:07:23,  1.83s/it, loss=0.098, lr=1e-5]Steps:  85%|████████▌ | 12786/15001 [8:11:30<1:07:23,  1.83s/it, loss=0.233, lr=1e-5]Steps:  85%|████████▌ | 12787/15001 [8:11:32<1:10:17,  1.90s/it, loss=0.233, lr=1e-5]Steps:  85%|████████▌ | 12787/15001 [8:11:32<1:10:17,  1.90s/it, loss=0.0658, lr=1e-5]Steps:  85%|████████▌ | 12788/15001 [8:11:33<1:06:57,  1.82s/it, loss=0.0658, lr=1e-5]Steps:  85%|████████▌ | 12788/15001 [8:11:34<1:06:57,  1.82s/it, loss=0.18, lr=1e-5]  Steps:  85%|████████▌ | 12789/15001 [8:11:35<1:09:16,  1.88s/it, loss=0.18, lr=1e-5]Steps:  85%|████████▌ | 12789/15001 [8:11:36<1:09:16,  1.88s/it, loss=0.0557, lr=1e-5]Steps:  85%|████████▌ | 12790/15001 [8:11:37<1:07:16,  1.83s/it, loss=0.0557, lr=1e-5]Steps:  85%|████████▌ | 12790/15001 [8:11:37<1:07:16,  1.83s/it, loss=0.211, lr=1e-5] Steps:  85%|████████▌ | 12791/15001 [8:11:39<1:06:51,  1.82s/it, loss=0.211, lr=1e-5]Steps:  85%|████████▌ | 12791/15001 [8:11:39<1:06:51,  1.82s/it, loss=0.0315, lr=1e-5]Steps:  85%|████████▌ | 12792/15001 [8:11:41<1:08:03,  1.85s/it, loss=0.0315, lr=1e-5]Steps:  85%|████████▌ | 12792/15001 [8:11:41<1:08:03,  1.85s/it, loss=0.0244, lr=1e-5]Steps:  85%|████████▌ | 12793/15001 [8:11:43<1:10:21,  1.91s/it, loss=0.0244, lr=1e-5]Steps:  85%|████████▌ | 12793/15001 [8:11:43<1:10:21,  1.91s/it, loss=0.0502, lr=1e-5]Steps:  85%|████████▌ | 12794/15001 [8:11:45<1:08:18,  1.86s/it, loss=0.0502, lr=1e-5]Steps:  85%|████████▌ | 12794/15001 [8:11:45<1:08:18,  1.86s/it, loss=0.103, lr=1e-5] Steps:  85%|████████▌ | 12795/15001 [8:11:46<1:07:25,  1.83s/it, loss=0.103, lr=1e-5]Steps:  85%|████████▌ | 12795/15001 [8:11:47<1:07:25,  1.83s/it, loss=0.174, lr=1e-5]Steps:  85%|████████▌ | 12796/15001 [8:11:48<1:04:30,  1.76s/it, loss=0.174, lr=1e-5]Steps:  85%|████████▌ | 12796/15001 [8:11:48<1:04:30,  1.76s/it, loss=0.222, lr=1e-5]Steps:  85%|████████▌ | 12797/15001 [8:11:50<1:05:42,  1.79s/it, loss=0.222, lr=1e-5]Steps:  85%|████████▌ | 12797/15001 [8:11:50<1:05:42,  1.79s/it, loss=0.153, lr=1e-5]Steps:  85%|████████▌ | 12798/15001 [8:11:52<1:10:05,  1.91s/it, loss=0.153, lr=1e-5]Steps:  85%|████████▌ | 12798/15001 [8:11:52<1:10:05,  1.91s/it, loss=0.253, lr=1e-5]Steps:  85%|████████▌ | 12799/15001 [8:11:54<1:08:28,  1.87s/it, loss=0.253, lr=1e-5]Steps:  85%|████████▌ | 12799/15001 [8:11:54<1:08:28,  1.87s/it, loss=0.359, lr=1e-5]Steps:  85%|████████▌ | 12800/15001 [8:11:56<1:07:17,  1.83s/it, loss=0.359, lr=1e-5]Steps:  85%|████████▌ | 12800/15001 [8:11:56<1:07:17,  1.83s/it, loss=0.0358, lr=1e-5]Steps:  85%|████████▌ | 12801/15001 [8:11:58<1:09:59,  1.91s/it, loss=0.0358, lr=1e-5]Steps:  85%|████████▌ | 12801/15001 [8:11:58<1:09:59,  1.91s/it, loss=0.0773, lr=1e-5]Steps:  85%|████████▌ | 12802/15001 [8:12:00<1:09:57,  1.91s/it, loss=0.0773, lr=1e-5]Steps:  85%|████████▌ | 12802/15001 [8:12:00<1:09:57,  1.91s/it, loss=0.197, lr=1e-5] Steps:  85%|████████▌ | 12803/15001 [8:12:02<1:13:18,  2.00s/it, loss=0.197, lr=1e-5]Steps:  85%|████████▌ | 12803/15001 [8:12:02<1:13:18,  2.00s/it, loss=0.298, lr=1e-5]Steps:  85%|████████▌ | 12804/15001 [8:12:04<1:12:55,  1.99s/it, loss=0.298, lr=1e-5]Steps:  85%|████████▌ | 12804/15001 [8:12:04<1:12:55,  1.99s/it, loss=0.146, lr=1e-5]Steps:  85%|████████▌ | 12805/15001 [8:12:06<1:11:32,  1.95s/it, loss=0.146, lr=1e-5]Steps:  85%|████████▌ | 12805/15001 [8:12:06<1:11:32,  1.95s/it, loss=0.176, lr=1e-5]Steps:  85%|████████▌ | 12806/15001 [8:12:07<1:09:20,  1.90s/it, loss=0.176, lr=1e-5]Steps:  85%|████████▌ | 12806/15001 [8:12:08<1:09:20,  1.90s/it, loss=0.249, lr=1e-5]Steps:  85%|████████▌ | 12807/15001 [8:12:09<1:10:43,  1.93s/it, loss=0.249, lr=1e-5]Steps:  85%|████████▌ | 12807/15001 [8:12:10<1:10:43,  1.93s/it, loss=0.393, lr=1e-5]Steps:  85%|████████▌ | 12808/15001 [8:12:11<1:07:08,  1.84s/it, loss=0.393, lr=1e-5]Steps:  85%|████████▌ | 12808/15001 [8:12:11<1:07:08,  1.84s/it, loss=0.22, lr=1e-5] Steps:  85%|████████▌ | 12809/15001 [8:12:13<1:08:37,  1.88s/it, loss=0.22, lr=1e-5]Steps:  85%|████████▌ | 12809/15001 [8:12:13<1:08:37,  1.88s/it, loss=0.174, lr=1e-5]Steps:  85%|████████▌ | 12810/15001 [8:12:15<1:08:10,  1.87s/it, loss=0.174, lr=1e-5]Steps:  85%|████████▌ | 12810/15001 [8:12:15<1:08:10,  1.87s/it, loss=0.242, lr=1e-5]Steps:  85%|████████▌ | 12811/15001 [8:12:16<1:04:37,  1.77s/it, loss=0.242, lr=1e-5]Steps:  85%|████████▌ | 12811/15001 [8:12:17<1:04:37,  1.77s/it, loss=0.266, lr=1e-5]Steps:  85%|████████▌ | 12812/15001 [8:12:18<1:06:11,  1.81s/it, loss=0.266, lr=1e-5]Steps:  85%|████████▌ | 12812/15001 [8:12:19<1:06:11,  1.81s/it, loss=0.0859, lr=1e-5]Steps:  85%|████████▌ | 12813/15001 [8:12:20<1:08:52,  1.89s/it, loss=0.0859, lr=1e-5]Steps:  85%|████████▌ | 12813/15001 [8:12:21<1:08:52,  1.89s/it, loss=0.165, lr=1e-5] Steps:  85%|████████▌ | 12814/15001 [8:12:22<1:07:05,  1.84s/it, loss=0.165, lr=1e-5]Steps:  85%|████████▌ | 12814/15001 [8:12:22<1:07:05,  1.84s/it, loss=0.0747, lr=1e-5]Steps:  85%|████████▌ | 12815/15001 [8:12:24<1:04:18,  1.76s/it, loss=0.0747, lr=1e-5]Steps:  85%|████████▌ | 12815/15001 [8:12:24<1:04:18,  1.76s/it, loss=0.0856, lr=1e-5]Steps:  85%|████████▌ | 12816/15001 [8:12:26<1:04:32,  1.77s/it, loss=0.0856, lr=1e-5]Steps:  85%|████████▌ | 12816/15001 [8:12:26<1:04:32,  1.77s/it, loss=0.18, lr=1e-5]  Steps:  85%|████████▌ | 12817/15001 [8:12:27<1:04:46,  1.78s/it, loss=0.18, lr=1e-5]Steps:  85%|████████▌ | 12817/15001 [8:12:28<1:04:46,  1.78s/it, loss=0.31, lr=1e-5]Steps:  85%|████████▌ | 12818/15001 [8:12:29<1:06:29,  1.83s/it, loss=0.31, lr=1e-5]Steps:  85%|████████▌ | 12818/15001 [8:12:29<1:06:29,  1.83s/it, loss=0.231, lr=1e-5]Steps:  85%|████████▌ | 12819/15001 [8:12:31<1:06:07,  1.82s/it, loss=0.231, lr=1e-5]Steps:  85%|████████▌ | 12819/15001 [8:12:31<1:06:07,  1.82s/it, loss=0.21, lr=1e-5] Steps:  85%|████████▌ | 12820/15001 [8:12:33<1:04:28,  1.77s/it, loss=0.21, lr=1e-5]Steps:  85%|████████▌ | 12820/15001 [8:12:33<1:04:28,  1.77s/it, loss=0.171, lr=1e-5]Steps:  85%|████████▌ | 12821/15001 [8:12:35<1:06:05,  1.82s/it, loss=0.171, lr=1e-5]Steps:  85%|████████▌ | 12821/15001 [8:12:35<1:06:05,  1.82s/it, loss=0.118, lr=1e-5]Steps:  85%|████████▌ | 12822/15001 [8:12:36<1:05:52,  1.81s/it, loss=0.118, lr=1e-5]Steps:  85%|████████▌ | 12822/15001 [8:12:37<1:05:52,  1.81s/it, loss=0.173, lr=1e-5]Steps:  85%|████████▌ | 12823/15001 [8:12:38<1:05:15,  1.80s/it, loss=0.173, lr=1e-5]Steps:  85%|████████▌ | 12823/15001 [8:12:38<1:05:15,  1.80s/it, loss=0.182, lr=1e-5]Steps:  85%|████████▌ | 12824/15001 [8:12:40<1:07:12,  1.85s/it, loss=0.182, lr=1e-5]Steps:  85%|████████▌ | 12824/15001 [8:12:40<1:07:12,  1.85s/it, loss=0.296, lr=1e-5]Steps:  85%|████████▌ | 12825/15001 [8:12:42<1:10:40,  1.95s/it, loss=0.296, lr=1e-5]Steps:  85%|████████▌ | 12825/15001 [8:12:42<1:10:40,  1.95s/it, loss=0.294, lr=1e-5]Steps:  86%|████████▌ | 12826/15001 [8:12:44<1:07:58,  1.88s/it, loss=0.294, lr=1e-5]Steps:  86%|████████▌ | 12826/15001 [8:12:44<1:07:58,  1.88s/it, loss=0.221, lr=1e-5]Steps:  86%|████████▌ | 12827/15001 [8:12:46<1:10:32,  1.95s/it, loss=0.221, lr=1e-5]Steps:  86%|████████▌ | 12827/15001 [8:12:46<1:10:32,  1.95s/it, loss=0.0827, lr=1e-5]Steps:  86%|████████▌ | 12828/15001 [8:12:48<1:11:14,  1.97s/it, loss=0.0827, lr=1e-5]Steps:  86%|████████▌ | 12828/15001 [8:12:48<1:11:14,  1.97s/it, loss=0.163, lr=1e-5] Steps:  86%|████████▌ | 12829/15001 [8:12:50<1:12:02,  1.99s/it, loss=0.163, lr=1e-5]Steps:  86%|████████▌ | 12829/15001 [8:12:50<1:12:02,  1.99s/it, loss=0.318, lr=1e-5]Steps:  86%|████████▌ | 12830/15001 [8:12:52<1:10:54,  1.96s/it, loss=0.318, lr=1e-5]Steps:  86%|████████▌ | 12830/15001 [8:12:52<1:10:54,  1.96s/it, loss=0.0613, lr=1e-5]Steps:  86%|████████▌ | 12831/15001 [8:12:54<1:07:01,  1.85s/it, loss=0.0613, lr=1e-5]Steps:  86%|████████▌ | 12831/15001 [8:12:54<1:07:01,  1.85s/it, loss=0.028, lr=1e-5] Steps:  86%|████████▌ | 12832/15001 [8:12:56<1:09:53,  1.93s/it, loss=0.028, lr=1e-5]Steps:  86%|████████▌ | 12832/15001 [8:12:56<1:09:53,  1.93s/it, loss=0.251, lr=1e-5]Steps:  86%|████████▌ | 12833/15001 [8:12:58<1:08:58,  1.91s/it, loss=0.251, lr=1e-5]Steps:  86%|████████▌ | 12833/15001 [8:12:58<1:08:58,  1.91s/it, loss=0.221, lr=1e-5]Steps:  86%|████████▌ | 12834/15001 [8:12:59<1:05:09,  1.80s/it, loss=0.221, lr=1e-5]Steps:  86%|████████▌ | 12834/15001 [8:13:00<1:05:09,  1.80s/it, loss=0.165, lr=1e-5]Steps:  86%|████████▌ | 12835/15001 [8:13:01<1:08:08,  1.89s/it, loss=0.165, lr=1e-5]Steps:  86%|████████▌ | 12835/15001 [8:13:02<1:08:08,  1.89s/it, loss=0.19, lr=1e-5] Steps:  86%|████████▌ | 12836/15001 [8:13:03<1:06:48,  1.85s/it, loss=0.19, lr=1e-5]Steps:  86%|████████▌ | 12836/15001 [8:13:03<1:06:48,  1.85s/it, loss=0.158, lr=1e-5]Steps:  86%|████████▌ | 12837/15001 [8:13:05<1:06:55,  1.86s/it, loss=0.158, lr=1e-5]Steps:  86%|████████▌ | 12837/15001 [8:13:05<1:06:55,  1.86s/it, loss=0.327, lr=1e-5]Steps:  86%|████████▌ | 12838/15001 [8:13:07<1:06:51,  1.85s/it, loss=0.327, lr=1e-5]Steps:  86%|████████▌ | 12838/15001 [8:13:07<1:06:51,  1.85s/it, loss=0.174, lr=1e-5]Steps:  86%|████████▌ | 12839/15001 [8:13:09<1:05:48,  1.83s/it, loss=0.174, lr=1e-5]Steps:  86%|████████▌ | 12839/15001 [8:13:09<1:05:48,  1.83s/it, loss=0.228, lr=1e-5]Steps:  86%|████████▌ | 12840/15001 [8:13:10<1:03:34,  1.77s/it, loss=0.228, lr=1e-5]Steps:  86%|████████▌ | 12840/15001 [8:13:11<1:03:34,  1.77s/it, loss=0.184, lr=1e-5]Steps:  86%|████████▌ | 12841/15001 [8:13:12<1:04:55,  1.80s/it, loss=0.184, lr=1e-5]Steps:  86%|████████▌ | 12841/15001 [8:13:12<1:04:55,  1.80s/it, loss=0.174, lr=1e-5]Steps:  86%|████████▌ | 12842/15001 [8:13:14<1:05:27,  1.82s/it, loss=0.174, lr=1e-5]Steps:  86%|████████▌ | 12842/15001 [8:13:14<1:05:27,  1.82s/it, loss=0.244, lr=1e-5]Steps:  86%|████████▌ | 12843/15001 [8:13:15<1:01:59,  1.72s/it, loss=0.244, lr=1e-5]Steps:  86%|████████▌ | 12843/15001 [8:13:16<1:01:59,  1.72s/it, loss=0.14, lr=1e-5] Steps:  86%|████████▌ | 12844/15001 [8:13:18<1:09:38,  1.94s/it, loss=0.14, lr=1e-5]Steps:  86%|████████▌ | 12844/15001 [8:13:18<1:09:38,  1.94s/it, loss=0.0989, lr=1e-5]Steps:  86%|████████▌ | 12845/15001 [8:13:20<1:06:45,  1.86s/it, loss=0.0989, lr=1e-5]Steps:  86%|████████▌ | 12845/15001 [8:13:20<1:06:45,  1.86s/it, loss=0.138, lr=1e-5] Steps:  86%|████████▌ | 12846/15001 [8:13:21<1:04:33,  1.80s/it, loss=0.138, lr=1e-5]Steps:  86%|████████▌ | 12846/15001 [8:13:21<1:04:33,  1.80s/it, loss=0.406, lr=1e-5]Steps:  86%|████████▌ | 12847/15001 [8:13:23<1:05:01,  1.81s/it, loss=0.406, lr=1e-5]Steps:  86%|████████▌ | 12847/15001 [8:13:23<1:05:01,  1.81s/it, loss=0.31, lr=1e-5] Steps:  86%|████████▌ | 12848/15001 [8:13:25<1:07:03,  1.87s/it, loss=0.31, lr=1e-5]Steps:  86%|████████▌ | 12848/15001 [8:13:25<1:07:03,  1.87s/it, loss=0.0353, lr=1e-5]Steps:  86%|████████▌ | 12849/15001 [8:13:27<1:09:26,  1.94s/it, loss=0.0353, lr=1e-5]Steps:  86%|████████▌ | 12849/15001 [8:13:28<1:09:26,  1.94s/it, loss=0.0766, lr=1e-5]Steps:  86%|████████▌ | 12850/15001 [8:13:29<1:13:31,  2.05s/it, loss=0.0766, lr=1e-5]Steps:  86%|████████▌ | 12850/15001 [8:13:30<1:13:31,  2.05s/it, loss=0.0754, lr=1e-5]Steps:  86%|████████▌ | 12851/15001 [8:13:31<1:12:20,  2.02s/it, loss=0.0754, lr=1e-5]Steps:  86%|████████▌ | 12851/15001 [8:13:32<1:12:20,  2.02s/it, loss=0.277, lr=1e-5] Steps:  86%|████████▌ | 12852/15001 [8:13:34<1:14:38,  2.08s/it, loss=0.277, lr=1e-5]Steps:  86%|████████▌ | 12852/15001 [8:13:34<1:14:38,  2.08s/it, loss=0.145, lr=1e-5]Steps:  86%|████████▌ | 12853/15001 [8:13:35<1:10:53,  1.98s/it, loss=0.145, lr=1e-5]Steps:  86%|████████▌ | 12853/15001 [8:13:36<1:10:53,  1.98s/it, loss=0.133, lr=1e-5]Steps:  86%|████████▌ | 12854/15001 [8:13:37<1:08:37,  1.92s/it, loss=0.133, lr=1e-5]Steps:  86%|████████▌ | 12854/15001 [8:13:37<1:08:37,  1.92s/it, loss=0.0886, lr=1e-5]Steps:  86%|████████▌ | 12855/15001 [8:13:39<1:06:09,  1.85s/it, loss=0.0886, lr=1e-5]Steps:  86%|████████▌ | 12855/15001 [8:13:39<1:06:09,  1.85s/it, loss=0.217, lr=1e-5] Steps:  86%|████████▌ | 12856/15001 [8:13:41<1:08:30,  1.92s/it, loss=0.217, lr=1e-5]Steps:  86%|████████▌ | 12856/15001 [8:13:41<1:08:30,  1.92s/it, loss=0.17, lr=1e-5] Steps:  86%|████████▌ | 12857/15001 [8:13:43<1:06:36,  1.86s/it, loss=0.17, lr=1e-5]Steps:  86%|████████▌ | 12857/15001 [8:13:43<1:06:36,  1.86s/it, loss=0.0991, lr=1e-5]Steps:  86%|████████▌ | 12858/15001 [8:13:45<1:07:18,  1.88s/it, loss=0.0991, lr=1e-5]Steps:  86%|████████▌ | 12858/15001 [8:13:45<1:07:18,  1.88s/it, loss=0.136, lr=1e-5] Steps:  86%|████████▌ | 12859/15001 [8:13:46<1:03:38,  1.78s/it, loss=0.136, lr=1e-5]Steps:  86%|████████▌ | 12859/15001 [8:13:46<1:03:38,  1.78s/it, loss=0.158, lr=1e-5]Steps:  86%|████████▌ | 12860/15001 [8:13:48<1:03:41,  1.78s/it, loss=0.158, lr=1e-5]Steps:  86%|████████▌ | 12860/15001 [8:13:48<1:03:41,  1.78s/it, loss=0.22, lr=1e-5] Steps:  86%|████████▌ | 12861/15001 [8:13:50<1:06:12,  1.86s/it, loss=0.22, lr=1e-5]Steps:  86%|████████▌ | 12861/15001 [8:13:50<1:06:12,  1.86s/it, loss=0.263, lr=1e-5]Steps:  86%|████████▌ | 12862/15001 [8:13:52<1:06:10,  1.86s/it, loss=0.263, lr=1e-5]Steps:  86%|████████▌ | 12862/15001 [8:13:52<1:06:10,  1.86s/it, loss=0.254, lr=1e-5]Steps:  86%|████████▌ | 12863/15001 [8:13:53<1:03:20,  1.78s/it, loss=0.254, lr=1e-5]Steps:  86%|████████▌ | 12863/15001 [8:13:54<1:03:20,  1.78s/it, loss=0.0988, lr=1e-5]Steps:  86%|████████▌ | 12864/15001 [8:13:55<1:03:03,  1.77s/it, loss=0.0988, lr=1e-5]Steps:  86%|████████▌ | 12864/15001 [8:13:55<1:03:03,  1.77s/it, loss=0.0793, lr=1e-5]Steps:  86%|████████▌ | 12865/15001 [8:13:57<1:04:33,  1.81s/it, loss=0.0793, lr=1e-5]Steps:  86%|████████▌ | 12865/15001 [8:13:57<1:04:33,  1.81s/it, loss=0.28, lr=1e-5]  Steps:  86%|████████▌ | 12866/15001 [8:13:59<1:05:40,  1.85s/it, loss=0.28, lr=1e-5]Steps:  86%|████████▌ | 12866/15001 [8:13:59<1:05:40,  1.85s/it, loss=0.142, lr=1e-5]Steps:  86%|████████▌ | 12867/15001 [8:14:01<1:05:22,  1.84s/it, loss=0.142, lr=1e-5]Steps:  86%|████████▌ | 12867/15001 [8:14:01<1:05:22,  1.84s/it, loss=0.0729, lr=1e-5]Steps:  86%|████████▌ | 12868/15001 [8:14:03<1:03:51,  1.80s/it, loss=0.0729, lr=1e-5]Steps:  86%|████████▌ | 12868/15001 [8:14:03<1:03:51,  1.80s/it, loss=0.178, lr=1e-5] Steps:  86%|████████▌ | 12869/15001 [8:14:04<1:04:27,  1.81s/it, loss=0.178, lr=1e-5]Steps:  86%|████████▌ | 12869/15001 [8:14:05<1:04:27,  1.81s/it, loss=0.136, lr=1e-5]Steps:  86%|████████▌ | 12870/15001 [8:14:07<1:08:43,  1.93s/it, loss=0.136, lr=1e-5]Steps:  86%|████████▌ | 12870/15001 [8:14:07<1:08:43,  1.93s/it, loss=0.232, lr=1e-5]Steps:  86%|████████▌ | 12871/15001 [8:14:09<1:11:17,  2.01s/it, loss=0.232, lr=1e-5]Steps:  86%|████████▌ | 12871/15001 [8:14:09<1:11:17,  2.01s/it, loss=0.269, lr=1e-5]Steps:  86%|████████▌ | 12872/15001 [8:14:11<1:11:05,  2.00s/it, loss=0.269, lr=1e-5]Steps:  86%|████████▌ | 12872/15001 [8:14:11<1:11:05,  2.00s/it, loss=0.375, lr=1e-5]Steps:  86%|████████▌ | 12873/15001 [8:14:13<1:10:46,  2.00s/it, loss=0.375, lr=1e-5]Steps:  86%|████████▌ | 12873/15001 [8:14:13<1:10:46,  2.00s/it, loss=0.143, lr=1e-5]Steps:  86%|████████▌ | 12874/15001 [8:14:15<1:11:06,  2.01s/it, loss=0.143, lr=1e-5]Steps:  86%|████████▌ | 12874/15001 [8:14:15<1:11:06,  2.01s/it, loss=0.246, lr=1e-5]Steps:  86%|████████▌ | 12875/15001 [8:14:17<1:10:04,  1.98s/it, loss=0.246, lr=1e-5]Steps:  86%|████████▌ | 12875/15001 [8:14:17<1:10:04,  1.98s/it, loss=0.231, lr=1e-5]Steps:  86%|████████▌ | 12876/15001 [8:14:19<1:09:01,  1.95s/it, loss=0.231, lr=1e-5]Steps:  86%|████████▌ | 12876/15001 [8:14:19<1:09:01,  1.95s/it, loss=0.0235, lr=1e-5]Steps:  86%|████████▌ | 12877/15001 [8:14:21<1:09:43,  1.97s/it, loss=0.0235, lr=1e-5]Steps:  86%|████████▌ | 12877/15001 [8:14:21<1:09:43,  1.97s/it, loss=0.204, lr=1e-5] Steps:  86%|████████▌ | 12878/15001 [8:14:22<1:05:52,  1.86s/it, loss=0.204, lr=1e-5]Steps:  86%|████████▌ | 12878/15001 [8:14:23<1:05:52,  1.86s/it, loss=0.277, lr=1e-5]Steps:  86%|████████▌ | 12879/15001 [8:14:24<1:10:06,  1.98s/it, loss=0.277, lr=1e-5]Steps:  86%|████████▌ | 12879/15001 [8:14:24<1:10:06,  1.98s/it, loss=0.0452, lr=1e-5]Steps:  86%|████████▌ | 12880/15001 [8:14:26<1:04:50,  1.83s/it, loss=0.0452, lr=1e-5]Steps:  86%|████████▌ | 12880/15001 [8:14:26<1:04:50,  1.83s/it, loss=0.15, lr=1e-5]  Steps:  86%|████████▌ | 12881/15001 [8:14:28<1:04:15,  1.82s/it, loss=0.15, lr=1e-5]Steps:  86%|████████▌ | 12881/15001 [8:14:28<1:04:15,  1.82s/it, loss=0.296, lr=1e-5]Steps:  86%|████████▌ | 12882/15001 [8:14:30<1:04:30,  1.83s/it, loss=0.296, lr=1e-5]Steps:  86%|████████▌ | 12882/15001 [8:14:30<1:04:30,  1.83s/it, loss=0.12, lr=1e-5] Steps:  86%|████████▌ | 12883/15001 [8:14:31<1:05:20,  1.85s/it, loss=0.12, lr=1e-5]Steps:  86%|████████▌ | 12883/15001 [8:14:32<1:05:20,  1.85s/it, loss=0.0889, lr=1e-5]Steps:  86%|████████▌ | 12884/15001 [8:14:33<1:05:04,  1.84s/it, loss=0.0889, lr=1e-5]Steps:  86%|████████▌ | 12884/15001 [8:14:34<1:05:04,  1.84s/it, loss=0.0296, lr=1e-5]Steps:  86%|████████▌ | 12885/15001 [8:14:35<1:04:44,  1.84s/it, loss=0.0296, lr=1e-5]Steps:  86%|████████▌ | 12885/15001 [8:14:35<1:04:44,  1.84s/it, loss=0.105, lr=1e-5] Steps:  86%|████████▌ | 12886/15001 [8:14:37<1:05:58,  1.87s/it, loss=0.105, lr=1e-5]Steps:  86%|████████▌ | 12886/15001 [8:14:37<1:05:58,  1.87s/it, loss=0.288, lr=1e-5]Steps:  86%|████████▌ | 12887/15001 [8:14:39<1:04:17,  1.82s/it, loss=0.288, lr=1e-5]Steps:  86%|████████▌ | 12887/15001 [8:14:39<1:04:17,  1.82s/it, loss=0.0636, lr=1e-5]Steps:  86%|████████▌ | 12888/15001 [8:14:41<1:03:33,  1.80s/it, loss=0.0636, lr=1e-5]Steps:  86%|████████▌ | 12888/15001 [8:14:41<1:03:33,  1.80s/it, loss=0.211, lr=1e-5] Steps:  86%|████████▌ | 12889/15001 [8:14:42<1:03:59,  1.82s/it, loss=0.211, lr=1e-5]Steps:  86%|████████▌ | 12889/15001 [8:14:43<1:03:59,  1.82s/it, loss=0.397, lr=1e-5]Steps:  86%|████████▌ | 12890/15001 [8:14:44<1:02:47,  1.78s/it, loss=0.397, lr=1e-5]Steps:  86%|████████▌ | 12890/15001 [8:14:44<1:02:47,  1.78s/it, loss=0.205, lr=1e-5]Steps:  86%|████████▌ | 12891/15001 [8:14:46<1:04:43,  1.84s/it, loss=0.205, lr=1e-5]Steps:  86%|████████▌ | 12891/15001 [8:14:46<1:04:43,  1.84s/it, loss=0.21, lr=1e-5] Steps:  86%|████████▌ | 12892/15001 [8:14:48<1:05:09,  1.85s/it, loss=0.21, lr=1e-5]Steps:  86%|████████▌ | 12892/15001 [8:14:48<1:05:09,  1.85s/it, loss=0.0657, lr=1e-5]Steps:  86%|████████▌ | 12893/15001 [8:14:50<1:05:41,  1.87s/it, loss=0.0657, lr=1e-5]Steps:  86%|████████▌ | 12893/15001 [8:14:50<1:05:41,  1.87s/it, loss=0.25, lr=1e-5]  Steps:  86%|████████▌ | 12894/15001 [8:14:52<1:07:46,  1.93s/it, loss=0.25, lr=1e-5]Steps:  86%|████████▌ | 12894/15001 [8:14:52<1:07:46,  1.93s/it, loss=0.231, lr=1e-5]Steps:  86%|████████▌ | 12895/15001 [8:14:54<1:08:40,  1.96s/it, loss=0.231, lr=1e-5]Steps:  86%|████████▌ | 12895/15001 [8:14:54<1:08:40,  1.96s/it, loss=0.168, lr=1e-5]Steps:  86%|████████▌ | 12896/15001 [8:14:56<1:06:02,  1.88s/it, loss=0.168, lr=1e-5]Steps:  86%|████████▌ | 12896/15001 [8:14:56<1:06:02,  1.88s/it, loss=0.249, lr=1e-5]Steps:  86%|████████▌ | 12897/15001 [8:14:58<1:10:16,  2.00s/it, loss=0.249, lr=1e-5]Steps:  86%|████████▌ | 12897/15001 [8:14:58<1:10:16,  2.00s/it, loss=0.163, lr=1e-5]Steps:  86%|████████▌ | 12898/15001 [8:15:00<1:06:52,  1.91s/it, loss=0.163, lr=1e-5]Steps:  86%|████████▌ | 12898/15001 [8:15:00<1:06:52,  1.91s/it, loss=0.159, lr=1e-5]Steps:  86%|████████▌ | 12899/15001 [8:15:02<1:08:32,  1.96s/it, loss=0.159, lr=1e-5]Steps:  86%|████████▌ | 12899/15001 [8:15:02<1:08:32,  1.96s/it, loss=0.175, lr=1e-5]Steps:  86%|████████▌ | 12900/15001 [8:15:03<1:05:46,  1.88s/it, loss=0.175, lr=1e-5]Steps:  86%|████████▌ | 12900/15001 [8:15:04<1:05:46,  1.88s/it, loss=0.418, lr=1e-5]Steps:  86%|████████▌ | 12901/15001 [8:15:05<1:04:54,  1.85s/it, loss=0.418, lr=1e-5]Steps:  86%|████████▌ | 12901/15001 [8:15:05<1:04:54,  1.85s/it, loss=0.13, lr=1e-5] Steps:  86%|████████▌ | 12902/15001 [8:15:07<1:03:33,  1.82s/it, loss=0.13, lr=1e-5]Steps:  86%|████████▌ | 12902/15001 [8:15:07<1:03:33,  1.82s/it, loss=0.189, lr=1e-5]Steps:  86%|████████▌ | 12903/15001 [8:15:09<1:06:14,  1.89s/it, loss=0.189, lr=1e-5]Steps:  86%|████████▌ | 12903/15001 [8:15:09<1:06:14,  1.89s/it, loss=0.163, lr=1e-5]Steps:  86%|████████▌ | 12904/15001 [8:15:11<1:02:48,  1.80s/it, loss=0.163, lr=1e-5]Steps:  86%|████████▌ | 12904/15001 [8:15:11<1:02:48,  1.80s/it, loss=0.343, lr=1e-5]Steps:  86%|████████▌ | 12905/15001 [8:15:12<1:02:32,  1.79s/it, loss=0.343, lr=1e-5]Steps:  86%|████████▌ | 12905/15001 [8:15:13<1:02:32,  1.79s/it, loss=0.105, lr=1e-5]Steps:  86%|████████▌ | 12906/15001 [8:15:14<1:03:36,  1.82s/it, loss=0.105, lr=1e-5]Steps:  86%|████████▌ | 12906/15001 [8:15:14<1:03:36,  1.82s/it, loss=0.273, lr=1e-5]Steps:  86%|████████▌ | 12907/15001 [8:15:16<1:02:04,  1.78s/it, loss=0.273, lr=1e-5]Steps:  86%|████████▌ | 12907/15001 [8:15:16<1:02:04,  1.78s/it, loss=0.19, lr=1e-5] Steps:  86%|████████▌ | 12908/15001 [8:15:18<1:04:45,  1.86s/it, loss=0.19, lr=1e-5]Steps:  86%|████████▌ | 12908/15001 [8:15:18<1:04:45,  1.86s/it, loss=0.0753, lr=1e-5]Steps:  86%|████████▌ | 12909/15001 [8:15:19<1:00:31,  1.74s/it, loss=0.0753, lr=1e-5]Steps:  86%|████████▌ | 12909/15001 [8:15:20<1:00:31,  1.74s/it, loss=0.0523, lr=1e-5]Steps:  86%|████████▌ | 12910/15001 [8:15:21<1:01:59,  1.78s/it, loss=0.0523, lr=1e-5]Steps:  86%|████████▌ | 12910/15001 [8:15:21<1:01:59,  1.78s/it, loss=0.0609, lr=1e-5]Steps:  86%|████████▌ | 12911/15001 [8:15:23<1:03:38,  1.83s/it, loss=0.0609, lr=1e-5]Steps:  86%|████████▌ | 12911/15001 [8:15:23<1:03:38,  1.83s/it, loss=0.198, lr=1e-5] Steps:  86%|████████▌ | 12912/15001 [8:15:25<1:04:43,  1.86s/it, loss=0.198, lr=1e-5]Steps:  86%|████████▌ | 12912/15001 [8:15:25<1:04:43,  1.86s/it, loss=0.103, lr=1e-5]Steps:  86%|████████▌ | 12913/15001 [8:15:27<1:01:01,  1.75s/it, loss=0.103, lr=1e-5]Steps:  86%|████████▌ | 12913/15001 [8:15:27<1:01:01,  1.75s/it, loss=0.265, lr=1e-5]Steps:  86%|████████▌ | 12914/15001 [8:15:29<1:03:01,  1.81s/it, loss=0.265, lr=1e-5]Steps:  86%|████████▌ | 12914/15001 [8:15:29<1:03:01,  1.81s/it, loss=0.207, lr=1e-5]Steps:  86%|████████▌ | 12915/15001 [8:15:31<1:06:03,  1.90s/it, loss=0.207, lr=1e-5]Steps:  86%|████████▌ | 12915/15001 [8:15:31<1:06:03,  1.90s/it, loss=0.21, lr=1e-5] Steps:  86%|████████▌ | 12916/15001 [8:15:33<1:05:02,  1.87s/it, loss=0.21, lr=1e-5]Steps:  86%|████████▌ | 12916/15001 [8:15:33<1:05:02,  1.87s/it, loss=0.053, lr=1e-5]Steps:  86%|████████▌ | 12917/15001 [8:15:35<1:07:36,  1.95s/it, loss=0.053, lr=1e-5]Steps:  86%|████████▌ | 12917/15001 [8:15:35<1:07:36,  1.95s/it, loss=0.184, lr=1e-5]Steps:  86%|████████▌ | 12918/15001 [8:15:37<1:06:49,  1.92s/it, loss=0.184, lr=1e-5]Steps:  86%|████████▌ | 12918/15001 [8:15:37<1:06:49,  1.92s/it, loss=0.401, lr=1e-5]Steps:  86%|████████▌ | 12919/15001 [8:15:39<1:07:37,  1.95s/it, loss=0.401, lr=1e-5]Steps:  86%|████████▌ | 12919/15001 [8:15:39<1:07:37,  1.95s/it, loss=0.236, lr=1e-5]Steps:  86%|████████▌ | 12920/15001 [8:15:41<1:10:44,  2.04s/it, loss=0.236, lr=1e-5]Steps:  86%|████████▌ | 12920/15001 [8:15:41<1:10:44,  2.04s/it, loss=0.228, lr=1e-5]Steps:  86%|████████▌ | 12921/15001 [8:15:43<1:09:23,  2.00s/it, loss=0.228, lr=1e-5]Steps:  86%|████████▌ | 12921/15001 [8:15:43<1:09:23,  2.00s/it, loss=0.158, lr=1e-5]Steps:  86%|████████▌ | 12922/15001 [8:15:44<1:05:05,  1.88s/it, loss=0.158, lr=1e-5]Steps:  86%|████████▌ | 12922/15001 [8:15:44<1:05:05,  1.88s/it, loss=0.327, lr=1e-5]Steps:  86%|████████▌ | 12923/15001 [8:15:46<1:05:34,  1.89s/it, loss=0.327, lr=1e-5]Steps:  86%|████████▌ | 12923/15001 [8:15:46<1:05:34,  1.89s/it, loss=0.159, lr=1e-5]Steps:  86%|████████▌ | 12924/15001 [8:15:48<1:04:29,  1.86s/it, loss=0.159, lr=1e-5]Steps:  86%|████████▌ | 12924/15001 [8:15:48<1:04:29,  1.86s/it, loss=0.177, lr=1e-5]Steps:  86%|████████▌ | 12925/15001 [8:15:50<1:04:43,  1.87s/it, loss=0.177, lr=1e-5]Steps:  86%|████████▌ | 12925/15001 [8:15:50<1:04:43,  1.87s/it, loss=0.141, lr=1e-5]Steps:  86%|██████��█▌ | 12926/15001 [8:15:52<1:02:59,  1.82s/it, loss=0.141, lr=1e-5]Steps:  86%|████████▌ | 12926/15001 [8:15:52<1:02:59,  1.82s/it, loss=0.241, lr=1e-5]Steps:  86%|████████▌ | 12927/15001 [8:15:53<1:02:34,  1.81s/it, loss=0.241, lr=1e-5]Steps:  86%|████████▌ | 12927/15001 [8:15:53<1:02:34,  1.81s/it, loss=0.247, lr=1e-5]Steps:  86%|████████▌ | 12928/15001 [8:15:55<1:01:28,  1.78s/it, loss=0.247, lr=1e-5]Steps:  86%|████████▌ | 12928/15001 [8:15:55<1:01:28,  1.78s/it, loss=0.363, lr=1e-5]Steps:  86%|████████▌ | 12929/15001 [8:15:57<1:04:04,  1.86s/it, loss=0.363, lr=1e-5]Steps:  86%|████████▌ | 12929/15001 [8:15:57<1:04:04,  1.86s/it, loss=0.0832, lr=1e-5]Steps:  86%|████████▌ | 12930/15001 [8:15:59<1:03:11,  1.83s/it, loss=0.0832, lr=1e-5]Steps:  86%|████████▌ | 12930/15001 [8:15:59<1:03:11,  1.83s/it, loss=0.149, lr=1e-5] Steps:  86%|████████▌ | 12931/15001 [8:16:01<1:01:40,  1.79s/it, loss=0.149, lr=1e-5]Steps:  86%|████████▌ | 12931/15001 [8:16:01<1:01:40,  1.79s/it, loss=0.263, lr=1e-5]Steps:  86%|████████▌ | 12932/15001 [8:16:02<1:01:08,  1.77s/it, loss=0.263, lr=1e-5]Steps:  86%|████████▌ | 12932/15001 [8:16:03<1:01:08,  1.77s/it, loss=0.242, lr=1e-5]Steps:  86%|████████▌ | 12933/15001 [8:16:04<1:03:13,  1.83s/it, loss=0.242, lr=1e-5]Steps:  86%|████████▌ | 12933/15001 [8:16:04<1:03:13,  1.83s/it, loss=0.246, lr=1e-5]Steps:  86%|████████▌ | 12934/15001 [8:16:06<1:02:22,  1.81s/it, loss=0.246, lr=1e-5]Steps:  86%|████████▌ | 12934/15001 [8:16:06<1:02:22,  1.81s/it, loss=0.11, lr=1e-5] Steps:  86%|████████▌ | 12935/15001 [8:16:08<59:57,  1.74s/it, loss=0.11, lr=1e-5]  Steps:  86%|████████▌ | 12935/15001 [8:16:08<59:57,  1.74s/it, loss=0.148, lr=1e-5]Steps:  86%|████████▌ | 12936/15001 [8:16:09<1:00:33,  1.76s/it, loss=0.148, lr=1e-5]Steps:  86%|████████▌ | 12936/15001 [8:16:10<1:00:33,  1.76s/it, loss=0.106, lr=1e-5]Steps:  86%|████████▌ | 12937/15001 [8:16:11<1:03:20,  1.84s/it, loss=0.106, lr=1e-5]Steps:  86%|████████▌ | 12937/15001 [8:16:12<1:03:20,  1.84s/it, loss=0.0489, lr=1e-5]Steps:  86%|████████▌ | 12938/15001 [8:16:13<1:03:22,  1.84s/it, loss=0.0489, lr=1e-5]Steps:  86%|████████▌ | 12938/15001 [8:16:13<1:03:22,  1.84s/it, loss=0.0838, lr=1e-5]Steps:  86%|████████▋ | 12939/15001 [8:16:15<1:04:28,  1.88s/it, loss=0.0838, lr=1e-5]Steps:  86%|████████▋ | 12939/15001 [8:16:15<1:04:28,  1.88s/it, loss=0.302, lr=1e-5] Steps:  86%|████████▋ | 12940/15001 [8:16:17<1:03:53,  1.86s/it, loss=0.302, lr=1e-5]Steps:  86%|████████▋ | 12940/15001 [8:16:17<1:03:53,  1.86s/it, loss=0.167, lr=1e-5]Steps:  86%|████████▋ | 12941/15001 [8:16:19<1:05:20,  1.90s/it, loss=0.167, lr=1e-5]Steps:  86%|████████▋ | 12941/15001 [8:16:19<1:05:20,  1.90s/it, loss=0.168, lr=1e-5]Steps:  86%|████████▋ | 12942/15001 [8:16:21<1:06:17,  1.93s/it, loss=0.168, lr=1e-5]Steps:  86%|████████▋ | 12942/15001 [8:16:21<1:06:17,  1.93s/it, loss=0.119, lr=1e-5]Steps:  86%|████████▋ | 12943/15001 [8:16:23<1:07:25,  1.97s/it, loss=0.119, lr=1e-5]Steps:  86%|████████▋ | 12943/15001 [8:16:23<1:07:25,  1.97s/it, loss=0.116, lr=1e-5]Steps:  86%|████████▋ | 12944/15001 [8:16:25<1:06:27,  1.94s/it, loss=0.116, lr=1e-5]Steps:  86%|████████▋ | 12944/15001 [8:16:25<1:06:27,  1.94s/it, loss=0.0748, lr=1e-5]Steps:  86%|████████▋ | 12945/15001 [8:16:27<1:04:45,  1.89s/it, loss=0.0748, lr=1e-5]Steps:  86%|████████▋ | 12945/15001 [8:16:27<1:04:45,  1.89s/it, loss=0.142, lr=1e-5] Steps:  86%|████████▋ | 12946/15001 [8:16:28<1:01:26,  1.79s/it, loss=0.142, lr=1e-5]Steps:  86%|████████▋ | 12946/15001 [8:16:29<1:01:26,  1.79s/it, loss=0.0894, lr=1e-5]Steps:  86%|████████▋ | 12947/15001 [8:16:30<1:03:58,  1.87s/it, loss=0.0894, lr=1e-5]Steps:  86%|████████▋ | 12947/15001 [8:16:31<1:03:58,  1.87s/it, loss=0.102, lr=1e-5] Steps:  86%|████████▋ | 12948/15001 [8:16:32<1:05:17,  1.91s/it, loss=0.102, lr=1e-5]Steps:  86%|████████▋ | 12948/15001 [8:16:32<1:05:17,  1.91s/it, loss=0.227, lr=1e-5]Steps:  86%|████████▋ | 12949/15001 [8:16:34<1:03:42,  1.86s/it, loss=0.227, lr=1e-5]Steps:  86%|████████▋ | 12949/15001 [8:16:34<1:03:42,  1.86s/it, loss=0.331, lr=1e-5]Steps:  86%|████████▋ | 12950/15001 [8:16:36<1:03:11,  1.85s/it, loss=0.331, lr=1e-5]Steps:  86%|████████▋ | 12950/15001 [8:16:36<1:03:11,  1.85s/it, loss=0.127, lr=1e-5]Steps:  86%|████████▋ | 12951/15001 [8:16:38<1:03:53,  1.87s/it, loss=0.127, lr=1e-5]Steps:  86%|████████▋ | 12951/15001 [8:16:38<1:03:53,  1.87s/it, loss=0.238, lr=1e-5]Steps:  86%|████████▋ | 12952/15001 [8:16:40<1:03:15,  1.85s/it, loss=0.238, lr=1e-5]Steps:  86%|████████▋ | 12952/15001 [8:16:40<1:03:15,  1.85s/it, loss=0.166, lr=1e-5]Steps:  86%|████████▋ | 12953/15001 [8:16:41<1:02:22,  1.83s/it, loss=0.166, lr=1e-5]Steps:  86%|████████▋ | 12953/15001 [8:16:42<1:02:22,  1.83s/it, loss=0.275, lr=1e-5]Steps:  86%|████████▋ | 12954/15001 [8:16:43<1:00:53,  1.78s/it, loss=0.275, lr=1e-5]Steps:  86%|████████▋ | 12954/15001 [8:16:43<1:00:53,  1.78s/it, loss=0.327, lr=1e-5]Steps:  86%|████████▋ | 12955/15001 [8:16:45<1:02:33,  1.83s/it, loss=0.327, lr=1e-5]Steps:  86%|████████▋ | 12955/15001 [8:16:45<1:02:33,  1.83s/it, loss=0.221, lr=1e-5]Steps:  86%|████████▋ | 12956/15001 [8:16:47<1:01:00,  1.79s/it, loss=0.221, lr=1e-5]Steps:  86%|████████▋ | 12956/15001 [8:16:47<1:01:00,  1.79s/it, loss=0.143, lr=1e-5]Steps:  86%|████████▋ | 12957/15001 [8:16:49<1:03:04,  1.85s/it, loss=0.143, lr=1e-5]Steps:  86%|████████▋ | 12957/15001 [8:16:49<1:03:04,  1.85s/it, loss=0.165, lr=1e-5]Steps:  86%|████████▋ | 12958/15001 [8:16:51<1:03:45,  1.87s/it, loss=0.165, lr=1e-5]Steps:  86%|████████▋ | 12958/15001 [8:16:51<1:03:45,  1.87s/it, loss=0.275, lr=1e-5]Steps:  86%|████████▋ | 12959/15001 [8:16:53<1:04:59,  1.91s/it, loss=0.275, lr=1e-5]Steps:  86%|████████▋ | 12959/15001 [8:16:53<1:04:59,  1.91s/it, loss=0.161, lr=1e-5]Steps:  86%|████████▋ | 12960/15001 [8:16:55<1:04:13,  1.89s/it, loss=0.161, lr=1e-5]Steps:  86%|████████▋ | 12960/15001 [8:16:55<1:04:13,  1.89s/it, loss=0.155, lr=1e-5]Steps:  86%|████████▋ | 12961/15001 [8:16:56<1:01:18,  1.80s/it, loss=0.155, lr=1e-5]Steps:  86%|████████▋ | 12961/15001 [8:16:56<1:01:18,  1.80s/it, loss=0.065, lr=1e-5]Steps:  86%|████████▋ | 12962/15001 [8:16:58<1:04:17,  1.89s/it, loss=0.065, lr=1e-5]Steps:  86%|████████▋ | 12962/15001 [8:16:58<1:04:17,  1.89s/it, loss=0.237, lr=1e-5]Steps:  86%|████████▋ | 12963/15001 [8:17:00<1:03:44,  1.88s/it, loss=0.237, lr=1e-5]Steps:  86%|████████▋ | 12963/15001 [8:17:00<1:03:44,  1.88s/it, loss=0.22, lr=1e-5] Steps:  86%|████████▋ | 12964/15001 [8:17:02<1:05:04,  1.92s/it, loss=0.22, lr=1e-5]Steps:  86%|████████▋ | 12964/15001 [8:17:02<1:05:04,  1.92s/it, loss=0.087, lr=1e-5]Steps:  86%|████████▋ | 12965/15001 [8:17:04<1:06:17,  1.95s/it, loss=0.087, lr=1e-5]Steps:  86%|████████▋ | 12965/15001 [8:17:04<1:06:17,  1.95s/it, loss=0.257, lr=1e-5]Steps:  86%|████████▋ | 12966/15001 [8:17:06<1:07:46,  2.00s/it, loss=0.257, lr=1e-5]Steps:  86%|████████▋ | 12966/15001 [8:17:06<1:07:46,  2.00s/it, loss=0.0903, lr=1e-5]Steps:  86%|████████▋ | 12967/15001 [8:17:08<1:06:59,  1.98s/it, loss=0.0903, lr=1e-5]Steps:  86%|████████▋ | 12967/15001 [8:17:08<1:06:59,  1.98s/it, loss=0.0546, lr=1e-5]Steps:  86%|████████▋ | 12968/15001 [8:17:10<1:07:34,  1.99s/it, loss=0.0546, lr=1e-5]Steps:  86%|████████▋ | 12968/15001 [8:17:10<1:07:34,  1.99s/it, loss=0.117, lr=1e-5] Steps:  86%|████████▋ | 12969/15001 [8:17:12<1:06:08,  1.95s/it, loss=0.117, lr=1e-5]Steps:  86%|████████▋ | 12969/15001 [8:17:12<1:06:08,  1.95s/it, loss=0.209, lr=1e-5]Steps:  86%|████████▋ | 12970/15001 [8:17:14<1:05:18,  1.93s/it, loss=0.209, lr=1e-5]Steps:  86%|████████▋ | 12970/15001 [8:17:14<1:05:18,  1.93s/it, loss=0.161, lr=1e-5]Steps:  86%|████████▋ | 12971/15001 [8:17:16<1:03:57,  1.89s/it, loss=0.161, lr=1e-5]Steps:  86%|████████▋ | 12971/15001 [8:17:16<1:03:57,  1.89s/it, loss=0.28, lr=1e-5] Steps:  86%|████████▋ | 12972/15001 [8:17:17<1:01:11,  1.81s/it, loss=0.28, lr=1e-5]Steps:  86%|████████▋ | 12972/15001 [8:17:18<1:01:11,  1.81s/it, loss=0.149, lr=1e-5]Steps:  86%|████████▋ | 12973/15001 [8:17:19<1:01:53,  1.83s/it, loss=0.149, lr=1e-5]Steps:  86%|████████▋ | 12973/15001 [8:17:19<1:01:53,  1.83s/it, loss=0.425, lr=1e-5]Steps:  86%|████████▋ | 12974/15001 [8:17:21<1:01:19,  1.82s/it, loss=0.425, lr=1e-5]Steps:  86%|████████▋ | 12974/15001 [8:17:21<1:01:19,  1.82s/it, loss=0.258, lr=1e-5]Steps:  86%|████████▋ | 12975/15001 [8:17:23<1:02:30,  1.85s/it, loss=0.258, lr=1e-5]Steps:  86%|████████▋ | 12975/15001 [8:17:23<1:02:30,  1.85s/it, loss=0.107, lr=1e-5]Steps:  87%|████████▋ | 12976/15001 [8:17:25<1:01:52,  1.83s/it, loss=0.107, lr=1e-5]Steps:  87%|████████▋ | 12976/15001 [8:17:25<1:01:52,  1.83s/it, loss=0.186, lr=1e-5]Steps:  87%|████████▋ | 12977/15001 [8:17:26<59:25,  1.76s/it, loss=0.186, lr=1e-5]  Steps:  87%|████████▋ | 12977/15001 [8:17:27<59:25,  1.76s/it, loss=0.177, lr=1e-5]Steps:  87%|████████▋ | 12978/15001 [8:17:28<1:00:35,  1.80s/it, loss=0.177, lr=1e-5]Steps:  87%|████████▋ | 12978/15001 [8:17:28<1:00:35,  1.80s/it, loss=0.107, lr=1e-5]Steps:  87%|████████▋ | 12979/15001 [8:17:30<1:01:01,  1.81s/it, loss=0.107, lr=1e-5]Steps:  87%|████████▋ | 12979/15001 [8:17:30<1:01:01,  1.81s/it, loss=0.214, lr=1e-5]Steps:  87%|████████▋ | 12980/15001 [8:17:32<1:00:26,  1.79s/it, loss=0.214, lr=1e-5]Steps:  87%|████████▋ | 12980/15001 [8:17:32<1:00:26,  1.79s/it, loss=0.0811, lr=1e-5]Steps:  87%|████████▋ | 12981/15001 [8:17:33<59:12,  1.76s/it, loss=0.0811, lr=1e-5]  Steps:  87%|████████▋ | 12981/15001 [8:17:34<59:12,  1.76s/it, loss=0.179, lr=1e-5] Steps:  87%|████████▋ | 12982/15001 [8:17:35<1:00:43,  1.80s/it, loss=0.179, lr=1e-5]Steps:  87%|████████▋ | 12982/15001 [8:17:36<1:00:43,  1.80s/it, loss=0.0955, lr=1e-5]Steps:  87%|████████▋ | 12983/15001 [8:17:37<1:01:15,  1.82s/it, loss=0.0955, lr=1e-5]Steps:  87%|████████▋ | 12983/15001 [8:17:38<1:01:15,  1.82s/it, loss=0.0519, lr=1e-5]Steps:  87%|████████▋ | 12984/15001 [8:17:39<1:03:42,  1.90s/it, loss=0.0519, lr=1e-5]Steps:  87%|████████▋ | 12984/15001 [8:17:40<1:03:42,  1.90s/it, loss=0.129, lr=1e-5] Steps:  87%|████████▋ | 12985/15001 [8:17:41<1:04:38,  1.92s/it, loss=0.129, lr=1e-5]Steps:  87%|████████▋ | 12985/15001 [8:17:42<1:04:38,  1.92s/it, loss=0.224, lr=1e-5]Steps:  87%|████████▋ | 12986/15001 [8:17:43<1:06:32,  1.98s/it, loss=0.224, lr=1e-5]Steps:  87%|████████▋ | 12986/15001 [8:17:44<1:06:32,  1.98s/it, loss=0.0975, lr=1e-5]Steps:  87%|████████▋ | 12987/15001 [8:17:45<1:06:22,  1.98s/it, loss=0.0975, lr=1e-5]Steps:  87%|████████▋ | 12987/15001 [8:17:46<1:06:22,  1.98s/it, loss=0.0469, lr=1e-5]Steps:  87%|████████▋ | 12988/15001 [8:17:47<1:05:58,  1.97s/it, loss=0.0469, lr=1e-5]Steps:  87%|████████▋ | 12988/15001 [8:17:48<1:05:58,  1.97s/it, loss=0.113, lr=1e-5] Steps:  87%|████████▋ | 12989/15001 [8:17:49<1:05:26,  1.95s/it, loss=0.113, lr=1e-5]Steps:  87%|████████▋ | 12989/15001 [8:17:49<1:05:26,  1.95s/it, loss=0.179, lr=1e-5]Steps:  87%|████████▋ | 12990/15001 [8:17:51<1:05:49,  1.96s/it, loss=0.179, lr=1e-5]Steps:  87%|████████▋ | 12990/15001 [8:17:51<1:05:49,  1.96s/it, loss=0.098, lr=1e-5]Steps:  87%|████████▋ | 12991/15001 [8:17:53<1:02:58,  1.88s/it, loss=0.098, lr=1e-5]Steps:  87%|████████▋ | 12991/15001 [8:17:53<1:02:58,  1.88s/it, loss=0.305, lr=1e-5]Steps:  87%|████████▋ | 12992/15001 [8:17:55<1:02:44,  1.87s/it, loss=0.305, lr=1e-5]Steps:  87%|████████▋ | 12992/15001 [8:17:55<1:02:44,  1.87s/it, loss=0.248, lr=1e-5]Steps:  87%|████████▋ | 12993/15001 [8:17:57<1:01:46,  1.85s/it, loss=0.248, lr=1e-5]Steps:  87%|████████▋ | 12993/15001 [8:17:57<1:01:46,  1.85s/it, loss=0.124, lr=1e-5]Steps:  87%|████████▋ | 12994/15001 [8:17:58<1:01:53,  1.85s/it, loss=0.124, lr=1e-5]Steps:  87%|████████▋ | 12994/15001 [8:17:59<1:01:53,  1.85s/it, loss=0.248, lr=1e-5]Steps:  87%|████████▋ | 12995/15001 [8:18:00<1:01:43,  1.85s/it, loss=0.248, lr=1e-5]Steps:  87%|████████▋ | 12995/15001 [8:18:00<1:01:43,  1.85s/it, loss=0.0322, lr=1e-5]Steps:  87%|████████▋ | 12996/15001 [8:18:02<1:01:16,  1.83s/it, loss=0.0322, lr=1e-5]Steps:  87%|████████▋ | 12996/15001 [8:18:02<1:01:16,  1.83s/it, loss=0.152, lr=1e-5] Steps:  87%|████████▋ | 12997/15001 [8:18:04<1:01:00,  1.83s/it, loss=0.152, lr=1e-5]Steps:  87%|████████▋ | 12997/15001 [8:18:04<1:01:00,  1.83s/it, loss=0.14, lr=1e-5] Steps:  87%|████████▋ | 12998/15001 [8:18:06<1:02:08,  1.86s/it, loss=0.14, lr=1e-5]Steps:  87%|████████▋ | 12998/15001 [8:18:06<1:02:08,  1.86s/it, loss=0.141, lr=1e-5]Steps:  87%|████████▋ | 12999/15001 [8:18:07<58:34,  1.76s/it, loss=0.141, lr=1e-5]  Steps:  87%|████████▋ | 12999/15001 [8:18:08<58:34,  1.76s/it, loss=0.176, lr=1e-5]Steps:  87%|████████▋ | 13000/15001 [8:18:09<1:01:06,  1.83s/it, loss=0.176, lr=1e-5]02/04/2024 21:20:29 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1540.14it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  87%|████████▋ | 13000/15001 [8:21:49<1:01:06,  1.83s/it, loss=0.21, lr=1e-5] Steps:  87%|████████▋ | 13001/15001 [8:21:51<37:36:03, 67.68s/it, loss=0.21, lr=1e-5]Steps:  87%|████████▋ | 13001/15001 [8:21:51<37:36:03, 67.68s/it, loss=0.205, lr=1e-5]Steps:  87%|████████▋ | 13002/15001 [8:21:52<26:33:53, 47.84s/it, loss=0.205, lr=1e-5]Steps:  87%|████████▋ | 13002/15001 [8:21:53<26:33:53, 47.84s/it, loss=0.123, lr=1e-5]Steps:  87%|████████▋ | 13003/15001 [8:21:54<18:56:39, 34.13s/it, loss=0.123, lr=1e-5]Steps:  87%|████████▋ | 13003/15001 [8:21:55<18:56:39, 34.13s/it, loss=0.119, lr=1e-5]Steps:  87%|████████▋ | 13004/15001 [8:21:56<13:31:45, 24.39s/it, loss=0.119, lr=1e-5]Steps:  87%|████████▋ | 13004/15001 [8:21:56<13:31:45, 24.39s/it, loss=0.0461, lr=1e-5]Steps:  87%|████████▋ | 13005/15001 [8:21:58<9:48:18, 17.68s/it, loss=0.0461, lr=1e-5] Steps:  87%|████████▋ | 13005/15001 [8:21:58<9:48:18, 17.68s/it, loss=0.182, lr=1e-5] Steps:  87%|████████▋ | 13006/15001 [8:22:00<7:09:54, 12.93s/it, loss=0.182, lr=1e-5]Steps:  87%|████████▋ | 13006/15001 [8:22:00<7:09:54, 12.93s/it, loss=0.118, lr=1e-5]Steps:  87%|████████▋ | 13007/15001 [8:22:02<5:18:35,  9.59s/it, loss=0.118, lr=1e-5]Steps:  87%|████████▋ | 13007/15001 [8:22:02<5:18:35,  9.59s/it, loss=0.159, lr=1e-5]Steps:  87%|████████▋ | 13008/15001 [8:22:04<4:00:51,  7.25s/it, loss=0.159, lr=1e-5]Steps:  87%|████████▋ | 13008/15001 [8:22:04<4:00:51,  7.25s/it, loss=0.35, lr=1e-5] Steps:  87%|████████▋ | 13009/15001 [8:22:05<3:07:40,  5.65s/it, loss=0.35, lr=1e-5]Steps:  87%|████████▋ | 13009/15001 [8:22:06<3:07:40,  5.65s/it, loss=0.232, lr=1e-5]Steps:  87%|████████▋ | 13010/15001 [8:22:07<2:28:51,  4.49s/it, loss=0.232, lr=1e-5]Steps:  87%|████████▋ | 13010/15001 [8:22:07<2:28:51,  4.49s/it, loss=0.185, lr=1e-5]Steps:  87%|████████▋ | 13011/15001 [8:22:09<2:01:55,  3.68s/it, loss=0.185, lr=1e-5]Steps:  87%|████████▋ | 13011/15001 [8:22:09<2:01:55,  3.68s/it, loss=0.0372, lr=1e-5]Steps:  87%|████████▋ | 13012/15001 [8:22:11<1:42:46,  3.10s/it, loss=0.0372, lr=1e-5]Steps:  87%|████████▋ | 13012/15001 [8:22:11<1:42:46,  3.10s/it, loss=0.225, lr=1e-5] Steps:  87%|████████▋ | 13013/15001 [8:22:13<1:30:19,  2.73s/it, loss=0.225, lr=1e-5]Steps:  87%|████████▋ | 13013/15001 [8:22:13<1:30:19,  2.73s/it, loss=0.316, lr=1e-5]Steps:  87%|████████▋ | 13014/15001 [8:22:14<1:21:49,  2.47s/it, loss=0.316, lr=1e-5]Steps:  87%|████████▋ | 13014/15001 [8:22:14<1:21:49,  2.47s/it, loss=0.00728, lr=1e-5]Steps:  87%|████████▋ | 13015/15001 [8:22:16<1:13:25,  2.22s/it, loss=0.00728, lr=1e-5]Steps:  87%|████████▋ | 13015/15001 [8:22:16<1:13:25,  2.22s/it, loss=0.0929, lr=1e-5] Steps:  87%|████████▋ | 13016/15001 [8:22:18<1:12:55,  2.20s/it, loss=0.0929, lr=1e-5]Steps:  87%|████████▋ | 13016/15001 [8:22:18<1:12:55,  2.20s/it, loss=0.335, lr=1e-5] Steps:  87%|████████▋ | 13017/15001 [8:22:20<1:11:32,  2.16s/it, loss=0.335, lr=1e-5]Steps:  87%|████████▋ | 13017/15001 [8:22:20<1:11:32,  2.16s/it, loss=0.117, lr=1e-5]Steps:  87%|████████▋ | 13018/15001 [8:22:22<1:07:07,  2.03s/it, loss=0.117, lr=1e-5]Steps:  87%|████████▋ | 13018/15001 [8:22:22<1:07:07,  2.03s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13019/15001 [8:22:24<1:07:08,  2.03s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13019/15001 [8:22:24<1:07:08,  2.03s/it, loss=0.164, lr=1e-5]Steps:  87%|████████▋ | 13020/15001 [8:22:26<1:10:06,  2.12s/it, loss=0.164, lr=1e-5]Steps:  87%|████████▋ | 13020/15001 [8:22:27<1:10:06,  2.12s/it, loss=0.154, lr=1e-5]Steps:  87%|████████▋ | 13021/15001 [8:22:28<1:08:07,  2.06s/it, loss=0.154, lr=1e-5]Steps:  87%|████████▋ | 13021/15001 [8:22:28<1:08:07,  2.06s/it, loss=0.189, lr=1e-5]Steps:  87%|████████▋ | 13022/15001 [8:22:30<1:06:04,  2.00s/it, loss=0.189, lr=1e-5]Steps:  87%|████████▋ | 13022/15001 [8:22:30<1:06:04,  2.00s/it, loss=0.248, lr=1e-5]Steps:  87%|████████▋ | 13023/15001 [8:22:32<1:03:29,  1.93s/it, loss=0.248, lr=1e-5]Steps:  87%|████████▋ | 13023/15001 [8:22:32<1:03:29,  1.93s/it, loss=0.305, lr=1e-5]Steps:  87%|████████▋ | 13024/15001 [8:22:34<1:00:34,  1.84s/it, loss=0.305, lr=1e-5]Steps:  87%|████████▋ | 13024/15001 [8:22:34<1:00:34,  1.84s/it, loss=0.118, lr=1e-5]Steps:  87%|████████▋ | 13025/15001 [8:22:35<1:00:30,  1.84s/it, loss=0.118, lr=1e-5]Steps:  87%|████████▋ | 13025/15001 [8:22:36<1:00:30,  1.84s/it, loss=0.336, lr=1e-5]Steps:  87%|████████▋ | 13026/15001 [8:22:37<58:26,  1.78s/it, loss=0.336, lr=1e-5]  Steps:  87%|████████▋ | 13026/15001 [8:22:38<58:26,  1.78s/it, loss=0.163, lr=1e-5]Steps:  87%|████████▋ | 13027/15001 [8:22:39<1:01:49,  1.88s/it, loss=0.163, lr=1e-5]Steps:  87%|████████▋ | 13027/15001 [8:22:39<1:01:49,  1.88s/it, loss=0.15, lr=1e-5] Steps:  87%|████████▋ | 13028/15001 [8:22:41<59:29,  1.81s/it, loss=0.15, lr=1e-5]  Steps:  87%|████████▋ | 13028/15001 [8:22:41<59:29,  1.81s/it, loss=0.181, lr=1e-5]Steps:  87%|████████▋ | 13029/15001 [8:22:43<1:00:45,  1.85s/it, loss=0.181, lr=1e-5]Steps:  87%|████████▋ | 13029/15001 [8:22:43<1:00:45,  1.85s/it, loss=0.164, lr=1e-5]Steps:  87%|████████▋ | 13030/15001 [8:22:45<1:00:10,  1.83s/it, loss=0.164, lr=1e-5]Steps:  87%|████████▋ | 13030/15001 [8:22:45<1:00:10,  1.83s/it, loss=0.0517, lr=1e-5]Steps:  87%|████████▋ | 13031/15001 [8:22:46<57:41,  1.76s/it, loss=0.0517, lr=1e-5]  Steps:  87%|████████▋ | 13031/15001 [8:22:47<57:41,  1.76s/it, loss=0.122, lr=1e-5] Steps:  87%|████████▋ | 13032/15001 [8:22:48<59:11,  1.80s/it, loss=0.122, lr=1e-5]Steps:  87%|████████▋ | 13032/15001 [8:22:48<59:11,  1.80s/it, loss=0.096, lr=1e-5]Steps:  87%|████████▋ | 13033/15001 [8:22:50<59:10,  1.80s/it, loss=0.096, lr=1e-5]Steps:  87%|████████▋ | 13033/15001 [8:22:50<59:10,  1.80s/it, loss=0.154, lr=1e-5]Steps:  87%|████████▋ | 13034/15001 [8:22:52<57:35,  1.76s/it, loss=0.154, lr=1e-5]Steps:  87%|████████▋ | 13034/15001 [8:22:52<57:35,  1.76s/it, loss=0.081, lr=1e-5]Steps:  87%|████████▋ | 13035/15001 [8:22:53<58:56,  1.80s/it, loss=0.081, lr=1e-5]Steps:  87%|████████▋ | 13035/15001 [8:22:54<58:56,  1.80s/it, loss=0.187, lr=1e-5]Steps:  87%|████████▋ | 13036/15001 [8:22:56<1:02:28,  1.91s/it, loss=0.187, lr=1e-5]Steps:  87%|████████▋ | 13036/15001 [8:22:56<1:02:28,  1.91s/it, loss=0.0567, lr=1e-5]Steps:  87%|████████▋ | 13037/15001 [8:22:57<59:25,  1.82s/it, loss=0.0567, lr=1e-5]  Steps:  87%|████████▋ | 13037/15001 [8:22:58<59:25,  1.82s/it, loss=0.105, lr=1e-5] Steps:  87%|████████▋ | 13038/15001 [8:22:59<1:01:34,  1.88s/it, loss=0.105, lr=1e-5]Steps:  87%|████████▋ | 13038/15001 [8:22:59<1:01:34,  1.88s/it, loss=0.219, lr=1e-5]Steps:  87%|████████▋ | 13039/15001 [8:23:01<1:03:43,  1.95s/it, loss=0.219, lr=1e-5]Steps:  87%|████████▋ | 13039/15001 [8:23:01<1:03:43,  1.95s/it, loss=0.0454, lr=1e-5]Steps:  87%|████████▋ | 13040/15001 [8:23:03<1:04:16,  1.97s/it, loss=0.0454, lr=1e-5]Steps:  87%|████████▋ | 13040/15001 [8:23:03<1:04:16,  1.97s/it, loss=0.186, lr=1e-5] Steps:  87%|████████▋ | 13041/15001 [8:23:05<1:03:45,  1.95s/it, loss=0.186, lr=1e-5]Steps:  87%|████████▋ | 13041/15001 [8:23:05<1:03:45,  1.95s/it, loss=0.189, lr=1e-5]Steps:  87%|████████▋ | 13042/15001 [8:23:07<1:02:43,  1.92s/it, loss=0.189, lr=1e-5]Steps:  87%|████████▋ | 13042/15001 [8:23:07<1:02:43,  1.92s/it, loss=0.236, lr=1e-5]Steps:  87%|████████▋ | 13043/15001 [8:23:09<1:01:54,  1.90s/it, loss=0.236, lr=1e-5]Steps:  87%|████████▋ | 13043/15001 [8:23:09<1:01:54,  1.90s/it, loss=0.192, lr=1e-5]Steps:  87%|█���██████▋ | 13044/15001 [8:23:11<1:04:12,  1.97s/it, loss=0.192, lr=1e-5]Steps:  87%|████████▋ | 13044/15001 [8:23:11<1:04:12,  1.97s/it, loss=0.0729, lr=1e-5]Steps:  87%|████████▋ | 13045/15001 [8:23:13<1:05:31,  2.01s/it, loss=0.0729, lr=1e-5]Steps:  87%|████████▋ | 13045/15001 [8:23:13<1:05:31,  2.01s/it, loss=0.0859, lr=1e-5]Steps:  87%|████████▋ | 13046/15001 [8:23:15<1:04:13,  1.97s/it, loss=0.0859, lr=1e-5]Steps:  87%|████████▋ | 13046/15001 [8:23:15<1:04:13,  1.97s/it, loss=0.184, lr=1e-5] Steps:  87%|████████▋ | 13047/15001 [8:23:17<1:02:07,  1.91s/it, loss=0.184, lr=1e-5]Steps:  87%|████████▋ | 13047/15001 [8:23:17<1:02:07,  1.91s/it, loss=0.252, lr=1e-5]Steps:  87%|████████▋ | 13048/15001 [8:23:19<1:01:31,  1.89s/it, loss=0.252, lr=1e-5]Steps:  87%|████████▋ | 13048/15001 [8:23:19<1:01:31,  1.89s/it, loss=0.171, lr=1e-5]Steps:  87%|████████▋ | 13049/15001 [8:23:20<1:00:10,  1.85s/it, loss=0.171, lr=1e-5]Steps:  87%|████████▋ | 13049/15001 [8:23:20<1:00:10,  1.85s/it, loss=0.0536, lr=1e-5]Steps:  87%|████████▋ | 13050/15001 [8:23:22<58:28,  1.80s/it, loss=0.0536, lr=1e-5]  Steps:  87%|████████▋ | 13050/15001 [8:23:22<58:28,  1.80s/it, loss=0.204, lr=1e-5] Steps:  87%|████████▋ | 13051/15001 [8:23:24<1:00:23,  1.86s/it, loss=0.204, lr=1e-5]Steps:  87%|████████▋ | 13051/15001 [8:23:24<1:00:23,  1.86s/it, loss=0.0892, lr=1e-5]Steps:  87%|████████▋ | 13052/15001 [8:23:26<58:55,  1.81s/it, loss=0.0892, lr=1e-5]  Steps:  87%|████████▋ | 13052/15001 [8:23:26<58:55,  1.81s/it, loss=0.1, lr=1e-5]   Steps:  87%|████████▋ | 13053/15001 [8:23:27<56:32,  1.74s/it, loss=0.1, lr=1e-5]Steps:  87%|████████▋ | 13053/15001 [8:23:28<56:32,  1.74s/it, loss=0.362, lr=1e-5]Steps:  87%|████████▋ | 13054/15001 [8:23:29<58:13,  1.79s/it, loss=0.362, lr=1e-5]Steps:  87%|████████▋ | 13054/15001 [8:23:29<58:13,  1.79s/it, loss=0.0147, lr=1e-5]Steps:  87%|████████▋ | 13055/15001 [8:23:31<57:26,  1.77s/it, loss=0.0147, lr=1e-5]Steps:  87%|████████▋ | 13055/15001 [8:23:31<57:26,  1.77s/it, loss=0.138, lr=1e-5] Steps:  87%|████████▋ | 13056/15001 [8:23:33<58:13,  1.80s/it, loss=0.138, lr=1e-5]Steps:  87%|████████▋ | 13056/15001 [8:23:33<58:13,  1.80s/it, loss=0.272, lr=1e-5]Steps:  87%|████████▋ | 13057/15001 [8:23:35<57:41,  1.78s/it, loss=0.272, lr=1e-5]Steps:  87%|████████▋ | 13057/15001 [8:23:35<57:41,  1.78s/it, loss=0.174, lr=1e-5]Steps:  87%|████████▋ | 13058/15001 [8:23:37<59:44,  1.84s/it, loss=0.174, lr=1e-5]Steps:  87%|████████▋ | 13058/15001 [8:23:37<59:44,  1.84s/it, loss=0.148, lr=1e-5]Steps:  87%|████████▋ | 13059/15001 [8:23:38<59:10,  1.83s/it, loss=0.148, lr=1e-5]Steps:  87%|████████▋ | 13059/15001 [8:23:39<59:10,  1.83s/it, loss=0.148, lr=1e-5]Steps:  87%|████████▋ | 13060/15001 [8:23:40<59:12,  1.83s/it, loss=0.148, lr=1e-5]Steps:  87%|████████▋ | 13060/15001 [8:23:40<59:12,  1.83s/it, loss=0.22, lr=1e-5] Steps:  87%|████████▋ | 13061/15001 [8:23:42<57:58,  1.79s/it, loss=0.22, lr=1e-5]Steps:  87%|████████▋ | 13061/15001 [8:23:42<57:58,  1.79s/it, loss=0.21, lr=1e-5]Steps:  87%|████████▋ | 13062/15001 [8:23:44<1:00:06,  1.86s/it, loss=0.21, lr=1e-5]Steps:  87%|████████▋ | 13062/15001 [8:23:44<1:00:06,  1.86s/it, loss=0.0774, lr=1e-5]Steps:  87%|████████▋ | 13063/15001 [8:23:46<1:03:52,  1.98s/it, loss=0.0774, lr=1e-5]Steps:  87%|████████▋ | 13063/15001 [8:23:46<1:03:52,  1.98s/it, loss=0.238, lr=1e-5] Steps:  87%|████████▋ | 13064/15001 [8:23:48<1:03:36,  1.97s/it, loss=0.238, lr=1e-5]Steps:  87%|████████▋ | 13064/15001 [8:23:48<1:03:36,  1.97s/it, loss=0.0453, lr=1e-5]Steps:  87%|████████▋ | 13065/15001 [8:23:50<1:03:21,  1.96s/it, loss=0.0453, lr=1e-5]Steps:  87%|████████▋ | 13065/15001 [8:23:50<1:03:21,  1.96s/it, loss=0.442, lr=1e-5] Steps:  87%|████████▋ | 13066/15001 [8:23:52<1:03:38,  1.97s/it, loss=0.442, lr=1e-5]Steps:  87%|████████▋ | 13066/15001 [8:23:52<1:03:38,  1.97s/it, loss=0.26, lr=1e-5] Steps:  87%|████████▋ | 13067/15001 [8:23:54<1:03:17,  1.96s/it, loss=0.26, lr=1e-5]Steps:  87%|████████▋ | 13067/15001 [8:23:54<1:03:17,  1.96s/it, loss=0.294, lr=1e-5]Steps:  87%|████████▋ | 13068/15001 [8:23:56<59:48,  1.86s/it, loss=0.294, lr=1e-5]  Steps:  87%|████████▋ | 13068/15001 [8:23:56<59:48,  1.86s/it, loss=0.0783, lr=1e-5]Steps:  87%|████████▋ | 13069/15001 [8:23:58<1:00:56,  1.89s/it, loss=0.0783, lr=1e-5]Steps:  87%|████████▋ | 13069/15001 [8:23:58<1:00:56,  1.89s/it, loss=0.0689, lr=1e-5]Steps:  87%|████████▋ | 13070/15001 [8:23:59<58:23,  1.81s/it, loss=0.0689, lr=1e-5]  Steps:  87%|████████▋ | 13070/15001 [8:24:00<58:23,  1.81s/it, loss=0.162, lr=1e-5] Steps:  87%|████████▋ | 13071/15001 [8:24:01<1:01:17,  1.91s/it, loss=0.162, lr=1e-5]Steps:  87%|████████▋ | 13071/15001 [8:24:01<1:01:17,  1.91s/it, loss=0.0875, lr=1e-5]Steps:  87%|████████▋ | 13072/15001 [8:24:03<59:06,  1.84s/it, loss=0.0875, lr=1e-5]  Steps:  87%|████████▋ | 13072/15001 [8:24:03<59:06,  1.84s/it, loss=0.099, lr=1e-5] Steps:  87%|████████▋ | 13073/15001 [8:24:05<58:15,  1.81s/it, loss=0.099, lr=1e-5]Steps:  87%|████████▋ | 13073/15001 [8:24:05<58:15,  1.81s/it, loss=0.255, lr=1e-5]Steps:  87%|████████▋ | 13074/15001 [8:24:07<57:46,  1.80s/it, loss=0.255, lr=1e-5]Steps:  87%|████████▋ | 13074/15001 [8:24:07<57:46,  1.80s/it, loss=0.165, lr=1e-5]Steps:  87%|████████▋ | 13075/15001 [8:24:09<1:01:15,  1.91s/it, loss=0.165, lr=1e-5]Steps:  87%|████████▋ | 13075/15001 [8:24:09<1:01:15,  1.91s/it, loss=0.0573, lr=1e-5]Steps:  87%|████████▋ | 13076/15001 [8:24:11<1:00:47,  1.89s/it, loss=0.0573, lr=1e-5]Steps:  87%|████████▋ | 13076/15001 [8:24:11<1:00:47,  1.89s/it, loss=0.252, lr=1e-5] Steps:  87%|████████▋ | 13077/15001 [8:24:12<1:00:21,  1.88s/it, loss=0.252, lr=1e-5]Steps:  87%|████████▋ | 13077/15001 [8:24:13<1:00:21,  1.88s/it, loss=0.212, lr=1e-5]Steps:  87%|████████▋ | 13078/15001 [8:24:14<58:52,  1.84s/it, loss=0.212, lr=1e-5]  Steps:  87%|████████▋ | 13078/15001 [8:24:14<58:52,  1.84s/it, loss=0.264, lr=1e-5]Steps:  87%|████████▋ | 13079/15001 [8:24:16<57:24,  1.79s/it, loss=0.264, lr=1e-5]Steps:  87%|████████▋ | 13079/15001 [8:24:16<57:24,  1.79s/it, loss=0.213, lr=1e-5]Steps:  87%|████████▋ | 13080/15001 [8:24:18<59:31,  1.86s/it, loss=0.213, lr=1e-5]Steps:  87%|████████▋ | 13080/15001 [8:24:18<59:31,  1.86s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13081/15001 [8:24:19<56:21,  1.76s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13081/15001 [8:24:20<56:21,  1.76s/it, loss=0.369, lr=1e-5]Steps:  87%|████████▋ | 13082/15001 [8:24:21<59:10,  1.85s/it, loss=0.369, lr=1e-5]Steps:  87%|████████▋ | 13082/15001 [8:24:22<59:10,  1.85s/it, loss=0.155, lr=1e-5]Steps:  87%|████████▋ | 13083/15001 [8:24:23<58:57,  1.84s/it, loss=0.155, lr=1e-5]Steps:  87%|████████▋ | 13083/15001 [8:24:24<58:57,  1.84s/it, loss=0.0601, lr=1e-5]Steps:  87%|████████▋ | 13084/15001 [8:24:25<1:00:12,  1.88s/it, loss=0.0601, lr=1e-5]Steps:  87%|████████▋ | 13084/15001 [8:24:26<1:00:12,  1.88s/it, loss=0.147, lr=1e-5] Steps:  87%|████████▋ | 13085/15001 [8:24:27<1:01:48,  1.94s/it, loss=0.147, lr=1e-5]Steps:  87%|████████▋ | 13085/15001 [8:24:27<1:01:48,  1.94s/it, loss=0.245, lr=1e-5]Steps:  87%|████████▋ | 13086/15001 [8:24:29<58:24,  1.83s/it, loss=0.245, lr=1e-5]  Steps:  87%|████████▋ | 13086/15001 [8:24:29<58:24,  1.83s/it, loss=0.195, lr=1e-5]Steps:  87%|████████▋ | 13087/15001 [8:24:31<1:03:32,  1.99s/it, loss=0.195, lr=1e-5]Steps:  87%|████████▋ | 13087/15001 [8:24:31<1:03:32,  1.99s/it, loss=0.196, lr=1e-5]Steps:  87%|████████▋ | 13088/15001 [8:24:33<1:00:27,  1.90s/it, loss=0.196, lr=1e-5]Steps:  87%|████████▋ | 13088/15001 [8:24:33<1:00:27,  1.90s/it, loss=0.0659, lr=1e-5]Steps:  87%|████████▋ | 13089/15001 [8:24:35<1:02:52,  1.97s/it, loss=0.0659, lr=1e-5]Steps:  87%|████████▋ | 13089/15001 [8:24:35<1:02:52,  1.97s/it, loss=0.105, lr=1e-5] Steps:  87%|████████▋ | 13090/15001 [8:24:37<1:02:17,  1.96s/it, loss=0.105, lr=1e-5]Steps:  87%|████████▋ | 13090/15001 [8:24:37<1:02:17,  1.96s/it, loss=0.191, lr=1e-5]Steps:  87%|████████▋ | 13091/15001 [8:24:39<1:01:39,  1.94s/it, loss=0.191, lr=1e-5]Steps:  87%|████████▋ | 13091/15001 [8:24:39<1:01:39,  1.94s/it, loss=0.165, lr=1e-5]Steps:  87%|████████▋ | 13092/15001 [8:24:41<1:00:51,  1.91s/it, loss=0.165, lr=1e-5]Steps:  87%|████████▋ | 13092/15001 [8:24:41<1:00:51,  1.91s/it, loss=0.0932, lr=1e-5]Steps:  87%|████████▋ | 13093/15001 [8:24:43<59:37,  1.88s/it, loss=0.0932, lr=1e-5]  Steps:  87%|████████▋ | 13093/15001 [8:24:43<59:37,  1.88s/it, loss=0.133, lr=1e-5] Steps:  87%|████████▋ | 13094/15001 [8:24:44<59:07,  1.86s/it, loss=0.133, lr=1e-5]Steps:  87%|████████▋ | 13094/15001 [8:24:45<59:07,  1.86s/it, loss=0.128, lr=1e-5]Steps:  87%|████████▋ | 13095/15001 [8:24:46<59:15,  1.87s/it, loss=0.128, lr=1e-5]Steps:  87%|████████▋ | 13095/15001 [8:24:46<59:15,  1.87s/it, loss=0.335, lr=1e-5]Steps:  87%|████████▋ | 13096/15001 [8:24:48<58:29,  1.84s/it, loss=0.335, lr=1e-5]Steps:  87%|████████▋ | 13096/15001 [8:24:48<58:29,  1.84s/it, loss=0.1, lr=1e-5]  Steps:  87%|████████▋ | 13097/15001 [8:24:50<59:48,  1.88s/it, loss=0.1, lr=1e-5]Steps:  87%|████████▋ | 13097/15001 [8:24:50<59:48,  1.88s/it, loss=0.0227, lr=1e-5]Steps:  87%|████████▋ | 13098/15001 [8:24:52<58:48,  1.85s/it, loss=0.0227, lr=1e-5]Steps:  87%|████████▋ | 13098/15001 [8:24:52<58:48,  1.85s/it, loss=0.105, lr=1e-5] Steps:  87%|████████▋ | 13099/15001 [8:24:54<57:17,  1.81s/it, loss=0.105, lr=1e-5]Steps:  87%|████████▋ | 13099/15001 [8:24:54<57:17,  1.81s/it, loss=0.154, lr=1e-5]Steps:  87%|████████▋ | 13100/15001 [8:24:55<57:00,  1.80s/it, loss=0.154, lr=1e-5]Steps:  87%|████████▋ | 13100/15001 [8:24:56<57:00,  1.80s/it, loss=0.234, lr=1e-5]Steps:  87%|████████▋ | 13101/15001 [8:24:57<58:58,  1.86s/it, loss=0.234, lr=1e-5]Steps:  87%|████████▋ | 13101/15001 [8:24:57<58:58,  1.86s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13102/15001 [8:24:59<58:04,  1.83s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13102/15001 [8:24:59<58:04,  1.83s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13103/15001 [8:25:01<55:23,  1.75s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13103/15001 [8:25:01<55:23,  1.75s/it, loss=0.195, lr=1e-5]Steps:  87%|████████▋ | 13104/15001 [8:25:02<55:05,  1.74s/it, loss=0.195, lr=1e-5]Steps:  87%|████████▋ | 13104/15001 [8:25:03<55:05,  1.74s/it, loss=0.199, lr=1e-5]Steps:  87%|████████▋ | 13105/15001 [8:25:04<57:02,  1.80s/it, loss=0.199, lr=1e-5]Steps:  87%|████████▋ | 13105/15001 [8:25:04<57:02,  1.80s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13106/15001 [8:25:06<56:49,  1.80s/it, loss=0.137, lr=1e-5]Steps:  87%|████████▋ | 13106/15001 [8:25:06<56:49,  1.80s/it, loss=0.162, lr=1e-5]Steps:  87%|████████▋ | 13107/15001 [8:25:08<59:43,  1.89s/it, loss=0.162, lr=1e-5]Steps:  87%|████████▋ | 13107/15001 [8:25:08<59:43,  1.89s/it, loss=0.13, lr=1e-5] Steps:  87%|████████▋ | 13108/15001 [8:25:10<59:12,  1.88s/it, loss=0.13, lr=1e-5]Steps:  87%|████████▋ | 13108/15001 [8:25:10<59:12,  1.88s/it, loss=0.0582, lr=1e-5]Steps:  87%|████████▋ | 13109/15001 [8:25:12<1:01:18,  1.94s/it, loss=0.0582, lr=1e-5]Steps:  87%|████████▋ | 13109/15001 [8:25:12<1:01:18,  1.94s/it, loss=0.211, lr=1e-5] Steps:  87%|████████▋ | 13110/15001 [8:25:14<1:02:03,  1.97s/it, loss=0.211, lr=1e-5]Steps:  87%|████████▋ | 13110/15001 [8:25:14<1:02:03,  1.97s/it, loss=0.0451, lr=1e-5]Steps:  87%|████████▋ | 13111/15001 [8:25:16<1:02:09,  1.97s/it, loss=0.0451, lr=1e-5]Steps:  87%|████████▋ | 13111/15001 [8:25:16<1:02:09,  1.97s/it, loss=0.0599, lr=1e-5]Steps:  87%|████████▋ | 13112/15001 [8:25:18<1:03:07,  2.00s/it, loss=0.0599, lr=1e-5]Steps:  87%|████████▋ | 13112/15001 [8:25:18<1:03:07,  2.00s/it, loss=0.0526, lr=1e-5]Steps:  87%|████████▋ | 13113/15001 [8:25:20<1:02:38,  1.99s/it, loss=0.0526, lr=1e-5]Steps:  87%|████████▋ | 13113/15001 [8:25:20<1:02:38,  1.99s/it, loss=0.267, lr=1e-5] Steps:  87%|████████▋ | 13114/15001 [8:25:22<1:00:12,  1.91s/it, loss=0.267, lr=1e-5]Steps:  87%|████████▋ | 13114/15001 [8:25:22<1:00:12,  1.91s/it, loss=0.0689, lr=1e-5]Steps:  87%|████████▋ | 13115/15001 [8:25:23<56:30,  1.80s/it, loss=0.0689, lr=1e-5]  Steps:  87%|████████▋ | 13115/15001 [8:25:24<56:30,  1.80s/it, loss=0.146, lr=1e-5] Steps:  87%|████████▋ | 13116/15001 [8:25:25<57:50,  1.84s/it, loss=0.146, lr=1e-5]Steps:  87%|████████▋ | 13116/15001 [8:25:26<57:50,  1.84s/it, loss=0.13, lr=1e-5] Steps:  87%|████████▋ | 13117/15001 [8:25:27<59:42,  1.90s/it, loss=0.13, lr=1e-5]Steps:  87%|████████▋ | 13117/15001 [8:25:27<59:42,  1.90s/it, loss=0.245, lr=1e-5]Steps:  87%|████████▋ | 13118/15001 [8:25:29<56:19,  1.79s/it, loss=0.245, lr=1e-5]Steps:  87%|████████▋ | 13118/15001 [8:25:29<56:19,  1.79s/it, loss=0.245, lr=1e-5]Steps:  87%|████████▋ | 13119/15001 [8:25:31<57:07,  1.82s/it, loss=0.245, lr=1e-5]Steps:  87%|████████▋ | 13119/15001 [8:25:31<57:07,  1.82s/it, loss=0.0505, lr=1e-5]Steps:  87%|████████▋ | 13120/15001 [8:25:33<58:01,  1.85s/it, loss=0.0505, lr=1e-5]Steps:  87%|████████▋ | 13120/15001 [8:25:33<58:01,  1.85s/it, loss=0.0666, lr=1e-5]Steps:  87%|████████▋ | 13121/15001 [8:25:34<55:53,  1.78s/it, loss=0.0666, lr=1e-5]Steps:  87%|████████▋ | 13121/15001 [8:25:35<55:53,  1.78s/it, loss=0.159, lr=1e-5] Steps:  87%|████████▋ | 13122/15001 [8:25:36<56:05,  1.79s/it, loss=0.159, lr=1e-5]Steps:  87%|████████▋ | 13122/15001 [8:25:36<56:05,  1.79s/it, loss=0.379, lr=1e-5]Steps:  87%|████████▋ | 13123/15001 [8:25:38<55:32,  1.77s/it, loss=0.379, lr=1e-5]Steps:  87%|████████▋ | 13123/15001 [8:25:38<55:32,  1.77s/it, loss=0.0284, lr=1e-5]Steps:  87%|████████▋ | 13124/15001 [8:25:40<56:22,  1.80s/it, loss=0.0284, lr=1e-5]Steps:  87%|████████▋ | 13124/15001 [8:25:40<56:22,  1.80s/it, loss=0.123, lr=1e-5] Steps:  87%|████████▋ | 13125/15001 [8:25:42<57:16,  1.83s/it, loss=0.123, lr=1e-5]Steps:  87%|████████▋ | 13125/15001 [8:25:42<57:16,  1.83s/it, loss=0.0372, lr=1e-5]Steps:  88%|████████▊ | 13126/15001 [8:25:43<56:36,  1.81s/it, loss=0.0372, lr=1e-5]Steps:  88%|████████▊ | 13126/15001 [8:25:44<56:36,  1.81s/it, loss=0.142, lr=1e-5] Steps:  88%|████████▊ | 13127/15001 [8:25:46<58:46,  1.88s/it, loss=0.142, lr=1e-5]Steps:  88%|████████▊ | 13127/15001 [8:25:46<58:46,  1.88s/it, loss=0.205, lr=1e-5]Steps:  88%|████████▊ | 13128/15001 [8:25:47<58:12,  1.86s/it, loss=0.205, lr=1e-5]Steps:  88%|████████▊ | 13128/15001 [8:25:47<58:12,  1.86s/it, loss=0.101, lr=1e-5]Steps:  88%|████████▊ | 13129/15001 [8:25:49<54:06,  1.73s/it, loss=0.101, lr=1e-5]Steps:  88%|████████▊ | 13129/15001 [8:25:49<54:06,  1.73s/it, loss=0.109, lr=1e-5]Steps:  88%|████████▊ | 13130/15001 [8:25:51<56:10,  1.80s/it, loss=0.109, lr=1e-5]Steps:  88%|████████▊ | 13130/15001 [8:25:51<56:10,  1.80s/it, loss=0.153, lr=1e-5]Steps:  88%|████████▊ | 13131/15001 [8:25:53<57:27,  1.84s/it, loss=0.153, lr=1e-5]Steps:  88%|████████▊ | 13131/15001 [8:25:53<57:27,  1.84s/it, loss=0.16, lr=1e-5] Steps:  88%|████████▊ | 13132/15001 [8:25:55<59:37,  1.91s/it, loss=0.16, lr=1e-5]Steps:  88%|████████▊ | 13132/15001 [8:25:55<59:37,  1.91s/it, loss=0.284, lr=1e-5]Steps:  88%|████████▊ | 13133/15001 [8:25:57<59:28,  1.91s/it, loss=0.284, lr=1e-5]Steps:  88%|████████▊ | 13133/15001 [8:25:57<59:28,  1.91s/it, loss=0.202, lr=1e-5]Steps:  88%|████████▊ | 13134/15001 [8:25:59<1:00:56,  1.96s/it, loss=0.202, lr=1e-5]Steps:  88%|████████▊ | 13134/15001 [8:25:59<1:00:56,  1.96s/it, loss=0.155, lr=1e-5]Steps:  88%|████████▊ | 13135/15001 [8:26:01<1:01:43,  1.98s/it, loss=0.155, lr=1e-5]Steps:  88%|████████▊ | 13135/15001 [8:26:01<1:01:43,  1.98s/it, loss=0.16, lr=1e-5] Steps:  88%|████████▊ | 13136/15001 [8:26:03<1:00:03,  1.93s/it, loss=0.16, lr=1e-5]Steps:  88%|████████▊ | 13136/15001 [8:26:03<1:00:03,  1.93s/it, loss=0.386, lr=1e-5]Steps:  88%|████████▊ | 13137/15001 [8:26:05<1:00:12,  1.94s/it, loss=0.386, lr=1e-5]Steps:  88%|████████▊ | 13137/15001 [8:26:05<1:00:12,  1.94s/it, loss=0.186, lr=1e-5]Steps:  88%|████████▊ | 13138/15001 [8:26:06<56:52,  1.83s/it, loss=0.186, lr=1e-5]  Steps:  88%|████████▊ | 13138/15001 [8:26:07<56:52,  1.83s/it, loss=0.0766, lr=1e-5]Steps:  88%|████████▊ | 13139/15001 [8:26:08<1:00:01,  1.93s/it, loss=0.0766, lr=1e-5]Steps:  88%|████████▊ | 13139/15001 [8:26:08<1:00:01,  1.93s/it, loss=0.112, lr=1e-5] Steps:  88%|████████▊ | 13140/15001 [8:26:10<58:25,  1.88s/it, loss=0.112, lr=1e-5]  Steps:  88%|████████▊ | 13140/15001 [8:26:10<58:25,  1.88s/it, loss=0.116, lr=1e-5]Steps:  88%|████████▊ | 13141/15001 [8:26:12<57:53,  1.87s/it, loss=0.116, lr=1e-5]Steps:  88%|████████▊ | 13141/15001 [8:26:12<57:53,  1.87s/it, loss=0.0942, lr=1e-5]Steps:  88%|████████▊ | 13142/15001 [8:26:14<56:38,  1.83s/it, loss=0.0942, lr=1e-5]Steps:  88%|████████▊ | 13142/15001 [8:26:14<56:38,  1.83s/it, loss=0.0991, lr=1e-5]Steps:  88%|████████▊ | 13143/15001 [8:26:16<58:20,  1.88s/it, loss=0.0991, lr=1e-5]Steps:  88%|████████▊ | 13143/15001 [8:26:16<58:20,  1.88s/it, loss=0.22, lr=1e-5]  Steps:  88%|████████▊ | 13144/15001 [8:26:17<57:45,  1.87s/it, loss=0.22, lr=1e-5]Steps:  88%|████████▊ | 13144/15001 [8:26:18<57:45,  1.87s/it, loss=0.112, lr=1e-5]Steps:  88%|████████▊ | 13145/15001 [8:26:20<59:27,  1.92s/it, loss=0.112, lr=1e-5]Steps:  88%|████████▊ | 13145/15001 [8:26:20<59:27,  1.92s/it, loss=0.157, lr=1e-5]Steps:  88%|████████▊ | 13146/15001 [8:26:21<58:13,  1.88s/it, loss=0.157, lr=1e-5]Steps:  88%|████████▊ | 13146/15001 [8:26:21<58:13,  1.88s/it, loss=0.19, lr=1e-5] Steps:  88%|████████▊ | 13147/15001 [8:26:23<57:02,  1.85s/it, loss=0.19, lr=1e-5]Steps:  88%|████████▊ | 13147/15001 [8:26:23<57:02,  1.85s/it, loss=0.0812, lr=1e-5]Steps:  88%|████████▊ | 13148/15001 [8:26:25<57:07,  1.85s/it, loss=0.0812, lr=1e-5]Steps:  88%|████████▊ | 13148/15001 [8:26:25<57:07,  1.85s/it, loss=0.17, lr=1e-5]  Steps:  88%|████████▊ | 13149/15001 [8:26:27<58:01,  1.88s/it, loss=0.17, lr=1e-5]Steps:  88%|████████▊ | 13149/15001 [8:26:27<58:01,  1.88s/it, loss=0.0747, lr=1e-5]Steps:  88%|████████▊ | 13150/15001 [8:26:29<56:52,  1.84s/it, loss=0.0747, lr=1e-5]Steps:  88%|████████▊ | 13150/15001 [8:26:29<56:52,  1.84s/it, loss=0.0552, lr=1e-5]Steps:  88%|████████▊ | 13151/15001 [8:26:31<57:05,  1.85s/it, loss=0.0552, lr=1e-5]Steps:  88%|████████▊ | 13151/15001 [8:26:31<57:05,  1.85s/it, loss=0.0674, lr=1e-5]Steps:  88%|████████▊ | 13152/15001 [8:26:32<57:37,  1.87s/it, loss=0.0674, lr=1e-5]Steps:  88%|████████▊ | 13152/15001 [8:26:32<57:37,  1.87s/it, loss=0.185, lr=1e-5] Steps:  88%|████████▊ | 13153/15001 [8:26:34<57:25,  1.86s/it, loss=0.185, lr=1e-5]Steps:  88%|████████▊ | 13153/15001 [8:26:34<57:25,  1.86s/it, loss=0.0761, lr=1e-5]Steps:  88%|████████▊ | 13154/15001 [8:26:36<59:30,  1.93s/it, loss=0.0761, lr=1e-5]Steps:  88%|████████▊ | 13154/15001 [8:26:36<59:30,  1.93s/it, loss=0.532, lr=1e-5] Steps:  88%|████████▊ | 13155/15001 [8:26:38<58:37,  1.91s/it, loss=0.532, lr=1e-5]Steps:  88%|████████▊ | 13155/15001 [8:26:39<58:37,  1.91s/it, loss=0.239, lr=1e-5]Steps:  88%|████████▊ | 13156/15001 [8:26:40<1:01:14,  1.99s/it, loss=0.239, lr=1e-5]Steps:  88%|████████▊ | 13156/15001 [8:26:41<1:01:14,  1.99s/it, loss=0.106, lr=1e-5]Steps:  88%|████████▊ | 13157/15001 [8:26:42<58:41,  1.91s/it, loss=0.106, lr=1e-5]  Steps:  88%|████████▊ | 13157/15001 [8:26:43<58:41,  1.91s/it, loss=0.163, lr=1e-5]Steps:  88%|████████▊ | 13158/15001 [8:26:45<1:03:05,  2.05s/it, loss=0.163, lr=1e-5]Steps:  88%|████████▊ | 13158/15001 [8:26:45<1:03:05,  2.05s/it, loss=0.236, lr=1e-5]Steps:  88%|████████▊ | 13159/15001 [8:26:46<1:00:54,  1.98s/it, loss=0.236, lr=1e-5]Steps:  88%|████████▊ | 13159/15001 [8:26:46<1:00:54,  1.98s/it, loss=0.103, lr=1e-5]Steps:  88%|████████▊ | 13160/15001 [8:26:48<57:05,  1.86s/it, loss=0.103, lr=1e-5]  Steps:  88%|████████▊ | 13160/15001 [8:26:48<57:05,  1.86s/it, loss=0.101, lr=1e-5]Steps:  88%|████████▊ | 13161/15001 [8:26:50<58:33,  1.91s/it, loss=0.101, lr=1e-5]Steps:  88%|████████▊ | 13161/15001 [8:26:50<58:33,  1.91s/it, loss=0.28, lr=1e-5] Steps:  88%|████████▊ | 13162/15001 [8:26:52<1:00:06,  1.96s/it, loss=0.28, lr=1e-5]Steps:  88%|████████▊ | 13162/15001 [8:26:52<1:00:06,  1.96s/it, loss=0.19, lr=1e-5]Steps:  88%|████████▊ | 13163/15001 [8:26:54<58:56,  1.92s/it, loss=0.19, lr=1e-5]  Steps:  88%|████████▊ | 13163/15001 [8:26:54<58:56,  1.92s/it, loss=0.194, lr=1e-5]Steps:  88%|████████▊ | 13164/15001 [8:26:55<55:56,  1.83s/it, loss=0.194, lr=1e-5]Steps:  88%|████████▊ | 13164/15001 [8:26:56<55:56,  1.83s/it, loss=0.0934, lr=1e-5]Steps:  88%|████████▊ | 13165/15001 [8:26:58<57:55,  1.89s/it, loss=0.0934, lr=1e-5]Steps:  88%|████████▊ | 13165/15001 [8:26:58<57:55,  1.89s/it, loss=0.27, lr=1e-5]  Steps:  88%|████████▊ | 13166/15001 [8:26:59<57:53,  1.89s/it, loss=0.27, lr=1e-5]Steps:  88%|████████▊ | 13166/15001 [8:26:59<57:53,  1.89s/it, loss=0.219, lr=1e-5]Steps:  88%|████████▊ | 13167/15001 [8:27:01<56:40,  1.85s/it, loss=0.219, lr=1e-5]Steps:  88%|████████▊ | 13167/15001 [8:27:01<56:40,  1.85s/it, loss=0.0583, lr=1e-5]Steps:  88%|████████▊ | 13168/15001 [8:27:03<51:59,  1.70s/it, loss=0.0583, lr=1e-5]Steps:  88%|████████▊ | 13168/15001 [8:27:03<51:59,  1.70s/it, loss=0.289, lr=1e-5] Steps:  88%|████████▊ | 13169/15001 [8:27:05<55:55,  1.83s/it, loss=0.289, lr=1e-5]Steps:  88%|████████▊ | 13169/15001 [8:27:05<55:55,  1.83s/it, loss=0.106, lr=1e-5]Steps:  88%|████████▊ | 13170/15001 [8:27:06<55:22,  1.81s/it, loss=0.106, lr=1e-5]Steps:  88%|████████▊ | 13170/15001 [8:27:07<55:22,  1.81s/it, loss=0.203, lr=1e-5]Steps:  88%|████████▊ | 13171/15001 [8:27:08<53:58,  1.77s/it, loss=0.203, lr=1e-5]Steps:  88%|████████▊ | 13171/15001 [8:27:08<53:58,  1.77s/it, loss=0.0976, lr=1e-5]Steps:  88%|████████▊ | 13172/15001 [8:27:10<55:05,  1.81s/it, loss=0.0976, lr=1e-5]Steps:  88%|████████▊ | 13172/15001 [8:27:10<55:05,  1.81s/it, loss=0.11, lr=1e-5]  Steps:  88%|████████▊ | 13173/15001 [8:27:12<55:02,  1.81s/it, loss=0.11, lr=1e-5]Steps:  88%|████████▊ | 13173/15001 [8:27:12<55:02,  1.81s/it, loss=0.18, lr=1e-5]Steps:  88%|████████▊ | 13174/15001 [8:27:14<54:46,  1.80s/it, loss=0.18, lr=1e-5]Steps:  88%|████████▊ | 13174/15001 [8:27:14<54:46,  1.80s/it, loss=0.172, lr=1e-5]Steps:  88%|████████▊ | 13175/15001 [8:27:15<55:51,  1.84s/it, loss=0.172, lr=1e-5]Steps:  88%|████████▊ | 13175/15001 [8:27:16<55:51,  1.84s/it, loss=0.174, lr=1e-5]Steps:  88%|████████▊ | 13176/15001 [8:27:17<55:56,  1.84s/it, loss=0.174, lr=1e-5]Steps:  88%|████████▊ | 13176/15001 [8:27:18<55:56,  1.84s/it, loss=0.188, lr=1e-5]Steps:  88%|████████▊ | 13177/15001 [8:27:19<55:46,  1.83s/it, loss=0.188, lr=1e-5]Steps:  88%|████████▊ | 13177/15001 [8:27:20<55:46,  1.83s/it, loss=0.145, lr=1e-5]Steps:  88%|████████▊ | 13178/15001 [8:27:21<1:00:20,  1.99s/it, loss=0.145, lr=1e-5]Steps:  88%|████████▊ | 13178/15001 [8:27:22<1:00:20,  1.99s/it, loss=0.0627, lr=1e-5]Steps:  88%|████████▊ | 13179/15001 [8:27:23<59:29,  1.96s/it, loss=0.0627, lr=1e-5]  Steps:  88%|████████▊ | 13179/15001 [8:27:24<59:29,  1.96s/it, loss=0.0762, lr=1e-5]Steps:  88%|████████▊ | 13180/15001 [8:27:25<1:00:11,  1.98s/it, loss=0.0762, lr=1e-5]Steps:  88%|████████▊ | 13180/15001 [8:27:26<1:00:11,  1.98s/it, loss=0.198, lr=1e-5] Steps:  88%|████████▊ | 13181/15001 [8:27:27<1:00:41,  2.00s/it, loss=0.198, lr=1e-5]Steps:  88%|████████▊ | 13181/15001 [8:27:28<1:00:41,  2.00s/it, loss=0.0823, lr=1e-5]Steps:  88%|████████▊ | 13182/15001 [8:27:29<58:41,  1.94s/it, loss=0.0823, lr=1e-5]  Steps:  88%|████████▊ | 13182/15001 [8:27:29<58:41,  1.94s/it, loss=0.279, lr=1e-5] Steps:  88%|████████▊ | 13183/15001 [8:27:31<56:51,  1.88s/it, loss=0.279, lr=1e-5]Steps:  88%|████████▊ | 13183/15001 [8:27:31<56:51,  1.88s/it, loss=0.141, lr=1e-5]Steps:  88%|████████▊ | 13184/15001 [8:27:33<54:23,  1.80s/it, loss=0.141, lr=1e-5]Steps:  88%|████████▊ | 13184/15001 [8:27:33<54:23,  1.80s/it, loss=0.272, lr=1e-5]Steps:  88%|████████▊ | 13185/15001 [8:27:35<56:04,  1.85s/it, loss=0.272, lr=1e-5]Steps:  88%|████████▊ | 13185/15001 [8:27:35<56:04,  1.85s/it, loss=0.308, lr=1e-5]Steps:  88%|████████▊ | 13186/15001 [8:27:36<52:46,  1.74s/it, loss=0.308, lr=1e-5]Steps:  88%|████████▊ | 13186/15001 [8:27:37<52:46,  1.74s/it, loss=0.0391, lr=1e-5]Steps:  88%|████████▊ | 13187/15001 [8:27:38<55:27,  1.83s/it, loss=0.0391, lr=1e-5]Steps:  88%|████████▊ | 13187/15001 [8:27:39<55:27,  1.83s/it, loss=0.0901, lr=1e-5]Steps:  88%|████████▊ | 13188/15001 [8:27:40<55:36,  1.84s/it, loss=0.0901, lr=1e-5]Steps:  88%|████████▊ | 13188/15001 [8:27:40<55:36,  1.84s/it, loss=0.2, lr=1e-5]   Steps:  88%|████████▊ | 13189/15001 [8:27:42<57:27,  1.90s/it, loss=0.2, lr=1e-5]Steps:  88%|████████▊ | 13189/15001 [8:27:42<57:27,  1.90s/it, loss=0.0673, lr=1e-5]Steps:  88%|████████▊ | 13190/15001 [8:27:44<58:12,  1.93s/it, loss=0.0673, lr=1e-5]Steps:  88%|████████▊ | 13190/15001 [8:27:44<58:12,  1.93s/it, loss=0.176, lr=1e-5] Steps:  88%|████████▊ | 13191/15001 [8:27:46<57:01,  1.89s/it, loss=0.176, lr=1e-5]Steps:  88%|████████▊ | 13191/15001 [8:27:46<57:01,  1.89s/it, loss=0.374, lr=1e-5]Steps:  88%|████████▊ | 13192/15001 [8:27:48<56:41,  1.88s/it, loss=0.374, lr=1e-5]Steps:  88%|████████▊ | 13192/15001 [8:27:48<56:41,  1.88s/it, loss=0.182, lr=1e-5]Steps:  88%|████████▊ | 13193/15001 [8:27:49<53:09,  1.76s/it, loss=0.182, lr=1e-5]Steps:  88%|████████▊ | 13193/15001 [8:27:50<53:09,  1.76s/it, loss=0.0925, lr=1e-5]Steps:  88%|████████▊ | 13194/15001 [8:27:51<55:29,  1.84s/it, loss=0.0925, lr=1e-5]Steps:  88%|████████▊ | 13194/15001 [8:27:51<55:29,  1.84s/it, loss=0.133, lr=1e-5] Steps:  88%|████████▊ | 13195/15001 [8:27:53<55:28,  1.84s/it, loss=0.133, lr=1e-5]Steps:  88%|████████▊ | 13195/15001 [8:27:53<55:28,  1.84s/it, loss=0.135, lr=1e-5]Steps:  88%|████████▊ | 13196/15001 [8:27:55<55:36,  1.85s/it, loss=0.135, lr=1e-5]Steps:  88%|████████▊ | 13196/15001 [8:27:55<55:36,  1.85s/it, loss=0.127, lr=1e-5]Steps:  88%|████████▊ | 13197/15001 [8:27:57<54:43,  1.82s/it, loss=0.127, lr=1e-5]Steps:  88%|████████▊ | 13197/15001 [8:27:57<54:43,  1.82s/it, loss=0.339, lr=1e-5]Steps:  88%|████████▊ | 13198/15001 [8:27:58<53:32,  1.78s/it, loss=0.339, lr=1e-5]Steps:  88%|████████▊ | 13198/15001 [8:27:59<53:32,  1.78s/it, loss=0.177, lr=1e-5]Steps:  88%|████████▊ | 13199/15001 [8:28:00<56:24,  1.88s/it, loss=0.177, lr=1e-5]Steps:  88%|████████▊ | 13199/15001 [8:28:01<56:24,  1.88s/it, loss=0.18, lr=1e-5] Steps:  88%|████████▊ | 13200/15001 [8:28:03<59:42,  1.99s/it, loss=0.18, lr=1e-5]Steps:  88%|████████▊ | 13200/15001 [8:28:03<59:42,  1.99s/it, loss=0.2, lr=1e-5] Steps:  88%|████████▊ | 13201/15001 [8:28:04<57:05,  1.90s/it, loss=0.2, lr=1e-5]Steps:  88%|████████▊ | 13201/15001 [8:28:05<57:05,  1.90s/it, loss=0.196, lr=1e-5]Steps:  88%|████████▊ | 13202/15001 [8:28:07<1:02:12,  2.07s/it, loss=0.196, lr=1e-5]Steps:  88%|████████▊ | 13202/15001 [8:28:07<1:02:12,  2.07s/it, loss=0.392, lr=1e-5]Steps:  88%|████████▊ | 13203/15001 [8:28:09<58:52,  1.96s/it, loss=0.392, lr=1e-5]  Steps:  88%|████████▊ | 13203/15001 [8:28:09<58:52,  1.96s/it, loss=0.17, lr=1e-5] Steps:  88%|████████▊ | 13204/15001 [8:28:11<59:43,  1.99s/it, loss=0.17, lr=1e-5]Steps:  88%|████████▊ | 13204/15001 [8:28:11<59:43,  1.99s/it, loss=0.105, lr=1e-5]Steps:  88%|████████▊ | 13205/15001 [8:28:12<57:06,  1.91s/it, loss=0.105, lr=1e-5]Steps:  88%|████████▊ | 13205/15001 [8:28:13<57:06,  1.91s/it, loss=0.286, lr=1e-5]Steps:  88%|████████▊ | 13206/15001 [8:28:14<55:18,  1.85s/it, loss=0.286, lr=1e-5]Steps:  88%|████████▊ | 13206/15001 [8:28:14<55:18,  1.85s/it, loss=0.0918, lr=1e-5]Steps:  88%|████████▊ | 13207/15001 [8:28:16<56:06,  1.88s/it, loss=0.0918, lr=1e-5]Steps:  88%|████████▊ | 13207/15001 [8:28:16<56:06,  1.88s/it, loss=0.0458, lr=1e-5]Steps:  88%|████████▊ | 13208/15001 [8:28:18<55:30,  1.86s/it, loss=0.0458, lr=1e-5]Steps:  88%|████████▊ | 13208/15001 [8:28:18<55:30,  1.86s/it, loss=0.18, lr=1e-5]  Steps:  88%|████████▊ | 13209/15001 [8:28:20<54:51,  1.84s/it, loss=0.18, lr=1e-5]Steps:  88%|████████▊ | 13209/15001 [8:28:20<54:51,  1.84s/it, loss=0.0504, lr=1e-5]Steps:  88%|████████▊ | 13210/15001 [8:28:22<55:26,  1.86s/it, loss=0.0504, lr=1e-5]Steps:  88%|████████▊ | 13210/15001 [8:28:22<55:26,  1.86s/it, loss=0.062, lr=1e-5] Steps:  88%|████████▊ | 13211/15001 [8:28:23<53:40,  1.80s/it, loss=0.062, lr=1e-5]Steps:  88%|████████▊ | 13211/15001 [8:28:23<53:40,  1.80s/it, loss=0.225, lr=1e-5]Steps:  88%|████████▊ | 13212/15001 [8:28:25<52:49,  1.77s/it, loss=0.225, lr=1e-5]Steps:  88%|████████▊ | 13212/15001 [8:28:25<52:49,  1.77s/it, loss=0.255, lr=1e-5]Steps:  88%|████████▊ | 13213/15001 [8:28:27<55:14,  1.85s/it, loss=0.255, lr=1e-5]Steps:  88%|████████▊ | 13213/15001 [8:28:27<55:14,  1.85s/it, loss=0.188, lr=1e-5]Steps:  88%|████████▊ | 13214/15001 [8:28:29<54:02,  1.81s/it, loss=0.188, lr=1e-5]Steps:  88%|████████▊ | 13214/15001 [8:28:29<54:02,  1.81s/it, loss=0.122, lr=1e-5]Steps:  88%|████████▊ | 13215/15001 [8:28:30<53:29,  1.80s/it, loss=0.122, lr=1e-5]Steps:  88%|████████▊ | 13215/15001 [8:28:31<53:29,  1.80s/it, loss=0.1, lr=1e-5]  Steps:  88%|████████▊ | 13216/15001 [8:28:32<53:16,  1.79s/it, loss=0.1, lr=1e-5]Steps:  88%|████████▊ | 13216/15001 [8:28:32<53:16,  1.79s/it, loss=0.33, lr=1e-5]Steps:  88%|████████▊ | 13217/15001 [8:28:34<53:35,  1.80s/it, loss=0.33, lr=1e-5]Steps:  88%|████████▊ | 13217/15001 [8:28:34<53:35,  1.80s/it, loss=0.267, lr=1e-5]Steps:  88%|████████▊ | 13218/15001 [8:28:36<53:25,  1.80s/it, loss=0.267, lr=1e-5]Steps:  88%|████████▊ | 13218/15001 [8:28:36<53:25,  1.80s/it, loss=0.155, lr=1e-5]Steps:  88%|████████▊ | 13219/15001 [8:28:38<52:37,  1.77s/it, loss=0.155, lr=1e-5]Steps:  88%|████████▊ | 13219/15001 [8:28:38<52:37,  1.77s/it, loss=0.0925, lr=1e-5]Steps:  88%|████████▊ | 13220/15001 [8:28:39<53:39,  1.81s/it, loss=0.0925, lr=1e-5]Steps:  88%|████████▊ | 13220/15001 [8:28:40<53:39,  1.81s/it, loss=0.0472, lr=1e-5]Steps:  88%|████████▊ | 13221/15001 [8:28:41<55:01,  1.85s/it, loss=0.0472, lr=1e-5]Steps:  88%|████████▊ | 13221/15001 [8:28:41<55:01,  1.85s/it, loss=0.169, lr=1e-5] Steps:  88%|████████▊ | 13222/15001 [8:28:43<55:38,  1.88s/it, loss=0.169, lr=1e-5]Steps:  88%|████████▊ | 13222/15001 [8:28:43<55:38,  1.88s/it, loss=0.152, lr=1e-5]Steps:  88%|████████▊ | 13223/15001 [8:28:45<57:31,  1.94s/it, loss=0.152, lr=1e-5]Steps:  88%|████████▊ | 13223/15001 [8:28:45<57:31,  1.94s/it, loss=0.098, lr=1e-5]Steps:  88%|████████▊ | 13224/15001 [8:28:48<59:10,  2.00s/it, loss=0.098, lr=1e-5]Steps:  88%|████████▊ | 13224/15001 [8:28:48<59:10,  2.00s/it, loss=0.268, lr=1e-5]Steps:  88%|████████▊ | 13225/15001 [8:28:49<58:21,  1.97s/it, loss=0.268, lr=1e-5]Steps:  88%|████████▊ | 13225/15001 [8:28:50<58:21,  1.97s/it, loss=0.224, lr=1e-5]Steps:  88%|████████▊ | 13226/15001 [8:28:51<56:44,  1.92s/it, loss=0.224, lr=1e-5]Steps:  88%|████████▊ | 13226/15001 [8:28:52<56:44,  1.92s/it, loss=0.0256, lr=1e-5]Steps:  88%|████████▊ | 13227/15001 [8:28:53<57:42,  1.95s/it, loss=0.0256, lr=1e-5]Steps:  88%|████████▊ | 13227/15001 [8:28:54<57:42,  1.95s/it, loss=0.222, lr=1e-5] Steps:  88%|████████▊ | 13228/15001 [8:28:55<59:11,  2.00s/it, loss=0.222, lr=1e-5]Steps:  88%|████████▊ | 13228/15001 [8:28:56<59:11,  2.00s/it, loss=0.116, lr=1e-5]Steps:  88%|████████▊ | 13229/15001 [8:28:57<57:31,  1.95s/it, loss=0.116, lr=1e-5]Steps:  88%|████████▊ | 13229/15001 [8:28:57<57:31,  1.95s/it, loss=0.168, lr=1e-5]Steps:  88%|████████▊ | 13230/15001 [8:28:59<53:35,  1.82s/it, loss=0.168, lr=1e-5]Steps:  88%|████████▊ | 13230/15001 [8:28:59<53:35,  1.82s/it, loss=0.122, lr=1e-5]Steps:  88%|████████▊ | 13231/15001 [8:29:01<56:36,  1.92s/it, loss=0.122, lr=1e-5]Steps:  88%|████████▊ | 13231/15001 [8:29:01<56:36,  1.92s/it, loss=0.168, lr=1e-5]Steps:  88%|████████▊ | 13232/15001 [8:29:03<54:31,  1.85s/it, loss=0.168, lr=1e-5]Steps:  88%|████████▊ | 13232/15001 [8:29:03<54:31,  1.85s/it, loss=0.231, lr=1e-5]Steps:  88%|████████▊ | 13233/15001 [8:29:05<55:44,  1.89s/it, loss=0.231, lr=1e-5]Steps:  88%|████████▊ | 13233/15001 [8:29:05<55:44,  1.89s/it, loss=0.292, lr=1e-5]Steps:  88%|████████▊ | 13234/15001 [8:29:06<55:42,  1.89s/it, loss=0.292, lr=1e-5]Steps:  88%|████████▊ | 13234/15001 [8:29:07<55:42,  1.89s/it, loss=0.179, lr=1e-5]Steps:  88%|████████▊ | 13235/15001 [8:29:08<56:00,  1.90s/it, loss=0.179, lr=1e-5]Steps:  88%|████████▊ | 13235/15001 [8:29:08<56:00,  1.90s/it, loss=0.165, lr=1e-5]Steps:  88%|████████▊ | 13236/15001 [8:29:10<54:11,  1.84s/it, loss=0.165, lr=1e-5]Steps:  88%|████████▊ | 13236/15001 [8:29:10<54:11,  1.84s/it, loss=0.201, lr=1e-5]Steps:  88%|████████▊ | 13237/15001 [8:29:12<56:09,  1.91s/it, loss=0.201, lr=1e-5]Steps:  88%|████████▊ | 13237/15001 [8:29:12<56:09,  1.91s/it, loss=0.317, lr=1e-5]Steps:  88%|████████▊ | 13238/15001 [8:29:14<55:21,  1.88s/it, loss=0.317, lr=1e-5]Steps:  88%|████████▊ | 13238/15001 [8:29:14<55:21,  1.88s/it, loss=0.135, lr=1e-5]Steps:  88%|████████▊ | 13239/15001 [8:29:16<55:01,  1.87s/it, loss=0.135, lr=1e-5]Steps:  88%|████████▊ | 13239/15001 [8:29:16<55:01,  1.87s/it, loss=0.235, lr=1e-5]Steps:  88%|████████▊ | 13240/15001 [8:29:18<54:53,  1.87s/it, loss=0.235, lr=1e-5]Steps:  88%|████████▊ | 13240/15001 [8:29:18<54:53,  1.87s/it, loss=0.122, lr=1e-5]Steps:  88%|████████▊ | 13241/15001 [8:29:19<53:57,  1.84s/it, loss=0.122, lr=1e-5]Steps:  88%|████████▊ | 13241/15001 [8:29:19<53:57,  1.84s/it, loss=0.324, lr=1e-5]Steps:  88%|████████▊ | 13242/15001 [8:29:21<52:34,  1.79s/it, loss=0.324, lr=1e-5]Steps:  88%|████████▊ | 13242/15001 [8:29:21<52:34,  1.79s/it, loss=0.0352, lr=1e-5]Steps:  88%|████████▊ | 13243/15001 [8:29:23<54:13,  1.85s/it, loss=0.0352, lr=1e-5]Steps:  88%|████████▊ | 13243/15001 [8:29:23<54:13,  1.85s/it, loss=0.111, lr=1e-5] Steps:  88%|████████▊ | 13244/15001 [8:29:25<52:35,  1.80s/it, loss=0.111, lr=1e-5]Steps:  88%|████████▊ | 13244/15001 [8:29:25<52:35,  1.80s/it, loss=0.11, lr=1e-5] Steps:  88%|████████▊ | 13245/15001 [8:29:27<54:46,  1.87s/it, loss=0.11, lr=1e-5]Steps:  88%|████████▊ | 13245/15001 [8:29:27<54:46,  1.87s/it, loss=0.0824, lr=1e-5]Steps:  88%|████████▊ | 13246/15001 [8:29:29<54:06,  1.85s/it, loss=0.0824, lr=1e-5]Steps:  88%|████████▊ | 13246/15001 [8:29:29<54:06,  1.85s/it, loss=0.2, lr=1e-5]   Steps:  88%|████████▊ | 13247/15001 [8:29:31<58:12,  1.99s/it, loss=0.2, lr=1e-5]Steps:  88%|████████▊ | 13247/15001 [8:29:31<58:12,  1.99s/it, loss=0.33, lr=1e-5]Steps:  88%|████████▊ | 13248/15001 [8:29:33<58:04,  1.99s/it, loss=0.33, lr=1e-5]Steps:  88%|████████▊ | 13248/15001 [8:29:33<58:04,  1.99s/it, loss=0.0831, lr=1e-5]Steps:  88%|████████▊ | 13249/15001 [8:29:35<57:49,  1.98s/it, loss=0.0831, lr=1e-5]Steps:  88%|████████▊ | 13249/15001 [8:29:35<57:49,  1.98s/it, loss=0.268, lr=1e-5] Steps:  88%|████████▊ | 13250/15001 [8:29:37<55:35,  1.90s/it, loss=0.268, lr=1e-5]Steps:  88%|████████▊ | 13250/15001 [8:29:37<55:35,  1.90s/it, loss=0.237, lr=1e-5]Steps:  88%|████████▊ | 13251/15001 [8:29:39<56:52,  1.95s/it, loss=0.237, lr=1e-5]Steps:  88%|████████▊ | 13251/15001 [8:29:39<56:52,  1.95s/it, loss=0.0568, lr=1e-5]Steps:  88%|████████▊ | 13252/15001 [8:29:40<55:24,  1.90s/it, loss=0.0568, lr=1e-5]Steps:  88%|████████▊ | 13252/15001 [8:29:41<55:24,  1.90s/it, loss=0.215, lr=1e-5] Steps:  88%|████████▊ | 13253/15001 [8:29:42<54:04,  1.86s/it, loss=0.215, lr=1e-5]Steps:  88%|████████▊ | 13253/15001 [8:29:42<54:04,  1.86s/it, loss=0.041, lr=1e-5]Steps:  88%|████████▊ | 13254/15001 [8:29:44<52:31,  1.80s/it, loss=0.041, lr=1e-5]Steps:  88%|████████▊ | 13254/15001 [8:29:44<52:31,  1.80s/it, loss=0.137, lr=1e-5]Steps:  88%|████████▊ | 13255/15001 [8:29:46<53:41,  1.85s/it, loss=0.137, lr=1e-5]Steps:  88%|████████▊ | 13255/15001 [8:29:46<53:41,  1.85s/it, loss=0.0408, lr=1e-5]Steps:  88%|████████▊ | 13256/15001 [8:29:48<52:42,  1.81s/it, loss=0.0408, lr=1e-5]Steps:  88%|████████▊ | 13256/15001 [8:29:48<52:42,  1.81s/it, loss=0.292, lr=1e-5] Steps:  88%|████████▊ | 13257/15001 [8:29:49<52:08,  1.79s/it, loss=0.292, lr=1e-5]Steps:  88%|████████▊ | 13257/15001 [8:29:49<52:08,  1.79s/it, loss=0.0384, lr=1e-5]Steps:  88%|████████▊ | 13258/15001 [8:29:51<51:17,  1.77s/it, loss=0.0384, lr=1e-5]Steps:  88%|████████▊ | 13258/15001 [8:29:51<51:17,  1.77s/it, loss=0.424, lr=1e-5] Steps:  88%|████████▊ | 13259/15001 [8:29:53<50:41,  1.75s/it, loss=0.424, lr=1e-5]Steps:  88%|████████▊ | 13259/15001 [8:29:53<50:41,  1.75s/it, loss=0.284, lr=1e-5]Steps:  88%|████████▊ | 13260/15001 [8:29:55<51:40,  1.78s/it, loss=0.284, lr=1e-5]Steps:  88%|████████▊ | 13260/15001 [8:29:55<51:40,  1.78s/it, loss=0.033, lr=1e-5]Steps:  88%|████████▊ | 13261/15001 [8:29:57<53:23,  1.84s/it, loss=0.033, lr=1e-5]Steps:  88%|████████▊ | 13261/15001 [8:29:57<53:23,  1.84s/it, loss=0.254, lr=1e-5]Steps:  88%|████████▊ | 13262/15001 [8:29:58<52:17,  1.80s/it, loss=0.254, lr=1e-5]Steps:  88%|████████▊ | 13262/15001 [8:29:58<52:17,  1.80s/it, loss=0.0927, lr=1e-5]Steps:  88%|████████▊ | 13263/15001 [8:30:00<51:22,  1.77s/it, loss=0.0927, lr=1e-5]Steps:  88%|████████▊ | 13263/15001 [8:30:00<51:22,  1.77s/it, loss=0.201, lr=1e-5] Steps:  88%|████████▊ | 13264/15001 [8:30:02<51:45,  1.79s/it, loss=0.201, lr=1e-5]Steps:  88%|████████▊ | 13264/15001 [8:30:02<51:45,  1.79s/it, loss=0.157, lr=1e-5]Steps:  88%|████████▊ | 13265/15001 [8:30:04<52:09,  1.80s/it, loss=0.157, lr=1e-5]Steps:  88%|████████▊ | 13265/15001 [8:30:04<52:09,  1.80s/it, loss=0.121, lr=1e-5]Steps:  88%|████████▊ | 13266/15001 [8:30:05<52:37,  1.82s/it, loss=0.121, lr=1e-5]Steps:  88%|████████▊ | 13266/15001 [8:30:06<52:37,  1.82s/it, loss=0.0353, lr=1e-5]Steps:  88%|████████▊ | 13267/15001 [8:30:07<50:39,  1.75s/it, loss=0.0353, lr=1e-5]Steps:  88%|████████▊ | 13267/15001 [8:30:07<50:39,  1.75s/it, loss=0.158, lr=1e-5] Steps:  88%|████████▊ | 13268/15001 [8:30:09<53:34,  1.85s/it, loss=0.158, lr=1e-5]Steps:  88%|████████▊ | 13268/15001 [8:30:09<53:34,  1.85s/it, loss=0.269, lr=1e-5]Steps:  88%|████████▊ | 13269/15001 [8:30:11<53:29,  1.85s/it, loss=0.269, lr=1e-5]Steps:  88%|████████▊ | 13269/15001 [8:30:11<53:29,  1.85s/it, loss=0.0139, lr=1e-5]Steps:  88%|████████▊ | 13270/15001 [8:30:13<55:41,  1.93s/it, loss=0.0139, lr=1e-5]Steps:  88%|████████▊ | 13270/15001 [8:30:13<55:41,  1.93s/it, loss=0.0175, lr=1e-5]Steps:  88%|████████▊ | 13271/15001 [8:30:15<53:43,  1.86s/it, loss=0.0175, lr=1e-5]Steps:  88%|████████▊ | 13271/15001 [8:30:15<53:43,  1.86s/it, loss=0.118, lr=1e-5] Steps:  88%|████████▊ | 13272/15001 [8:30:17<58:30,  2.03s/it, loss=0.118, lr=1e-5]Steps:  88%|████████▊ | 13272/15001 [8:30:17<58:30,  2.03s/it, loss=0.16, lr=1e-5] Steps:  88%|████████▊ | 13273/15001 [8:30:19<57:49,  2.01s/it, loss=0.16, lr=1e-5]Steps:  88%|████████▊ | 13273/15001 [8:30:19<57:49,  2.01s/it, loss=0.063, lr=1e-5]Steps:  88%|████████▊ | 13274/15001 [8:30:21<55:22,  1.92s/it, loss=0.063, lr=1e-5]Steps:  88%|████████▊ | 13274/15001 [8:30:21<55:22,  1.92s/it, loss=0.114, lr=1e-5]Steps:  88%|████████▊ | 13275/15001 [8:30:23<52:52,  1.84s/it, loss=0.114, lr=1e-5]Steps:  88%|████████▊ | 13275/15001 [8:30:23<52:52,  1.84s/it, loss=0.156, lr=1e-5]Steps:  89%|████████▊ | 13276/15001 [8:30:25<53:45,  1.87s/it, loss=0.156, lr=1e-5]Steps:  89%|████████▊ | 13276/15001 [8:30:25<53:45,  1.87s/it, loss=0.14, lr=1e-5] Steps:  89%|████████▊ | 13277/15001 [8:30:26<52:35,  1.83s/it, loss=0.14, lr=1e-5]Steps:  89%|████████▊ | 13277/15001 [8:30:26<52:35,  1.83s/it, loss=0.136, lr=1e-5]Steps:  89%|████████▊ | 13278/15001 [8:30:28<53:04,  1.85s/it, loss=0.136, lr=1e-5]Steps:  89%|████████▊ | 13278/15001 [8:30:28<53:04,  1.85s/it, loss=0.355, lr=1e-5]Steps:  89%|████████▊ | 13279/15001 [8:30:30<53:36,  1.87s/it, loss=0.355, lr=1e-5]Steps:  89%|████████▊ | 13279/15001 [8:30:30<53:36,  1.87s/it, loss=0.104, lr=1e-5]Steps:  89%|████████▊ | 13280/15001 [8:30:32<53:20,  1.86s/it, loss=0.104, lr=1e-5]Steps:  89%|████████▊ | 13280/15001 [8:30:32<53:20,  1.86s/it, loss=0.0334, lr=1e-5]Steps:  89%|████████▊ | 13281/15001 [8:30:34<52:12,  1.82s/it, loss=0.0334, lr=1e-5]Steps:  89%|████████▊ | 13281/15001 [8:30:34<52:12,  1.82s/it, loss=0.206, lr=1e-5] Steps:  89%|████████▊ | 13282/15001 [8:30:35<51:52,  1.81s/it, loss=0.206, lr=1e-5]Steps:  89%|████████▊ | 13282/15001 [8:30:36<51:52,  1.81s/it, loss=0.175, lr=1e-5]Steps:  89%|████████▊ | 13283/15001 [8:30:37<53:16,  1.86s/it, loss=0.175, lr=1e-5]Steps:  89%|████████▊ | 13283/15001 [8:30:37<53:16,  1.86s/it, loss=0.0523, lr=1e-5]Steps:  89%|████████▊ | 13284/15001 [8:30:39<52:50,  1.85s/it, loss=0.0523, lr=1e-5]Steps:  89%|████████▊ | 13284/15001 [8:30:39<52:50,  1.85s/it, loss=0.177, lr=1e-5] Steps:  89%|████████▊ | 13285/15001 [8:30:41<51:31,  1.80s/it, loss=0.177, lr=1e-5]Steps:  89%|████████▊ | 13285/15001 [8:30:41<51:31,  1.80s/it, loss=0.0659, lr=1e-5]Steps:  89%|████████▊ | 13286/15001 [8:30:43<51:06,  1.79s/it, loss=0.0659, lr=1e-5]Steps:  89%|████████▊ | 13286/15001 [8:30:43<51:06,  1.79s/it, loss=0.0351, lr=1e-5]Steps:  89%|████████▊ | 13287/15001 [8:30:44<50:55,  1.78s/it, loss=0.0351, lr=1e-5]Steps:  89%|████████▊ | 13287/15001 [8:30:45<50:55,  1.78s/it, loss=0.0216, lr=1e-5]Steps:  89%|████████▊ | 13288/15001 [8:30:46<51:46,  1.81s/it, loss=0.0216, lr=1e-5]Steps:  89%|████████▊ | 13288/15001 [8:30:46<51:46,  1.81s/it, loss=0.332, lr=1e-5] Steps:  89%|████████▊ | 13289/15001 [8:30:48<52:00,  1.82s/it, loss=0.332, lr=1e-5]Steps:  89%|████████▊ | 13289/15001 [8:30:48<52:00,  1.82s/it, loss=0.164, lr=1e-5]Steps:  89%|████████▊ | 13290/15001 [8:30:50<51:12,  1.80s/it, loss=0.164, lr=1e-5]Steps:  89%|████████▊ | 13290/15001 [8:30:50<51:12,  1.80s/it, loss=0.262, lr=1e-5]Steps:  89%|████████▊ | 13291/15001 [8:30:52<53:02,  1.86s/it, loss=0.262, lr=1e-5]Steps:  89%|████████▊ | 13291/15001 [8:30:52<53:02,  1.86s/it, loss=0.0427, lr=1e-5]Steps:  89%|████████▊ | 13292/15001 [8:30:54<54:05,  1.90s/it, loss=0.0427, lr=1e-5]Steps:  89%|████████▊ | 13292/15001 [8:30:54<54:05,  1.90s/it, loss=0.165, lr=1e-5] Steps:  89%|████████▊ | 13293/15001 [8:30:56<52:47,  1.85s/it, loss=0.165, lr=1e-5]Steps:  89%|████████▊ | 13293/15001 [8:30:56<52:47,  1.85s/it, loss=0.149, lr=1e-5]Steps:  89%|████████▊ | 13294/15001 [8:30:58<55:07,  1.94s/it, loss=0.149, lr=1e-5]Steps:  89%|████████▊ | 13294/15001 [8:30:58<55:07,  1.94s/it, loss=0.2, lr=1e-5]  Steps:  89%|████████▊ | 13295/15001 [8:31:00<56:00,  1.97s/it, loss=0.2, lr=1e-5]Steps:  89%|████████▊ | 13295/15001 [8:31:00<56:00,  1.97s/it, loss=0.0743, lr=1e-5]Steps:  89%|████████▊ | 13296/15001 [8:31:02<54:43,  1.93s/it, loss=0.0743, lr=1e-5]Steps:  89%|████████▊ | 13296/15001 [8:31:02<54:43,  1.93s/it, loss=0.0709, lr=1e-5]Steps:  89%|████████▊ | 13297/15001 [8:31:04<54:49,  1.93s/it, loss=0.0709, lr=1e-5]Steps:  89%|████████▊ | 13297/15001 [8:31:04<54:49,  1.93s/it, loss=0.0786, lr=1e-5]Steps:  89%|████████▊ | 13298/15001 [8:31:06<55:20,  1.95s/it, loss=0.0786, lr=1e-5]Steps:  89%|████████▊ | 13298/15001 [8:31:06<55:20,  1.95s/it, loss=0.292, lr=1e-5] Steps:  89%|████████▊ | 13299/15001 [8:31:07<51:16,  1.81s/it, loss=0.292, lr=1e-5]Steps:  89%|████████▊ | 13299/15001 [8:31:07<51:16,  1.81s/it, loss=0.262, lr=1e-5]Steps:  89%|████████▊ | 13300/15001 [8:31:09<53:11,  1.88s/it, loss=0.262, lr=1e-5]Steps:  89%|████████▊ | 13300/15001 [8:31:09<53:11,  1.88s/it, loss=0.181, lr=1e-5]Steps:  89%|████████▊ | 13301/15001 [8:31:11<52:12,  1.84s/it, loss=0.181, lr=1e-5]Steps:  89%|████████▊ | 13301/15001 [8:31:11<52:12,  1.84s/it, loss=0.197, lr=1e-5]Steps:  89%|████████▊ | 13302/15001 [8:31:12<50:02,  1.77s/it, loss=0.197, lr=1e-5]Steps:  89%|████████▊ | 13302/15001 [8:31:13<50:02,  1.77s/it, loss=0.282, lr=1e-5]Steps:  89%|████████▊ | 13303/15001 [8:31:14<52:14,  1.85s/it, loss=0.282, lr=1e-5]Steps:  89%|████████▊ | 13303/15001 [8:31:15<52:14,  1.85s/it, loss=0.025, lr=1e-5]Steps:  89%|████████▊ | 13304/15001 [8:31:16<49:10,  1.74s/it, loss=0.025, lr=1e-5]Steps:  89%|████████▊ | 13304/15001 [8:31:16<49:10,  1.74s/it, loss=0.317, lr=1e-5]Steps:  89%|████████▊ | 13305/15001 [8:31:18<51:02,  1.81s/it, loss=0.317, lr=1e-5]Steps:  89%|████████▊ | 13305/15001 [8:31:18<51:02,  1.81s/it, loss=0.159, lr=1e-5]Steps:  89%|████████▊ | 13306/15001 [8:31:20<51:35,  1.83s/it, loss=0.159, lr=1e-5]Steps:  89%|████████▊ | 13306/15001 [8:31:20<51:35,  1.83s/it, loss=0.226, lr=1e-5]Steps:  89%|████████▊ | 13307/15001 [8:31:22<51:47,  1.83s/it, loss=0.226, lr=1e-5]Steps:  89%|████████▊ | 13307/15001 [8:31:22<51:47,  1.83s/it, loss=0.14, lr=1e-5] Steps:  89%|████████▊ | 13308/15001 [8:31:24<54:19,  1.93s/it, loss=0.14, lr=1e-5]Steps:  89%|████████▊ | 13308/15001 [8:31:24<54:19,  1.93s/it, loss=0.137, lr=1e-5]Steps:  89%|████████▊ | 13309/15001 [8:31:26<53:15,  1.89s/it, loss=0.137, lr=1e-5]Steps:  89%|████████▊ | 13309/15001 [8:31:26<53:15,  1.89s/it, loss=0.102, lr=1e-5]Steps:  89%|████████▊ | 13310/15001 [8:31:27<50:17,  1.78s/it, loss=0.102, lr=1e-5]Steps:  89%|████████▊ | 13310/15001 [8:31:27<50:17,  1.78s/it, loss=0.0381, lr=1e-5]Steps:  89%|████████▊ | 13311/15001 [8:31:29<51:10,  1.82s/it, loss=0.0381, lr=1e-5]Steps:  89%|████████▊ | 13311/15001 [8:31:29<51:10,  1.82s/it, loss=0.0453, lr=1e-5]Steps:  89%|████████▊ | 13312/15001 [8:31:31<53:16,  1.89s/it, loss=0.0453, lr=1e-5]Steps:  89%|████████▊ | 13312/15001 [8:31:31<53:16,  1.89s/it, loss=0.149, lr=1e-5] Steps:  89%|████████▊ | 13313/15001 [8:31:33<52:15,  1.86s/it, loss=0.149, lr=1e-5]Steps:  89%|████████▊ | 13313/15001 [8:31:33<52:15,  1.86s/it, loss=0.205, lr=1e-5]Steps:  89%|████████▉ | 13314/15001 [8:31:35<52:55,  1.88s/it, loss=0.205, lr=1e-5]Steps:  89%|████████▉ | 13314/15001 [8:31:35<52:55,  1.88s/it, loss=0.19, lr=1e-5] Steps:  89%|████████▉ | 13315/15001 [8:31:37<54:33,  1.94s/it, loss=0.19, lr=1e-5]Steps:  89%|████████▉ | 13315/15001 [8:31:37<54:33,  1.94s/it, loss=0.0225, lr=1e-5]Steps:  89%|████████▉ | 13316/15001 [8:31:39<53:21,  1.90s/it, loss=0.0225, lr=1e-5]Steps:  89%|████████▉ | 13316/15001 [8:31:39<53:21,  1.90s/it, loss=0.176, lr=1e-5] Steps:  89%|████████▉ | 13317/15001 [8:31:41<55:12,  1.97s/it, loss=0.176, lr=1e-5]Steps:  89%|████████▉ | 13317/15001 [8:31:41<55:12,  1.97s/it, loss=0.187, lr=1e-5]Steps:  89%|████████▉ | 13318/15001 [8:31:43<55:30,  1.98s/it, loss=0.187, lr=1e-5]Steps:  89%|████████▉ | 13318/15001 [8:31:43<55:30,  1.98s/it, loss=0.0685, lr=1e-5]Steps:  89%|████████▉ | 13319/15001 [8:31:45<53:34,  1.91s/it, loss=0.0685, lr=1e-5]Steps:  89%|████████▉ | 13319/15001 [8:31:45<53:34,  1.91s/it, loss=0.154, lr=1e-5] Steps:  89%|████████▉ | 13320/15001 [8:31:47<54:08,  1.93s/it, loss=0.154, lr=1e-5]Steps:  89%|████████▉ | 13320/15001 [8:31:47<54:08,  1.93s/it, loss=0.118, lr=1e-5]Steps:  89%|████████▉ | 13321/15001 [8:31:49<54:38,  1.95s/it, loss=0.118, lr=1e-5]Steps:  89%|████████▉ | 13321/15001 [8:31:49<54:38,  1.95s/it, loss=0.188, lr=1e-5]Steps:  89%|████████▉ | 13322/15001 [8:31:50<52:41,  1.88s/it, loss=0.188, lr=1e-5]Steps:  89%|████████▉ | 13322/15001 [8:31:51<52:41,  1.88s/it, loss=0.278, lr=1e-5]Steps:  89%|████████▉ | 13323/15001 [8:31:52<51:51,  1.85s/it, loss=0.278, lr=1e-5]Steps:  89%|████████▉ | 13323/15001 [8:31:52<51:51,  1.85s/it, loss=0.0798, lr=1e-5]Steps:  89%|████████▉ | 13324/15001 [8:31:54<51:54,  1.86s/it, loss=0.0798, lr=1e-5]Steps:  89%|████████▉ | 13324/15001 [8:31:54<51:54,  1.86s/it, loss=0.167, lr=1e-5] Steps:  89%|████████▉ | 13325/15001 [8:31:56<52:42,  1.89s/it, loss=0.167, lr=1e-5]Steps:  89%|████████▉ | 13325/15001 [8:31:56<52:42,  1.89s/it, loss=0.0257, lr=1e-5]Steps:  89%|████████▉ | 13326/15001 [8:31:58<50:30,  1.81s/it, loss=0.0257, lr=1e-5]Steps:  89%|████████▉ | 13326/15001 [8:31:58<50:30,  1.81s/it, loss=0.123, lr=1e-5] Steps:  89%|████████▉ | 13327/15001 [8:31:59<49:16,  1.77s/it, loss=0.123, lr=1e-5]Steps:  89%|████████▉ | 13327/15001 [8:32:00<49:16,  1.77s/it, loss=0.197, lr=1e-5]Steps:  89%|████████▉ | 13328/15001 [8:32:01<52:21,  1.88s/it, loss=0.197, lr=1e-5]Steps:  89%|████████▉ | 13328/15001 [8:32:01<52:21,  1.88s/it, loss=0.277, lr=1e-5]Steps:  89%|████████▉ | 13329/15001 [8:32:03<49:01,  1.76s/it, loss=0.277, lr=1e-5]Steps:  89%|████████▉ | 13329/15001 [8:32:03<49:01,  1.76s/it, loss=0.172, lr=1e-5]Steps:  89%|████████▉ | 13330/15001 [8:32:05<49:31,  1.78s/it, loss=0.172, lr=1e-5]Steps:  89%|████████▉ | 13330/15001 [8:32:05<49:31,  1.78s/it, loss=0.102, lr=1e-5]Steps:  89%|████████▉ | 13331/15001 [8:32:07<50:41,  1.82s/it, loss=0.102, lr=1e-5]Steps:  89%|████████▉ | 13331/15001 [8:32:07<50:41,  1.82s/it, loss=0.107, lr=1e-5]Steps:  89%|████████▉ | 13332/15001 [8:32:08<50:44,  1.82s/it, loss=0.107, lr=1e-5]Steps:  89%|████████▉ | 13332/15001 [8:32:09<50:44,  1.82s/it, loss=0.19, lr=1e-5] Steps:  89%|████████▉ | 13333/15001 [8:32:10<48:33,  1.75s/it, loss=0.19, lr=1e-5]Steps:  89%|████████▉ | 13333/15001 [8:32:10<48:33,  1.75s/it, loss=0.349, lr=1e-5]Steps:  89%|████████▉ | 13334/15001 [8:32:12<50:32,  1.82s/it, loss=0.349, lr=1e-5]Steps:  89%|████████▉ | 13334/15001 [8:32:12<50:32,  1.82s/it, loss=0.157, lr=1e-5]Steps:  89%|████████▉ | 13335/15001 [8:32:13<47:26,  1.71s/it, loss=0.157, lr=1e-5]Steps:  89%|████████▉ | 13335/15001 [8:32:14<47:26,  1.71s/it, loss=0.0709, lr=1e-5]Steps:  89%|████████▉ | 13336/15001 [8:32:16<52:05,  1.88s/it, loss=0.0709, lr=1e-5]Steps:  89%|████████▉ | 13336/15001 [8:32:16<52:05,  1.88s/it, loss=0.153, lr=1e-5] Steps:  89%|████████▉ | 13337/15001 [8:32:18<52:09,  1.88s/it, loss=0.153, lr=1e-5]Steps:  89%|████████▉ | 13337/15001 [8:32:18<52:09,  1.88s/it, loss=0.183, lr=1e-5]Steps:  89%|████████▉ | 13338/15001 [8:32:19<50:13,  1.81s/it, loss=0.183, lr=1e-5]Steps:  89%|████████▉ | 13338/15001 [8:32:20<50:13,  1.81s/it, loss=0.0979, lr=1e-5]Steps:  89%|████████▉ | 13339/15001 [8:32:21<51:37,  1.86s/it, loss=0.0979, lr=1e-5]Steps:  89%|████████▉ | 13339/15001 [8:32:22<51:37,  1.86s/it, loss=0.0519, lr=1e-5]Steps:  89%|████████▉ | 13340/15001 [8:32:23<53:28,  1.93s/it, loss=0.0519, lr=1e-5]Steps:  89%|████████▉ | 13340/15001 [8:32:24<53:28,  1.93s/it, loss=0.252, lr=1e-5] Steps:  89%|████████▉ | 13341/15001 [8:32:25<54:30,  1.97s/it, loss=0.252, lr=1e-5]Steps:  89%|████████▉ | 13341/15001 [8:32:26<54:30,  1.97s/it, loss=0.141, lr=1e-5]Steps:  89%|████████▉ | 13342/15001 [8:32:28<56:20,  2.04s/it, loss=0.141, lr=1e-5]Steps:  89%|████████▉ | 13342/15001 [8:32:28<56:20,  2.04s/it, loss=0.0616, lr=1e-5]Steps:  89%|████████▉ | 13343/15001 [8:32:29<55:17,  2.00s/it, loss=0.0616, lr=1e-5]Steps:  89%|████████▉ | 13343/15001 [8:32:30<55:17,  2.00s/it, loss=0.0629, lr=1e-5]Steps:  89%|████████▉ | 13344/15001 [8:32:31<54:10,  1.96s/it, loss=0.0629, lr=1e-5]Steps:  89%|████████▉ | 13344/15001 [8:32:32<54:10,  1.96s/it, loss=0.151, lr=1e-5] Steps:  89%|████████▉ | 13345/15001 [8:32:33<52:43,  1.91s/it, loss=0.151, lr=1e-5]Steps:  89%|████████▉ | 13345/15001 [8:32:33<52:43,  1.91s/it, loss=0.23, lr=1e-5] Steps:  89%|████████▉ | 13346/15001 [8:32:35<53:00,  1.92s/it, loss=0.23, lr=1e-5]Steps:  89%|████████▉ | 13346/15001 [8:32:35<53:00,  1.92s/it, loss=0.153, lr=1e-5]Steps:  89%|████████▉ | 13347/15001 [8:32:37<52:11,  1.89s/it, loss=0.153, lr=1e-5]Steps:  89%|████████▉ | 13347/15001 [8:32:37<52:11,  1.89s/it, loss=0.224, lr=1e-5]Steps:  89%|████████▉ | 13348/15001 [8:32:38<49:21,  1.79s/it, loss=0.224, lr=1e-5]Steps:  89%|████████▉ | 13348/15001 [8:32:39<49:21,  1.79s/it, loss=0.186, lr=1e-5]Steps:  89%|████████▉ | 13349/15001 [8:32:41<52:21,  1.90s/it, loss=0.186, lr=1e-5]Steps:  89%|████████▉ | 13349/15001 [8:32:41<52:21,  1.90s/it, loss=0.137, lr=1e-5]Steps:  89%|████████▉ | 13350/15001 [8:32:42<50:58,  1.85s/it, loss=0.137, lr=1e-5]Steps:  89%|████████▉ | 13350/15001 [8:32:43<50:58,  1.85s/it, loss=0.201, lr=1e-5]Steps:  89%|████████▉ | 13351/15001 [8:32:44<50:26,  1.83s/it, loss=0.201, lr=1e-5]Steps:  89%|████████▉ | 13351/15001 [8:32:44<50:26,  1.83s/it, loss=0.331, lr=1e-5]Steps:  89%|████████▉ | 13352/15001 [8:32:46<52:08,  1.90s/it, loss=0.331, lr=1e-5]Steps:  89%|████████▉ | 13352/15001 [8:32:46<52:08,  1.90s/it, loss=0.0474, lr=1e-5]Steps:  89%|████████▉ | 13353/15001 [8:32:48<51:31,  1.88s/it, loss=0.0474, lr=1e-5]Steps:  89%|████████▉ | 13353/15001 [8:32:48<51:31,  1.88s/it, loss=0.28, lr=1e-5]  Steps:  89%|████████▉ | 13354/15001 [8:32:50<49:17,  1.80s/it, loss=0.28, lr=1e-5]Steps:  89%|████████▉ | 13354/15001 [8:32:50<49:17,  1.80s/it, loss=0.0412, lr=1e-5]Steps:  89%|████████▉ | 13355/15001 [8:32:52<50:30,  1.84s/it, loss=0.0412, lr=1e-5]Steps:  89%|████████▉ | 13355/15001 [8:32:52<50:30,  1.84s/it, loss=0.167, lr=1e-5] Steps:  89%|████████▉ | 13356/15001 [8:32:53<50:07,  1.83s/it, loss=0.167, lr=1e-5]Steps:  89%|████████▉ | 13356/15001 [8:32:54<50:07,  1.83s/it, loss=0.21, lr=1e-5] Steps:  89%|████████▉ | 13357/15001 [8:32:55<47:59,  1.75s/it, loss=0.21, lr=1e-5]Steps:  89%|████████▉ | 13357/15001 [8:32:55<47:59,  1.75s/it, loss=0.123, lr=1e-5]Steps:  89%|████████▉ | 13358/15001 [8:32:57<49:46,  1.82s/it, loss=0.123, lr=1e-5]Steps:  89%|████████▉ | 13358/15001 [8:32:57<49:46,  1.82s/it, loss=0.184, lr=1e-5]Steps:  89%|████████▉ | 13359/15001 [8:32:59<51:17,  1.87s/it, loss=0.184, lr=1e-5]Steps:  89%|████████▉ | 13359/15001 [8:32:59<51:17,  1.87s/it, loss=0.0526, lr=1e-5]Steps:  89%|████████▉ | 13360/15001 [8:33:01<51:58,  1.90s/it, loss=0.0526, lr=1e-5]Steps:  89%|████████▉ | 13360/15001 [8:33:01<51:58,  1.90s/it, loss=0.152, lr=1e-5] Steps:  89%|████████▉ | 13361/15001 [8:33:03<51:02,  1.87s/it, loss=0.152, lr=1e-5]Steps:  89%|████████▉ | 13361/15001 [8:33:03<51:02,  1.87s/it, loss=0.384, lr=1e-5]Steps:  89%|████████▉ | 13362/15001 [8:33:05<52:08,  1.91s/it, loss=0.384, lr=1e-5]Steps:  89%|████████▉ | 13362/15001 [8:33:05<52:08,  1.91s/it, loss=0.245, lr=1e-5]Steps:  89%|████████▉ | 13363/15001 [8:33:07<54:09,  1.98s/it, loss=0.245, lr=1e-5]Steps:  89%|████████▉ | 13363/15001 [8:33:07<54:09,  1.98s/it, loss=0.317, lr=1e-5]Steps:  89%|████████▉ | 13364/15001 [8:33:09<54:34,  2.00s/it, loss=0.317, lr=1e-5]Steps:  89%|████████▉ | 13364/15001 [8:33:09<54:34,  2.00s/it, loss=0.0744, lr=1e-5]Steps:  89%|████████▉ | 13365/15001 [8:33:11<54:41,  2.01s/it, loss=0.0744, lr=1e-5]Steps:  89%|████████▉ | 13365/15001 [8:33:11<54:41,  2.01s/it, loss=0.271, lr=1e-5] Steps:  89%|████████▉ | 13366/15001 [8:33:13<52:27,  1.93s/it, loss=0.271, lr=1e-5]Steps:  89%|████████▉ | 13366/15001 [8:33:13<52:27,  1.93s/it, loss=0.114, lr=1e-5]Steps:  89%|████████▉ | 13367/15001 [8:33:14<51:13,  1.88s/it, loss=0.114, lr=1e-5]Steps:  89%|████████▉ | 13367/15001 [8:33:14<51:13,  1.88s/it, loss=0.13, lr=1e-5] Steps:  89%|████████▉ | 13368/15001 [8:33:16<50:58,  1.87s/it, loss=0.13, lr=1e-5]Steps:  89%|████████▉ | 13368/15001 [8:33:16<50:58,  1.87s/it, loss=0.27, lr=1e-5]Steps:  89%|████████▉ | 13369/15001 [8:33:18<48:57,  1.80s/it, loss=0.27, lr=1e-5]Steps:  89%|████████▉ | 13369/15001 [8:33:18<48:57,  1.80s/it, loss=0.0218, lr=1e-5]Steps:  89%|████████▉ | 13370/15001 [8:33:20<49:55,  1.84s/it, loss=0.0218, lr=1e-5]Steps:  89%|████████▉ | 13370/15001 [8:33:20<49:55,  1.84s/it, loss=0.321, lr=1e-5] Steps:  89%|████████▉ | 13371/15001 [8:33:22<49:36,  1.83s/it, loss=0.321, lr=1e-5]Steps:  89%|████████▉ | 13371/15001 [8:33:22<49:36,  1.83s/it, loss=0.0319, lr=1e-5]Steps:  89%|████████▉ | 13372/15001 [8:33:23<46:57,  1.73s/it, loss=0.0319, lr=1e-5]Steps:  89%|████████▉ | 13372/15001 [8:33:24<46:57,  1.73s/it, loss=0.18, lr=1e-5]  Steps:  89%|████████▉ | 13373/15001 [8:33:25<48:38,  1.79s/it, loss=0.18, lr=1e-5]Steps:  89%|████████▉ | 13373/15001 [8:33:25<48:38,  1.79s/it, loss=0.307, lr=1e-5]Steps:  89%|████████▉ | 13374/15001 [8:33:27<50:31,  1.86s/it, loss=0.307, lr=1e-5]Steps:  89%|████████▉ | 13374/15001 [8:33:27<50:31,  1.86s/it, loss=0.0624, lr=1e-5]Steps:  89%|████████▉ | 13375/15001 [8:33:29<47:22,  1.75s/it, loss=0.0624, lr=1e-5]Steps:  89%|████████▉ | 13375/15001 [8:33:29<47:22,  1.75s/it, loss=0.151, lr=1e-5] Steps:  89%|████████▉ | 13376/15001 [8:33:30<47:29,  1.75s/it, loss=0.151, lr=1e-5]Steps:  89%|████████▉ | 13376/15001 [8:33:31<47:29,  1.75s/it, loss=0.272, lr=1e-5]Steps:  89%|████████▉ | 13377/15001 [8:33:32<49:49,  1.84s/it, loss=0.272, lr=1e-5]Steps:  89%|████████▉ | 13377/15001 [8:33:33<49:49,  1.84s/it, loss=0.07, lr=1e-5] Steps:  89%|████████▉ | 13378/15001 [8:33:34<48:46,  1.80s/it, loss=0.07, lr=1e-5]Steps:  89%|████████▉ | 13378/15001 [8:33:34<48:46,  1.80s/it, loss=0.15, lr=1e-5]Steps:  89%|████████▉ | 13379/15001 [8:33:36<48:45,  1.80s/it, loss=0.15, lr=1e-5]Steps:  89%|████████▉ | 13379/15001 [8:33:36<48:45,  1.80s/it, loss=0.0942, lr=1e-5]Steps:  89%|████████▉ | 13380/15001 [8:33:38<51:24,  1.90s/it, loss=0.0942, lr=1e-5]Steps:  89%|████████▉ | 13380/15001 [8:33:38<51:24,  1.90s/it, loss=0.0218, lr=1e-5]Steps:  89%|████████▉ | 13381/15001 [8:33:40<50:12,  1.86s/it, loss=0.0218, lr=1e-5]Steps:  89%|████████▉ | 13381/15001 [8:33:40<50:12,  1.86s/it, loss=0.261, lr=1e-5] Steps:  89%|████████▉ | 13382/15001 [8:33:42<49:07,  1.82s/it, loss=0.261, lr=1e-5]Steps:  89%|████████▉ | 13382/15001 [8:33:42<49:07,  1.82s/it, loss=0.279, lr=1e-5]Steps:  89%|████████▉ | 13383/15001 [8:33:43<49:17,  1.83s/it, loss=0.279, lr=1e-5]Steps:  89%|████████▉ | 13383/15001 [8:33:43<49:17,  1.83s/it, loss=0.171, lr=1e-5]Steps:  89%|████████▉ | 13384/15001 [8:33:45<51:22,  1.91s/it, loss=0.171, lr=1e-5]Steps:  89%|████████▉ | 13384/15001 [8:33:46<51:22,  1.91s/it, loss=0.0751, lr=1e-5]Steps:  89%|████████▉ | 13385/15001 [8:33:47<52:17,  1.94s/it, loss=0.0751, lr=1e-5]Steps:  89%|████████▉ | 13385/15001 [8:33:48<52:17,  1.94s/it, loss=0.0537, lr=1e-5]Steps:  89%|████████▉ | 13386/15001 [8:33:49<51:20,  1.91s/it, loss=0.0537, lr=1e-5]Steps:  89%|████████▉ | 13386/15001 [8:33:50<51:20,  1.91s/it, loss=0.267, lr=1e-5] Steps:  89%|████████▉ | 13387/15001 [8:33:51<51:00,  1.90s/it, loss=0.267, lr=1e-5]Steps:  89%|████████▉ | 13387/15001 [8:33:51<51:00,  1.90s/it, loss=0.15, lr=1e-5] Steps:  89%|████████▉ | 13388/15001 [8:33:53<51:43,  1.92s/it, loss=0.15, lr=1e-5]Steps:  89%|████████▉ | 13388/15001 [8:33:53<51:43,  1.92s/it, loss=0.0489, lr=1e-5]Steps:  89%|████████▉ | 13389/15001 [8:33:55<53:02,  1.97s/it, loss=0.0489, lr=1e-5]Steps:  89%|████████▉ | 13389/15001 [8:33:55<53:02,  1.97s/it, loss=0.184, lr=1e-5] Steps:  89%|████████▉ | 13390/15001 [8:33:57<51:37,  1.92s/it, loss=0.184, lr=1e-5]Steps:  89%|████████▉ | 13390/15001 [8:33:57<51:37,  1.92s/it, loss=0.189, lr=1e-5]Steps:  89%|████████▉ | 13391/15001 [8:33:59<50:24,  1.88s/it, loss=0.189, lr=1e-5]Steps:  89%|████████▉ | 13391/15001 [8:33:59<50:24,  1.88s/it, loss=0.106, lr=1e-5]Steps:  89%|████████▉ | 13392/15001 [8:34:01<50:01,  1.87s/it, loss=0.106, lr=1e-5]Steps:  89%|████████▉ | 13392/15001 [8:34:01<50:01,  1.87s/it, loss=0.204, lr=1e-5]Steps:  89%|████████▉ | 13393/15001 [8:34:02<45:11,  1.69s/it, loss=0.204, lr=1e-5]Steps:  89%|████████▉ | 13393/15001 [8:34:02<45:11,  1.69s/it, loss=0.195, lr=1e-5]Steps:  89%|████████▉ | 13394/15001 [8:34:04<48:47,  1.82s/it, loss=0.195, lr=1e-5]Steps:  89%|████████▉ | 13394/15001 [8:34:04<48:47,  1.82s/it, loss=0.151, lr=1e-5]Steps:  89%|████████▉ | 13395/15001 [8:34:06<48:08,  1.80s/it, loss=0.151, lr=1e-5]Steps:  89%|████████▉ | 13395/15001 [8:34:06<48:08,  1.80s/it, loss=0.0903, lr=1e-5]Steps:  89%|████████▉ | 13396/15001 [8:34:08<48:47,  1.82s/it, loss=0.0903, lr=1e-5]Steps:  89%|████████▉ | 13396/15001 [8:34:08<48:47,  1.82s/it, loss=0.266, lr=1e-5] Steps:  89%|████████▉ | 13397/15001 [8:34:09<47:24,  1.77s/it, loss=0.266, lr=1e-5]Steps:  89%|████████▉ | 13397/15001 [8:34:10<47:24,  1.77s/it, loss=0.229, lr=1e-5]Steps:  89%|████████▉ | 13398/15001 [8:34:11<46:11,  1.73s/it, loss=0.229, lr=1e-5]Steps:  89%|████████▉ | 13398/15001 [8:34:11<46:11,  1.73s/it, loss=0.136, lr=1e-5]Steps:  89%|████████▉ | 13399/15001 [8:34:13<48:15,  1.81s/it, loss=0.136, lr=1e-5]Steps:  89%|████████▉ | 13399/15001 [8:34:13<48:15,  1.81s/it, loss=0.245, lr=1e-5]Steps:  89%|████████▉ | 13400/15001 [8:34:15<48:10,  1.81s/it, loss=0.245, lr=1e-5]Steps:  89%|████████▉ | 13400/15001 [8:34:15<48:10,  1.81s/it, loss=0.0726, lr=1e-5]Steps:  89%|████████▉ | 13401/15001 [8:34:17<47:42,  1.79s/it, loss=0.0726, lr=1e-5]Steps:  89%|████████▉ | 13401/15001 [8:34:17<47:42,  1.79s/it, loss=0.0587, lr=1e-5]Steps:  89%|████████▉ | 13402/15001 [8:34:18<48:58,  1.84s/it, loss=0.0587, lr=1e-5]Steps:  89%|████████▉ | 13402/15001 [8:34:19<48:58,  1.84s/it, loss=0.213, lr=1e-5] Steps:  89%|████████▉ | 13403/15001 [8:34:20<48:52,  1.84s/it, loss=0.213, lr=1e-5]Steps:  89%|████████▉ | 13403/15001 [8:34:20<48:52,  1.84s/it, loss=0.089, lr=1e-5]Steps:  89%|████████▉ | 13404/15001 [8:34:22<48:02,  1.80s/it, loss=0.089, lr=1e-5]Steps:  89%|████████▉ | 13404/15001 [8:34:22<48:02,  1.80s/it, loss=0.0786, lr=1e-5]Steps:  89%|████████▉ | 13405/15001 [8:34:24<46:13,  1.74s/it, loss=0.0786, lr=1e-5]Steps:  89%|████████▉ | 13405/15001 [8:34:24<46:13,  1.74s/it, loss=0.303, lr=1e-5] Steps:  89%|████████▉ | 13406/15001 [8:34:26<47:52,  1.80s/it, loss=0.303, lr=1e-5]Steps:  89%|████████▉ | 13406/15001 [8:34:26<47:52,  1.80s/it, loss=0.159, lr=1e-5]Steps:  89%|████████▉ | 13407/15001 [8:34:28<50:39,  1.91s/it, loss=0.159, lr=1e-5]Steps:  89%|████████▉ | 13407/15001 [8:34:28<50:39,  1.91s/it, loss=0.221, lr=1e-5]Steps:  89%|████████▉ | 13408/15001 [8:34:30<50:34,  1.90s/it, loss=0.221, lr=1e-5]Steps:  89%|████████▉ | 13408/15001 [8:34:30<50:34,  1.90s/it, loss=0.0697, lr=1e-5]Steps:  89%|████████▉ | 13409/15001 [8:34:32<52:37,  1.98s/it, loss=0.0697, lr=1e-5]Steps:  89%|████████▉ | 13409/15001 [8:34:32<52:37,  1.98s/it, loss=0.228, lr=1e-5] Steps:  89%|████████▉ | 13410/15001 [8:34:34<51:42,  1.95s/it, loss=0.228, lr=1e-5]Steps:  89%|████████▉ | 13410/15001 [8:34:34<51:42,  1.95s/it, loss=0.076, lr=1e-5]Steps:  89%|████████▉ | 13411/15001 [8:34:36<52:30,  1.98s/it, loss=0.076, lr=1e-5]Steps:  89%|████████▉ | 13411/15001 [8:34:36<52:30,  1.98s/it, loss=0.0499, lr=1e-5]Steps:  89%|████████▉ | 13412/15001 [8:34:38<52:07,  1.97s/it, loss=0.0499, lr=1e-5]Steps:  89%|████████▉ | 13412/15001 [8:34:38<52:07,  1.97s/it, loss=0.0525, lr=1e-5]Steps:  89%|████████▉ | 13413/15001 [8:34:40<51:42,  1.95s/it, loss=0.0525, lr=1e-5]Steps:  89%|████████▉ | 13413/15001 [8:34:40<51:42,  1.95s/it, loss=0.195, lr=1e-5] Steps:  89%|████████▉ | 13414/15001 [8:34:41<50:56,  1.93s/it, loss=0.195, lr=1e-5]Steps:  89%|████████▉ | 13414/15001 [8:34:41<50:56,  1.93s/it, loss=0.174, lr=1e-5]Steps:  89%|████████▉ | 13415/15001 [8:34:43<48:36,  1.84s/it, loss=0.174, lr=1e-5]Steps:  89%|████████▉ | 13415/15001 [8:34:43<48:36,  1.84s/it, loss=0.0919, lr=1e-5]Steps:  89%|████████▉ | 13416/15001 [8:34:45<50:26,  1.91s/it, loss=0.0919, lr=1e-5]Steps:  89%|████████▉ | 13416/15001 [8:34:45<50:26,  1.91s/it, loss=0.233, lr=1e-5] Steps:  89%|████████▉ | 13417/15001 [8:34:47<48:35,  1.84s/it, loss=0.233, lr=1e-5]Steps:  89%|████████▉ | 13417/15001 [8:34:47<48:35,  1.84s/it, loss=0.128, lr=1e-5]Steps:  89%|████████▉ | 13418/15001 [8:34:49<49:12,  1.87s/it, loss=0.128, lr=1e-5]Steps:  89%|████████▉ | 13418/15001 [8:34:49<49:12,  1.87s/it, loss=0.08, lr=1e-5] Steps:  89%|████████▉ | 13419/15001 [8:34:51<48:48,  1.85s/it, loss=0.08, lr=1e-5]Steps:  89%|████████▉ | 13419/15001 [8:34:51<48:48,  1.85s/it, loss=0.246, lr=1e-5]Steps:  89%|████████▉ | 13420/15001 [8:34:52<48:27,  1.84s/it, loss=0.246, lr=1e-5]Steps:  89%|████████▉ | 13420/15001 [8:34:53<48:27,  1.84s/it, loss=0.356, lr=1e-5]Steps:  89%|████████▉ | 13421/15001 [8:34:54<49:52,  1.89s/it, loss=0.356, lr=1e-5]Steps:  89%|████████▉ | 13421/15001 [8:34:54<49:52,  1.89s/it, loss=0.146, lr=1e-5]Steps:  89%|████████▉ | 13422/15001 [8:34:56<49:31,  1.88s/it, loss=0.146, lr=1e-5]Steps:  89%|████████▉ | 13422/15001 [8:34:56<49:31,  1.88s/it, loss=0.0918, lr=1e-5]Steps:  89%|████████▉ | 13423/15001 [8:34:58<48:02,  1.83s/it, loss=0.0918, lr=1e-5]Steps:  89%|████████▉ | 13423/15001 [8:34:58<48:02,  1.83s/it, loss=0.161, lr=1e-5] Steps:  89%|████████▉ | 13424/15001 [8:35:00<47:35,  1.81s/it, loss=0.161, lr=1e-5]Steps:  89%|████████▉ | 13424/15001 [8:35:00<47:35,  1.81s/it, loss=0.0968, lr=1e-5]Steps:  89%|████████▉ | 13425/15001 [8:35:01<46:58,  1.79s/it, loss=0.0968, lr=1e-5]Steps:  89%|████████▉ | 13425/15001 [8:35:02<46:58,  1.79s/it, loss=0.138, lr=1e-5] Steps:  90%|████████▉ | 13426/15001 [8:35:03<47:43,  1.82s/it, loss=0.138, lr=1e-5]Steps:  90%|████████▉ | 13426/15001 [8:35:03<47:43,  1.82s/it, loss=0.13, lr=1e-5] Steps:  90%|████████▉ | 13427/15001 [8:35:05<46:03,  1.76s/it, loss=0.13, lr=1e-5]Steps:  90%|████████▉ | 13427/15001 [8:35:05<46:03,  1.76s/it, loss=0.148, lr=1e-5]Steps:  90%|████████▉ | 13428/15001 [8:35:07<46:50,  1.79s/it, loss=0.148, lr=1e-5]Steps:  90%|████████▉ | 13428/15001 [8:35:07<46:50,  1.79s/it, loss=0.109, lr=1e-5]Steps:  90%|████████▉ | 13429/15001 [8:35:09<48:13,  1.84s/it, loss=0.109, lr=1e-5]Steps:  90%|████████▉ | 13429/15001 [8:35:09<48:13,  1.84s/it, loss=0.116, lr=1e-5]Steps:  90%|████████▉ | 13430/15001 [8:35:11<49:27,  1.89s/it, loss=0.116, lr=1e-5]Steps:  90%|████████▉ | 13430/15001 [8:35:11<49:27,  1.89s/it, loss=0.242, lr=1e-5]Steps:  90%|████████▉ | 13431/15001 [8:35:12<47:29,  1.81s/it, loss=0.242, lr=1e-5]Steps:  90%|████████▉ | 13431/15001 [8:35:13<47:29,  1.81s/it, loss=0.25, lr=1e-5] Steps:  90%|████████▉ | 13432/15001 [8:35:15<50:09,  1.92s/it, loss=0.25, lr=1e-5]Steps:  90%|████████▉ | 13432/15001 [8:35:15<50:09,  1.92s/it, loss=0.129, lr=1e-5]Steps:  90%|████████▉ | 13433/15001 [8:35:17<51:46,  1.98s/it, loss=0.129, lr=1e-5]Steps:  90%|████████▉ | 13433/15001 [8:35:17<51:46,  1.98s/it, loss=0.138, lr=1e-5]Steps:  90%|████████▉ | 13434/15001 [8:35:18<49:53,  1.91s/it, loss=0.138, lr=1e-5]Steps:  90%|████████▉ | 13434/15001 [8:35:19<49:53,  1.91s/it, loss=0.126, lr=1e-5]Steps:  90%|████████▉ | 13435/15001 [8:35:20<50:35,  1.94s/it, loss=0.126, lr=1e-5]Steps:  90%|████████▉ | 13435/15001 [8:35:21<50:35,  1.94s/it, loss=0.102, lr=1e-5]Steps:  90%|████████▉ | 13436/15001 [8:35:22<47:55,  1.84s/it, loss=0.102, lr=1e-5]Steps:  90%|████████▉ | 13436/15001 [8:35:22<47:55,  1.84s/it, loss=0.1, lr=1e-5]  Steps:  90%|████████▉ | 13437/15001 [8:35:24<49:50,  1.91s/it, loss=0.1, lr=1e-5]Steps:  90%|████████▉ | 13437/15001 [8:35:24<49:50,  1.91s/it, loss=0.235, lr=1e-5]Steps:  90%|████████▉ | 13438/15001 [8:35:26<47:52,  1.84s/it, loss=0.235, lr=1e-5]Steps:  90%|████████▉ | 13438/15001 [8:35:26<47:52,  1.84s/it, loss=0.297, lr=1e-5]Steps:  90%|████████▉ | 13439/15001 [8:35:28<48:46,  1.87s/it, loss=0.297, lr=1e-5]Steps:  90%|████████▉ | 13439/15001 [8:35:28<48:46,  1.87s/it, loss=0.0451, lr=1e-5]Steps:  90%|████████▉ | 13440/15001 [8:35:30<47:45,  1.84s/it, loss=0.0451, lr=1e-5]Steps:  90%|████████▉ | 13440/15001 [8:35:30<47:45,  1.84s/it, loss=0.157, lr=1e-5] Steps:  90%|████████▉ | 13441/15001 [8:35:31<48:33,  1.87s/it, loss=0.157, lr=1e-5]Steps:  90%|████████▉ | 13441/15001 [8:35:31<48:33,  1.87s/it, loss=0.0503, lr=1e-5]Steps:  90%|████████▉ | 13442/15001 [8:35:33<45:26,  1.75s/it, loss=0.0503, lr=1e-5]Steps:  90%|████████▉ | 13442/15001 [8:35:33<45:26,  1.75s/it, loss=0.289, lr=1e-5] Steps:  90%|████████▉ | 13443/15001 [8:35:35<47:15,  1.82s/it, loss=0.289, lr=1e-5]Steps:  90%|████████▉ | 13443/15001 [8:35:35<47:15,  1.82s/it, loss=0.172, lr=1e-5]Steps:  90%|████████▉ | 13444/15001 [8:35:37<47:58,  1.85s/it, loss=0.172, lr=1e-5]Steps:  90%|████████▉ | 13444/15001 [8:35:37<47:58,  1.85s/it, loss=0.0486, lr=1e-5]Steps:  90%|████████▉ | 13445/15001 [8:35:39<47:26,  1.83s/it, loss=0.0486, lr=1e-5]Steps:  90%|████████▉ | 13445/15001 [8:35:39<47:26,  1.83s/it, loss=0.133, lr=1e-5] Steps:  90%|████████▉ | 13446/15001 [8:35:40<45:55,  1.77s/it, loss=0.133, lr=1e-5]Steps:  90%|████████▉ | 13446/15001 [8:35:41<45:55,  1.77s/it, loss=0.145, lr=1e-5]Steps:  90%|████████▉ | 13447/15001 [8:35:42<47:30,  1.83s/it, loss=0.145, lr=1e-5]Steps:  90%|████████▉ | 13447/15001 [8:35:42<47:30,  1.83s/it, loss=0.00992, lr=1e-5]Steps:  90%|████████▉ | 13448/15001 [8:35:44<46:33,  1.80s/it, loss=0.00992, lr=1e-5]Steps:  90%|████████▉ | 13448/15001 [8:35:44<46:33,  1.80s/it, loss=0.238, lr=1e-5]  Steps:  90%|████████▉ | 13449/15001 [8:35:46<46:56,  1.81s/it, loss=0.238, lr=1e-5]Steps:  90%|████████▉ | 13449/15001 [8:35:46<46:56,  1.81s/it, loss=0.0362, lr=1e-5]Steps:  90%|████████▉ | 13450/15001 [8:35:48<47:29,  1.84s/it, loss=0.0362, lr=1e-5]Steps:  90%|████████▉ | 13450/15001 [8:35:48<47:29,  1.84s/it, loss=0.0536, lr=1e-5]Steps:  90%|████████▉ | 13451/15001 [8:35:50<47:14,  1.83s/it, loss=0.0536, lr=1e-5]Steps:  90%|████████▉ | 13451/15001 [8:35:50<47:14,  1.83s/it, loss=0.126, lr=1e-5] Steps:  90%|████████▉ | 13452/15001 [8:35:51<46:42,  1.81s/it, loss=0.126, lr=1e-5]Steps:  90%|████████▉ | 13452/15001 [8:35:52<46:42,  1.81s/it, loss=0.0718, lr=1e-5]Steps:  90%|████████▉ | 13453/15001 [8:35:53<49:10,  1.91s/it, loss=0.0718, lr=1e-5]Steps:  90%|████████▉ | 13453/15001 [8:35:54<49:10,  1.91s/it, loss=0.0768, lr=1e-5]Steps:  90%|████████▉ | 13454/15001 [8:35:55<50:07,  1.94s/it, loss=0.0768, lr=1e-5]Steps:  90%|████████▉ | 13454/15001 [8:35:56<50:07,  1.94s/it, loss=0.103, lr=1e-5] Steps:  90%|████████▉ | 13455/15001 [8:35:57<49:51,  1.94s/it, loss=0.103, lr=1e-5]Steps:  90%|████████▉ | 13455/15001 [8:35:58<49:51,  1.94s/it, loss=0.24, lr=1e-5] Steps:  90%|████████▉ | 13456/15001 [8:36:00<52:26,  2.04s/it, loss=0.24, lr=1e-5]Steps:  90%|████████▉ | 13456/15001 [8:36:00<52:26,  2.04s/it, loss=0.186, lr=1e-5]Steps:  90%|████████▉ | 13457/15001 [8:36:01<50:33,  1.96s/it, loss=0.186, lr=1e-5]Steps:  90%|████████▉ | 13457/15001 [8:36:02<50:33,  1.96s/it, loss=0.298, lr=1e-5]Steps:  90%|████████▉ | 13458/15001 [8:36:03<51:09,  1.99s/it, loss=0.298, lr=1e-5]Steps:  90%|████████▉ | 13458/15001 [8:36:04<51:09,  1.99s/it, loss=0.132, lr=1e-5]Steps:  90%|████████▉ | 13459/15001 [8:36:05<48:54,  1.90s/it, loss=0.132, lr=1e-5]Steps:  90%|████████▉ | 13459/15001 [8:36:05<48:54,  1.90s/it, loss=0.0427, lr=1e-5]Steps:  90%|████████▉ | 13460/15001 [8:36:07<47:14,  1.84s/it, loss=0.0427, lr=1e-5]Steps:  90%|████████▉ | 13460/15001 [8:36:07<47:14,  1.84s/it, loss=0.225, lr=1e-5] Steps:  90%|████████▉ | 13461/15001 [8:36:09<49:17,  1.92s/it, loss=0.225, lr=1e-5]Steps:  90%|████████▉ | 13461/15001 [8:36:09<49:17,  1.92s/it, loss=0.0883, lr=1e-5]Steps:  90%|████████▉ | 13462/15001 [8:36:11<48:40,  1.90s/it, loss=0.0883, lr=1e-5]Steps:  90%|████████▉ | 13462/15001 [8:36:11<48:40,  1.90s/it, loss=0.123, lr=1e-5] Steps:  90%|████████▉ | 13463/15001 [8:36:13<47:33,  1.86s/it, loss=0.123, lr=1e-5]Steps:  90%|████████▉ | 13463/15001 [8:36:13<47:33,  1.86s/it, loss=0.0398, lr=1e-5]Steps:  90%|████████▉ | 13464/15001 [8:36:14<46:48,  1.83s/it, loss=0.0398, lr=1e-5]Steps:  90%|████████▉ | 13464/15001 [8:36:14<46:48,  1.83s/it, loss=0.075, lr=1e-5] Steps:  90%|████████▉ | 13465/15001 [8:36:16<45:36,  1.78s/it, loss=0.075, lr=1e-5]Steps:  90%|████████▉ | 13465/15001 [8:36:16<45:36,  1.78s/it, loss=0.195, lr=1e-5]Steps:  90%|████████▉ | 13466/15001 [8:36:18<46:10,  1.81s/it, loss=0.195, lr=1e-5]Steps:  90%|████████▉ | 13466/15001 [8:36:18<46:10,  1.81s/it, loss=0.0779, lr=1e-5]Steps:  90%|████████▉ | 13467/15001 [8:36:19<44:32,  1.74s/it, loss=0.0779, lr=1e-5]Steps:  90%|████████▉ | 13467/15001 [8:36:20<44:32,  1.74s/it, loss=0.237, lr=1e-5] Steps:  90%|████████▉ | 13468/15001 [8:36:21<46:45,  1.83s/it, loss=0.237, lr=1e-5]Steps:  90%|████████▉ | 13468/15001 [8:36:22<46:45,  1.83s/it, loss=0.101, lr=1e-5]Steps:  90%|████████▉ | 13469/15001 [8:36:23<46:08,  1.81s/it, loss=0.101, lr=1e-5]Steps:  90%|████████▉ | 13469/15001 [8:36:23<46:08,  1.81s/it, loss=0.142, lr=1e-5]Steps:  90%|████████▉ | 13470/15001 [8:36:25<44:39,  1.75s/it, loss=0.142, lr=1e-5]Steps:  90%|████████▉ | 13470/15001 [8:36:25<44:39,  1.75s/it, loss=0.42, lr=1e-5] Steps:  90%|████████▉ | 13471/15001 [8:36:27<46:50,  1.84s/it, loss=0.42, lr=1e-5]Steps:  90%|████████▉ | 13471/15001 [8:36:27<46:50,  1.84s/it, loss=0.111, lr=1e-5]Steps:  90%|████████▉ | 13472/15001 [8:36:29<47:34,  1.87s/it, loss=0.111, lr=1e-5]Steps:  90%|████████▉ | 13472/15001 [8:36:29<47:34,  1.87s/it, loss=0.102, lr=1e-5]Steps:  90%|████████▉ | 13473/15001 [8:36:31<45:58,  1.81s/it, loss=0.102, lr=1e-5]Steps:  90%|████████▉ | 13473/15001 [8:36:31<45:58,  1.81s/it, loss=0.285, lr=1e-5]Steps:  90%|████████▉ | 13474/15001 [8:36:33<47:35,  1.87s/it, loss=0.285, lr=1e-5]Steps:  90%|████████▉ | 13474/15001 [8:36:33<47:35,  1.87s/it, loss=0.274, lr=1e-5]Steps:  90%|████████▉ | 13475/15001 [8:36:34<47:42,  1.88s/it, loss=0.274, lr=1e-5]Steps:  90%|████████▉ | 13475/15001 [8:36:35<47:42,  1.88s/it, loss=0.193, lr=1e-5]Steps:  90%|████████▉ | 13476/15001 [8:36:37<49:46,  1.96s/it, loss=0.193, lr=1e-5]Steps:  90%|████████▉ | 13476/15001 [8:36:37<49:46,  1.96s/it, loss=0.118, lr=1e-5]Steps:  90%|████████▉ | 13477/15001 [8:36:38<47:46,  1.88s/it, loss=0.118, lr=1e-5]Steps:  90%|████████▉ | 13477/15001 [8:36:39<47:46,  1.88s/it, loss=0.0297, lr=1e-5]Steps:  90%|████████▉ | 13478/15001 [8:36:40<49:38,  1.96s/it, loss=0.0297, lr=1e-5]Steps:  90%|████████▉ | 13478/15001 [8:36:41<49:38,  1.96s/it, loss=0.303, lr=1e-5] Steps:  90%|████████▉ | 13479/15001 [8:36:42<48:34,  1.91s/it, loss=0.303, lr=1e-5]Steps:  90%|████████▉ | 13479/15001 [8:36:43<48:34,  1.91s/it, loss=0.338, lr=1e-5]Steps:  90%|████████▉ | 13480/15001 [8:36:44<50:43,  2.00s/it, loss=0.338, lr=1e-5]Steps:  90%|████████▉ | 13480/15001 [8:36:45<50:43,  2.00s/it, loss=0.221, lr=1e-5]Steps:  90%|████████▉ | 13481/15001 [8:36:46<51:14,  2.02s/it, loss=0.221, lr=1e-5]Steps:  90%|████████▉ | 13481/15001 [8:36:47<51:14,  2.02s/it, loss=0.148, lr=1e-5]Steps:  90%|████████▉ | 13482/15001 [8:36:48<49:17,  1.95s/it, loss=0.148, lr=1e-5]Steps:  90%|████████▉ | 13482/15001 [8:36:48<49:17,  1.95s/it, loss=0.185, lr=1e-5]Steps:  90%|████████▉ | 13483/15001 [8:36:50<47:34,  1.88s/it, loss=0.185, lr=1e-5]Steps:  90%|████████▉ | 13483/15001 [8:36:50<47:34,  1.88s/it, loss=0.18, lr=1e-5] Steps:  90%|████████▉ | 13484/15001 [8:36:52<46:28,  1.84s/it, loss=0.18, lr=1e-5]Steps:  90%|████████▉ | 13484/15001 [8:36:52<46:28,  1.84s/it, loss=0.323, lr=1e-5]Steps:  90%|████████▉ | 13485/15001 [8:36:54<47:18,  1.87s/it, loss=0.323, lr=1e-5]Steps:  90%|████████▉ | 13485/15001 [8:36:54<47:18,  1.87s/it, loss=0.233, lr=1e-5]Steps:  90%|████████▉ | 13486/15001 [8:36:55<45:53,  1.82s/it, loss=0.233, lr=1e-5]Steps:  90%|████████▉ | 13486/15001 [8:36:56<45:53,  1.82s/it, loss=0.242, lr=1e-5]Steps:  90%|████████▉ | 13487/15001 [8:36:57<45:14,  1.79s/it, loss=0.242, lr=1e-5]Steps:  90%|████████▉ | 13487/15001 [8:36:57<45:14,  1.79s/it, loss=0.142, lr=1e-5]Steps:  90%|████████▉ | 13488/15001 [8:36:59<47:03,  1.87s/it, loss=0.142, lr=1e-5]Steps:  90%|████████▉ | 13488/15001 [8:36:59<47:03,  1.87s/it, loss=0.303, lr=1e-5]Steps:  90%|████████▉ | 13489/15001 [8:37:01<45:32,  1.81s/it, loss=0.303, lr=1e-5]Steps:  90%|████████▉ | 13489/15001 [8:37:01<45:32,  1.81s/it, loss=0.26, lr=1e-5] Steps:  90%|████████▉ | 13490/15001 [8:37:02<44:25,  1.76s/it, loss=0.26, lr=1e-5]Steps:  90%|████████▉ | 13490/15001 [8:37:03<44:25,  1.76s/it, loss=0.349, lr=1e-5]Steps:  90%|████████▉ | 13491/15001 [8:37:04<45:46,  1.82s/it, loss=0.349, lr=1e-5]Steps:  90%|████████▉ | 13491/15001 [8:37:05<45:46,  1.82s/it, loss=0.217, lr=1e-5]Steps:  90%|████████▉ | 13492/15001 [8:37:06<45:31,  1.81s/it, loss=0.217, lr=1e-5]Steps:  90%|████████▉ | 13492/15001 [8:37:06<45:31,  1.81s/it, loss=0.204, lr=1e-5]Steps:  90%|████████▉ | 13493/15001 [8:37:08<46:34,  1.85s/it, loss=0.204, lr=1e-5]Steps:  90%|��███████▉ | 13493/15001 [8:37:08<46:34,  1.85s/it, loss=0.0556, lr=1e-5]Steps:  90%|████████▉ | 13494/15001 [8:37:10<44:17,  1.76s/it, loss=0.0556, lr=1e-5]Steps:  90%|████████▉ | 13494/15001 [8:37:10<44:17,  1.76s/it, loss=0.174, lr=1e-5] Steps:  90%|████████▉ | 13495/15001 [8:37:12<44:56,  1.79s/it, loss=0.174, lr=1e-5]Steps:  90%|████████▉ | 13495/15001 [8:37:12<44:56,  1.79s/it, loss=0.119, lr=1e-5]Steps:  90%|████████▉ | 13496/15001 [8:37:13<44:26,  1.77s/it, loss=0.119, lr=1e-5]Steps:  90%|████████▉ | 13496/15001 [8:37:14<44:26,  1.77s/it, loss=0.136, lr=1e-5]Steps:  90%|████████▉ | 13497/15001 [8:37:15<44:33,  1.78s/it, loss=0.136, lr=1e-5]Steps:  90%|████████▉ | 13497/15001 [8:37:15<44:33,  1.78s/it, loss=0.205, lr=1e-5]Steps:  90%|████████▉ | 13498/15001 [8:37:17<46:40,  1.86s/it, loss=0.205, lr=1e-5]Steps:  90%|████████▉ | 13498/15001 [8:37:17<46:40,  1.86s/it, loss=0.185, lr=1e-5]Steps:  90%|████████▉ | 13499/15001 [8:37:19<47:52,  1.91s/it, loss=0.185, lr=1e-5]Steps:  90%|████████▉ | 13499/15001 [8:37:19<47:52,  1.91s/it, loss=0.0902, lr=1e-5]Steps:  90%|████████▉ | 13500/15001 [8:37:21<48:47,  1.95s/it, loss=0.0902, lr=1e-5]02/04/2024 21:39:40 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1922.38it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  90%|████████▉ | 13500/15001 [8:41:00<48:47,  1.95s/it, loss=0.246, lr=1e-5] Steps:  90%|█████████ | 13501/15001 [8:41:01<28:03:31, 67.34s/it, loss=0.246, lr=1e-5]Steps:  90%|█████████ | 13501/15001 [8:41:01<28:03:31, 67.34s/it, loss=0.0727, lr=1e-5]Steps:  90%|█████████ | 13502/15001 [8:41:03<19:50:51, 47.67s/it, loss=0.0727, lr=1e-5]Steps:  90%|█████████ | 13502/15001 [8:41:03<19:50:51, 47.67s/it, loss=0.095, lr=1e-5] Steps:  90%|█████████ | 13503/15001 [8:41:05<14:05:57, 33.88s/it, loss=0.095, lr=1e-5]Steps:  90%|█████████ | 13503/15001 [8:41:05<14:05:57, 33.88s/it, loss=0.0899, lr=1e-5]Steps:  90%|█████████ | 13504/15001 [8:41:06<10:05:25, 24.27s/it, loss=0.0899, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  90%|█████████ | 13504/15001 [8:41:07<10:05:25, 24.27s/it, loss=0.13, lr=1e-5]  Steps:  90%|█████████ | 13505/15001 [8:41:09<7:20:19, 17.66s/it, loss=0.13, lr=1e-5] Steps:  90%|█████████ | 13505/15001 [8:41:09<7:20:19, 17.66s/it, loss=0.295, lr=1e-5]Steps:  90%|█████████ | 13506/15001 [8:41:10<5:20:46, 12.87s/it, loss=0.295, lr=1e-5]Steps:  90%|█████████ | 13506/15001 [8:41:11<5:20:46, 12.87s/it, loss=0.208, lr=1e-5]Steps:  90%|█████████ | 13507/15001 [8:41:12<3:57:58,  9.56s/it, loss=0.208, lr=1e-5]Steps:  90%|█████████ | 13507/15001 [8:41:12<3:57:58,  9.56s/it, loss=0.0876, lr=1e-5]Steps:  90%|█████████ | 13508/15001 [8:41:14<3:02:29,  7.33s/it, loss=0.0876, lr=1e-5]Steps:  90%|█████████ | 13508/15001 [8:41:14<3:02:29,  7.33s/it, loss=0.289, lr=1e-5] Steps:  90%|█████████ | 13509/15001 [8:41:16<2:20:56,  5.67s/it, loss=0.289, lr=1e-5]Steps:  90%|█████████ | 13509/15001 [8:41:16<2:20:56,  5.67s/it, loss=0.0553, lr=1e-5]Steps:  90%|█████████ | 13510/15001 [8:41:18<1:54:03,  4.59s/it, loss=0.0553, lr=1e-5]Steps:  90%|█████████ | 13510/15001 [8:41:18<1:54:03,  4.59s/it, loss=0.152, lr=1e-5] Steps:  90%|█████████ | 13511/15001 [8:41:20<1:33:48,  3.78s/it, loss=0.152, lr=1e-5]Steps:  90%|█████████ | 13511/15001 [8:41:20<1:33:48,  3.78s/it, loss=0.27, lr=1e-5] Steps:  90%|█████████ | 13512/15001 [8:41:22<1:21:48,  3.30s/it, loss=0.27, lr=1e-5]Steps:  90%|█████████ | 13512/15001 [8:41:22<1:21:48,  3.30s/it, loss=0.0877, lr=1e-5]Steps:  90%|█████████ | 13513/15001 [8:41:24<1:11:08,  2.87s/it, loss=0.0877, lr=1e-5]Steps:  90%|█████████ | 13513/15001 [8:41:24<1:11:08,  2.87s/it, loss=0.0509, lr=1e-5]Steps:  90%|█████████ | 13514/15001 [8:41:26<1:03:45,  2.57s/it, loss=0.0509, lr=1e-5]Steps:  90%|█████████ | 13514/15001 [8:41:26<1:03:45,  2.57s/it, loss=0.195, lr=1e-5] Steps:  90%|█████████ | 13515/15001 [8:41:28<57:08,  2.31s/it, loss=0.195, lr=1e-5]  Steps:  90%|█████████ | 13515/15001 [8:41:28<57:08,  2.31s/it, loss=0.157, lr=1e-5]Steps:  90%|█████████ | 13516/15001 [8:41:30<54:29,  2.20s/it, loss=0.157, lr=1e-5]Steps:  90%|█████████ | 13516/15001 [8:41:30<54:29,  2.20s/it, loss=0.35, lr=1e-5] Steps:  90%|█████████ | 13517/15001 [8:41:31<51:07,  2.07s/it, loss=0.35, lr=1e-5]Steps:  90%|█████████ | 13517/15001 [8:41:32<51:07,  2.07s/it, loss=0.177, lr=1e-5]Steps:  90%|█████████ | 13518/15001 [8:41:33<47:58,  1.94s/it, loss=0.177, lr=1e-5]Steps:  90%|█████████ | 13518/15001 [8:41:33<47:58,  1.94s/it, loss=0.231, lr=1e-5]Steps:  90%|█████████ | 13519/15001 [8:41:35<47:35,  1.93s/it, loss=0.231, lr=1e-5]Steps:  90%|█████████ | 13519/15001 [8:41:35<47:35,  1.93s/it, loss=0.14, lr=1e-5] Steps:  90%|█████████ | 13520/15001 [8:41:37<46:03,  1.87s/it, loss=0.14, lr=1e-5]Steps:  90%|█████████ | 13520/15001 [8:41:37<46:03,  1.87s/it, loss=0.157, lr=1e-5]Steps:  90%|█████████ | 13521/15001 [8:41:39<45:57,  1.86s/it, loss=0.157, lr=1e-5]Steps:  90%|█████████ | 13521/15001 [8:41:39<45:57,  1.86s/it, loss=0.0934, lr=1e-5]Steps:  90%|█████████ | 13522/15001 [8:41:41<46:45,  1.90s/it, loss=0.0934, lr=1e-5]Steps:  90%|█████████ | 13522/15001 [8:41:41<46:45,  1.90s/it, loss=0.194, lr=1e-5] Steps:  90%|█████████ | 13523/15001 [8:41:42<45:03,  1.83s/it, loss=0.194, lr=1e-5]Steps:  90%|█████████ | 13523/15001 [8:41:42<45:03,  1.83s/it, loss=0.356, lr=1e-5]Steps:  90%|█████████ | 13524/15001 [8:41:44<44:07,  1.79s/it, loss=0.356, lr=1e-5]Steps:  90%|█████████ | 13524/15001 [8:41:44<44:07,  1.79s/it, loss=0.098, lr=1e-5]Steps:  90%|█████████ | 13525/15001 [8:41:46<43:37,  1.77s/it, loss=0.098, lr=1e-5]Steps:  90%|█████████ | 13525/15001 [8:41:46<43:37,  1.77s/it, loss=0.212, lr=1e-5]Steps:  90%|█████████ | 13526/15001 [8:41:47<43:17,  1.76s/it, loss=0.212, lr=1e-5]Steps:  90%|█████████ | 13526/15001 [8:41:48<43:17,  1.76s/it, loss=0.0629, lr=1e-5]Steps:  90%|█████████ | 13527/15001 [8:41:49<44:13,  1.80s/it, loss=0.0629, lr=1e-5]Steps:  90%|█████████ | 13527/15001 [8:41:50<44:13,  1.80s/it, loss=0.314, lr=1e-5] Steps:  90%|█████████ | 13528/15001 [8:41:51<44:53,  1.83s/it, loss=0.314, lr=1e-5]Steps:  90%|█████████ | 13528/15001 [8:41:51<44:53,  1.83s/it, loss=0.179, lr=1e-5]Steps:  90%|█████████ | 13529/15001 [8:41:53<42:38,  1.74s/it, loss=0.179, lr=1e-5]Steps:  90%|█████████ | 13529/15001 [8:41:53<42:38,  1.74s/it, loss=0.082, lr=1e-5]Steps:  90%|█████████ | 13530/15001 [8:41:55<45:08,  1.84s/it, loss=0.082, lr=1e-5]Steps:  90%|█████████ | 13530/15001 [8:41:55<45:08,  1.84s/it, loss=0.194, lr=1e-5]Steps:  90%|█████████ | 13531/15001 [8:41:57<45:45,  1.87s/it, loss=0.194, lr=1e-5]Steps:  90%|█████████ | 13531/15001 [8:41:57<45:45,  1.87s/it, loss=0.23, lr=1e-5] Steps:  90%|█████████ | 13532/15001 [8:41:58<45:11,  1.85s/it, loss=0.23, lr=1e-5]Steps:  90%|█████████ | 13532/15001 [8:41:59<45:11,  1.85s/it, loss=0.313, lr=1e-5]Steps:  90%|█████████ | 13533/15001 [8:42:01<46:47,  1.91s/it, loss=0.313, lr=1e-5]Steps:  90%|█████████ | 13533/15001 [8:42:01<46:47,  1.91s/it, loss=0.0682, lr=1e-5]Steps:  90%|█████████ | 13534/15001 [8:42:03<48:14,  1.97s/it, loss=0.0682, lr=1e-5]Steps:  90%|█████████ | 13534/15001 [8:42:03<48:14,  1.97s/it, loss=0.062, lr=1e-5] Steps:  90%|█████████ | 13535/15001 [8:42:04<47:05,  1.93s/it, loss=0.062, lr=1e-5]Steps:  90%|█████████ | 13535/15001 [8:42:05<47:05,  1.93s/it, loss=0.0594, lr=1e-5]Steps:  90%|█████████ | 13536/15001 [8:42:06<47:19,  1.94s/it, loss=0.0594, lr=1e-5]Steps:  90%|█████████ | 13536/15001 [8:42:07<47:19,  1.94s/it, loss=0.153, lr=1e-5] Steps:  90%|█████████ | 13537/15001 [8:42:08<48:09,  1.97s/it, loss=0.153, lr=1e-5]Steps:  90%|█████████ | 13537/15001 [8:42:09<48:09,  1.97s/it, loss=0.0621, lr=1e-5]Steps:  90%|█████████ | 13538/15001 [8:42:10<45:03,  1.85s/it, loss=0.0621, lr=1e-5]Steps:  90%|█████████ | 13538/15001 [8:42:11<45:03,  1.85s/it, loss=0.221, lr=1e-5] Steps:  90%|█████████ | 13539/15001 [8:42:12<46:16,  1.90s/it, loss=0.221, lr=1e-5]Steps:  90%|█████████ | 13539/15001 [8:42:12<46:16,  1.90s/it, loss=0.187, lr=1e-5]Steps:  90%|█████████ | 13540/15001 [8:42:14<45:29,  1.87s/it, loss=0.187, lr=1e-5]Steps:  90%|█████████ | 13540/15001 [8:42:14<45:29,  1.87s/it, loss=0.116, lr=1e-5]Steps:  90%|█████████ | 13541/15001 [8:42:16<44:47,  1.84s/it, loss=0.116, lr=1e-5]Steps:  90%|█████████ | 13541/15001 [8:42:16<44:47,  1.84s/it, loss=0.0598, lr=1e-5]Steps:  90%|█████████ | 13542/15001 [8:42:17<44:33,  1.83s/it, loss=0.0598, lr=1e-5]Steps:  90%|█████████ | 13542/15001 [8:42:18<44:33,  1.83s/it, loss=0.123, lr=1e-5] Steps:  90%|█████████ | 13543/15001 [8:42:19<44:07,  1.82s/it, loss=0.123, lr=1e-5]Steps:  90%|█████████ | 13543/15001 [8:42:19<44:07,  1.82s/it, loss=0.139, lr=1e-5]Steps:  90%|█████████ | 13544/15001 [8:42:21<45:26,  1.87s/it, loss=0.139, lr=1e-5]Steps:  90%|█████████ | 13544/15001 [8:42:21<45:26,  1.87s/it, loss=0.0944, lr=1e-5]Steps:  90%|█████████ | 13545/15001 [8:42:23<44:41,  1.84s/it, loss=0.0944, lr=1e-5]Steps:  90%|█████████ | 13545/15001 [8:42:23<44:41,  1.84s/it, loss=0.232, lr=1e-5] Steps:  90%|█████████ | 13546/15001 [8:42:25<42:17,  1.74s/it, loss=0.232, lr=1e-5]Steps:  90%|█████████ | 13546/15001 [8:42:25<42:17,  1.74s/it, loss=0.222, lr=1e-5]Steps:  90%|█████████ | 13547/15001 [8:42:27<44:25,  1.83s/it, loss=0.222, lr=1e-5]Steps:  90%|█████████ | 13547/15001 [8:42:27<44:25,  1.83s/it, loss=0.0492, lr=1e-5]Steps:  90%|█████████ | 13548/15001 [8:42:28<43:37,  1.80s/it, loss=0.0492, lr=1e-5]Steps:  90%|█████████ | 13548/15001 [8:42:28<43:37,  1.80s/it, loss=0.273, lr=1e-5] Steps:  90%|█████████ | 13549/15001 [8:42:30<43:40,  1.81s/it, loss=0.273, lr=1e-5]Steps:  90%|█████████ | 13549/15001 [8:42:30<43:40,  1.81s/it, loss=0.124, lr=1e-5]Steps:  90%|█████████ | 13550/15001 [8:42:32<42:02,  1.74s/it, loss=0.124, lr=1e-5]Steps:  90%|█████████ | 13550/15001 [8:42:32<42:02,  1.74s/it, loss=0.308, lr=1e-5]Steps:  90%|█████████ | 13551/15001 [8:42:34<43:10,  1.79s/it, loss=0.308, lr=1e-5]Steps:  90%|█████████ | 13551/15001 [8:42:34<43:10,  1.79s/it, loss=0.125, lr=1e-5]Steps:  90%|█████████ | 13552/15001 [8:42:36<44:38,  1.85s/it, loss=0.125, lr=1e-5]Steps:  90%|█████████ | 13552/15001 [8:42:36<44:38,  1.85s/it, loss=0.0454, lr=1e-5]Steps:  90%|█████████ | 13553/15001 [8:42:37<43:58,  1.82s/it, loss=0.0454, lr=1e-5]Steps:  90%|█████████ | 13553/15001 [8:42:37<43:58,  1.82s/it, loss=0.0803, lr=1e-5]Steps:  90%|█████████ | 13554/15001 [8:42:39<40:19,  1.67s/it, loss=0.0803, lr=1e-5]Steps:  90%|█████████ | 13554/15001 [8:42:39<40:19,  1.67s/it, loss=0.235, lr=1e-5] Steps:  90%|█████████ | 13555/15001 [8:42:41<44:56,  1.86s/it, loss=0.235, lr=1e-5]Steps:  90%|█████████ | 13555/15001 [8:42:41<44:56,  1.86s/it, loss=0.149, lr=1e-5]Steps:  90%|█████████ | 13556/15001 [8:42:43<45:12,  1.88s/it, loss=0.149, lr=1e-5]Steps:  90%|█████████ | 13556/15001 [8:42:43<45:12,  1.88s/it, loss=0.129, lr=1e-5]Steps:  90%|█████████ | 13557/15001 [8:42:45<46:14,  1.92s/it, loss=0.129, lr=1e-5]Steps:  90%|█████████ | 13557/15001 [8:42:45<46:14,  1.92s/it, loss=0.297, lr=1e-5]Steps:  90%|█████████ | 13558/15001 [8:42:47<47:13,  1.96s/it, loss=0.297, lr=1e-5]Steps:  90%|█████████ | 13558/15001 [8:42:47<47:13,  1.96s/it, loss=0.165, lr=1e-5]Steps:  90%|█████████ | 13559/15001 [8:42:49<47:58,  2.00s/it, loss=0.165, lr=1e-5]Steps:  90%|█████████ | 13559/15001 [8:42:49<47:58,  2.00s/it, loss=0.2, lr=1e-5]  Steps:  90%|█████████ | 13560/15001 [8:42:51<47:34,  1.98s/it, loss=0.2, lr=1e-5]Steps:  90%|█████████ | 13560/15001 [8:42:51<47:34,  1.98s/it, loss=0.0617, lr=1e-5]Steps:  90%|█████████ | 13561/15001 [8:42:53<46:40,  1.95s/it, loss=0.0617, lr=1e-5]Steps:  90%|█████████ | 13561/15001 [8:42:53<46:40,  1.95s/it, loss=0.179, lr=1e-5] Steps:  90%|█████████ | 13562/15001 [8:42:55<46:41,  1.95s/it, loss=0.179, lr=1e-5]Steps:  90%|█████████ | 13562/15001 [8:42:55<46:41,  1.95s/it, loss=0.206, lr=1e-5]Steps:  90%|█████████ | 13563/15001 [8:42:56<44:43,  1.87s/it, loss=0.206, lr=1e-5]Steps:  90%|█████████ | 13563/15001 [8:42:57<44:43,  1.87s/it, loss=0.231, lr=1e-5]Steps:  90%|█████████ | 13564/15001 [8:42:58<43:36,  1.82s/it, loss=0.231, lr=1e-5]Steps:  90%|█████████ | 13564/15001 [8:42:58<43:36,  1.82s/it, loss=0.19, lr=1e-5] Steps:  90%|█████████ | 13565/15001 [8:43:00<44:10,  1.85s/it, loss=0.19, lr=1e-5]Steps:  90%|█████████ | 13565/15001 [8:43:00<44:10,  1.85s/it, loss=0.255, lr=1e-5]Steps:  90%|█████████ | 13566/15001 [8:43:02<42:33,  1.78s/it, loss=0.255, lr=1e-5]Steps:  90%|█████████ | 13566/15001 [8:43:02<42:33,  1.78s/it, loss=0.261, lr=1e-5]Steps:  90%|█████████ | 13567/15001 [8:43:04<44:02,  1.84s/it, loss=0.261, lr=1e-5]Steps:  90%|█████████ | 13567/15001 [8:43:04<44:02,  1.84s/it, loss=0.111, lr=1e-5]Steps:  90%|█████████ | 13568/15001 [8:43:06<44:22,  1.86s/it, loss=0.111, lr=1e-5]Steps:  90%|█████████ | 13568/15001 [8:43:06<44:22,  1.86s/it, loss=0.184, lr=1e-5]Steps:  90%|█████████ | 13569/15001 [8:43:07<42:01,  1.76s/it, loss=0.184, lr=1e-5]Steps:  90%|█████████ | 13569/15001 [8:43:08<42:01,  1.76s/it, loss=0.0994, lr=1e-5]Steps:  90%|█████████ | 13570/15001 [8:43:09<44:02,  1.85s/it, loss=0.0994, lr=1e-5]Steps:  90%|█████████ | 13570/15001 [8:43:09<44:02,  1.85s/it, loss=0.122, lr=1e-5] Steps:  90%|█████████ | 13571/15001 [8:43:11<42:49,  1.80s/it, loss=0.122, lr=1e-5]Steps:  90%|█████████ | 13571/15001 [8:43:11<42:49,  1.80s/it, loss=0.182, lr=1e-5]Steps:  90%|█████████ | 13572/15001 [8:43:13<44:06,  1.85s/it, loss=0.182, lr=1e-5]Steps:  90%|█████████ | 13572/15001 [8:43:13<44:06,  1.85s/it, loss=0.316, lr=1e-5]Steps:  90%|█████████ | 13573/15001 [8:43:15<45:26,  1.91s/it, loss=0.316, lr=1e-5]Steps:  90%|█████████ | 13573/15001 [8:43:15<45:26,  1.91s/it, loss=0.369, lr=1e-5]Steps:  90%|█████████ | 13574/15001 [8:43:17<44:30,  1.87s/it, loss=0.369, lr=1e-5]Steps:  90%|█████████ | 13574/15001 [8:43:17<44:30,  1.87s/it, loss=0.0761, lr=1e-5]Steps:  90%|█████████ | 13575/15001 [8:43:18<43:30,  1.83s/it, loss=0.0761, lr=1e-5]Steps:  90%|█████████ | 13575/15001 [8:43:18<43:30,  1.83s/it, loss=0.112, lr=1e-5] Steps:  91%|█████████ | 13576/15001 [8:43:20<41:52,  1.76s/it, loss=0.112, lr=1e-5]Steps:  91%|█████████ | 13576/15001 [8:43:20<41:52,  1.76s/it, loss=0.166, lr=1e-5]Steps:  91%|█████████ | 13577/15001 [8:43:22<44:00,  1.85s/it, loss=0.166, lr=1e-5]Steps:  91%|█████████ | 13577/15001 [8:43:22<44:00,  1.85s/it, loss=0.142, lr=1e-5]Steps:  91%|█████████ | 13578/15001 [8:43:24<42:54,  1.81s/it, loss=0.142, lr=1e-5]Steps:  91%|█████████ | 13578/15001 [8:43:24<42:54,  1.81s/it, loss=0.226, lr=1e-5]Steps:  91%|█████████ | 13579/15001 [8:43:26<44:32,  1.88s/it, loss=0.226, lr=1e-5]Steps:  91%|█████████ | 13579/15001 [8:43:26<44:32,  1.88s/it, loss=0.13, lr=1e-5] Steps:  91%|█████████ | 13580/15001 [8:43:28<47:40,  2.01s/it, loss=0.13, lr=1e-5]Steps:  91%|█████████ | 13580/15001 [8:43:28<47:40,  2.01s/it, loss=0.132, lr=1e-5]Steps:  91%|█████████ | 13581/15001 [8:43:30<47:07,  1.99s/it, loss=0.132, lr=1e-5]Steps:  91%|█████████ | 13581/15001 [8:43:30<47:07,  1.99s/it, loss=0.191, lr=1e-5]Steps:  91%|█████████ | 13582/15001 [8:43:32<46:43,  1.98s/it, loss=0.191, lr=1e-5]Steps:  91%|█████████ | 13582/15001 [8:43:32<46:43,  1.98s/it, loss=0.0953, lr=1e-5]Steps:  91%|█████████ | 13583/15001 [8:43:34<45:40,  1.93s/it, loss=0.0953, lr=1e-5]Steps:  91%|█████████ | 13583/15001 [8:43:34<45:40,  1.93s/it, loss=0.149, lr=1e-5] Steps:  91%|█████████ | 13584/15001 [8:43:36<46:05,  1.95s/it, loss=0.149, lr=1e-5]Steps:  91%|█████████ | 13584/15001 [8:43:36<46:05,  1.95s/it, loss=0.0545, lr=1e-5]Steps:  91%|█████████ | 13585/15001 [8:43:38<44:44,  1.90s/it, loss=0.0545, lr=1e-5]Steps:  91%|█████████ | 13585/15001 [8:43:38<44:44,  1.90s/it, loss=0.0959, lr=1e-5]Steps:  91%|█████████ | 13586/15001 [8:43:39<43:13,  1.83s/it, loss=0.0959, lr=1e-5]Steps:  91%|█████████ | 13586/15001 [8:43:40<43:13,  1.83s/it, loss=0.0664, lr=1e-5]Steps:  91%|█████████ | 13587/15001 [8:43:41<44:57,  1.91s/it, loss=0.0664, lr=1e-5]Steps:  91%|█████████ | 13587/15001 [8:43:41<44:57,  1.91s/it, loss=0.282, lr=1e-5] Steps:  91%|█████████ | 13588/15001 [8:43:43<42:23,  1.80s/it, loss=0.282, lr=1e-5]Steps:  91%|█████████ | 13588/15001 [8:43:43<42:23,  1.80s/it, loss=0.187, lr=1e-5]Steps:  91%|█████████ | 13589/15001 [8:43:45<43:40,  1.86s/it, loss=0.187, lr=1e-5]Steps:  91%|█████████ | 13589/15001 [8:43:45<43:40,  1.86s/it, loss=0.0666, lr=1e-5]Steps:  91%|█████████ | 13590/15001 [8:43:47<44:17,  1.88s/it, loss=0.0666, lr=1e-5]Steps:  91%|█████████ | 13590/15001 [8:43:47<44:17,  1.88s/it, loss=0.066, lr=1e-5] Steps:  91%|█████████ | 13591/15001 [8:43:49<43:18,  1.84s/it, loss=0.066, lr=1e-5]Steps:  91%|█████████ | 13591/15001 [8:43:49<43:18,  1.84s/it, loss=0.179, lr=1e-5]Steps:  91%|█████████ | 13592/15001 [8:43:51<43:58,  1.87s/it, loss=0.179, lr=1e-5]Steps:  91%|█████████ | 13592/15001 [8:43:51<43:58,  1.87s/it, loss=0.0841, lr=1e-5]Steps:  91%|█████████ | 13593/15001 [8:43:52<42:30,  1.81s/it, loss=0.0841, lr=1e-5]Steps:  91%|█████████ | 13593/15001 [8:43:52<42:30,  1.81s/it, loss=0.249, lr=1e-5] Steps:  91%|█████████ | 13594/15001 [8:43:54<42:23,  1.81s/it, loss=0.249, lr=1e-5]Steps:  91%|█████████ | 13594/15001 [8:43:54<42:23,  1.81s/it, loss=0.209, lr=1e-5]Steps:  91%|█████████ | 13595/15001 [8:43:56<41:58,  1.79s/it, loss=0.209, lr=1e-5]Steps:  91%|█████████ | 13595/15001 [8:43:56<41:58,  1.79s/it, loss=0.17, lr=1e-5] Steps:  91%|█████████ | 13596/15001 [8:43:57<41:21,  1.77s/it, loss=0.17, lr=1e-5]Steps:  91%|█████████ | 13596/15001 [8:43:58<41:21,  1.77s/it, loss=0.354, lr=1e-5]Steps:  91%|█████████ | 13597/15001 [8:43:59<41:24,  1.77s/it, loss=0.354, lr=1e-5]Steps:  91%|█████████ | 13597/15001 [8:43:59<41:24,  1.77s/it, loss=0.301, lr=1e-5]Steps:  91%|█████████ | 13598/15001 [8:44:01<40:51,  1.75s/it, loss=0.301, lr=1e-5]Steps:  91%|█████████ | 13598/15001 [8:44:01<40:51,  1.75s/it, loss=0.0999, lr=1e-5]Steps:  91%|█████████ | 13599/15001 [8:44:03<42:08,  1.80s/it, loss=0.0999, lr=1e-5]Steps:  91%|█████████ | 13599/15001 [8:44:03<42:08,  1.80s/it, loss=0.321, lr=1e-5] Steps:  91%|█████████ | 13600/15001 [8:44:05<43:02,  1.84s/it, loss=0.321, lr=1e-5]Steps:  91%|█████████ | 13600/15001 [8:44:05<43:02,  1.84s/it, loss=0.12, lr=1e-5] Steps:  91%|█████████ | 13601/15001 [8:44:07<43:44,  1.87s/it, loss=0.12, lr=1e-5]Steps:  91%|█████████ | 13601/15001 [8:44:07<43:44,  1.87s/it, loss=0.117, lr=1e-5]Steps:  91%|█████████ | 13602/15001 [8:44:09<43:56,  1.88s/it, loss=0.117, lr=1e-5]Steps:  91%|█████████ | 13602/15001 [8:44:09<43:56,  1.88s/it, loss=0.149, lr=1e-5]Steps:  91%|█████████ | 13603/15001 [8:44:11<45:30,  1.95s/it, loss=0.149, lr=1e-5]Steps:  91%|█████████ | 13603/15001 [8:44:11<45:30,  1.95s/it, loss=0.125, lr=1e-5]Steps:  91%|█████████ | 13604/15001 [8:44:13<46:48,  2.01s/it, loss=0.125, lr=1e-5]Steps:  91%|█████████ | 13604/15001 [8:44:13<46:48,  2.01s/it, loss=0.215, lr=1e-5]Steps:  91%|█████████ | 13605/15001 [8:44:15<46:22,  1.99s/it, loss=0.215, lr=1e-5]Steps:  91%|█████████ | 13605/15001 [8:44:15<46:22,  1.99s/it, loss=0.219, lr=1e-5]Steps:  91%|█████████ | 13606/15001 [8:44:17<45:30,  1.96s/it, loss=0.219, lr=1e-5]Steps:  91%|█████████ | 13606/15001 [8:44:17<45:30,  1.96s/it, loss=0.215, lr=1e-5]Steps:  91%|█████████ | 13607/15001 [8:44:19<44:36,  1.92s/it, loss=0.215, lr=1e-5]Steps:  91%|█████████ | 13607/15001 [8:44:19<44:36,  1.92s/it, loss=0.0573, lr=1e-5]Steps:  91%|█████████ | 13608/15001 [8:44:20<42:43,  1.84s/it, loss=0.0573, lr=1e-5]Steps:  91%|█████████ | 13608/15001 [8:44:20<42:43,  1.84s/it, loss=0.195, lr=1e-5] Steps:  91%|█████████ | 13609/15001 [8:44:22<42:49,  1.85s/it, loss=0.195, lr=1e-5]Steps:  91%|█████████ | 13609/15001 [8:44:22<42:49,  1.85s/it, loss=0.0335, lr=1e-5]Steps:  91%|█████████ | 13610/15001 [8:44:24<41:01,  1.77s/it, loss=0.0335, lr=1e-5]Steps:  91%|█████████ | 13610/15001 [8:44:24<41:01,  1.77s/it, loss=0.264, lr=1e-5] Steps:  91%|█████████ | 13611/15001 [8:44:25<40:39,  1.75s/it, loss=0.264, lr=1e-5]Steps:  91%|█████████ | 13611/15001 [8:44:26<40:39,  1.75s/it, loss=0.304, lr=1e-5]Steps:  91%|█████████ | 13612/15001 [8:44:28<44:56,  1.94s/it, loss=0.304, lr=1e-5]Steps:  91%|█████████ | 13612/15001 [8:44:28<44:56,  1.94s/it, loss=0.221, lr=1e-5]Steps:  91%|█████████ | 13613/15001 [8:44:29<42:37,  1.84s/it, loss=0.221, lr=1e-5]Steps:  91%|█████████ | 13613/15001 [8:44:30<42:37,  1.84s/it, loss=0.1, lr=1e-5]  Steps:  91%|█████████ | 13614/15001 [8:44:31<43:48,  1.90s/it, loss=0.1, lr=1e-5]Steps:  91%|█████████ | 13614/15001 [8:44:31<43:48,  1.90s/it, loss=0.384, lr=1e-5]Steps:  91%|█████████ | 13615/15001 [8:44:33<42:11,  1.83s/it, loss=0.384, lr=1e-5]Steps:  91%|█████████ | 13615/15001 [8:44:33<42:11,  1.83s/it, loss=0.249, lr=1e-5]Steps:  91%|█████████ | 13616/15001 [8:44:35<42:04,  1.82s/it, loss=0.249, lr=1e-5]Steps:  91%|█████████ | 13616/15001 [8:44:35<42:04,  1.82s/it, loss=0.199, lr=1e-5]Steps:  91%|█████████ | 13617/15001 [8:44:37<42:19,  1.83s/it, loss=0.199, lr=1e-5]Steps:  91%|█████████ | 13617/15001 [8:44:37<42:19,  1.83s/it, loss=0.294, lr=1e-5]Steps:  91%|█████████ | 13618/15001 [8:44:38<40:28,  1.76s/it, loss=0.294, lr=1e-5]Steps:  91%|█████████ | 13618/15001 [8:44:39<40:28,  1.76s/it, loss=0.202, lr=1e-5]Steps:  91%|█████████ | 13619/15001 [8:44:40<41:28,  1.80s/it, loss=0.202, lr=1e-5]Steps:  91%|█████████ | 13619/15001 [8:44:40<41:28,  1.80s/it, loss=0.201, lr=1e-5]Steps:  91%|█████████ | 13620/15001 [8:44:42<40:32,  1.76s/it, loss=0.201, lr=1e-5]Steps:  91%|█████████ | 13620/15001 [8:44:42<40:32,  1.76s/it, loss=0.0819, lr=1e-5]Steps:  91%|█████████ | 13621/15001 [8:44:44<41:36,  1.81s/it, loss=0.0819, lr=1e-5]Steps:  91%|█████████ | 13621/15001 [8:44:44<41:36,  1.81s/it, loss=0.06, lr=1e-5]  Steps:  91%|█████████ | 13622/15001 [8:44:46<43:05,  1.88s/it, loss=0.06, lr=1e-5]Steps:  91%|█████████ | 13622/15001 [8:44:46<43:05,  1.88s/it, loss=0.224, lr=1e-5]Steps:  91%|█████████ | 13623/15001 [8:44:47<40:59,  1.78s/it, loss=0.224, lr=1e-5]Steps:  91%|█████████ | 13623/15001 [8:44:48<40:59,  1.78s/it, loss=0.0891, lr=1e-5]Steps:  91%|█████████ | 13624/15001 [8:44:49<42:22,  1.85s/it, loss=0.0891, lr=1e-5]Steps:  91%|█████████ | 13624/15001 [8:44:50<42:22,  1.85s/it, loss=0.108, lr=1e-5] Steps:  91%|█████████ | 13625/15001 [8:44:52<45:36,  1.99s/it, loss=0.108, lr=1e-5]Steps:  91%|█████████ | 13625/15001 [8:44:52<45:36,  1.99s/it, loss=0.0535, lr=1e-5]Steps:  91%|█████████ | 13626/15001 [8:44:54<44:03,  1.92s/it, loss=0.0535, lr=1e-5]Steps:  91%|█████████ | 13626/15001 [8:44:54<44:03,  1.92s/it, loss=0.202, lr=1e-5] Steps:  91%|█████████ | 13627/15001 [8:44:56<45:36,  1.99s/it, loss=0.202, lr=1e-5]Steps:  91%|█████████ | 13627/15001 [8:44:56<45:36,  1.99s/it, loss=0.183, lr=1e-5]Steps:  91%|█████████ | 13628/15001 [8:44:58<45:05,  1.97s/it, loss=0.183, lr=1e-5]Steps:  91%|█████████ | 13628/15001 [8:44:58<45:05,  1.97s/it, loss=0.0682, lr=1e-5]Steps:  91%|█████████ | 13629/15001 [8:45:00<46:36,  2.04s/it, loss=0.0682, lr=1e-5]Steps:  91%|█████████ | 13629/15001 [8:45:00<46:36,  2.04s/it, loss=0.227, lr=1e-5] Steps:  91%|█████████ | 13630/15001 [8:45:02<44:23,  1.94s/it, loss=0.227, lr=1e-5]Steps:  91%|█████████ | 13630/15001 [8:45:02<44:23,  1.94s/it, loss=0.0537, lr=1e-5]Steps:  91%|█████████ | 13631/15001 [8:45:03<41:39,  1.82s/it, loss=0.0537, lr=1e-5]Steps:  91%|█████████ | 13631/15001 [8:45:03<41:39,  1.82s/it, loss=0.112, lr=1e-5] Steps:  91%|█████████ | 13632/15001 [8:45:05<42:12,  1.85s/it, loss=0.112, lr=1e-5]Steps:  91%|█████████ | 13632/15001 [8:45:05<42:12,  1.85s/it, loss=0.177, lr=1e-5]Steps:  91%|█████████ | 13633/15001 [8:45:07<40:36,  1.78s/it, loss=0.177, lr=1e-5]Steps:  91%|█████████ | 13633/15001 [8:45:07<40:36,  1.78s/it, loss=0.217, lr=1e-5]Steps:  91%|█████████ | 13634/15001 [8:45:09<42:08,  1.85s/it, loss=0.217, lr=1e-5]Steps:  91%|█████████ | 13634/15001 [8:45:09<42:08,  1.85s/it, loss=0.0643, lr=1e-5]Steps:  91%|█████████ | 13635/15001 [8:45:10<41:17,  1.81s/it, loss=0.0643, lr=1e-5]Steps:  91%|█████████ | 13635/15001 [8:45:11<41:17,  1.81s/it, loss=0.0771, lr=1e-5]Steps:  91%|█████████ | 13636/15001 [8:45:12<43:03,  1.89s/it, loss=0.0771, lr=1e-5]Steps:  91%|█████████ | 13636/15001 [8:45:12<43:03,  1.89s/it, loss=0.069, lr=1e-5] Steps:  91%|█████████ | 13637/15001 [8:45:14<41:55,  1.84s/it, loss=0.069, lr=1e-5]Steps:  91%|█████████ | 13637/15001 [8:45:14<41:55,  1.84s/it, loss=0.263, lr=1e-5]Steps:  91%|█████████ | 13638/15001 [8:45:16<40:54,  1.80s/it, loss=0.263, lr=1e-5]Steps:  91%|█████████ | 13638/15001 [8:45:16<40:54,  1.80s/it, loss=0.044, lr=1e-5]Steps:  91%|█████████ | 13639/15001 [8:45:18<40:45,  1.80s/it, loss=0.044, lr=1e-5]Steps:  91%|█████████ | 13639/15001 [8:45:18<40:45,  1.80s/it, loss=0.259, lr=1e-5]Steps:  91%|█████████ | 13640/15001 [8:45:20<41:16,  1.82s/it, loss=0.259, lr=1e-5]Steps:  91%|█████████ | 13640/15001 [8:45:20<41:16,  1.82s/it, loss=0.245, lr=1e-5]Steps:  91%|█████████ | 13641/15001 [8:45:21<40:48,  1.80s/it, loss=0.245, lr=1e-5]Steps:  91%|█████████ | 13641/15001 [8:45:21<40:48,  1.80s/it, loss=0.222, lr=1e-5]Steps:  91%|█████████ | 13642/15001 [8:45:23<41:37,  1.84s/it, loss=0.222, lr=1e-5]Steps:  91%|█████████ | 13642/15001 [8:45:23<41:37,  1.84s/it, loss=0.0507, lr=1e-5]Steps:  91%|█████████ | 13643/15001 [8:45:25<41:18,  1.82s/it, loss=0.0507, lr=1e-5]Steps:  91%|█████████ | 13643/15001 [8:45:25<41:18,  1.82s/it, loss=0.151, lr=1e-5] Steps:  91%|█████████ | 13644/15001 [8:45:27<41:31,  1.84s/it, loss=0.151, lr=1e-5]Steps:  91%|█████████ | 13644/15001 [8:45:27<41:31,  1.84s/it, loss=0.267, lr=1e-5]Steps:  91%|█████████ | 13645/15001 [8:45:28<39:34,  1.75s/it, loss=0.267, lr=1e-5]Steps:  91%|█████████ | 13645/15001 [8:45:29<39:34,  1.75s/it, loss=0.066, lr=1e-5]Steps:  91%|█████████ | 13646/15001 [8:45:31<41:58,  1.86s/it, loss=0.066, lr=1e-5]Steps:  91%|█████████ | 13646/15001 [8:45:31<41:58,  1.86s/it, loss=0.175, lr=1e-5]Steps:  91%|█████████ | 13647/15001 [8:45:32<41:45,  1.85s/it, loss=0.175, lr=1e-5]Steps:  91%|█████████ | 13647/15001 [8:45:33<41:45,  1.85s/it, loss=0.359, lr=1e-5]Steps:  91%|█████████ | 13648/15001 [8:45:35<44:07,  1.96s/it, loss=0.359, lr=1e-5]Steps:  91%|█████████ | 13648/15001 [8:45:35<44:07,  1.96s/it, loss=0.205, lr=1e-5]Steps:  91%|█████████ | 13649/15001 [8:45:37<44:21,  1.97s/it, loss=0.205, lr=1e-5]Steps:  91%|█████████ | 13649/15001 [8:45:37<44:21,  1.97s/it, loss=0.136, lr=1e-5]Steps:  91%|█████████ | 13650/15001 [8:45:39<45:05,  2.00s/it, loss=0.136, lr=1e-5]Steps:  91%|█████████ | 13650/15001 [8:45:39<45:05,  2.00s/it, loss=0.0708, lr=1e-5]Steps:  91%|█████████ | 13651/15001 [8:45:41<45:15,  2.01s/it, loss=0.0708, lr=1e-5]Steps:  91%|█████████ | 13651/15001 [8:45:41<45:15,  2.01s/it, loss=0.411, lr=1e-5] Steps:  91%|█████████ | 13652/15001 [8:45:42<43:45,  1.95s/it, loss=0.411, lr=1e-5]Steps:  91%|█████████ | 13652/15001 [8:45:43<43:45,  1.95s/it, loss=0.16, lr=1e-5] Steps:  91%|█████████ | 13653/15001 [8:45:44<43:24,  1.93s/it, loss=0.16, lr=1e-5]Steps:  91%|█████████ | 13653/15001 [8:45:45<43:24,  1.93s/it, loss=0.251, lr=1e-5]Steps:  91%|█████████ | 13654/15001 [8:45:46<43:30,  1.94s/it, loss=0.251, lr=1e-5]Steps:  91%|█████████ | 13654/15001 [8:45:46<43:30,  1.94s/it, loss=0.318, lr=1e-5]Steps:  91%|█████████ | 13655/15001 [8:45:48<40:44,  1.82s/it, loss=0.318, lr=1e-5]Steps:  91%|█████████ | 13655/15001 [8:45:48<40:44,  1.82s/it, loss=0.179, lr=1e-5]Steps:  91%|█████████ | 13656/15001 [8:45:50<40:16,  1.80s/it, loss=0.179, lr=1e-5]Steps:  91%|█████████ | 13656/15001 [8:45:50<40:16,  1.80s/it, loss=0.2, lr=1e-5]  Steps:  91%|█████████ | 13657/15001 [8:45:51<40:53,  1.83s/it, loss=0.2, lr=1e-5]Steps:  91%|█████████ | 13657/15001 [8:45:52<40:53,  1.83s/it, loss=0.173, lr=1e-5]Steps:  91%|█████████ | 13658/15001 [8:45:54<42:30,  1.90s/it, loss=0.173, lr=1e-5]Steps:  91%|█████████ | 13658/15001 [8:45:54<42:30,  1.90s/it, loss=0.139, lr=1e-5]Steps:  91%|█████████ | 13659/15001 [8:45:55<41:06,  1.84s/it, loss=0.139, lr=1e-5]Steps:  91%|█████████ | 13659/15001 [8:45:55<41:06,  1.84s/it, loss=0.222, lr=1e-5]Steps:  91%|█████████ | 13660/15001 [8:45:57<40:03,  1.79s/it, loss=0.222, lr=1e-5]Steps:  91%|█████████ | 13660/15001 [8:45:57<40:03,  1.79s/it, loss=0.196, lr=1e-5]Steps:  91%|█████████ | 13661/15001 [8:45:59<42:44,  1.91s/it, loss=0.196, lr=1e-5]Steps:  91%|█████████ | 13661/15001 [8:45:59<42:44,  1.91s/it, loss=0.376, lr=1e-5]Steps:  91%|█████████ | 13662/15001 [8:46:01<41:56,  1.88s/it, loss=0.376, lr=1e-5]Steps:  91%|█████████ | 13662/15001 [8:46:01<41:56,  1.88s/it, loss=0.127, lr=1e-5]Steps:  91%|█████████ | 13663/15001 [8:46:03<41:35,  1.87s/it, loss=0.127, lr=1e-5]Steps:  91%|█████████ | 13663/15001 [8:46:03<41:35,  1.87s/it, loss=0.128, lr=1e-5]Steps:  91%|█████████ | 13664/15001 [8:46:05<41:08,  1.85s/it, loss=0.128, lr=1e-5]Steps:  91%|█████████ | 13664/15001 [8:46:05<41:08,  1.85s/it, loss=0.109, lr=1e-5]Steps:  91%|█████████ | 13665/15001 [8:46:06<40:42,  1.83s/it, loss=0.109, lr=1e-5]Steps:  91%|█████████ | 13665/15001 [8:46:07<40:42,  1.83s/it, loss=0.214, lr=1e-5]Steps:  91%|█████████ | 13666/15001 [8:46:08<40:31,  1.82s/it, loss=0.214, lr=1e-5]Steps:  91%|█████████ | 13666/15001 [8:46:08<40:31,  1.82s/it, loss=0.135, lr=1e-5]Steps:  91%|█████████ | 13667/15001 [8:46:10<41:23,  1.86s/it, loss=0.135, lr=1e-5]Steps:  91%|█████████ | 13667/15001 [8:46:10<41:23,  1.86s/it, loss=0.243, lr=1e-5]Steps:  91%|█████████ | 13668/15001 [8:46:12<40:46,  1.84s/it, loss=0.243, lr=1e-5]Steps:  91%|█████████ | 13668/15001 [8:46:12<40:46,  1.84s/it, loss=0.2, lr=1e-5]  Steps:  91%|█████████ | 13669/15001 [8:46:14<41:18,  1.86s/it, loss=0.2, lr=1e-5]Steps:  91%|█████████ | 13669/15001 [8:46:14<41:18,  1.86s/it, loss=0.195, lr=1e-5]Steps:  91%|█████████ | 13670/15001 [8:46:16<42:26,  1.91s/it, loss=0.195, lr=1e-5]Steps:  91%|█████████ | 13670/15001 [8:46:16<42:26,  1.91s/it, loss=0.147, lr=1e-5]Steps:  91%|█████████ | 13671/15001 [8:46:18<42:57,  1.94s/it, loss=0.147, lr=1e-5]Steps:  91%|█████████ | 13671/15001 [8:46:18<42:57,  1.94s/it, loss=0.177, lr=1e-5]Steps:  91%|█████████ | 13672/15001 [8:46:20<44:05,  1.99s/it, loss=0.177, lr=1e-5]Steps:  91%|█████████ | 13672/15001 [8:46:20<44:05,  1.99s/it, loss=0.0793, lr=1e-5]Steps:  91%|█████████ | 13673/15001 [8:46:22<43:25,  1.96s/it, loss=0.0793, lr=1e-5]Steps:  91%|█████████ | 13673/15001 [8:46:22<43:25,  1.96s/it, loss=0.295, lr=1e-5] Steps:  91%|█████████ | 13674/15001 [8:46:24<43:48,  1.98s/it, loss=0.295, lr=1e-5]Steps:  91%|█████████ | 13674/15001 [8:46:24<43:48,  1.98s/it, loss=0.133, lr=1e-5]Steps:  91%|█████████ | 13675/15001 [8:46:26<43:15,  1.96s/it, loss=0.133, lr=1e-5]Steps:  91%|█████████ | 13675/15001 [8:46:26<43:15,  1.96s/it, loss=0.163, lr=1e-5]Steps:  91%|█████████ | 13676/15001 [8:46:27<41:42,  1.89s/it, loss=0.163, lr=1e-5]Steps:  91%|█████████ | 13676/15001 [8:46:28<41:42,  1.89s/it, loss=0.0997, lr=1e-5]Steps:  91%|█████████ | 13677/15001 [8:46:30<42:39,  1.93s/it, loss=0.0997, lr=1e-5]Steps:  91%|█████████ | 13677/15001 [8:46:30<42:39,  1.93s/it, loss=0.238, lr=1e-5] Steps:  91%|█████████ | 13678/15001 [8:46:31<40:59,  1.86s/it, loss=0.238, lr=1e-5]Steps:  91%|█████████ | 13678/15001 [8:46:31<40:59,  1.86s/it, loss=0.238, lr=1e-5]Steps:  91%|█████████ | 13679/15001 [8:46:33<41:21,  1.88s/it, loss=0.238, lr=1e-5]Steps:  91%|█████████ | 13679/15001 [8:46:33<41:21,  1.88s/it, loss=0.179, lr=1e-5]Steps:  91%|█████████ | 13680/15001 [8:46:35<40:54,  1.86s/it, loss=0.179, lr=1e-5]Steps:  91%|█████████ | 13680/15001 [8:46:35<40:54,  1.86s/it, loss=0.252, lr=1e-5]Steps:  91%|█████████ | 13681/15001 [8:46:37<40:03,  1.82s/it, loss=0.252, lr=1e-5]Steps:  91%|█████████ | 13681/15001 [8:46:37<40:03,  1.82s/it, loss=0.0919, lr=1e-5]Steps:  91%|█████████ | 13682/15001 [8:46:39<40:20,  1.84s/it, loss=0.0919, lr=1e-5]Steps:  91%|█████████ | 13682/15001 [8:46:39<40:20,  1.84s/it, loss=0.0736, lr=1e-5]Steps:  91%|█████████ | 13683/15001 [8:46:40<39:24,  1.79s/it, loss=0.0736, lr=1e-5]Steps:  91%|█████████ | 13683/15001 [8:46:40<39:24,  1.79s/it, loss=0.109, lr=1e-5] Steps:  91%|█████████ | 13684/15001 [8:46:42<39:57,  1.82s/it, loss=0.109, lr=1e-5]Steps:  91%|█████████ | 13684/15001 [8:46:42<39:57,  1.82s/it, loss=0.177, lr=1e-5]Steps:  91%|█████████ | 13685/15001 [8:46:44<38:44,  1.77s/it, loss=0.177, lr=1e-5]Steps:  91%|█████████ | 13685/15001 [8:46:44<38:44,  1.77s/it, loss=0.17, lr=1e-5] Steps:  91%|█████████ | 13686/15001 [8:46:46<38:46,  1.77s/it, loss=0.17, lr=1e-5]Steps:  91%|█████████ | 13686/15001 [8:46:46<38:46,  1.77s/it, loss=0.106, lr=1e-5]Steps:  91%|█████████ | 13687/15001 [8:46:47<38:35,  1.76s/it, loss=0.106, lr=1e-5]Steps:  91%|█████████ | 13687/15001 [8:46:48<38:35,  1.76s/it, loss=0.0589, lr=1e-5]Steps:  91%|██��██████ | 13688/15001 [8:46:49<39:10,  1.79s/it, loss=0.0589, lr=1e-5]Steps:  91%|█████████ | 13688/15001 [8:46:49<39:10,  1.79s/it, loss=0.285, lr=1e-5] Steps:  91%|█████████▏| 13689/15001 [8:46:51<39:52,  1.82s/it, loss=0.285, lr=1e-5]Steps:  91%|█████████▏| 13689/15001 [8:46:51<39:52,  1.82s/it, loss=0.316, lr=1e-5]Steps:  91%|█████████▏| 13690/15001 [8:46:53<39:21,  1.80s/it, loss=0.316, lr=1e-5]Steps:  91%|█████████▏| 13690/15001 [8:46:53<39:21,  1.80s/it, loss=0.0494, lr=1e-5]Steps:  91%|█████████▏| 13691/15001 [8:46:54<38:24,  1.76s/it, loss=0.0494, lr=1e-5]Steps:  91%|█████████▏| 13691/15001 [8:46:55<38:24,  1.76s/it, loss=0.234, lr=1e-5] Steps:  91%|█████████▏| 13692/15001 [8:46:57<40:22,  1.85s/it, loss=0.234, lr=1e-5]Steps:  91%|█████████▏| 13692/15001 [8:46:57<40:22,  1.85s/it, loss=0.156, lr=1e-5]Steps:  91%|█████████▏| 13693/15001 [8:46:58<40:09,  1.84s/it, loss=0.156, lr=1e-5]Steps:  91%|█████████▏| 13693/15001 [8:46:59<40:09,  1.84s/it, loss=0.194, lr=1e-5]Steps:  91%|█████████▏| 13694/15001 [8:47:01<42:09,  1.93s/it, loss=0.194, lr=1e-5]Steps:  91%|█████████▏| 13694/15001 [8:47:01<42:09,  1.93s/it, loss=0.327, lr=1e-5]Steps:  91%|█████████▏| 13695/15001 [8:47:02<41:55,  1.93s/it, loss=0.327, lr=1e-5]Steps:  91%|█████████▏| 13695/15001 [8:47:03<41:55,  1.93s/it, loss=0.141, lr=1e-5]Steps:  91%|█████████▏| 13696/15001 [8:47:05<44:28,  2.04s/it, loss=0.141, lr=1e-5]Steps:  91%|█████████▏| 13696/15001 [8:47:05<44:28,  2.04s/it, loss=0.0479, lr=1e-5]Steps:  91%|█████████▏| 13697/15001 [8:47:07<43:32,  2.00s/it, loss=0.0479, lr=1e-5]Steps:  91%|█████████▏| 13697/15001 [8:47:07<43:32,  2.00s/it, loss=0.193, lr=1e-5] Steps:  91%|█████████▏| 13698/15001 [8:47:09<42:54,  1.98s/it, loss=0.193, lr=1e-5]Steps:  91%|█████████▏| 13698/15001 [8:47:09<42:54,  1.98s/it, loss=0.329, lr=1e-5]Steps:  91%|█████████▏| 13699/15001 [8:47:10<41:50,  1.93s/it, loss=0.329, lr=1e-5]Steps:  91%|█████████▏| 13699/15001 [8:47:10<41:50,  1.93s/it, loss=0.046, lr=1e-5]Steps:  91%|█████████▏| 13700/15001 [8:47:12<41:16,  1.90s/it, loss=0.046, lr=1e-5]Steps:  91%|█████████▏| 13700/15001 [8:47:12<41:16,  1.90s/it, loss=0.0388, lr=1e-5]Steps:  91%|█████████▏| 13701/15001 [8:47:14<41:17,  1.91s/it, loss=0.0388, lr=1e-5]Steps:  91%|█████████▏| 13701/15001 [8:47:14<41:17,  1.91s/it, loss=0.159, lr=1e-5] Steps:  91%|█████████▏| 13702/15001 [8:47:16<39:41,  1.83s/it, loss=0.159, lr=1e-5]Steps:  91%|█████████▏| 13702/15001 [8:47:16<39:41,  1.83s/it, loss=0.181, lr=1e-5]Steps:  91%|█████████▏| 13703/15001 [8:47:18<39:26,  1.82s/it, loss=0.181, lr=1e-5]Steps:  91%|█████████▏| 13703/15001 [8:47:18<39:26,  1.82s/it, loss=0.197, lr=1e-5]Steps:  91%|█████████▏| 13704/15001 [8:47:20<40:26,  1.87s/it, loss=0.197, lr=1e-5]Steps:  91%|█████████▏| 13704/15001 [8:47:20<40:26,  1.87s/it, loss=0.348, lr=1e-5]Steps:  91%|█████████▏| 13705/15001 [8:47:21<40:04,  1.86s/it, loss=0.348, lr=1e-5]Steps:  91%|█████████▏| 13705/15001 [8:47:21<40:04,  1.86s/it, loss=0.215, lr=1e-5]Steps:  91%|█████████▏| 13706/15001 [8:47:23<39:06,  1.81s/it, loss=0.215, lr=1e-5]Steps:  91%|█████████▏| 13706/15001 [8:47:23<39:06,  1.81s/it, loss=0.247, lr=1e-5]Steps:  91%|█████████▏| 13707/15001 [8:47:25<39:16,  1.82s/it, loss=0.247, lr=1e-5]Steps:  91%|█████████▏| 13707/15001 [8:47:25<39:16,  1.82s/it, loss=0.251, lr=1e-5]Steps:  91%|█████████▏| 13708/15001 [8:47:27<38:40,  1.79s/it, loss=0.251, lr=1e-5]Steps:  91%|█████████▏| 13708/15001 [8:47:27<38:40,  1.79s/it, loss=0.207, lr=1e-5]Steps:  91%|█████████▏| 13709/15001 [8:47:28<38:26,  1.79s/it, loss=0.207, lr=1e-5]Steps:  91%|█████████▏| 13709/15001 [8:47:29<38:26,  1.79s/it, loss=0.176, lr=1e-5]Steps:  91%|█████████▏| 13710/15001 [8:47:30<39:30,  1.84s/it, loss=0.176, lr=1e-5]Steps:  91%|█████████▏| 13710/15001 [8:47:30<39:30,  1.84s/it, loss=0.223, lr=1e-5]Steps:  91%|█████████▏| 13711/15001 [8:47:32<37:23,  1.74s/it, loss=0.223, lr=1e-5]Steps:  91%|█████████▏| 13711/15001 [8:47:32<37:23,  1.74s/it, loss=0.072, lr=1e-5]Steps:  91%|█████████▏| 13712/15001 [8:47:34<38:48,  1.81s/it, loss=0.072, lr=1e-5]Steps:  91%|████████���▏| 13712/15001 [8:47:34<38:48,  1.81s/it, loss=0.0715, lr=1e-5]Steps:  91%|█████████▏| 13713/15001 [8:47:36<40:02,  1.87s/it, loss=0.0715, lr=1e-5]Steps:  91%|█████████▏| 13713/15001 [8:47:36<40:02,  1.87s/it, loss=0.141, lr=1e-5] Steps:  91%|█████████▏| 13714/15001 [8:47:38<38:33,  1.80s/it, loss=0.141, lr=1e-5]Steps:  91%|█████████▏| 13714/15001 [8:47:38<38:33,  1.80s/it, loss=0.0466, lr=1e-5]Steps:  91%|█████████▏| 13715/15001 [8:47:39<39:22,  1.84s/it, loss=0.0466, lr=1e-5]Steps:  91%|█████████▏| 13715/15001 [8:47:40<39:22,  1.84s/it, loss=0.189, lr=1e-5] Steps:  91%|█████████▏| 13716/15001 [8:47:41<39:47,  1.86s/it, loss=0.189, lr=1e-5]Steps:  91%|█████████▏| 13716/15001 [8:47:41<39:47,  1.86s/it, loss=0.0693, lr=1e-5]Steps:  91%|█████████▏| 13717/15001 [8:47:43<40:46,  1.91s/it, loss=0.0693, lr=1e-5]Steps:  91%|█████████▏| 13717/15001 [8:47:43<40:46,  1.91s/it, loss=0.156, lr=1e-5] Steps:  91%|█████████▏| 13718/15001 [8:47:45<41:00,  1.92s/it, loss=0.156, lr=1e-5]Steps:  91%|█████████▏| 13718/15001 [8:47:45<41:00,  1.92s/it, loss=0.108, lr=1e-5]Steps:  91%|█████████▏| 13719/15001 [8:47:47<41:06,  1.92s/it, loss=0.108, lr=1e-5]Steps:  91%|█████████▏| 13719/15001 [8:47:47<41:06,  1.92s/it, loss=0.137, lr=1e-5]Steps:  91%|█████████▏| 13720/15001 [8:47:49<41:24,  1.94s/it, loss=0.137, lr=1e-5]Steps:  91%|█████████▏| 13720/15001 [8:47:49<41:24,  1.94s/it, loss=0.224, lr=1e-5]Steps:  91%|█████████▏| 13721/15001 [8:47:51<41:47,  1.96s/it, loss=0.224, lr=1e-5]Steps:  91%|█████████▏| 13721/15001 [8:47:51<41:47,  1.96s/it, loss=0.222, lr=1e-5]Steps:  91%|█████████▏| 13722/15001 [8:47:53<41:30,  1.95s/it, loss=0.222, lr=1e-5]Steps:  91%|█████████▏| 13722/15001 [8:47:53<41:30,  1.95s/it, loss=0.0528, lr=1e-5]Steps:  91%|█████████▏| 13723/15001 [8:47:55<40:21,  1.89s/it, loss=0.0528, lr=1e-5]Steps:  91%|█████████▏| 13723/15001 [8:47:55<40:21,  1.89s/it, loss=0.149, lr=1e-5] Steps:  91%|█████████▏| 13724/15001 [8:47:57<39:25,  1.85s/it, loss=0.149, lr=1e-5]Steps:  91%|█████████▏| 13724/15001 [8:47:57<39:25,  1.85s/it, loss=0.0951, lr=1e-5]Steps:  91%|█████████▏| 13725/15001 [8:47:58<39:03,  1.84s/it, loss=0.0951, lr=1e-5]Steps:  91%|█████████▏| 13725/15001 [8:47:59<39:03,  1.84s/it, loss=0.265, lr=1e-5] Steps:  92%|█████████▏| 13726/15001 [8:48:00<40:07,  1.89s/it, loss=0.265, lr=1e-5]Steps:  92%|█████████▏| 13726/15001 [8:48:01<40:07,  1.89s/it, loss=0.151, lr=1e-5]Steps:  92%|█████████▏| 13727/15001 [8:48:02<39:33,  1.86s/it, loss=0.151, lr=1e-5]Steps:  92%|█████████▏| 13727/15001 [8:48:02<39:33,  1.86s/it, loss=0.323, lr=1e-5]Steps:  92%|█████████▏| 13728/15001 [8:48:04<38:45,  1.83s/it, loss=0.323, lr=1e-5]Steps:  92%|█████████▏| 13728/15001 [8:48:04<38:45,  1.83s/it, loss=0.0419, lr=1e-5]Steps:  92%|█████████▏| 13729/15001 [8:48:06<37:48,  1.78s/it, loss=0.0419, lr=1e-5]Steps:  92%|█████████▏| 13729/15001 [8:48:06<37:48,  1.78s/it, loss=0.132, lr=1e-5] Steps:  92%|█████████▏| 13730/15001 [8:48:07<36:40,  1.73s/it, loss=0.132, lr=1e-5]Steps:  92%|█████████▏| 13730/15001 [8:48:08<36:40,  1.73s/it, loss=0.272, lr=1e-5]Steps:  92%|█████████▏| 13731/15001 [8:48:09<36:53,  1.74s/it, loss=0.272, lr=1e-5]Steps:  92%|█████████▏| 13731/15001 [8:48:10<36:53,  1.74s/it, loss=0.091, lr=1e-5]Steps:  92%|█████████▏| 13732/15001 [8:48:11<38:46,  1.83s/it, loss=0.091, lr=1e-5]Steps:  92%|█████████▏| 13732/15001 [8:48:11<38:46,  1.83s/it, loss=0.122, lr=1e-5]Steps:  92%|█████████▏| 13733/15001 [8:48:13<38:17,  1.81s/it, loss=0.122, lr=1e-5]Steps:  92%|█████████▏| 13733/15001 [8:48:13<38:17,  1.81s/it, loss=0.154, lr=1e-5]Steps:  92%|█████████▏| 13734/15001 [8:48:15<38:09,  1.81s/it, loss=0.154, lr=1e-5]Steps:  92%|█████████▏| 13734/15001 [8:48:15<38:09,  1.81s/it, loss=0.219, lr=1e-5]Steps:  92%|█████████▏| 13735/15001 [8:48:17<39:35,  1.88s/it, loss=0.219, lr=1e-5]Steps:  92%|█████████▏| 13735/15001 [8:48:17<39:35,  1.88s/it, loss=0.191, lr=1e-5]Steps:  92%|█████████▏| 13736/15001 [8:48:18<38:32,  1.83s/it, loss=0.191, lr=1e-5]Steps:  92%|█████████▏| 13736/15001 [8:48:19<38:32,  1.83s/it, loss=0.208, lr=1e-5]Steps:  92%|█████████▏| 13737/15001 [8:48:20<37:06,  1.76s/it, loss=0.208, lr=1e-5]Steps:  92%|█████████▏| 13737/15001 [8:48:20<37:06,  1.76s/it, loss=0.229, lr=1e-5]Steps:  92%|█████████▏| 13738/15001 [8:48:22<38:18,  1.82s/it, loss=0.229, lr=1e-5]Steps:  92%|█████████▏| 13738/15001 [8:48:22<38:18,  1.82s/it, loss=0.0794, lr=1e-5]Steps:  92%|█████████▏| 13739/15001 [8:48:24<38:49,  1.85s/it, loss=0.0794, lr=1e-5]Steps:  92%|█████████▏| 13739/15001 [8:48:24<38:49,  1.85s/it, loss=0.264, lr=1e-5] Steps:  92%|█████████▏| 13740/15001 [8:48:26<39:48,  1.89s/it, loss=0.264, lr=1e-5]Steps:  92%|█████████▏| 13740/15001 [8:48:26<39:48,  1.89s/it, loss=0.146, lr=1e-5]Steps:  92%|█████████▏| 13741/15001 [8:48:28<40:46,  1.94s/it, loss=0.146, lr=1e-5]Steps:  92%|█████████▏| 13741/15001 [8:48:28<40:46,  1.94s/it, loss=0.16, lr=1e-5] Steps:  92%|█████████▏| 13742/15001 [8:48:30<42:19,  2.02s/it, loss=0.16, lr=1e-5]Steps:  92%|█████████▏| 13742/15001 [8:48:30<42:19,  2.02s/it, loss=0.0722, lr=1e-5]Steps:  92%|█████████▏| 13743/15001 [8:48:32<40:56,  1.95s/it, loss=0.0722, lr=1e-5]Steps:  92%|█████████▏| 13743/15001 [8:48:32<40:56,  1.95s/it, loss=0.0728, lr=1e-5]Steps:  92%|█████████▏| 13744/15001 [8:48:34<42:18,  2.02s/it, loss=0.0728, lr=1e-5]Steps:  92%|█████████▏| 13744/15001 [8:48:34<42:18,  2.02s/it, loss=0.354, lr=1e-5] Steps:  92%|█████████▏| 13745/15001 [8:48:36<40:17,  1.92s/it, loss=0.354, lr=1e-5]Steps:  92%|█████████▏| 13745/15001 [8:48:36<40:17,  1.92s/it, loss=0.162, lr=1e-5]Steps:  92%|█████████▏| 13746/15001 [8:48:38<40:47,  1.95s/it, loss=0.162, lr=1e-5]Steps:  92%|█████████▏| 13746/15001 [8:48:38<40:47,  1.95s/it, loss=0.186, lr=1e-5]Steps:  92%|█████████▏| 13747/15001 [8:48:39<38:35,  1.85s/it, loss=0.186, lr=1e-5]Steps:  92%|█████████▏| 13747/15001 [8:48:40<38:35,  1.85s/it, loss=0.103, lr=1e-5]Steps:  92%|█████████▏| 13748/15001 [8:48:41<39:09,  1.88s/it, loss=0.103, lr=1e-5]Steps:  92%|█████████▏| 13748/15001 [8:48:41<39:09,  1.88s/it, loss=0.19, lr=1e-5] Steps:  92%|█████████▏| 13749/15001 [8:48:43<37:01,  1.77s/it, loss=0.19, lr=1e-5]Steps:  92%|█████████▏| 13749/15001 [8:48:43<37:01,  1.77s/it, loss=0.239, lr=1e-5]Steps:  92%|█████████▏| 13750/15001 [8:48:45<38:57,  1.87s/it, loss=0.239, lr=1e-5]Steps:  92%|█████████▏| 13750/15001 [8:48:45<38:57,  1.87s/it, loss=0.189, lr=1e-5]Steps:  92%|█████████▏| 13751/15001 [8:48:47<37:03,  1.78s/it, loss=0.189, lr=1e-5]Steps:  92%|█████████▏| 13751/15001 [8:48:47<37:03,  1.78s/it, loss=0.412, lr=1e-5]Steps:  92%|█████████▏| 13752/15001 [8:48:48<36:14,  1.74s/it, loss=0.412, lr=1e-5]Steps:  92%|█████████▏| 13752/15001 [8:48:49<36:14,  1.74s/it, loss=0.438, lr=1e-5]Steps:  92%|█████████▏| 13753/15001 [8:48:50<39:17,  1.89s/it, loss=0.438, lr=1e-5]Steps:  92%|█████████▏| 13753/15001 [8:48:51<39:17,  1.89s/it, loss=0.311, lr=1e-5]Steps:  92%|█████████▏| 13754/15001 [8:48:52<37:46,  1.82s/it, loss=0.311, lr=1e-5]Steps:  92%|█████████▏| 13754/15001 [8:48:52<37:46,  1.82s/it, loss=0.24, lr=1e-5] Steps:  92%|█████████▏| 13755/15001 [8:48:54<38:50,  1.87s/it, loss=0.24, lr=1e-5]Steps:  92%|█████████▏| 13755/15001 [8:48:54<38:50,  1.87s/it, loss=0.242, lr=1e-5]Steps:  92%|█████████▏| 13756/15001 [8:48:56<38:22,  1.85s/it, loss=0.242, lr=1e-5]Steps:  92%|█████████▏| 13756/15001 [8:48:56<38:22,  1.85s/it, loss=0.147, lr=1e-5]Steps:  92%|█████████▏| 13757/15001 [8:48:58<36:53,  1.78s/it, loss=0.147, lr=1e-5]Steps:  92%|█████████▏| 13757/15001 [8:48:58<36:53,  1.78s/it, loss=0.425, lr=1e-5]Steps:  92%|█████████▏| 13758/15001 [8:49:00<38:51,  1.88s/it, loss=0.425, lr=1e-5]Steps:  92%|█████████▏| 13758/15001 [8:49:00<38:51,  1.88s/it, loss=0.107, lr=1e-5]Steps:  92%|█████████▏| 13759/15001 [8:49:01<38:07,  1.84s/it, loss=0.107, lr=1e-5]Steps:  92%|█████████▏| 13759/15001 [8:49:02<38:07,  1.84s/it, loss=0.0759, lr=1e-5]Steps:  92%|█████████▏| 13760/15001 [8:49:03<37:02,  1.79s/it, loss=0.0759, lr=1e-5]Steps:  92%|█████████▏| 13760/15001 [8:49:03<37:02,  1.79s/it, loss=0.241, lr=1e-5] Steps:  92%|█████████▏| 13761/15001 [8:49:05<37:28,  1.81s/it, loss=0.241, lr=1e-5]Steps:  92%|█████████▏| 13761/15001 [8:49:05<37:28,  1.81s/it, loss=0.39, lr=1e-5] Steps:  92%|█████████▏| 13762/15001 [8:49:07<38:24,  1.86s/it, loss=0.39, lr=1e-5]Steps:  92%|█████████▏| 13762/15001 [8:49:07<38:24,  1.86s/it, loss=0.0527, lr=1e-5]Steps:  92%|█████████▏| 13763/15001 [8:49:09<39:42,  1.92s/it, loss=0.0527, lr=1e-5]Steps:  92%|█████████▏| 13763/15001 [8:49:09<39:42,  1.92s/it, loss=0.234, lr=1e-5] Steps:  92%|█████████▏| 13764/15001 [8:49:11<40:05,  1.94s/it, loss=0.234, lr=1e-5]Steps:  92%|█████████▏| 13764/15001 [8:49:11<40:05,  1.94s/it, loss=0.12, lr=1e-5] Steps:  92%|█████████▏| 13765/15001 [8:49:13<40:32,  1.97s/it, loss=0.12, lr=1e-5]Steps:  92%|█████████▏| 13765/15001 [8:49:13<40:32,  1.97s/it, loss=0.22, lr=1e-5]Steps:  92%|█████████▏| 13766/15001 [8:49:15<39:38,  1.93s/it, loss=0.22, lr=1e-5]Steps:  92%|█████████▏| 13766/15001 [8:49:15<39:38,  1.93s/it, loss=0.222, lr=1e-5]Steps:  92%|█████████▏| 13767/15001 [8:49:17<40:38,  1.98s/it, loss=0.222, lr=1e-5]Steps:  92%|█████████▏| 13767/15001 [8:49:17<40:38,  1.98s/it, loss=0.198, lr=1e-5]Steps:  92%|█████████▏| 13768/15001 [8:49:19<39:32,  1.92s/it, loss=0.198, lr=1e-5]Steps:  92%|█████████▏| 13768/15001 [8:49:19<39:32,  1.92s/it, loss=0.239, lr=1e-5]Steps:  92%|█████████▏| 13769/15001 [8:49:20<38:10,  1.86s/it, loss=0.239, lr=1e-5]Steps:  92%|█████████▏| 13769/15001 [8:49:21<38:10,  1.86s/it, loss=0.0617, lr=1e-5]Steps:  92%|█████████▏| 13770/15001 [8:49:22<39:18,  1.92s/it, loss=0.0617, lr=1e-5]Steps:  92%|█████████▏| 13770/15001 [8:49:23<39:18,  1.92s/it, loss=0.0378, lr=1e-5]Steps:  92%|█████████▏| 13771/15001 [8:49:24<38:09,  1.86s/it, loss=0.0378, lr=1e-5]Steps:  92%|█████████▏| 13771/15001 [8:49:24<38:09,  1.86s/it, loss=0.135, lr=1e-5] Steps:  92%|█████████▏| 13772/15001 [8:49:26<36:30,  1.78s/it, loss=0.135, lr=1e-5]Steps:  92%|█████████▏| 13772/15001 [8:49:26<36:30,  1.78s/it, loss=0.199, lr=1e-5]Steps:  92%|█████████▏| 13773/15001 [8:49:28<37:01,  1.81s/it, loss=0.199, lr=1e-5]Steps:  92%|█████████▏| 13773/15001 [8:49:28<37:01,  1.81s/it, loss=0.102, lr=1e-5]Steps:  92%|█████████▏| 13774/15001 [8:49:30<37:52,  1.85s/it, loss=0.102, lr=1e-5]Steps:  92%|█████████▏| 13774/15001 [8:49:30<37:52,  1.85s/it, loss=0.129, lr=1e-5]Steps:  92%|█████████▏| 13775/15001 [8:49:31<36:30,  1.79s/it, loss=0.129, lr=1e-5]Steps:  92%|█████████▏| 13775/15001 [8:49:32<36:30,  1.79s/it, loss=0.267, lr=1e-5]Steps:  92%|█████████▏| 13776/15001 [8:49:33<37:36,  1.84s/it, loss=0.267, lr=1e-5]Steps:  92%|█████████▏| 13776/15001 [8:49:33<37:36,  1.84s/it, loss=0.138, lr=1e-5]Steps:  92%|█████████▏| 13777/15001 [8:49:35<37:33,  1.84s/it, loss=0.138, lr=1e-5]Steps:  92%|█████████▏| 13777/15001 [8:49:35<37:33,  1.84s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13778/15001 [8:49:37<36:58,  1.81s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13778/15001 [8:49:37<36:58,  1.81s/it, loss=0.0518, lr=1e-5]Steps:  92%|█████████▏| 13779/15001 [8:49:38<35:34,  1.75s/it, loss=0.0518, lr=1e-5]Steps:  92%|█████████▏| 13779/15001 [8:49:39<35:34,  1.75s/it, loss=0.119, lr=1e-5] Steps:  92%|█████████▏| 13780/15001 [8:49:41<37:40,  1.85s/it, loss=0.119, lr=1e-5]Steps:  92%|█████████▏| 13780/15001 [8:49:41<37:40,  1.85s/it, loss=0.161, lr=1e-5]Steps:  92%|█████████▏| 13781/15001 [8:49:42<37:58,  1.87s/it, loss=0.161, lr=1e-5]Steps:  92%|█████████▏| 13781/15001 [8:49:43<37:58,  1.87s/it, loss=0.0952, lr=1e-5]Steps:  92%|█████████▏| 13782/15001 [8:49:44<37:08,  1.83s/it, loss=0.0952, lr=1e-5]Steps:  92%|█████████▏| 13782/15001 [8:49:45<37:08,  1.83s/it, loss=0.0705, lr=1e-5]Steps:  92%|█████████▏| 13783/15001 [8:49:46<39:14,  1.93s/it, loss=0.0705, lr=1e-5]Steps:  92%|█████████▏| 13783/15001 [8:49:46<39:14,  1.93s/it, loss=0.0427, lr=1e-5]Steps:  92%|█████████▏| 13784/15001 [8:49:48<38:49,  1.91s/it, loss=0.0427, lr=1e-5]Steps:  92%|█████████▏| 13784/15001 [8:49:48<38:49,  1.91s/it, loss=0.0259, lr=1e-5]Steps:  92%|█████████▏| 13785/15001 [8:49:51<44:46,  2.21s/it, loss=0.0259, lr=1e-5]Steps:  92%|█████████▏| 13785/15001 [8:49:51<44:46,  2.21s/it, loss=0.201, lr=1e-5] Steps:  92%|█████████▏| 13786/15001 [8:49:53<43:10,  2.13s/it, loss=0.201, lr=1e-5]Steps:  92%|█████████▏| 13786/15001 [8:49:53<43:10,  2.13s/it, loss=0.0658, lr=1e-5]Steps:  92%|█████████▏| 13787/15001 [8:49:55<41:59,  2.07s/it, loss=0.0658, lr=1e-5]Steps:  92%|█████████▏| 13787/15001 [8:49:55<41:59,  2.07s/it, loss=0.25, lr=1e-5]  Steps:  92%|█████████▏| 13788/15001 [8:49:57<40:07,  1.98s/it, loss=0.25, lr=1e-5]Steps:  92%|█████████▏| 13788/15001 [8:49:57<40:07,  1.98s/it, loss=0.22, lr=1e-5]Steps:  92%|█████████▏| 13789/15001 [8:49:59<40:28,  2.00s/it, loss=0.22, lr=1e-5]Steps:  92%|█████████▏| 13789/15001 [8:49:59<40:28,  2.00s/it, loss=0.241, lr=1e-5]Steps:  92%|█████████▏| 13790/15001 [8:50:01<39:49,  1.97s/it, loss=0.241, lr=1e-5]Steps:  92%|█████████▏| 13790/15001 [8:50:01<39:49,  1.97s/it, loss=0.0554, lr=1e-5]Steps:  92%|█████████▏| 13791/15001 [8:50:02<38:02,  1.89s/it, loss=0.0554, lr=1e-5]Steps:  92%|█████████▏| 13791/15001 [8:50:03<38:02,  1.89s/it, loss=0.197, lr=1e-5] Steps:  92%|█████████▏| 13792/15001 [8:50:04<38:16,  1.90s/it, loss=0.197, lr=1e-5]Steps:  92%|█████████▏| 13792/15001 [8:50:05<38:16,  1.90s/it, loss=0.132, lr=1e-5]Steps:  92%|█████████▏| 13793/15001 [8:50:06<38:19,  1.90s/it, loss=0.132, lr=1e-5]Steps:  92%|█████████▏| 13793/15001 [8:50:06<38:19,  1.90s/it, loss=0.02, lr=1e-5] Steps:  92%|█████████▏| 13794/15001 [8:50:08<38:00,  1.89s/it, loss=0.02, lr=1e-5]Steps:  92%|█████████▏| 13794/15001 [8:50:08<38:00,  1.89s/it, loss=0.219, lr=1e-5]Steps:  92%|█████████▏| 13795/15001 [8:50:10<36:40,  1.82s/it, loss=0.219, lr=1e-5]Steps:  92%|█████████▏| 13795/15001 [8:50:10<36:40,  1.82s/it, loss=0.102, lr=1e-5]Steps:  92%|█████████▏| 13796/15001 [8:50:12<38:16,  1.91s/it, loss=0.102, lr=1e-5]Steps:  92%|█████████▏| 13796/15001 [8:50:12<38:16,  1.91s/it, loss=0.0645, lr=1e-5]Steps:  92%|█████████▏| 13797/15001 [8:50:13<36:29,  1.82s/it, loss=0.0645, lr=1e-5]Steps:  92%|█████████▏| 13797/15001 [8:50:14<36:29,  1.82s/it, loss=0.124, lr=1e-5] Steps:  92%|█████████▏| 13798/15001 [8:50:15<37:19,  1.86s/it, loss=0.124, lr=1e-5]Steps:  92%|█████████▏| 13798/15001 [8:50:15<37:19,  1.86s/it, loss=0.0736, lr=1e-5]Steps:  92%|█████████▏| 13799/15001 [8:50:17<36:35,  1.83s/it, loss=0.0736, lr=1e-5]Steps:  92%|█████████▏| 13799/15001 [8:50:17<36:35,  1.83s/it, loss=0.155, lr=1e-5] Steps:  92%|█████████▏| 13800/15001 [8:50:19<35:51,  1.79s/it, loss=0.155, lr=1e-5]Steps:  92%|█████████▏| 13800/15001 [8:50:19<35:51,  1.79s/it, loss=0.28, lr=1e-5] Steps:  92%|█████████▏| 13801/15001 [8:50:21<35:40,  1.78s/it, loss=0.28, lr=1e-5]Steps:  92%|█████████▏| 13801/15001 [8:50:21<35:40,  1.78s/it, loss=0.195, lr=1e-5]Steps:  92%|█████████▏| 13802/15001 [8:50:23<36:32,  1.83s/it, loss=0.195, lr=1e-5]Steps:  92%|█████████▏| 13802/15001 [8:50:23<36:32,  1.83s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13803/15001 [8:50:24<36:45,  1.84s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13803/15001 [8:50:25<36:45,  1.84s/it, loss=0.365, lr=1e-5]Steps:  92%|█████████▏| 13804/15001 [8:50:26<35:40,  1.79s/it, loss=0.365, lr=1e-5]Steps:  92%|█████████▏| 13804/15001 [8:50:26<35:40,  1.79s/it, loss=0.0714, lr=1e-5]Steps:  92%|█████████▏| 13805/15001 [8:50:28<36:17,  1.82s/it, loss=0.0714, lr=1e-5]Steps:  92%|█████████▏| 13805/15001 [8:50:28<36:17,  1.82s/it, loss=0.0179, lr=1e-5]Steps:  92%|█████████▏| 13806/15001 [8:50:30<36:38,  1.84s/it, loss=0.0179, lr=1e-5]Steps:  92%|█████████▏| 13806/15001 [8:50:30<36:38,  1.84s/it, loss=0.16, lr=1e-5]  Steps:  92%|█████████▏| 13807/15001 [8:50:32<37:29,  1.88s/it, loss=0.16, lr=1e-5]Steps:  92%|█████████▏| 13807/15001 [8:50:32<37:29,  1.88s/it, loss=0.178, lr=1e-5]Steps:  92%|█████████▏| 13808/15001 [8:50:34<37:11,  1.87s/it, loss=0.178, lr=1e-5]Steps:  92%|█████████▏| 13808/15001 [8:50:34<37:11,  1.87s/it, loss=0.332, lr=1e-5]Steps:  92%|█████████▏| 13809/15001 [8:50:36<38:48,  1.95s/it, loss=0.332, lr=1e-5]Steps:  92%|█████████▏| 13809/15001 [8:50:36<38:48,  1.95s/it, loss=0.0848, lr=1e-5]Steps:  92%|█████████▏| 13810/15001 [8:50:38<39:08,  1.97s/it, loss=0.0848, lr=1e-5]Steps:  92%|█████████▏| 13810/15001 [8:50:38<39:08,  1.97s/it, loss=0.278, lr=1e-5] Steps:  92%|█████████▏| 13811/15001 [8:50:40<39:10,  1.98s/it, loss=0.278, lr=1e-5]Steps:  92%|█████████▏| 13811/15001 [8:50:40<39:10,  1.98s/it, loss=0.21, lr=1e-5] Steps:  92%|█████████▏| 13812/15001 [8:50:42<38:38,  1.95s/it, loss=0.21, lr=1e-5]Steps:  92%|█████████▏| 13812/15001 [8:50:42<38:38,  1.95s/it, loss=0.0802, lr=1e-5]Steps:  92%|█████████▏| 13813/15001 [8:50:44<37:15,  1.88s/it, loss=0.0802, lr=1e-5]Steps:  92%|█████████▏| 13813/15001 [8:50:44<37:15,  1.88s/it, loss=0.0487, lr=1e-5]Steps:  92%|█████████▏| 13814/15001 [8:50:46<39:31,  2.00s/it, loss=0.0487, lr=1e-5]Steps:  92%|█████████▏| 13814/15001 [8:50:46<39:31,  2.00s/it, loss=0.205, lr=1e-5] Steps:  92%|█████████▏| 13815/15001 [8:50:47<37:10,  1.88s/it, loss=0.205, lr=1e-5]Steps:  92%|█████████▏| 13815/15001 [8:50:48<37:10,  1.88s/it, loss=0.097, lr=1e-5]Steps:  92%|█████████▏| 13816/15001 [8:50:49<37:17,  1.89s/it, loss=0.097, lr=1e-5]Steps:  92%|█████████▏| 13816/15001 [8:50:49<37:17,  1.89s/it, loss=0.247, lr=1e-5]Steps:  92%|█████████▏| 13817/15001 [8:50:51<37:05,  1.88s/it, loss=0.247, lr=1e-5]Steps:  92%|█████████▏| 13817/15001 [8:50:51<37:05,  1.88s/it, loss=0.103, lr=1e-5]Steps:  92%|█████████▏| 13818/15001 [8:50:53<36:52,  1.87s/it, loss=0.103, lr=1e-5]Steps:  92%|█████████▏| 13818/15001 [8:50:53<36:52,  1.87s/it, loss=0.0443, lr=1e-5]Steps:  92%|█████████▏| 13819/15001 [8:50:55<35:59,  1.83s/it, loss=0.0443, lr=1e-5]Steps:  92%|█████████▏| 13819/15001 [8:50:55<35:59,  1.83s/it, loss=0.0621, lr=1e-5]Steps:  92%|█████████▏| 13820/15001 [8:50:57<36:33,  1.86s/it, loss=0.0621, lr=1e-5]Steps:  92%|█████████▏| 13820/15001 [8:50:57<36:33,  1.86s/it, loss=0.428, lr=1e-5] Steps:  92%|█████████▏| 13821/15001 [8:50:58<36:17,  1.85s/it, loss=0.428, lr=1e-5]Steps:  92%|█████████▏| 13821/15001 [8:50:59<36:17,  1.85s/it, loss=0.301, lr=1e-5]Steps:  92%|█████████▏| 13822/15001 [8:51:00<37:05,  1.89s/it, loss=0.301, lr=1e-5]Steps:  92%|█████████▏| 13822/15001 [8:51:01<37:05,  1.89s/it, loss=0.201, lr=1e-5]Steps:  92%|█████████▏| 13823/15001 [8:51:02<36:54,  1.88s/it, loss=0.201, lr=1e-5]Steps:  92%|█████████▏| 13823/15001 [8:51:02<36:54,  1.88s/it, loss=0.178, lr=1e-5]Steps:  92%|█████████▏| 13824/15001 [8:51:04<35:28,  1.81s/it, loss=0.178, lr=1e-5]Steps:  92%|█████████▏| 13824/15001 [8:51:04<35:28,  1.81s/it, loss=0.0271, lr=1e-5]Steps:  92%|█████████▏| 13825/15001 [8:51:06<35:13,  1.80s/it, loss=0.0271, lr=1e-5]Steps:  92%|█████████▏| 13825/15001 [8:51:06<35:13,  1.80s/it, loss=0.131, lr=1e-5] Steps:  92%|█████████▏| 13826/15001 [8:51:08<35:45,  1.83s/it, loss=0.131, lr=1e-5]Steps:  92%|█████████▏| 13826/15001 [8:51:08<35:45,  1.83s/it, loss=0.173, lr=1e-5]Steps:  92%|█████████▏| 13827/15001 [8:51:09<35:20,  1.81s/it, loss=0.173, lr=1e-5]Steps:  92%|█████████▏| 13827/15001 [8:51:10<35:20,  1.81s/it, loss=0.0447, lr=1e-5]Steps:  92%|█████████▏| 13828/15001 [8:51:11<34:13,  1.75s/it, loss=0.0447, lr=1e-5]Steps:  92%|█████████▏| 13828/15001 [8:51:11<34:13,  1.75s/it, loss=0.136, lr=1e-5] Steps:  92%|█████████▏| 13829/15001 [8:51:13<36:04,  1.85s/it, loss=0.136, lr=1e-5]Steps:  92%|█████████▏| 13829/15001 [8:51:13<36:04,  1.85s/it, loss=0.304, lr=1e-5]Steps:  92%|█████████▏| 13830/15001 [8:51:15<35:59,  1.84s/it, loss=0.304, lr=1e-5]Steps:  92%|█████████▏| 13830/15001 [8:51:15<35:59,  1.84s/it, loss=0.108, lr=1e-5]Steps:  92%|█████████▏| 13831/15001 [8:51:17<37:33,  1.93s/it, loss=0.108, lr=1e-5]Steps:  92%|█████████▏| 13831/15001 [8:51:17<37:33,  1.93s/it, loss=0.143, lr=1e-5]Steps:  92%|█████████▏| 13832/15001 [8:51:19<38:11,  1.96s/it, loss=0.143, lr=1e-5]Steps:  92%|█████████▏| 13832/15001 [8:51:19<38:11,  1.96s/it, loss=0.127, lr=1e-5]Steps:  92%|█████████▏| 13833/15001 [8:51:21<36:37,  1.88s/it, loss=0.127, lr=1e-5]Steps:  92%|█████████▏| 13833/15001 [8:51:21<36:37,  1.88s/it, loss=0.0238, lr=1e-5]Steps:  92%|█████████▏| 13834/15001 [8:51:23<37:59,  1.95s/it, loss=0.0238, lr=1e-5]Steps:  92%|█████████▏| 13834/15001 [8:51:23<37:59,  1.95s/it, loss=0.0912, lr=1e-5]Steps:  92%|█████████▏| 13835/15001 [8:51:25<39:46,  2.05s/it, loss=0.0912, lr=1e-5]Steps:  92%|█████████▏| 13835/15001 [8:51:25<39:46,  2.05s/it, loss=0.0754, lr=1e-5]Steps:  92%|█████████▏| 13836/15001 [8:51:27<37:59,  1.96s/it, loss=0.0754, lr=1e-5]Steps:  92%|█████████▏| 13836/15001 [8:51:27<37:59,  1.96s/it, loss=0.169, lr=1e-5] Steps:  92%|█████████▏| 13837/15001 [8:51:29<36:43,  1.89s/it, loss=0.169, lr=1e-5]Steps:  92%|█████████▏| 13837/15001 [8:51:29<36:43,  1.89s/it, loss=0.343, lr=1e-5]Steps:  92%|█████████▏| 13838/15001 [8:51:30<35:43,  1.84s/it, loss=0.343, lr=1e-5]Steps:  92%|█████████▏| 13838/15001 [8:51:30<35:43,  1.84s/it, loss=0.117, lr=1e-5]Steps:  92%|█████████▏| 13839/15001 [8:51:32<35:21,  1.83s/it, loss=0.117, lr=1e-5]Steps:  92%|█████████▏| 13839/15001 [8:51:32<35:21,  1.83s/it, loss=0.306, lr=1e-5]Steps:  92%|█████████▏| 13840/15001 [8:51:34<34:05,  1.76s/it, loss=0.306, lr=1e-5]Steps:  92%|█████████▏| 13840/15001 [8:51:34<34:05,  1.76s/it, loss=0.284, lr=1e-5]Steps:  92%|█████████▏| 13841/15001 [8:51:36<34:14,  1.77s/it, loss=0.284, lr=1e-5]Steps:  92%|█████████▏| 13841/15001 [8:51:36<34:14,  1.77s/it, loss=0.148, lr=1e-5]Steps:  92%|█████████▏| 13842/15001 [8:51:38<35:16,  1.83s/it, loss=0.148, lr=1e-5]Steps:  92%|█████████▏| 13842/15001 [8:51:38<35:16,  1.83s/it, loss=0.127, lr=1e-5]Steps:  92%|█████████▏| 13843/15001 [8:51:39<35:49,  1.86s/it, loss=0.127, lr=1e-5]Steps:  92%|█████████▏| 13843/15001 [8:51:40<35:49,  1.86s/it, loss=0.283, lr=1e-5]Steps:  92%|█████████▏| 13844/15001 [8:51:41<35:56,  1.86s/it, loss=0.283, lr=1e-5]Steps:  92%|█████████▏| 13844/15001 [8:51:41<35:56,  1.86s/it, loss=0.111, lr=1e-5]Steps:  92%|█████████▏| 13845/15001 [8:51:43<35:05,  1.82s/it, loss=0.111, lr=1e-5]Steps:  92%|█████████▏| 13845/15001 [8:51:43<35:05,  1.82s/it, loss=0.228, lr=1e-5]Steps:  92%|█████████▏| 13846/15001 [8:51:45<34:51,  1.81s/it, loss=0.228, lr=1e-5]Steps:  92%|█████████▏| 13846/15001 [8:51:45<34:51,  1.81s/it, loss=0.181, lr=1e-5]Steps:  92%|█████████▏| 13847/15001 [8:51:47<35:10,  1.83s/it, loss=0.181, lr=1e-5]Steps:  92%|█████████▏| 13847/15001 [8:51:47<35:10,  1.83s/it, loss=0.0144, lr=1e-5]Steps:  92%|█████████▏| 13848/15001 [8:51:48<34:54,  1.82s/it, loss=0.0144, lr=1e-5]Steps:  92%|█████████▏| 13848/15001 [8:51:49<34:54,  1.82s/it, loss=0.238, lr=1e-5] Steps:  92%|█████████▏| 13849/15001 [8:51:51<36:08,  1.88s/it, loss=0.238, lr=1e-5]Steps:  92%|█████████▏| 13849/15001 [8:51:51<36:08,  1.88s/it, loss=0.316, lr=1e-5]Steps:  92%|█████████▏| 13850/15001 [8:51:52<34:49,  1.82s/it, loss=0.316, lr=1e-5]Steps:  92%|█████████▏| 13850/15001 [8:51:52<34:49,  1.82s/it, loss=0.117, lr=1e-5]Steps:  92%|█████████▏| 13851/15001 [8:51:54<34:26,  1.80s/it, loss=0.117, lr=1e-5]Steps:  92%|█████████▏| 13851/15001 [8:51:54<34:26,  1.80s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13852/15001 [8:51:56<36:00,  1.88s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13852/15001 [8:51:56<36:00,  1.88s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13853/15001 [8:51:58<35:57,  1.88s/it, loss=0.179, lr=1e-5]Steps:  92%|█████████▏| 13853/15001 [8:51:58<35:57,  1.88s/it, loss=0.199, lr=1e-5]Steps:  92%|█████████▏| 13854/15001 [8:52:00<35:12,  1.84s/it, loss=0.199, lr=1e-5]Steps:  92%|█████████▏| 13854/15001 [8:52:00<35:12,  1.84s/it, loss=0.108, lr=1e-5]Steps:  92%|█████████▏| 13855/15001 [8:52:02<38:02,  1.99s/it, loss=0.108, lr=1e-5]Steps:  92%|█████████▏| 13855/15001 [8:52:02<38:02,  1.99s/it, loss=0.244, lr=1e-5]Steps:  92%|█████████▏| 13856/15001 [8:52:04<37:10,  1.95s/it, loss=0.244, lr=1e-5]Steps:  92%|█████████▏| 13856/15001 [8:52:04<37:10,  1.95s/it, loss=0.0991, lr=1e-5]Steps:  92%|█████████▏| 13857/15001 [8:52:06<38:03,  2.00s/it, loss=0.0991, lr=1e-5]Steps:  92%|█████████▏| 13857/15001 [8:52:06<38:03,  2.00s/it, loss=0.102, lr=1e-5] Steps:  92%|█████████▏| 13858/15001 [8:52:08<36:47,  1.93s/it, loss=0.102, lr=1e-5]Steps:  92%|█████████▏| 13858/15001 [8:52:08<36:47,  1.93s/it, loss=0.398, lr=1e-5]Steps:  92%|█████████▏| 13859/15001 [8:52:09<35:31,  1.87s/it, loss=0.398, lr=1e-5]Steps:  92%|█████████▏| 13859/15001 [8:52:10<35:31,  1.87s/it, loss=0.339, lr=1e-5]Steps:  92%|█████████▏| 13860/15001 [8:52:11<34:34,  1.82s/it, loss=0.339, lr=1e-5]Steps:  92%|█████████▏| 13860/15001 [8:52:11<34:34,  1.82s/it, loss=0.159, lr=1e-5]Steps:  92%|█████████▏| 13861/15001 [8:52:13<34:37,  1.82s/it, loss=0.159, lr=1e-5]Steps:  92%|█████████▏| 13861/15001 [8:52:13<34:37,  1.82s/it, loss=0.199, lr=1e-5]Steps:  92%|█████████▏| 13862/15001 [8:52:15<33:39,  1.77s/it, loss=0.199, lr=1e-5]Steps:  92%|█████████▏| 13862/15001 [8:52:15<33:39,  1.77s/it, loss=0.051, lr=1e-5]Steps:  92%|█████████▏| 13863/15001 [8:52:17<34:23,  1.81s/it, loss=0.051, lr=1e-5]Steps:  92%|█████████▏| 13863/15001 [8:52:17<34:23,  1.81s/it, loss=0.275, lr=1e-5]Steps:  92%|█████████▏| 13864/15001 [8:52:18<34:04,  1.80s/it, loss=0.275, lr=1e-5]Steps:  92%|█████████▏| 13864/15001 [8:52:19<34:04,  1.80s/it, loss=0.231, lr=1e-5]Steps:  92%|█████████▏| 13865/15001 [8:52:20<35:09,  1.86s/it, loss=0.231, lr=1e-5]Steps:  92%|█████████▏| 13865/15001 [8:52:20<35:09,  1.86s/it, loss=0.266, lr=1e-5]Steps:  92%|█████████▏| 13866/15001 [8:52:22<35:18,  1.87s/it, loss=0.266, lr=1e-5]Steps:  92%|█████████▏| 13866/15001 [8:52:22<35:18,  1.87s/it, loss=0.13, lr=1e-5] Steps:  92%|█████████▏| 13867/15001 [8:52:24<34:37,  1.83s/it, loss=0.13, lr=1e-5]Steps:  92%|█████████▏| 13867/15001 [8:52:24<34:37,  1.83s/it, loss=0.135, lr=1e-5]Steps:  92%|█████████▏| 13868/15001 [8:52:26<34:56,  1.85s/it, loss=0.135, lr=1e-5]Steps:  92%|█████████▏| 13868/15001 [8:52:26<34:56,  1.85s/it, loss=0.159, lr=1e-5]Steps:  92%|█████████▏| 13869/15001 [8:52:28<33:52,  1.80s/it, loss=0.159, lr=1e-5]Steps:  92%|█████████▏| 13869/15001 [8:52:28<33:52,  1.80s/it, loss=0.117, lr=1e-5]Steps:  92%|█████████▏| 13870/15001 [8:52:29<34:15,  1.82s/it, loss=0.117, lr=1e-5]Steps:  92%|█████████▏| 13870/15001 [8:52:29<34:15,  1.82s/it, loss=0.228, lr=1e-5]Steps:  92%|█████████▏| 13871/15001 [8:52:31<34:20,  1.82s/it, loss=0.228, lr=1e-5]Steps:  92%|█████████▏| 13871/15001 [8:52:31<34:20,  1.82s/it, loss=0.139, lr=1e-5]Steps:  92%|█████████▏| 13872/15001 [8:52:33<33:25,  1.78s/it, loss=0.139, lr=1e-5]Steps:  92%|█████████▏| 13872/15001 [8:52:33<33:25,  1.78s/it, loss=0.239, lr=1e-5]Steps:  92%|█████████▏| 13873/15001 [8:52:35<33:32,  1.78s/it, loss=0.239, lr=1e-5]Steps:  92%|█████████▏| 13873/15001 [8:52:35<33:32,  1.78s/it, loss=0.0988, lr=1e-5]Steps:  92%|█████████▏| 13874/15001 [8:52:37<35:11,  1.87s/it, loss=0.0988, lr=1e-5]Steps:  92%|█████████▏| 13874/15001 [8:52:37<35:11,  1.87s/it, loss=0.154, lr=1e-5] Steps:  92%|█████████▏| 13875/15001 [8:52:39<34:34,  1.84s/it, loss=0.154, lr=1e-5]Steps:  92%|█████████▏| 13875/15001 [8:52:39<34:34,  1.84s/it, loss=0.0558, lr=1e-5]Steps:  93%|█████████▎| 13876/15001 [8:52:41<35:42,  1.90s/it, loss=0.0558, lr=1e-5]Steps:  93%|█████████▎| 13876/15001 [8:52:41<35:42,  1.90s/it, loss=0.12, lr=1e-5]  Steps:  93%|█████████▎| 13877/15001 [8:52:43<35:52,  1.92s/it, loss=0.12, lr=1e-5]Steps:  93%|█████████▎| 13877/15001 [8:52:43<35:52,  1.92s/it, loss=0.168, lr=1e-5]Steps:  93%|█████████▎| 13878/15001 [8:52:45<37:10,  1.99s/it, loss=0.168, lr=1e-5]Steps:  93%|█████████▎| 13878/15001 [8:52:45<37:10,  1.99s/it, loss=0.169, lr=1e-5]Steps:  93%|█████████▎| 13879/15001 [8:52:47<37:14,  1.99s/it, loss=0.169, lr=1e-5]Steps:  93%|█████████▎| 13879/15001 [8:52:47<37:14,  1.99s/it, loss=0.0784, lr=1e-5]Steps:  93%|█████████▎| 13880/15001 [8:52:49<37:32,  2.01s/it, loss=0.0784, lr=1e-5]Steps:  93%|█████████▎| 13880/15001 [8:52:49<37:32,  2.01s/it, loss=0.0934, lr=1e-5]Steps:  93%|█████████▎| 13881/15001 [8:52:50<35:33,  1.90s/it, loss=0.0934, lr=1e-5]Steps:  93%|█████████▎| 13881/15001 [8:52:51<35:33,  1.90s/it, loss=0.124, lr=1e-5] Steps:  93%|█████████▎| 13882/15001 [8:52:53<37:13,  2.00s/it, loss=0.124, lr=1e-5]Steps:  93%|█████████▎| 13882/15001 [8:52:53<37:13,  2.00s/it, loss=0.157, lr=1e-5]Steps:  93%|█████████▎| 13883/15001 [8:52:54<35:37,  1.91s/it, loss=0.157, lr=1e-5]Steps:  93%|█████████▎| 13883/15001 [8:52:54<35:37,  1.91s/it, loss=0.121, lr=1e-5]Steps:  93%|█████████▎| 13884/15001 [8:52:56<33:49,  1.82s/it, loss=0.121, lr=1e-5]Steps:  93%|█████████▎| 13884/15001 [8:52:56<33:49,  1.82s/it, loss=0.25, lr=1e-5] Steps:  93%|█████████▎| 13885/15001 [8:52:58<35:04,  1.89s/it, loss=0.25, lr=1e-5]Steps:  93%|█████████▎| 13885/15001 [8:52:58<35:04,  1.89s/it, loss=0.164, lr=1e-5]Steps:  93%|█████████▎| 13886/15001 [8:53:00<35:25,  1.91s/it, loss=0.164, lr=1e-5]Steps:  93%|█████████▎| 13886/15001 [8:53:00<35:25,  1.91s/it, loss=0.064, lr=1e-5]Steps:  93%|█████████▎| 13887/15001 [8:53:02<34:15,  1.84s/it, loss=0.064, lr=1e-5]Steps:  93%|█████████▎| 13887/15001 [8:53:02<34:15,  1.84s/it, loss=0.324, lr=1e-5]Steps:  93%|█████████▎| 13888/15001 [8:53:04<34:44,  1.87s/it, loss=0.324, lr=1e-5]Steps:  93%|█████████▎| 13888/15001 [8:53:04<34:44,  1.87s/it, loss=0.17, lr=1e-5] Steps:  93%|█████████▎| 13889/15001 [8:53:05<33:24,  1.80s/it, loss=0.17, lr=1e-5]Steps:  93%|█████████▎| 13889/15001 [8:53:06<33:24,  1.80s/it, loss=0.281, lr=1e-5]Steps:  93%|█████████▎| 13890/15001 [8:53:07<34:18,  1.85s/it, loss=0.281, lr=1e-5]Steps:  93%|█████████▎| 13890/15001 [8:53:07<34:18,  1.85s/it, loss=0.135, lr=1e-5]Steps:  93%|█████████▎| 13891/15001 [8:53:09<33:35,  1.82s/it, loss=0.135, lr=1e-5]Steps:  93%|█████████▎| 13891/15001 [8:53:09<33:35,  1.82s/it, loss=0.215, lr=1e-5]Steps:  93%|█████████▎| 13892/15001 [8:53:11<33:33,  1.82s/it, loss=0.215, lr=1e-5]Steps:  93%|█████████▎| 13892/15001 [8:53:11<33:33,  1.82s/it, loss=0.26, lr=1e-5] Steps:  93%|█████████▎| 13893/15001 [8:53:13<33:37,  1.82s/it, loss=0.26, lr=1e-5]Steps:  93%|█████████▎| 13893/15001 [8:53:13<33:37,  1.82s/it, loss=0.241, lr=1e-5]Steps:  93%|█████████▎| 13894/15001 [8:53:14<33:58,  1.84s/it, loss=0.241, lr=1e-5]Steps:  93%|█████████▎| 13894/15001 [8:53:15<33:58,  1.84s/it, loss=0.103, lr=1e-5]Steps:  93%|█████████▎| 13895/15001 [8:53:16<34:52,  1.89s/it, loss=0.103, lr=1e-5]Steps:  93%|█████████▎| 13895/15001 [8:53:17<34:52,  1.89s/it, loss=0.315, lr=1e-5]Steps:  93%|█████████▎| 13896/15001 [8:53:18<33:59,  1.85s/it, loss=0.315, lr=1e-5]Steps:  93%|█████████▎| 13896/15001 [8:53:18<33:59,  1.85s/it, loss=0.146, lr=1e-5]Steps:  93%|█████████▎| 13897/15001 [8:53:20<34:18,  1.86s/it, loss=0.146, lr=1e-5]Steps:  93%|█████████▎| 13897/15001 [8:53:20<34:18,  1.86s/it, loss=0.313, lr=1e-5]Steps:  93%|█████████▎| 13898/15001 [8:53:22<32:36,  1.77s/it, loss=0.313, lr=1e-5]Steps:  93%|█████████▎| 13898/15001 [8:53:22<32:36,  1.77s/it, loss=0.094, lr=1e-5]Steps:  93%|█████████▎| 13899/15001 [8:53:24<35:17,  1.92s/it, loss=0.094, lr=1e-5]Steps:  93%|█████████▎| 13899/15001 [8:53:24<35:17,  1.92s/it, loss=0.0856, lr=1e-5]Steps:  93%|█████████▎| 13900/15001 [8:53:26<35:31,  1.94s/it, loss=0.0856, lr=1e-5]Steps:  93%|█████████▎| 13900/15001 [8:53:26<35:31,  1.94s/it, loss=0.0591, lr=1e-5]Steps:  93%|█████████▎| 13901/15001 [8:53:28<35:50,  1.96s/it, loss=0.0591, lr=1e-5]Steps:  93%|█████████▎| 13901/15001 [8:53:28<35:50,  1.96s/it, loss=0.113, lr=1e-5] Steps:  93%|█████████▎| 13902/15001 [8:53:30<35:14,  1.92s/it, loss=0.113, lr=1e-5]Steps:  93%|█████████▎| 13902/15001 [8:53:30<35:14,  1.92s/it, loss=0.158, lr=1e-5]Steps:  93%|█████████▎| 13903/15001 [8:53:32<34:38,  1.89s/it, loss=0.158, lr=1e-5]Steps:  93%|█████████▎| 13903/15001 [8:53:32<34:38,  1.89s/it, loss=0.172, lr=1e-5]Steps:  93%|█████████▎| 13904/15001 [8:53:34<36:34,  2.00s/it, loss=0.172, lr=1e-5]Steps:  93%|█████████▎| 13904/15001 [8:53:34<36:34,  2.00s/it, loss=0.145, lr=1e-5]Steps:  93%|█████████▎| 13905/15001 [8:53:35<34:17,  1.88s/it, loss=0.145, lr=1e-5]Steps:  93%|█████████▎| 13905/15001 [8:53:36<34:17,  1.88s/it, loss=0.31, lr=1e-5] Steps:  93%|█████████▎| 13906/15001 [8:53:37<34:51,  1.91s/it, loss=0.31, lr=1e-5]Steps:  93%|█████████▎| 13906/15001 [8:53:38<34:51,  1.91s/it, loss=0.0134, lr=1e-5]Steps:  93%|█████████▎| 13907/15001 [8:53:39<33:01,  1.81s/it, loss=0.0134, lr=1e-5]Steps:  93%|█████████▎| 13907/15001 [8:53:39<33:01,  1.81s/it, loss=0.172, lr=1e-5] Steps:  93%|█████████▎| 13908/15001 [8:53:41<33:59,  1.87s/it, loss=0.172, lr=1e-5]Steps:  93%|█████████▎| 13908/15001 [8:53:41<33:59,  1.87s/it, loss=0.341, lr=1e-5]Steps:  93%|█████���███▎| 13909/15001 [8:53:43<33:49,  1.86s/it, loss=0.341, lr=1e-5]Steps:  93%|█████████▎| 13909/15001 [8:53:43<33:49,  1.86s/it, loss=0.144, lr=1e-5]Steps:  93%|█████████▎| 13910/15001 [8:53:45<34:04,  1.87s/it, loss=0.144, lr=1e-5]Steps:  93%|█████████▎| 13910/15001 [8:53:45<34:04,  1.87s/it, loss=0.059, lr=1e-5]Steps:  93%|█████████▎| 13911/15001 [8:53:47<35:23,  1.95s/it, loss=0.059, lr=1e-5]Steps:  93%|█████████▎| 13911/15001 [8:53:47<35:23,  1.95s/it, loss=0.143, lr=1e-5]Steps:  93%|█████████▎| 13912/15001 [8:53:49<34:22,  1.89s/it, loss=0.143, lr=1e-5]Steps:  93%|█████████▎| 13912/15001 [8:53:49<34:22,  1.89s/it, loss=0.116, lr=1e-5]Steps:  93%|█████████▎| 13913/15001 [8:53:50<33:52,  1.87s/it, loss=0.116, lr=1e-5]Steps:  93%|█████████▎| 13913/15001 [8:53:50<33:52,  1.87s/it, loss=0.121, lr=1e-5]Steps:  93%|█████████▎| 13914/15001 [8:53:52<33:16,  1.84s/it, loss=0.121, lr=1e-5]Steps:  93%|█████████▎| 13914/15001 [8:53:52<33:16,  1.84s/it, loss=0.0133, lr=1e-5]Steps:  93%|█████████▎| 13915/15001 [8:53:54<33:15,  1.84s/it, loss=0.0133, lr=1e-5]Steps:  93%|█████████▎| 13915/15001 [8:53:54<33:15,  1.84s/it, loss=0.285, lr=1e-5] Steps:  93%|█████████▎| 13916/15001 [8:53:56<33:45,  1.87s/it, loss=0.285, lr=1e-5]Steps:  93%|█████████▎| 13916/15001 [8:53:56<33:45,  1.87s/it, loss=0.212, lr=1e-5]Steps:  93%|█████████▎| 13917/15001 [8:53:58<33:55,  1.88s/it, loss=0.212, lr=1e-5]Steps:  93%|█████████▎| 13917/15001 [8:53:58<33:55,  1.88s/it, loss=0.0505, lr=1e-5]Steps:  93%|█████████▎| 13918/15001 [8:53:59<32:22,  1.79s/it, loss=0.0505, lr=1e-5]Steps:  93%|█████████▎| 13918/15001 [8:54:00<32:22,  1.79s/it, loss=0.266, lr=1e-5] Steps:  93%|█████████▎| 13919/15001 [8:54:01<33:05,  1.84s/it, loss=0.266, lr=1e-5]Steps:  93%|█████████▎| 13919/15001 [8:54:02<33:05,  1.84s/it, loss=0.346, lr=1e-5]Steps:  93%|█████████▎| 13920/15001 [8:54:03<31:57,  1.77s/it, loss=0.346, lr=1e-5]Steps:  93%|█████████▎| 13920/15001 [8:54:03<31:57,  1.77s/it, loss=0.155, lr=1e-5]Steps:  93%|█████████▎| 13921/15001 [8:54:05<33:42,  1.87s/it, loss=0.155, lr=1e-5]Steps:  93%|█████████▎| 13921/15001 [8:54:05<33:42,  1.87s/it, loss=0.153, lr=1e-5]Steps:  93%|█████████▎| 13922/15001 [8:54:07<34:32,  1.92s/it, loss=0.153, lr=1e-5]Steps:  93%|█████████▎| 13922/15001 [8:54:07<34:32,  1.92s/it, loss=0.184, lr=1e-5]Steps:  93%|█████████▎| 13923/15001 [8:54:09<34:26,  1.92s/it, loss=0.184, lr=1e-5]Steps:  93%|█████████▎| 13923/15001 [8:54:09<34:26,  1.92s/it, loss=0.249, lr=1e-5]Steps:  93%|█████████▎| 13924/15001 [8:54:11<35:20,  1.97s/it, loss=0.249, lr=1e-5]Steps:  93%|█████████▎| 13924/15001 [8:54:11<35:20,  1.97s/it, loss=0.149, lr=1e-5]Steps:  93%|█████████▎| 13925/15001 [8:54:13<35:04,  1.96s/it, loss=0.149, lr=1e-5]Steps:  93%|█████████▎| 13925/15001 [8:54:13<35:04,  1.96s/it, loss=0.232, lr=1e-5]Steps:  93%|█████████▎| 13926/15001 [8:54:15<34:46,  1.94s/it, loss=0.232, lr=1e-5]Steps:  93%|█████████▎| 13926/15001 [8:54:15<34:46,  1.94s/it, loss=0.16, lr=1e-5] Steps:  93%|█████████▎| 13927/15001 [8:54:17<34:00,  1.90s/it, loss=0.16, lr=1e-5]Steps:  93%|█████████▎| 13927/15001 [8:54:17<34:00,  1.90s/it, loss=0.0734, lr=1e-5]Steps:  93%|█████████▎| 13928/15001 [8:54:19<33:29,  1.87s/it, loss=0.0734, lr=1e-5]Steps:  93%|█████████▎| 13928/15001 [8:54:19<33:29,  1.87s/it, loss=0.159, lr=1e-5] Steps:  93%|█████████▎| 13929/15001 [8:54:20<32:59,  1.85s/it, loss=0.159, lr=1e-5]Steps:  93%|█████████▎| 13929/15001 [8:54:21<32:59,  1.85s/it, loss=0.25, lr=1e-5] Steps:  93%|█████████▎| 13930/15001 [8:54:22<33:49,  1.89s/it, loss=0.25, lr=1e-5]Steps:  93%|█████████▎| 13930/15001 [8:54:23<33:49,  1.89s/it, loss=0.296, lr=1e-5]Steps:  93%|█████████▎| 13931/15001 [8:54:24<33:58,  1.91s/it, loss=0.296, lr=1e-5]Steps:  93%|█████████▎| 13931/15001 [8:54:24<33:58,  1.91s/it, loss=0.288, lr=1e-5]Steps:  93%|█████████▎| 13932/15001 [8:54:26<33:39,  1.89s/it, loss=0.288, lr=1e-5]Steps:  93%|█████████▎| 13932/15001 [8:54:26<33:39,  1.89s/it, loss=0.149, lr=1e-5]Steps:  93%|█████████▎| 13933/15001 [8:54:28<32:21,  1.82s/it, loss=0.149, lr=1e-5]Steps:  93%|█████████▎| 13933/15001 [8:54:28<32:21,  1.82s/it, loss=0.178, lr=1e-5]Steps:  93%|█████████▎| 13934/15001 [8:54:29<31:36,  1.78s/it, loss=0.178, lr=1e-5]Steps:  93%|█████████▎| 13934/15001 [8:54:30<31:36,  1.78s/it, loss=0.163, lr=1e-5]Steps:  93%|█████████▎| 13935/15001 [8:54:31<32:33,  1.83s/it, loss=0.163, lr=1e-5]Steps:  93%|█████████▎| 13935/15001 [8:54:32<32:33,  1.83s/it, loss=0.191, lr=1e-5]Steps:  93%|█████████▎| 13936/15001 [8:54:33<31:40,  1.78s/it, loss=0.191, lr=1e-5]Steps:  93%|█████████▎| 13936/15001 [8:54:33<31:40,  1.78s/it, loss=0.3, lr=1e-5]  Steps:  93%|█████████▎| 13937/15001 [8:54:35<31:45,  1.79s/it, loss=0.3, lr=1e-5]Steps:  93%|█████████▎| 13937/15001 [8:54:35<31:45,  1.79s/it, loss=0.343, lr=1e-5]Steps:  93%|█████████▎| 13938/15001 [8:54:37<31:53,  1.80s/it, loss=0.343, lr=1e-5]Steps:  93%|█████████▎| 13938/15001 [8:54:37<31:53,  1.80s/it, loss=0.136, lr=1e-5]Steps:  93%|█████████▎| 13939/15001 [8:54:39<34:00,  1.92s/it, loss=0.136, lr=1e-5]Steps:  93%|█████████▎| 13939/15001 [8:54:39<34:00,  1.92s/it, loss=0.189, lr=1e-5]Steps:  93%|█████████▎| 13940/15001 [8:54:41<32:08,  1.82s/it, loss=0.189, lr=1e-5]Steps:  93%|█████████▎| 13940/15001 [8:54:41<32:08,  1.82s/it, loss=0.0573, lr=1e-5]Steps:  93%|█████████▎| 13941/15001 [8:54:43<33:36,  1.90s/it, loss=0.0573, lr=1e-5]Steps:  93%|█████████▎| 13941/15001 [8:54:43<33:36,  1.90s/it, loss=0.0505, lr=1e-5]Steps:  93%|█████████▎| 13942/15001 [8:54:44<33:19,  1.89s/it, loss=0.0505, lr=1e-5]Steps:  93%|█████████▎| 13942/15001 [8:54:45<33:19,  1.89s/it, loss=0.179, lr=1e-5] Steps:  93%|█████████▎| 13943/15001 [8:54:46<32:49,  1.86s/it, loss=0.179, lr=1e-5]Steps:  93%|█████████▎| 13943/15001 [8:54:46<32:49,  1.86s/it, loss=0.431, lr=1e-5]Steps:  93%|█████████▎| 13944/15001 [8:54:48<33:45,  1.92s/it, loss=0.431, lr=1e-5]Steps:  93%|█████████▎| 13944/15001 [8:54:48<33:45,  1.92s/it, loss=0.237, lr=1e-5]Steps:  93%|█████████▎| 13945/15001 [8:54:51<35:06,  1.99s/it, loss=0.237, lr=1e-5]Steps:  93%|█████████▎| 13945/15001 [8:54:51<35:06,  1.99s/it, loss=0.311, lr=1e-5]Steps:  93%|█████████▎| 13946/15001 [8:54:53<35:22,  2.01s/it, loss=0.311, lr=1e-5]Steps:  93%|█████████▎| 13946/15001 [8:54:53<35:22,  2.01s/it, loss=0.132, lr=1e-5]Steps:  93%|█████████▎| 13947/15001 [8:54:55<35:51,  2.04s/it, loss=0.132, lr=1e-5]Steps:  93%|█████████▎| 13947/15001 [8:54:55<35:51,  2.04s/it, loss=0.172, lr=1e-5]Steps:  93%|█████████▎| 13948/15001 [8:54:56<33:15,  1.90s/it, loss=0.172, lr=1e-5]Steps:  93%|█████████▎| 13948/15001 [8:54:57<33:15,  1.90s/it, loss=0.0859, lr=1e-5]Steps:  93%|█████████▎| 13949/15001 [8:54:59<36:37,  2.09s/it, loss=0.0859, lr=1e-5]Steps:  93%|█████████▎| 13949/15001 [8:54:59<36:37,  2.09s/it, loss=0.3, lr=1e-5]   Steps:  93%|█████████▎| 13950/15001 [8:55:01<34:44,  1.98s/it, loss=0.3, lr=1e-5]Steps:  93%|█████████▎| 13950/15001 [8:55:01<34:44,  1.98s/it, loss=0.174, lr=1e-5]Steps:  93%|█████████▎| 13951/15001 [8:55:02<33:06,  1.89s/it, loss=0.174, lr=1e-5]Steps:  93%|█████████▎| 13951/15001 [8:55:02<33:06,  1.89s/it, loss=0.0655, lr=1e-5]Steps:  93%|█████████▎| 13952/15001 [8:55:04<32:23,  1.85s/it, loss=0.0655, lr=1e-5]Steps:  93%|█████████▎| 13952/15001 [8:55:04<32:23,  1.85s/it, loss=0.301, lr=1e-5] Steps:  93%|█████████▎| 13953/15001 [8:55:06<33:16,  1.91s/it, loss=0.301, lr=1e-5]Steps:  93%|█████████▎| 13953/15001 [8:55:06<33:16,  1.91s/it, loss=0.185, lr=1e-5]Steps:  93%|█████████▎| 13954/15001 [8:55:08<33:03,  1.89s/it, loss=0.185, lr=1e-5]Steps:  93%|█████████▎| 13954/15001 [8:55:08<33:03,  1.89s/it, loss=0.301, lr=1e-5]Steps:  93%|█████████▎| 13955/15001 [8:55:09<31:27,  1.80s/it, loss=0.301, lr=1e-5]Steps:  93%|█████████▎| 13955/15001 [8:55:10<31:27,  1.80s/it, loss=0.0389, lr=1e-5]Steps:  93%|█████████▎| 13956/15001 [8:55:11<31:54,  1.83s/it, loss=0.0389, lr=1e-5]Steps:  93%|█████████▎| 13956/15001 [8:55:12<31:54,  1.83s/it, loss=0.185, lr=1e-5] Steps:  93%|█████████▎| 13957/15001 [8:55:13<32:11,  1.85s/it, loss=0.185, lr=1e-5]Steps:  93%|█████████▎| 13957/15001 [8:55:13<32:11,  1.85s/it, loss=0.281, lr=1e-5]Steps:  93%|█████████▎| 13958/15001 [8:55:15<31:42,  1.82s/it, loss=0.281, lr=1e-5]Steps:  93%|█████████▎| 13958/15001 [8:55:15<31:42,  1.82s/it, loss=0.0689, lr=1e-5]Steps:  93%|█████████▎| 13959/15001 [8:55:17<32:45,  1.89s/it, loss=0.0689, lr=1e-5]Steps:  93%|█████████▎| 13959/15001 [8:55:17<32:45,  1.89s/it, loss=0.118, lr=1e-5] Steps:  93%|█████████▎| 13960/15001 [8:55:19<32:02,  1.85s/it, loss=0.118, lr=1e-5]Steps:  93%|█████████▎| 13960/15001 [8:55:19<32:02,  1.85s/it, loss=0.0904, lr=1e-5]Steps:  93%|█████████▎| 13961/15001 [8:55:21<31:47,  1.83s/it, loss=0.0904, lr=1e-5]Steps:  93%|█████████▎| 13961/15001 [8:55:21<31:47,  1.83s/it, loss=0.23, lr=1e-5]  Steps:  93%|█████████▎| 13962/15001 [8:55:22<31:56,  1.84s/it, loss=0.23, lr=1e-5]Steps:  93%|█████████▎| 13962/15001 [8:55:23<31:56,  1.84s/it, loss=0.212, lr=1e-5]Steps:  93%|█████████▎| 13963/15001 [8:55:24<31:05,  1.80s/it, loss=0.212, lr=1e-5]Steps:  93%|█████████▎| 13963/15001 [8:55:24<31:05,  1.80s/it, loss=0.174, lr=1e-5]Steps:  93%|█████████▎| 13964/15001 [8:55:26<30:54,  1.79s/it, loss=0.174, lr=1e-5]Steps:  93%|█████████▎| 13964/15001 [8:55:26<30:54,  1.79s/it, loss=0.193, lr=1e-5]Steps:  93%|█████████▎| 13965/15001 [8:55:28<30:12,  1.75s/it, loss=0.193, lr=1e-5]Steps:  93%|█████████▎| 13965/15001 [8:55:28<30:12,  1.75s/it, loss=0.158, lr=1e-5]Steps:  93%|█████████▎| 13966/15001 [8:55:30<31:30,  1.83s/it, loss=0.158, lr=1e-5]Steps:  93%|█████████▎| 13966/15001 [8:55:30<31:30,  1.83s/it, loss=0.176, lr=1e-5]Steps:  93%|█████████▎| 13967/15001 [8:55:31<31:08,  1.81s/it, loss=0.176, lr=1e-5]Steps:  93%|█████████▎| 13967/15001 [8:55:32<31:08,  1.81s/it, loss=0.114, lr=1e-5]Steps:  93%|█████████▎| 13968/15001 [8:55:34<33:52,  1.97s/it, loss=0.114, lr=1e-5]Steps:  93%|█████████▎| 13968/15001 [8:55:34<33:52,  1.97s/it, loss=0.0327, lr=1e-5]Steps:  93%|█████████▎| 13969/15001 [8:55:36<34:20,  2.00s/it, loss=0.0327, lr=1e-5]Steps:  93%|█████████▎| 13969/15001 [8:55:36<34:20,  2.00s/it, loss=0.253, lr=1e-5] Steps:  93%|█████████▎| 13970/15001 [8:55:38<33:59,  1.98s/it, loss=0.253, lr=1e-5]Steps:  93%|█████████▎| 13970/15001 [8:55:38<33:59,  1.98s/it, loss=0.136, lr=1e-5]Steps:  93%|█████████▎| 13971/15001 [8:55:40<33:52,  1.97s/it, loss=0.136, lr=1e-5]Steps:  93%|█████████▎| 13971/15001 [8:55:40<33:52,  1.97s/it, loss=0.28, lr=1e-5] Steps:  93%|█████████▎| 13972/15001 [8:55:42<33:41,  1.96s/it, loss=0.28, lr=1e-5]Steps:  93%|█████████▎| 13972/15001 [8:55:42<33:41,  1.96s/it, loss=0.132, lr=1e-5]Steps:  93%|█████████▎| 13973/15001 [8:55:43<33:08,  1.93s/it, loss=0.132, lr=1e-5]Steps:  93%|█████████▎| 13973/15001 [8:55:44<33:08,  1.93s/it, loss=0.248, lr=1e-5]Steps:  93%|█████████▎| 13974/15001 [8:55:45<32:59,  1.93s/it, loss=0.248, lr=1e-5]Steps:  93%|█████████▎| 13974/15001 [8:55:46<32:59,  1.93s/it, loss=0.116, lr=1e-5]Steps:  93%|█████████▎| 13975/15001 [8:55:47<31:41,  1.85s/it, loss=0.116, lr=1e-5]Steps:  93%|█████████▎| 13975/15001 [8:55:47<31:41,  1.85s/it, loss=0.0693, lr=1e-5]Steps:  93%|█████████▎| 13976/15001 [8:55:49<30:42,  1.80s/it, loss=0.0693, lr=1e-5]Steps:  93%|█████████▎| 13976/15001 [8:55:49<30:42,  1.80s/it, loss=0.085, lr=1e-5] Steps:  93%|█████████▎| 13977/15001 [8:55:51<31:59,  1.87s/it, loss=0.085, lr=1e-5]Steps:  93%|█████████▎| 13977/15001 [8:55:51<31:59,  1.87s/it, loss=0.509, lr=1e-5]Steps:  93%|█████████▎| 13978/15001 [8:55:52<29:58,  1.76s/it, loss=0.509, lr=1e-5]Steps:  93%|█████████▎| 13978/15001 [8:55:53<29:58,  1.76s/it, loss=0.0452, lr=1e-5]Steps:  93%|█████████▎| 13979/15001 [8:55:54<32:22,  1.90s/it, loss=0.0452, lr=1e-5]Steps:  93%|█████████▎| 13979/15001 [8:55:55<32:22,  1.90s/it, loss=0.339, lr=1e-5] Steps:  93%|█████████▎| 13980/15001 [8:55:56<30:53,  1.82s/it, loss=0.339, lr=1e-5]Steps:  93%|█████████▎| 13980/15001 [8:55:56<30:53,  1.82s/it, loss=0.173, lr=1e-5]Steps:  93%|█████████▎| 13981/15001 [8:55:58<30:17,  1.78s/it, loss=0.173, lr=1e-5]Steps:  93%|█████████▎| 13981/15001 [8:55:58<30:17,  1.78s/it, loss=0.157, lr=1e-5]Steps:  93%|█████████▎| 13982/15001 [8:56:00<30:46,  1.81s/it, loss=0.157, lr=1e-5]Steps:  93%|█████████▎| 13982/15001 [8:56:00<30:46,  1.81s/it, loss=0.0659, lr=1e-5]Steps:  93%|█████████▎| 13983/15001 [8:56:01<30:27,  1.80s/it, loss=0.0659, lr=1e-5]Steps:  93%|█████████▎| 13983/15001 [8:56:02<30:27,  1.80s/it, loss=0.135, lr=1e-5] Steps:  93%|█████████▎| 13984/15001 [8:56:03<30:32,  1.80s/it, loss=0.135, lr=1e-5]Steps:  93%|█████████▎| 13984/15001 [8:56:03<30:32,  1.80s/it, loss=0.117, lr=1e-5]Steps:  93%|█████████▎| 13985/15001 [8:56:05<29:40,  1.75s/it, loss=0.117, lr=1e-5]Steps:  93%|█████████▎| 13985/15001 [8:56:05<29:40,  1.75s/it, loss=0.109, lr=1e-5]Steps:  93%|█████████▎| 13986/15001 [8:56:07<30:22,  1.80s/it, loss=0.109, lr=1e-5]Steps:  93%|█████████▎| 13986/15001 [8:56:07<30:22,  1.80s/it, loss=0.218, lr=1e-5]Steps:  93%|█████████▎| 13987/15001 [8:56:08<29:29,  1.75s/it, loss=0.218, lr=1e-5]Steps:  93%|█████████▎| 13987/15001 [8:56:09<29:29,  1.75s/it, loss=0.262, lr=1e-5]Steps:  93%|█████████▎| 13988/15001 [8:56:10<29:18,  1.74s/it, loss=0.262, lr=1e-5]Steps:  93%|█████████▎| 13988/15001 [8:56:10<29:18,  1.74s/it, loss=0.113, lr=1e-5]Steps:  93%|█████████▎| 13989/15001 [8:56:12<30:13,  1.79s/it, loss=0.113, lr=1e-5]Steps:  93%|█████████▎| 13989/15001 [8:56:12<30:13,  1.79s/it, loss=0.234, lr=1e-5]Steps:  93%|█████████▎| 13990/15001 [8:56:14<32:25,  1.92s/it, loss=0.234, lr=1e-5]Steps:  93%|█████████▎| 13990/15001 [8:56:14<32:25,  1.92s/it, loss=0.0461, lr=1e-5]Steps:  93%|█████████▎| 13991/15001 [8:56:16<32:59,  1.96s/it, loss=0.0461, lr=1e-5]Steps:  93%|█████████▎| 13991/15001 [8:56:16<32:59,  1.96s/it, loss=0.0436, lr=1e-5]Steps:  93%|█████████▎| 13992/15001 [8:56:18<33:17,  1.98s/it, loss=0.0436, lr=1e-5]Steps:  93%|█████████▎| 13992/15001 [8:56:18<33:17,  1.98s/it, loss=0.0742, lr=1e-5]Steps:  93%|█████████▎| 13993/15001 [8:56:20<32:43,  1.95s/it, loss=0.0742, lr=1e-5]Steps:  93%|█████████▎| 13993/15001 [8:56:20<32:43,  1.95s/it, loss=0.113, lr=1e-5] Steps:  93%|█████████▎| 13994/15001 [8:56:22<32:33,  1.94s/it, loss=0.113, lr=1e-5]Steps:  93%|█████████▎| 13994/15001 [8:56:23<32:33,  1.94s/it, loss=0.0305, lr=1e-5]Steps:  93%|█████████▎| 13995/15001 [8:56:24<34:05,  2.03s/it, loss=0.0305, lr=1e-5]Steps:  93%|█████████▎| 13995/15001 [8:56:24<34:05,  2.03s/it, loss=0.212, lr=1e-5] Steps:  93%|█████████▎| 13996/15001 [8:56:26<32:05,  1.92s/it, loss=0.212, lr=1e-5]Steps:  93%|█████████▎| 13996/15001 [8:56:26<32:05,  1.92s/it, loss=0.146, lr=1e-5]Steps:  93%|█████████▎| 13997/15001 [8:56:28<31:48,  1.90s/it, loss=0.146, lr=1e-5]Steps:  93%|█████████▎| 13997/15001 [8:56:28<31:48,  1.90s/it, loss=0.393, lr=1e-5]Steps:  93%|█████████▎| 13998/15001 [8:56:30<30:36,  1.83s/it, loss=0.393, lr=1e-5]Steps:  93%|█████████▎| 13998/15001 [8:56:30<30:36,  1.83s/it, loss=0.213, lr=1e-5]Steps:  93%|█████████▎| 13999/15001 [8:56:32<31:17,  1.87s/it, loss=0.213, lr=1e-5]Steps:  93%|█████████▎| 13999/15001 [8:56:32<31:17,  1.87s/it, loss=0.222, lr=1e-5]Steps:  93%|█████████▎| 14000/15001 [8:56:33<29:39,  1.78s/it, loss=0.222, lr=1e-5]02/04/2024 21:58:52 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 947.29it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  93%|█████████▎| 14000/15001 [9:00:12<29:39,  1.78s/it, loss=0.344, lr=1e-5]Steps:  93%|█████████▎| 14001/15001 [9:00:14<18:44:35, 67.48s/it, loss=0.344, lr=1e-5]Steps:  93%|█████████▎| 14001/15001 [9:00:14<18:44:35, 67.48s/it, loss=0.1, lr=1e-5]  Steps:  93%|█████████▎| 14002/15001 [9:00:16<13:15:53, 47.80s/it, loss=0.1, lr=1e-5]Steps:  93%|█████████▎| 14002/15001 [9:00:16<13:15:53, 47.80s/it, loss=0.23, lr=1e-5]Steps:  93%|█████████▎| 14003/15001 [9:00:18<9:25:44, 34.01s/it, loss=0.23, lr=1e-5] Steps:  93%|█████████▎| 14003/15001 [9:00:18<9:25:44, 34.01s/it, loss=0.282, lr=1e-5]Steps:  93%|█████████▎| 14004/15001 [9:00:20<6:45:27, 24.40s/it, loss=0.282, lr=1e-5]wandb: Network error (TransientError), entering retry loop.
+Steps:  93%|█████████▎| 14004/15001 [9:00:20<6:45:27, 24.40s/it, loss=0.4, lr=1e-5]  Steps:  93%|█████████▎| 14005/15001 [9:00:21<4:53:04, 17.66s/it, loss=0.4, lr=1e-5]Steps:  93%|█████████▎| 14005/15001 [9:00:22<4:53:04, 17.66s/it, loss=0.218, lr=1e-5]Steps:  93%|█████████▎| 14006/15001 [9:00:23<3:33:20, 12.86s/it, loss=0.218, lr=1e-5]Steps:  93%|█████████▎| 14006/15001 [9:00:23<3:33:20, 12.86s/it, loss=0.143, lr=1e-5]Steps:  93%|█████████▎| 14007/15001 [9:00:25<2:38:56,  9.59s/it, loss=0.143, lr=1e-5]Steps:  93%|█████████▎| 14007/15001 [9:00:25<2:38:56,  9.59s/it, loss=0.0541, lr=1e-5]Steps:  93%|█████████▎| 14008/15001 [9:00:27<1:59:17,  7.21s/it, loss=0.0541, lr=1e-5]Steps:  93%|█████████▎| 14008/15001 [9:00:27<1:59:17,  7.21s/it, loss=0.269, lr=1e-5] Steps:  93%|█████████▎| 14009/15001 [9:00:29<1:32:48,  5.61s/it, loss=0.269, lr=1e-5]Steps:  93%|█████████▎| 14009/15001 [9:00:29<1:32:48,  5.61s/it, loss=0.24, lr=1e-5] Steps:  93%|█████████▎| 14010/15001 [9:00:30<1:13:08,  4.43s/it, loss=0.24, lr=1e-5]Steps:  93%|█████████▎| 14010/15001 [9:00:31<1:13:08,  4.43s/it, loss=0.17, lr=1e-5]Steps:  93%|█████████▎| 14011/15001 [9:00:32<1:01:50,  3.75s/it, loss=0.17, lr=1e-5]Steps:  93%|█████████▎| 14011/15001 [9:00:33<1:01:50,  3.75s/it, loss=0.131, lr=1e-5]Steps:  93%|█████████▎| 14012/15001 [9:00:34<51:43,  3.14s/it, loss=0.131, lr=1e-5]  Steps:  93%|█████████▎| 14012/15001 [9:00:34<51:43,  3.14s/it, loss=0.0444, lr=1e-5]Steps:  93%|█████████▎| 14013/15001 [9:00:36<43:43,  2.66s/it, loss=0.0444, lr=1e-5]Steps:  93%|█████████▎| 14013/15001 [9:00:36<43:43,  2.66s/it, loss=0.233, lr=1e-5] Steps:  93%|█████████▎| 14014/15001 [9:00:38<41:00,  2.49s/it, loss=0.233, lr=1e-5]Steps:  93%|█████████▎| 14014/15001 [9:00:38<41:00,  2.49s/it, loss=0.0319, lr=1e-5]Steps:  93%|█████████▎| 14015/15001 [9:00:39<36:29,  2.22s/it, loss=0.0319, lr=1e-5]Steps:  93%|█████████▎| 14015/15001 [9:00:40<36:29,  2.22s/it, loss=0.422, lr=1e-5] Steps:  93%|█████████▎| 14016/15001 [9:00:41<34:44,  2.12s/it, loss=0.422, lr=1e-5]Steps:  93%|█████████▎| 14016/15001 [9:00:42<34:44,  2.12s/it, loss=0.114, lr=1e-5]Steps:  93%|█████████▎| 14017/15001 [9:00:43<33:36,  2.05s/it, loss=0.114, lr=1e-5]Steps:  93%|█████████▎| 14017/15001 [9:00:43<33:36,  2.05s/it, loss=0.281, lr=1e-5]Steps:  93%|█████████▎| 14018/15001 [9:00:45<32:06,  1.96s/it, loss=0.281, lr=1e-5]Steps:  93%|█████████▎| 14018/15001 [9:00:45<32:06,  1.96s/it, loss=0.0681, lr=1e-5]Steps:  93%|█████████▎| 14019/15001 [9:00:47<30:54,  1.89s/it, loss=0.0681, lr=1e-5]Steps:  93%|█████████▎| 14019/15001 [9:00:47<30:54,  1.89s/it, loss=0.24, lr=1e-5]  Steps:  93%|█████████▎| 14020/15001 [9:00:49<30:38,  1.87s/it, loss=0.24, lr=1e-5]Steps:  93%|█████████▎| 14020/15001 [9:00:49<30:38,  1.87s/it, loss=0.0771, lr=1e-5]Steps:  93%|█████████▎| 14021/15001 [9:00:51<32:00,  1.96s/it, loss=0.0771, lr=1e-5]Steps:  93%|█████████▎| 14021/15001 [9:00:51<32:00,  1.96s/it, loss=0.315, lr=1e-5] Steps:  93%|█████████▎| 14022/15001 [9:00:53<32:02,  1.96s/it, loss=0.315, lr=1e-5]Steps:  93%|█████████▎| 14022/15001 [9:00:53<32:02,  1.96s/it, loss=0.256, lr=1e-5]Steps:  93%|█████████▎| 14023/15001 [9:00:55<32:42,  2.01s/it, loss=0.256, lr=1e-5]Steps:  93%|█████████▎| 14023/15001 [9:00:55<32:42,  2.01s/it, loss=0.23, lr=1e-5] Steps:  93%|█████████▎| 14024/15001 [9:00:57<32:17,  1.98s/it, loss=0.23, lr=1e-5]Steps:  93%|█████████▎| 14024/15001 [9:00:57<32:17,  1.98s/it, loss=0.151, lr=1e-5]Steps:  93%|█████████▎| 14025/15001 [9:00:59<32:52,  2.02s/it, loss=0.151, lr=1e-5]Steps:  93%|█████████▎| 14025/15001 [9:00:59<32:52,  2.02s/it, loss=0.0552, lr=1e-5]Steps:  94%|█████████▎| 14026/15001 [9:01:01<32:25,  2.00s/it, loss=0.0552, lr=1e-5]Steps:  94%|█████████▎| 14026/15001 [9:01:01<32:25,  2.00s/it, loss=0.126, lr=1e-5] Steps:  94%|█████████▎| 14027/15001 [9:01:02<31:15,  1.93s/it, loss=0.126, lr=1e-5]Steps:  94%|█████████▎| 14027/15001 [9:01:03<31:15,  1.93s/it, loss=0.397, lr=1e-5]Steps:  94%|█████████▎| 14028/15001 [9:01:04<30:19,  1.87s/it, loss=0.397, lr=1e-5]Steps:  94%|█████████▎| 14028/15001 [9:01:05<30:19,  1.87s/it, loss=0.109, lr=1e-5]Steps:  94%|█████████▎| 14029/15001 [9:01:06<30:58,  1.91s/it, loss=0.109, lr=1e-5]Steps:  94%|█████████▎| 14029/15001 [9:01:06<30:58,  1.91s/it, loss=0.215, lr=1e-5]Steps:  94%|█████████▎| 14030/15001 [9:01:08<29:47,  1.84s/it, loss=0.215, lr=1e-5]Steps:  94%|█████████▎| 14030/15001 [9:01:08<29:47,  1.84s/it, loss=0.235, lr=1e-5]Steps:  94%|█████████▎| 14031/15001 [9:01:10<28:55,  1.79s/it, loss=0.235, lr=1e-5]Steps:  94%|█████████▎| 14031/15001 [9:01:10<28:55,  1.79s/it, loss=0.151, lr=1e-5]Steps:  94%|█████████▎| 14032/15001 [9:01:12<30:46,  1.91s/it, loss=0.151, lr=1e-5]Steps:  94%|█████████▎| 14032/15001 [9:01:12<30:46,  1.91s/it, loss=0.115, lr=1e-5]Steps:  94%|█████████▎| 14033/15001 [9:01:13<29:31,  1.83s/it, loss=0.115, lr=1e-5]Steps:  94%|█████████▎| 14033/15001 [9:01:14<29:31,  1.83s/it, loss=0.199, lr=1e-5]Steps:  94%|█████████▎| 14034/15001 [9:01:15<28:56,  1.80s/it, loss=0.199, lr=1e-5]Steps:  94%|█████████▎| 14034/15001 [9:01:15<28:56,  1.80s/it, loss=0.156, lr=1e-5]Steps:  94%|█████████▎| 14035/15001 [9:01:17<29:20,  1.82s/it, loss=0.156, lr=1e-5]Steps:  94%|█████████▎| 14035/15001 [9:01:17<29:20,  1.82s/it, loss=0.24, lr=1e-5] Steps:  94%|█████████▎| 14036/15001 [9:01:19<28:14,  1.76s/it, loss=0.24, lr=1e-5]Steps:  94%|█████████▎| 14036/15001 [9:01:19<28:14,  1.76s/it, loss=0.18, lr=1e-5]Steps:  94%|█████████▎| 14037/15001 [9:01:21<30:20,  1.89s/it, loss=0.18, lr=1e-5]Steps:  94%|█████████▎| 14037/15001 [9:01:21<30:20,  1.89s/it, loss=0.233, lr=1e-5]Steps:  94%|█████████▎| 14038/15001 [9:01:22<28:32,  1.78s/it, loss=0.233, lr=1e-5]Steps:  94%|█████████▎| 14038/15001 [9:01:23<28:32,  1.78s/it, loss=0.16, lr=1e-5] Steps:  94%|█████████▎| 14039/15001 [9:01:24<30:07,  1.88s/it, loss=0.16, lr=1e-5]Steps:  94%|█████████▎| 14039/15001 [9:01:25<30:07,  1.88s/it, loss=0.185, lr=1e-5]Steps:  94%|█████████▎| 14040/15001 [9:01:26<30:07,  1.88s/it, loss=0.185, lr=1e-5]Steps:  94%|█████████▎| 14040/15001 [9:01:26<30:07,  1.88s/it, loss=0.0439, lr=1e-5]Steps:  94%|█████████▎| 14041/15001 [9:01:28<28:17,  1.77s/it, loss=0.0439, lr=1e-5]Steps:  94%|█████████▎| 14041/15001 [9:01:28<28:17,  1.77s/it, loss=0.0981, lr=1e-5]Steps:  94%|█████████▎| 14042/15001 [9:01:30<30:20,  1.90s/it, loss=0.0981, lr=1e-5]Steps:  94%|█████████▎| 14042/15001 [9:01:30<30:20,  1.90s/it, loss=0.0688, lr=1e-5]Steps:  94%|█████████▎| 14043/15001 [9:01:32<29:55,  1.87s/it, loss=0.0688, lr=1e-5]Steps:  94%|█████████▎| 14043/15001 [9:01:32<29:55,  1.87s/it, loss=0.093, lr=1e-5] Steps:  94%|█████████▎| 14044/15001 [9:01:34<30:36,  1.92s/it, loss=0.093, lr=1e-5]Steps:  94%|█████████▎| 14044/15001 [9:01:34<30:36,  1.92s/it, loss=0.195, lr=1e-5]Steps:  94%|█████████▎| 14045/15001 [9:01:36<29:41,  1.86s/it, loss=0.195, lr=1e-5]Steps:  94%|█████████▎| 14045/15001 [9:01:36<29:41,  1.86s/it, loss=0.372, lr=1e-5]Steps:  94%|█████████▎| 14046/15001 [9:01:38<31:21,  1.97s/it, loss=0.372, lr=1e-5]Steps:  94%|█████████▎| 14046/15001 [9:01:38<31:21,  1.97s/it, loss=0.146, lr=1e-5]Steps:  94%|█████████▎| 14047/15001 [9:01:40<31:11,  1.96s/it, loss=0.146, lr=1e-5]Steps:  94%|█████████▎| 14047/15001 [9:01:40<31:11,  1.96s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▎| 14048/15001 [9:01:42<33:00,  2.08s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▎| 14048/15001 [9:01:42<33:00,  2.08s/it, loss=0.162, lr=1e-5]Steps:  94%|█████████▎| 14049/15001 [9:01:44<32:17,  2.04s/it, loss=0.162, lr=1e-5]Steps:  94%|█████████▎| 14049/15001 [9:01:44<32:17,  2.04s/it, loss=0.203, lr=1e-5]Steps:  94%|█████████▎| 14050/15001 [9:01:46<31:05,  1.96s/it, loss=0.203, lr=1e-5]Steps:  94%|█████████▎| 14050/15001 [9:01:46<31:05,  1.96s/it, loss=0.117, lr=1e-5]Steps:  94%|█████████▎| 14051/15001 [9:01:47<29:33,  1.87s/it, loss=0.117, lr=1e-5]Steps:  94%|█████████▎| 14051/15001 [9:01:48<29:33,  1.87s/it, loss=0.104, lr=1e-5]Steps:  94%|█████████▎| 14052/15001 [9:01:49<28:22,  1.79s/it, loss=0.104, lr=1e-5]Steps:  94%|█████████▎| 14052/15001 [9:01:49<28:22,  1.79s/it, loss=0.296, lr=1e-5]Steps:  94%|█████████▎| 14053/15001 [9:01:51<28:30,  1.80s/it, loss=0.296, lr=1e-5]Steps:  94%|█████████▎| 14053/15001 [9:01:51<28:30,  1.80s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▎| 14054/15001 [9:01:53<28:58,  1.84s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▎| 14054/15001 [9:01:53<28:58,  1.84s/it, loss=0.162, lr=1e-5]Steps:  94%|█████████▎| 14055/15001 [9:01:55<28:05,  1.78s/it, loss=0.162, lr=1e-5]Steps:  94%|█████████▎| 14055/15001 [9:01:55<28:05,  1.78s/it, loss=0.249, lr=1e-5]Steps:  94%|█████████▎| 14056/15001 [9:01:56<28:55,  1.84s/it, loss=0.249, lr=1e-5]Steps:  94%|█████████▎| 14056/15001 [9:01:57<28:55,  1.84s/it, loss=0.209, lr=1e-5]Steps:  94%|█████████▎| 14057/15001 [9:01:58<28:58,  1.84s/it, loss=0.209, lr=1e-5]Steps:  94%|█████████▎| 14057/15001 [9:01:59<28:58,  1.84s/it, loss=0.155, lr=1e-5]Steps:  94%|█████████▎| 14058/15001 [9:02:00<29:23,  1.87s/it, loss=0.155, lr=1e-5]Steps:  94%|█████████▎| 14058/15001 [9:02:00<29:23,  1.87s/it, loss=0.173, lr=1e-5]Steps:  94%|█████████▎| 14059/15001 [9:02:02<29:14,  1.86s/it, loss=0.173, lr=1e-5]Steps:  94%|█████████▎| 14059/15001 [9:02:02<29:14,  1.86s/it, loss=0.258, lr=1e-5]Steps:  94%|█████████▎| 14060/15001 [9:02:04<28:47,  1.84s/it, loss=0.258, lr=1e-5]Steps:  94%|█████████▎| 14060/15001 [9:02:04<28:47,  1.84s/it, loss=0.0515, lr=1e-5]Steps:  94%|█████████▎| 14061/15001 [9:02:06<28:59,  1.85s/it, loss=0.0515, lr=1e-5]Steps:  94%|█████████▎| 14061/15001 [9:02:06<28:59,  1.85s/it, loss=0.214, lr=1e-5] Steps:  94%|█████████▎| 14062/15001 [9:02:07<28:16,  1.81s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▎| 14062/15001 [9:02:08<28:16,  1.81s/it, loss=0.159, lr=1e-5]Steps:  94%|█████████▎| 14063/15001 [9:02:09<29:01,  1.86s/it, loss=0.159, lr=1e-5]Steps:  94%|█████████▎| 14063/15001 [9:02:10<29:01,  1.86s/it, loss=0.196, lr=1e-5]Steps:  94%|█████████▍| 14064/15001 [9:02:11<28:18,  1.81s/it, loss=0.196, lr=1e-5]Steps:  94%|█████████▍| 14064/15001 [9:02:11<28:18,  1.81s/it, loss=0.174, lr=1e-5]Steps:  94%|█████████▍| 14065/15001 [9:02:13<27:53,  1.79s/it, loss=0.174, lr=1e-5]Steps:  94%|█████████▍| 14065/15001 [9:02:13<27:53,  1.79s/it, loss=0.327, lr=1e-5]Steps:  94%|█████████▍| 14066/15001 [9:02:15<28:04,  1.80s/it, loss=0.327, lr=1e-5]Steps:  94%|█████████▍| 14066/15001 [9:02:15<28:04,  1.80s/it, loss=0.158, lr=1e-5]Steps:  94%|█████████▍| 14067/15001 [9:02:17<29:31,  1.90s/it, loss=0.158, lr=1e-5]Steps:  94%|█████████▍| 14067/15001 [9:02:17<29:31,  1.90s/it, loss=0.145, lr=1e-5]Steps:  94%|█████████▍| 14068/15001 [9:02:19<29:52,  1.92s/it, loss=0.145, lr=1e-5]Steps:  94%|█████████▍| 14068/15001 [9:02:19<29:52,  1.92s/it, loss=0.103, lr=1e-5]Steps:  94%|█████████▍| 14069/15001 [9:02:21<29:03,  1.87s/it, loss=0.103, lr=1e-5]Steps:  94%|█████████▍| 14069/15001 [9:02:21<29:03,  1.87s/it, loss=0.0298, lr=1e-5]Steps:  94%|█████████▍| 14070/15001 [9:02:23<30:29,  1.96s/it, loss=0.0298, lr=1e-5]Steps:  94%|█████████▍| 14070/15001 [9:02:23<30:29,  1.96s/it, loss=0.0609, lr=1e-5]Steps:  94%|█████████▍| 14071/15001 [9:02:25<29:52,  1.93s/it, loss=0.0609, lr=1e-5]Steps:  94%|█████████▍| 14071/15001 [9:02:25<29:52,  1.93s/it, loss=0.209, lr=1e-5] Steps:  94%|█████████▍| 14072/15001 [9:02:27<30:41,  1.98s/it, loss=0.209, lr=1e-5]Steps:  94%|█████████▍| 14072/15001 [9:02:27<30:41,  1.98s/it, loss=0.0261, lr=1e-5]Steps:  94%|█████████▍| 14073/15001 [9:02:28<29:05,  1.88s/it, loss=0.0261, lr=1e-5]Steps:  94%|█████████▍| 14073/15001 [9:02:29<29:05,  1.88s/it, loss=0.157, lr=1e-5] Steps:  94%|█████████▍| 14074/15001 [9:02:30<29:32,  1.91s/it, loss=0.157, lr=1e-5]Steps:  94%|█████████▍| 14074/15001 [9:02:30<29:32,  1.91s/it, loss=0.183, lr=1e-5]Steps:  94%|█████████▍| 14075/15001 [9:02:32<28:57,  1.88s/it, loss=0.183, lr=1e-5]Steps:  94%|█��███████▍| 14075/15001 [9:02:32<28:57,  1.88s/it, loss=0.182, lr=1e-5]Steps:  94%|█████████▍| 14076/15001 [9:02:34<27:37,  1.79s/it, loss=0.182, lr=1e-5]Steps:  94%|█████████▍| 14076/15001 [9:02:34<27:37,  1.79s/it, loss=0.0302, lr=1e-5]Steps:  94%|█████████▍| 14077/15001 [9:02:36<29:18,  1.90s/it, loss=0.0302, lr=1e-5]Steps:  94%|█████████▍| 14077/15001 [9:02:36<29:18,  1.90s/it, loss=0.149, lr=1e-5] Steps:  94%|█████████▍| 14078/15001 [9:02:38<28:11,  1.83s/it, loss=0.149, lr=1e-5]Steps:  94%|█████████▍| 14078/15001 [9:02:38<28:11,  1.83s/it, loss=0.156, lr=1e-5]Steps:  94%|█████████▍| 14079/15001 [9:02:39<27:38,  1.80s/it, loss=0.156, lr=1e-5]Steps:  94%|█████████▍| 14079/15001 [9:02:40<27:38,  1.80s/it, loss=0.326, lr=1e-5]Steps:  94%|█████████▍| 14080/15001 [9:02:41<28:32,  1.86s/it, loss=0.326, lr=1e-5]Steps:  94%|█████████▍| 14080/15001 [9:02:41<28:32,  1.86s/it, loss=0.0872, lr=1e-5]Steps:  94%|█████████▍| 14081/15001 [9:02:43<27:52,  1.82s/it, loss=0.0872, lr=1e-5]Steps:  94%|█████████▍| 14081/15001 [9:02:43<27:52,  1.82s/it, loss=0.024, lr=1e-5] Steps:  94%|█████████▍| 14082/15001 [9:02:45<26:51,  1.75s/it, loss=0.024, lr=1e-5]Steps:  94%|█████████▍| 14082/15001 [9:02:46<26:51,  1.75s/it, loss=0.0895, lr=1e-5]Steps:  94%|█████████▍| 14083/15001 [9:02:48<33:09,  2.17s/it, loss=0.0895, lr=1e-5]Steps:  94%|█████████▍| 14083/15001 [9:02:48<33:09,  2.17s/it, loss=0.127, lr=1e-5] Steps:  94%|█████████▍| 14084/15001 [9:02:49<30:55,  2.02s/it, loss=0.127, lr=1e-5]Steps:  94%|█████████▍| 14084/15001 [9:02:50<30:55,  2.02s/it, loss=0.181, lr=1e-5]Steps:  94%|█████████▍| 14085/15001 [9:02:51<30:24,  1.99s/it, loss=0.181, lr=1e-5]Steps:  94%|█████████▍| 14085/15001 [9:02:52<30:24,  1.99s/it, loss=0.146, lr=1e-5]Steps:  94%|█████████▍| 14086/15001 [9:02:53<30:14,  1.98s/it, loss=0.146, lr=1e-5]Steps:  94%|█████████▍| 14086/15001 [9:02:53<30:14,  1.98s/it, loss=0.401, lr=1e-5]Steps:  94%|█████████▍| 14087/15001 [9:02:55<28:29,  1.87s/it, loss=0.401, lr=1e-5]Steps:  94%|█████████▍| 14087/15001 [9:02:55<28:29,  1.87s/it, loss=0.186, lr=1e-5]Steps:  94%|█████████▍| 14088/15001 [9:02:57<28:08,  1.85s/it, loss=0.186, lr=1e-5]Steps:  94%|█████████▍| 14088/15001 [9:02:57<28:08,  1.85s/it, loss=0.26, lr=1e-5] Steps:  94%|█████████▍| 14089/15001 [9:02:59<29:09,  1.92s/it, loss=0.26, lr=1e-5]Steps:  94%|█████████▍| 14089/15001 [9:02:59<29:09,  1.92s/it, loss=0.234, lr=1e-5]Steps:  94%|█████████▍| 14090/15001 [9:03:01<29:23,  1.94s/it, loss=0.234, lr=1e-5]Steps:  94%|█████████▍| 14090/15001 [9:03:01<29:23,  1.94s/it, loss=0.182, lr=1e-5]Steps:  94%|█████████▍| 14091/15001 [9:03:03<31:23,  2.07s/it, loss=0.182, lr=1e-5]Steps:  94%|█████████▍| 14091/15001 [9:03:03<31:23,  2.07s/it, loss=0.116, lr=1e-5]Steps:  94%|█████████▍| 14092/15001 [9:03:05<31:18,  2.07s/it, loss=0.116, lr=1e-5]Steps:  94%|█████████▍| 14092/15001 [9:03:05<31:18,  2.07s/it, loss=0.0522, lr=1e-5]Steps:  94%|█████████▍| 14093/15001 [9:03:07<29:43,  1.96s/it, loss=0.0522, lr=1e-5]Steps:  94%|█████████▍| 14093/15001 [9:03:07<29:43,  1.96s/it, loss=0.11, lr=1e-5]  Steps:  94%|█████████▍| 14094/15001 [9:03:09<30:15,  2.00s/it, loss=0.11, lr=1e-5]Steps:  94%|█████████▍| 14094/15001 [9:03:09<30:15,  2.00s/it, loss=0.416, lr=1e-5]Steps:  94%|█████████▍| 14095/15001 [9:03:11<29:21,  1.94s/it, loss=0.416, lr=1e-5]Steps:  94%|█████████▍| 14095/15001 [9:03:11<29:21,  1.94s/it, loss=0.241, lr=1e-5]Steps:  94%|█████████▍| 14096/15001 [9:03:13<28:08,  1.87s/it, loss=0.241, lr=1e-5]Steps:  94%|█████████▍| 14096/15001 [9:03:13<28:08,  1.87s/it, loss=0.193, lr=1e-5]Steps:  94%|█████████▍| 14097/15001 [9:03:14<27:15,  1.81s/it, loss=0.193, lr=1e-5]Steps:  94%|█████████▍| 14097/15001 [9:03:15<27:15,  1.81s/it, loss=0.0753, lr=1e-5]Steps:  94%|█████████▍| 14098/15001 [9:03:16<27:10,  1.81s/it, loss=0.0753, lr=1e-5]Steps:  94%|█████████▍| 14098/15001 [9:03:16<27:10,  1.81s/it, loss=0.118, lr=1e-5] Steps:  94%|█████████▍| 14099/15001 [9:03:18<28:46,  1.91s/it, loss=0.118, lr=1e-5]Steps:  94%|█████████▍| 14099/15001 [9:03:18<28:46,  1.91s/it, loss=0.411, lr=1e-5]Steps:  94%|█████���███▍| 14100/15001 [9:03:20<27:46,  1.85s/it, loss=0.411, lr=1e-5]Steps:  94%|█████████▍| 14100/15001 [9:03:20<27:46,  1.85s/it, loss=0.251, lr=1e-5]Steps:  94%|█████████▍| 14101/15001 [9:03:22<27:41,  1.85s/it, loss=0.251, lr=1e-5]Steps:  94%|█████████▍| 14101/15001 [9:03:22<27:41,  1.85s/it, loss=0.286, lr=1e-5]Steps:  94%|█████████▍| 14102/15001 [9:03:23<26:58,  1.80s/it, loss=0.286, lr=1e-5]Steps:  94%|█████████▍| 14102/15001 [9:03:24<26:58,  1.80s/it, loss=0.0867, lr=1e-5]Steps:  94%|█████████▍| 14103/15001 [9:03:25<27:31,  1.84s/it, loss=0.0867, lr=1e-5]Steps:  94%|█████████▍| 14103/15001 [9:03:26<27:31,  1.84s/it, loss=0.0416, lr=1e-5]Steps:  94%|█████████▍| 14104/15001 [9:03:27<27:47,  1.86s/it, loss=0.0416, lr=1e-5]Steps:  94%|█████████▍| 14104/15001 [9:03:27<27:47,  1.86s/it, loss=0.0824, lr=1e-5]Steps:  94%|█████████▍| 14105/15001 [9:03:29<27:44,  1.86s/it, loss=0.0824, lr=1e-5]Steps:  94%|█████████▍| 14105/15001 [9:03:29<27:44,  1.86s/it, loss=0.166, lr=1e-5] Steps:  94%|█████████▍| 14106/15001 [9:03:31<27:07,  1.82s/it, loss=0.166, lr=1e-5]Steps:  94%|█████████▍| 14106/15001 [9:03:31<27:07,  1.82s/it, loss=0.169, lr=1e-5]Steps:  94%|█████████▍| 14107/15001 [9:03:33<26:48,  1.80s/it, loss=0.169, lr=1e-5]Steps:  94%|█████████▍| 14107/15001 [9:03:33<26:48,  1.80s/it, loss=0.221, lr=1e-5]Steps:  94%|█████████▍| 14108/15001 [9:03:34<26:27,  1.78s/it, loss=0.221, lr=1e-5]Steps:  94%|█████████▍| 14108/15001 [9:03:35<26:27,  1.78s/it, loss=0.126, lr=1e-5]Steps:  94%|█████████▍| 14109/15001 [9:03:36<27:49,  1.87s/it, loss=0.126, lr=1e-5]Steps:  94%|█████████▍| 14109/15001 [9:03:36<27:49,  1.87s/it, loss=0.179, lr=1e-5]Steps:  94%|█████████▍| 14110/15001 [9:03:38<27:28,  1.85s/it, loss=0.179, lr=1e-5]Steps:  94%|█████████▍| 14110/15001 [9:03:38<27:28,  1.85s/it, loss=0.496, lr=1e-5]Steps:  94%|█████████▍| 14111/15001 [9:03:40<27:18,  1.84s/it, loss=0.496, lr=1e-5]Steps:  94%|█████████▍| 14111/15001 [9:03:40<27:18,  1.84s/it, loss=0.252, lr=1e-5]Steps:  94%|█████████▍| 14112/15001 [9:03:42<28:10,  1.90s/it, loss=0.252, lr=1e-5]Steps:  94%|█████████▍| 14112/15001 [9:03:42<28:10,  1.90s/it, loss=0.364, lr=1e-5]Steps:  94%|█████████▍| 14113/15001 [9:03:44<28:21,  1.92s/it, loss=0.364, lr=1e-5]Steps:  94%|█████████▍| 14113/15001 [9:03:44<28:21,  1.92s/it, loss=0.164, lr=1e-5]Steps:  94%|█████████▍| 14114/15001 [9:03:46<28:22,  1.92s/it, loss=0.164, lr=1e-5]Steps:  94%|█████████▍| 14114/15001 [9:03:46<28:22,  1.92s/it, loss=0.227, lr=1e-5]Steps:  94%|█████████▍| 14115/15001 [9:03:48<29:44,  2.01s/it, loss=0.227, lr=1e-5]Steps:  94%|█████████▍| 14115/15001 [9:03:48<29:44,  2.01s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▍| 14116/15001 [9:03:50<29:02,  1.97s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▍| 14116/15001 [9:03:50<29:02,  1.97s/it, loss=0.0373, lr=1e-5]Steps:  94%|█████████▍| 14117/15001 [9:03:52<28:37,  1.94s/it, loss=0.0373, lr=1e-5]Steps:  94%|█████████▍| 14117/15001 [9:03:52<28:37,  1.94s/it, loss=0.171, lr=1e-5] Steps:  94%|█████████▍| 14118/15001 [9:03:54<27:52,  1.89s/it, loss=0.171, lr=1e-5]Steps:  94%|█████████▍| 14118/15001 [9:03:54<27:52,  1.89s/it, loss=0.151, lr=1e-5]Steps:  94%|█████████▍| 14119/15001 [9:03:55<27:31,  1.87s/it, loss=0.151, lr=1e-5]Steps:  94%|█████████▍| 14119/15001 [9:03:56<27:31,  1.87s/it, loss=0.22, lr=1e-5] Steps:  94%|█████████▍| 14120/15001 [9:03:57<26:39,  1.82s/it, loss=0.22, lr=1e-5]Steps:  94%|█████████▍| 14120/15001 [9:03:57<26:39,  1.82s/it, loss=0.361, lr=1e-5]Steps:  94%|█████████▍| 14121/15001 [9:03:59<25:56,  1.77s/it, loss=0.361, lr=1e-5]Steps:  94%|█████████▍| 14121/15001 [9:03:59<25:56,  1.77s/it, loss=0.0915, lr=1e-5]Steps:  94%|█████████▍| 14122/15001 [9:04:01<26:37,  1.82s/it, loss=0.0915, lr=1e-5]Steps:  94%|█████████▍| 14122/15001 [9:04:01<26:37,  1.82s/it, loss=0.0538, lr=1e-5]Steps:  94%|█████████▍| 14123/15001 [9:04:03<27:27,  1.88s/it, loss=0.0538, lr=1e-5]Steps:  94%|█████████▍| 14123/15001 [9:04:03<27:27,  1.88s/it, loss=0.258, lr=1e-5] Steps:  94%|█████████▍| 14124/15001 [9:04:05<27:30,  1.88s/it, loss=0.258, lr=1e-5]Steps:  94%|████████��▍| 14124/15001 [9:04:05<27:30,  1.88s/it, loss=0.166, lr=1e-5]Steps:  94%|█████████▍| 14125/15001 [9:04:06<26:09,  1.79s/it, loss=0.166, lr=1e-5]Steps:  94%|█████████▍| 14125/15001 [9:04:06<26:09,  1.79s/it, loss=0.2, lr=1e-5]  Steps:  94%|█████████▍| 14126/15001 [9:04:08<27:14,  1.87s/it, loss=0.2, lr=1e-5]Steps:  94%|█████████▍| 14126/15001 [9:04:08<27:14,  1.87s/it, loss=0.476, lr=1e-5]Steps:  94%|█████████▍| 14127/15001 [9:04:10<26:57,  1.85s/it, loss=0.476, lr=1e-5]Steps:  94%|█████████▍| 14127/15001 [9:04:10<26:57,  1.85s/it, loss=0.102, lr=1e-5]Steps:  94%|█████████▍| 14128/15001 [9:04:12<25:21,  1.74s/it, loss=0.102, lr=1e-5]Steps:  94%|█████████▍| 14128/15001 [9:04:12<25:21,  1.74s/it, loss=0.175, lr=1e-5]Steps:  94%|█████████▍| 14129/15001 [9:04:14<26:37,  1.83s/it, loss=0.175, lr=1e-5]Steps:  94%|█████████▍| 14129/15001 [9:04:14<26:37,  1.83s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▍| 14130/15001 [9:04:16<27:28,  1.89s/it, loss=0.214, lr=1e-5]Steps:  94%|█████████▍| 14130/15001 [9:04:16<27:28,  1.89s/it, loss=0.0975, lr=1e-5]Steps:  94%|█████████▍| 14131/15001 [9:04:17<26:21,  1.82s/it, loss=0.0975, lr=1e-5]Steps:  94%|█████████▍| 14131/15001 [9:04:18<26:21,  1.82s/it, loss=0.38, lr=1e-5]  Steps:  94%|█████████▍| 14132/15001 [9:04:19<27:04,  1.87s/it, loss=0.38, lr=1e-5]Steps:  94%|█████████▍| 14132/15001 [9:04:19<27:04,  1.87s/it, loss=0.108, lr=1e-5]Steps:  94%|█████████▍| 14133/15001 [9:04:21<26:42,  1.85s/it, loss=0.108, lr=1e-5]Steps:  94%|█████████▍| 14133/15001 [9:04:21<26:42,  1.85s/it, loss=0.204, lr=1e-5]Steps:  94%|█████████▍| 14134/15001 [9:04:23<25:54,  1.79s/it, loss=0.204, lr=1e-5]Steps:  94%|█████████▍| 14134/15001 [9:04:23<25:54,  1.79s/it, loss=0.147, lr=1e-5]Steps:  94%|█████████▍| 14135/15001 [9:04:25<27:09,  1.88s/it, loss=0.147, lr=1e-5]Steps:  94%|█████████▍| 14135/15001 [9:04:25<27:09,  1.88s/it, loss=0.365, lr=1e-5]Steps:  94%|█████████▍| 14136/15001 [9:04:27<27:23,  1.90s/it, loss=0.365, lr=1e-5]Steps:  94%|█████████▍| 14136/15001 [9:04:27<27:23,  1.90s/it, loss=0.179, lr=1e-5]Steps:  94%|█████████▍| 14137/15001 [9:04:29<27:49,  1.93s/it, loss=0.179, lr=1e-5]Steps:  94%|█████████▍| 14137/15001 [9:04:29<27:49,  1.93s/it, loss=0.112, lr=1e-5]Steps:  94%|█████████▍| 14138/15001 [9:04:31<28:20,  1.97s/it, loss=0.112, lr=1e-5]Steps:  94%|█████████▍| 14138/15001 [9:04:31<28:20,  1.97s/it, loss=0.233, lr=1e-5]Steps:  94%|█████████▍| 14139/15001 [9:04:33<27:38,  1.92s/it, loss=0.233, lr=1e-5]Steps:  94%|█████████▍| 14139/15001 [9:04:33<27:38,  1.92s/it, loss=0.107, lr=1e-5]Steps:  94%|█████████▍| 14140/15001 [9:04:35<27:43,  1.93s/it, loss=0.107, lr=1e-5]Steps:  94%|█████████▍| 14140/15001 [9:04:35<27:43,  1.93s/it, loss=0.156, lr=1e-5]Steps:  94%|█████████▍| 14141/15001 [9:04:37<27:26,  1.91s/it, loss=0.156, lr=1e-5]Steps:  94%|█████████▍| 14141/15001 [9:04:37<27:26,  1.91s/it, loss=0.283, lr=1e-5]Steps:  94%|█████████▍| 14142/15001 [9:04:38<26:12,  1.83s/it, loss=0.283, lr=1e-5]Steps:  94%|█████████▍| 14142/15001 [9:04:39<26:12,  1.83s/it, loss=0.194, lr=1e-5]Steps:  94%|█████████▍| 14143/15001 [9:04:40<26:54,  1.88s/it, loss=0.194, lr=1e-5]Steps:  94%|█████████▍| 14143/15001 [9:04:40<26:54,  1.88s/it, loss=0.0835, lr=1e-5]Steps:  94%|█████████▍| 14144/15001 [9:04:42<26:08,  1.83s/it, loss=0.0835, lr=1e-5]Steps:  94%|█████████▍| 14144/15001 [9:04:42<26:08,  1.83s/it, loss=0.144, lr=1e-5] Steps:  94%|█████████▍| 14145/15001 [9:04:44<25:55,  1.82s/it, loss=0.144, lr=1e-5]Steps:  94%|█████████▍| 14145/15001 [9:04:44<25:55,  1.82s/it, loss=0.0124, lr=1e-5]Steps:  94%|█████████▍| 14146/15001 [9:04:46<26:15,  1.84s/it, loss=0.0124, lr=1e-5]Steps:  94%|█████████▍| 14146/15001 [9:04:46<26:15,  1.84s/it, loss=0.288, lr=1e-5] Steps:  94%|█████████▍| 14147/15001 [9:04:48<26:46,  1.88s/it, loss=0.288, lr=1e-5]Steps:  94%|█████████▍| 14147/15001 [9:04:48<26:46,  1.88s/it, loss=0.165, lr=1e-5]Steps:  94%|█████████▍| 14148/15001 [9:04:49<26:29,  1.86s/it, loss=0.165, lr=1e-5]Steps:  94%|█████████▍| 14148/15001 [9:04:49<26:29,  1.86s/it, loss=0.148, lr=1e-5]Steps:  94%|█████████▍| 14149/15001 [9:04:51<26:54,  1.90s/it, loss=0.148, lr=1e-5]Steps:  94%|█████████▍| 14149/15001 [9:04:51<26:54,  1.90s/it, loss=0.178, lr=1e-5]Steps:  94%|█████████▍| 14150/15001 [9:04:53<25:28,  1.80s/it, loss=0.178, lr=1e-5]Steps:  94%|█████████▍| 14150/15001 [9:04:53<25:28,  1.80s/it, loss=0.173, lr=1e-5]Steps:  94%|█████████▍| 14151/15001 [9:04:55<25:40,  1.81s/it, loss=0.173, lr=1e-5]Steps:  94%|█████████▍| 14151/15001 [9:04:55<25:40,  1.81s/it, loss=0.211, lr=1e-5]Steps:  94%|█████████▍| 14152/15001 [9:04:57<26:43,  1.89s/it, loss=0.211, lr=1e-5]Steps:  94%|█████████▍| 14152/15001 [9:04:57<26:43,  1.89s/it, loss=0.103, lr=1e-5]Steps:  94%|█████████▍| 14153/15001 [9:04:59<26:01,  1.84s/it, loss=0.103, lr=1e-5]Steps:  94%|█████████▍| 14153/15001 [9:04:59<26:01,  1.84s/it, loss=0.0269, lr=1e-5]Steps:  94%|█████████▍| 14154/15001 [9:05:00<25:00,  1.77s/it, loss=0.0269, lr=1e-5]Steps:  94%|█████████▍| 14154/15001 [9:05:00<25:00,  1.77s/it, loss=0.21, lr=1e-5]  Steps:  94%|█████████▍| 14155/15001 [9:05:02<24:24,  1.73s/it, loss=0.21, lr=1e-5]Steps:  94%|█████████▍| 14155/15001 [9:05:02<24:24,  1.73s/it, loss=0.255, lr=1e-5]Steps:  94%|█████████▍| 14156/15001 [9:05:04<25:52,  1.84s/it, loss=0.255, lr=1e-5]Steps:  94%|█████████▍| 14156/15001 [9:05:04<25:52,  1.84s/it, loss=0.149, lr=1e-5]Steps:  94%|█████████▍| 14157/15001 [9:05:06<25:40,  1.82s/it, loss=0.149, lr=1e-5]Steps:  94%|█████████▍| 14157/15001 [9:05:06<25:40,  1.82s/it, loss=0.0833, lr=1e-5]Steps:  94%|█████████▍| 14158/15001 [9:05:08<26:10,  1.86s/it, loss=0.0833, lr=1e-5]Steps:  94%|█████████▍| 14158/15001 [9:05:08<26:10,  1.86s/it, loss=0.155, lr=1e-5] Steps:  94%|█████████▍| 14159/15001 [9:05:10<26:43,  1.90s/it, loss=0.155, lr=1e-5]Steps:  94%|█████████▍| 14159/15001 [9:05:10<26:43,  1.90s/it, loss=0.0322, lr=1e-5]Steps:  94%|█████████▍| 14160/15001 [9:05:11<26:10,  1.87s/it, loss=0.0322, lr=1e-5]Steps:  94%|█████████▍| 14160/15001 [9:05:12<26:10,  1.87s/it, loss=0.143, lr=1e-5] Steps:  94%|█████████▍| 14161/15001 [9:05:14<27:23,  1.96s/it, loss=0.143, lr=1e-5]Steps:  94%|█████████▍| 14161/15001 [9:05:14<27:23,  1.96s/it, loss=0.286, lr=1e-5]Steps:  94%|█████████▍| 14162/15001 [9:05:15<26:50,  1.92s/it, loss=0.286, lr=1e-5]Steps:  94%|█████████▍| 14162/15001 [9:05:16<26:50,  1.92s/it, loss=0.145, lr=1e-5]Steps:  94%|█████████▍| 14163/15001 [9:05:18<27:43,  1.98s/it, loss=0.145, lr=1e-5]Steps:  94%|█████████▍| 14163/15001 [9:05:18<27:43,  1.98s/it, loss=0.154, lr=1e-5]Steps:  94%|█████████▍| 14164/15001 [9:05:20<29:01,  2.08s/it, loss=0.154, lr=1e-5]Steps:  94%|█████████▍| 14164/15001 [9:05:20<29:01,  2.08s/it, loss=0.188, lr=1e-5]Steps:  94%|█████████▍| 14165/15001 [9:05:21<26:53,  1.93s/it, loss=0.188, lr=1e-5]Steps:  94%|█████████▍| 14165/15001 [9:05:22<26:53,  1.93s/it, loss=0.187, lr=1e-5]Steps:  94%|█████████▍| 14166/15001 [9:05:23<27:16,  1.96s/it, loss=0.187, lr=1e-5]Steps:  94%|█████████▍| 14166/15001 [9:05:24<27:16,  1.96s/it, loss=0.16, lr=1e-5] Steps:  94%|█████████▍| 14167/15001 [9:05:25<25:45,  1.85s/it, loss=0.16, lr=1e-5]Steps:  94%|█████████▍| 14167/15001 [9:05:25<25:45,  1.85s/it, loss=0.118, lr=1e-5]Steps:  94%|█████████▍| 14168/15001 [9:05:27<26:21,  1.90s/it, loss=0.118, lr=1e-5]Steps:  94%|█████████▍| 14168/15001 [9:05:27<26:21,  1.90s/it, loss=0.144, lr=1e-5]Steps:  94%|█████████▍| 14169/15001 [9:05:29<26:33,  1.92s/it, loss=0.144, lr=1e-5]Steps:  94%|█████████▍| 14169/15001 [9:05:29<26:33,  1.92s/it, loss=0.0917, lr=1e-5]Steps:  94%|█████████▍| 14170/15001 [9:05:31<26:06,  1.88s/it, loss=0.0917, lr=1e-5]Steps:  94%|█████████▍| 14170/15001 [9:05:31<26:06,  1.88s/it, loss=0.348, lr=1e-5] Steps:  94%|█████████▍| 14171/15001 [9:05:32<24:41,  1.78s/it, loss=0.348, lr=1e-5]Steps:  94%|█████████▍| 14171/15001 [9:05:33<24:41,  1.78s/it, loss=0.0368, lr=1e-5]Steps:  94%|█████████▍| 14172/15001 [9:05:34<25:27,  1.84s/it, loss=0.0368, lr=1e-5]Steps:  94%|█████████▍| 14172/15001 [9:05:35<25:27,  1.84s/it, loss=0.051, lr=1e-5] Steps:  94%|█████████▍| 14173/15001 [9:05:36<25:20,  1.84s/it, loss=0.051, lr=1e-5]Steps:  94%|█████████▍| 14173/15001 [9:05:36<25:20,  1.84s/it, loss=0.08, lr=1e-5] Steps:  94%|█████████▍| 14174/15001 [9:05:38<25:11,  1.83s/it, loss=0.08, lr=1e-5]Steps:  94%|█████████▍| 14174/15001 [9:05:38<25:11,  1.83s/it, loss=0.168, lr=1e-5]Steps:  94%|█████████▍| 14175/15001 [9:05:40<26:21,  1.91s/it, loss=0.168, lr=1e-5]Steps:  94%|█████████▍| 14175/15001 [9:05:40<26:21,  1.91s/it, loss=0.495, lr=1e-5]Steps:  95%|█████████▍| 14176/15001 [9:05:42<25:50,  1.88s/it, loss=0.495, lr=1e-5]Steps:  95%|█████████▍| 14176/15001 [9:05:42<25:50,  1.88s/it, loss=0.134, lr=1e-5]Steps:  95%|█████████▍| 14177/15001 [9:05:44<26:07,  1.90s/it, loss=0.134, lr=1e-5]Steps:  95%|█████████▍| 14177/15001 [9:05:44<26:07,  1.90s/it, loss=0.117, lr=1e-5]Steps:  95%|█████████▍| 14178/15001 [9:05:46<26:35,  1.94s/it, loss=0.117, lr=1e-5]Steps:  95%|█████████▍| 14178/15001 [9:05:46<26:35,  1.94s/it, loss=0.199, lr=1e-5]Steps:  95%|█████████▍| 14179/15001 [9:05:48<25:32,  1.86s/it, loss=0.199, lr=1e-5]Steps:  95%|█████████▍| 14179/15001 [9:05:48<25:32,  1.86s/it, loss=0.192, lr=1e-5]Steps:  95%|█████████▍| 14180/15001 [9:05:50<26:31,  1.94s/it, loss=0.192, lr=1e-5]Steps:  95%|█████████▍| 14180/15001 [9:05:50<26:31,  1.94s/it, loss=0.229, lr=1e-5]Steps:  95%|█████████▍| 14181/15001 [9:05:52<26:18,  1.92s/it, loss=0.229, lr=1e-5]Steps:  95%|█████████▍| 14181/15001 [9:05:52<26:18,  1.92s/it, loss=0.234, lr=1e-5]Steps:  95%|█████████▍| 14182/15001 [9:05:54<26:34,  1.95s/it, loss=0.234, lr=1e-5]Steps:  95%|█████████▍| 14182/15001 [9:05:54<26:34,  1.95s/it, loss=0.121, lr=1e-5]Steps:  95%|█████████▍| 14183/15001 [9:05:55<25:59,  1.91s/it, loss=0.121, lr=1e-5]Steps:  95%|█████████▍| 14183/15001 [9:05:56<25:59,  1.91s/it, loss=0.45, lr=1e-5] Steps:  95%|█████████▍| 14184/15001 [9:05:57<26:38,  1.96s/it, loss=0.45, lr=1e-5]Steps:  95%|█████████▍| 14184/15001 [9:05:58<26:38,  1.96s/it, loss=0.13, lr=1e-5]Steps:  95%|█████████▍| 14185/15001 [9:05:59<26:48,  1.97s/it, loss=0.13, lr=1e-5]Steps:  95%|█████████▍| 14185/15001 [9:06:00<26:48,  1.97s/it, loss=0.41, lr=1e-5]Steps:  95%|█████████▍| 14186/15001 [9:06:02<27:16,  2.01s/it, loss=0.41, lr=1e-5]Steps:  95%|█████████▍| 14186/15001 [9:06:02<27:16,  2.01s/it, loss=0.17, lr=1e-5]Steps:  95%|█████████▍| 14187/15001 [9:06:03<26:52,  1.98s/it, loss=0.17, lr=1e-5]Steps:  95%|█████████▍| 14187/15001 [9:06:04<26:52,  1.98s/it, loss=0.0631, lr=1e-5]Steps:  95%|█████████▍| 14188/15001 [9:06:05<26:21,  1.95s/it, loss=0.0631, lr=1e-5]Steps:  95%|█████████▍| 14188/15001 [9:06:05<26:21,  1.95s/it, loss=0.123, lr=1e-5] Steps:  95%|█████████▍| 14189/15001 [9:06:07<25:41,  1.90s/it, loss=0.123, lr=1e-5]Steps:  95%|█████████▍| 14189/15001 [9:06:07<25:41,  1.90s/it, loss=0.198, lr=1e-5]Steps:  95%|█████████▍| 14190/15001 [9:06:09<25:31,  1.89s/it, loss=0.198, lr=1e-5]Steps:  95%|█████████▍| 14190/15001 [9:06:09<25:31,  1.89s/it, loss=0.181, lr=1e-5]Steps:  95%|█████████▍| 14191/15001 [9:06:11<25:07,  1.86s/it, loss=0.181, lr=1e-5]Steps:  95%|█████████▍| 14191/15001 [9:06:11<25:07,  1.86s/it, loss=0.39, lr=1e-5] Steps:  95%|█████████▍| 14192/15001 [9:06:13<24:34,  1.82s/it, loss=0.39, lr=1e-5]Steps:  95%|█████████▍| 14192/15001 [9:06:13<24:34,  1.82s/it, loss=0.111, lr=1e-5]Steps:  95%|█████████▍| 14193/15001 [9:06:14<24:10,  1.79s/it, loss=0.111, lr=1e-5]Steps:  95%|█████████▍| 14193/15001 [9:06:15<24:10,  1.79s/it, loss=0.216, lr=1e-5]Steps:  95%|█████████▍| 14194/15001 [9:06:16<24:26,  1.82s/it, loss=0.216, lr=1e-5]Steps:  95%|█████████▍| 14194/15001 [9:06:16<24:26,  1.82s/it, loss=0.171, lr=1e-5]Steps:  95%|█████████▍| 14195/15001 [9:06:18<24:28,  1.82s/it, loss=0.171, lr=1e-5]Steps:  95%|█████████▍| 14195/15001 [9:06:18<24:28,  1.82s/it, loss=0.266, lr=1e-5]Steps:  95%|█████████▍| 14196/15001 [9:06:20<25:16,  1.88s/it, loss=0.266, lr=1e-5]Steps:  95%|█████████▍| 14196/15001 [9:06:20<25:16,  1.88s/it, loss=0.341, lr=1e-5]Steps:  95%|█████████▍| 14197/15001 [9:06:22<24:26,  1.82s/it, loss=0.341, lr=1e-5]Steps:  95%|█████████▍| 14197/15001 [9:06:22<24:26,  1.82s/it, loss=0.203, lr=1e-5]Steps:  95%|█████████▍| 14198/15001 [9:06:23<23:56,  1.79s/it, loss=0.203, lr=1e-5]Steps:  95%|█████████▍| 14198/15001 [9:06:24<23:56,  1.79s/it, loss=0.308, lr=1e-5]Steps:  95%|█████████▍| 14199/15001 [9:06:25<23:40,  1.77s/it, loss=0.308, lr=1e-5]Steps:  95%|█████████▍| 14199/15001 [9:06:26<23:40,  1.77s/it, loss=0.354, lr=1e-5]Steps:  95%|█████████▍| 14200/15001 [9:06:27<24:18,  1.82s/it, loss=0.354, lr=1e-5]Steps:  95%|█████████▍| 14200/15001 [9:06:27<24:18,  1.82s/it, loss=0.181, lr=1e-5]Steps:  95%|█████████▍| 14201/15001 [9:06:29<24:08,  1.81s/it, loss=0.181, lr=1e-5]Steps:  95%|█████████▍| 14201/15001 [9:06:29<24:08,  1.81s/it, loss=0.297, lr=1e-5]Steps:  95%|█████████▍| 14202/15001 [9:06:31<24:30,  1.84s/it, loss=0.297, lr=1e-5]Steps:  95%|█████████▍| 14202/15001 [9:06:31<24:30,  1.84s/it, loss=0.0811, lr=1e-5]Steps:  95%|█████████▍| 14203/15001 [9:06:33<24:35,  1.85s/it, loss=0.0811, lr=1e-5]Steps:  95%|█████████▍| 14203/15001 [9:06:33<24:35,  1.85s/it, loss=0.272, lr=1e-5] Steps:  95%|█████████▍| 14204/15001 [9:06:35<25:14,  1.90s/it, loss=0.272, lr=1e-5]Steps:  95%|█████████▍| 14204/15001 [9:06:35<25:14,  1.90s/it, loss=0.157, lr=1e-5]Steps:  95%|█████████▍| 14205/15001 [9:06:37<25:48,  1.95s/it, loss=0.157, lr=1e-5]Steps:  95%|█████████▍| 14205/15001 [9:06:37<25:48,  1.95s/it, loss=0.267, lr=1e-5]Steps:  95%|█████████▍| 14206/15001 [9:06:39<26:57,  2.04s/it, loss=0.267, lr=1e-5]Steps:  95%|█████████▍| 14206/15001 [9:06:39<26:57,  2.04s/it, loss=0.0273, lr=1e-5]Steps:  95%|█████████▍| 14207/15001 [9:06:41<27:17,  2.06s/it, loss=0.0273, lr=1e-5]Steps:  95%|█████████▍| 14207/15001 [9:06:41<27:17,  2.06s/it, loss=0.106, lr=1e-5] Steps:  95%|█████████▍| 14208/15001 [9:06:43<27:42,  2.10s/it, loss=0.106, lr=1e-5]Steps:  95%|█████████▍| 14208/15001 [9:06:43<27:42,  2.10s/it, loss=0.133, lr=1e-5]Steps:  95%|█████████▍| 14209/15001 [9:06:45<26:20,  2.00s/it, loss=0.133, lr=1e-5]Steps:  95%|█████████▍| 14209/15001 [9:06:45<26:20,  2.00s/it, loss=0.134, lr=1e-5]Steps:  95%|█████████▍| 14210/15001 [9:06:47<25:43,  1.95s/it, loss=0.134, lr=1e-5]Steps:  95%|█████████▍| 14210/15001 [9:06:47<25:43,  1.95s/it, loss=0.337, lr=1e-5]Steps:  95%|█████████▍| 14211/15001 [9:06:49<25:30,  1.94s/it, loss=0.337, lr=1e-5]Steps:  95%|█████████▍| 14211/15001 [9:06:49<25:30,  1.94s/it, loss=0.0754, lr=1e-5]Steps:  95%|█████████▍| 14212/15001 [9:06:50<24:38,  1.87s/it, loss=0.0754, lr=1e-5]Steps:  95%|█████████▍| 14212/15001 [9:06:51<24:38,  1.87s/it, loss=0.209, lr=1e-5] Steps:  95%|█████████▍| 14213/15001 [9:06:52<24:35,  1.87s/it, loss=0.209, lr=1e-5]Steps:  95%|█████████▍| 14213/15001 [9:06:52<24:35,  1.87s/it, loss=0.183, lr=1e-5]Steps:  95%|█████████▍| 14214/15001 [9:06:54<23:36,  1.80s/it, loss=0.183, lr=1e-5]Steps:  95%|█████████▍| 14214/15001 [9:06:54<23:36,  1.80s/it, loss=0.336, lr=1e-5]Steps:  95%|█████████▍| 14215/15001 [9:06:56<25:13,  1.93s/it, loss=0.336, lr=1e-5]Steps:  95%|█████████▍| 14215/15001 [9:06:56<25:13,  1.93s/it, loss=0.106, lr=1e-5]Steps:  95%|█████████▍| 14216/15001 [9:06:58<24:23,  1.86s/it, loss=0.106, lr=1e-5]Steps:  95%|█████████▍| 14216/15001 [9:06:58<24:23,  1.86s/it, loss=0.164, lr=1e-5]Steps:  95%|█████████▍| 14217/15001 [9:07:00<23:50,  1.82s/it, loss=0.164, lr=1e-5]Steps:  95%|█████████▍| 14217/15001 [9:07:00<23:50,  1.82s/it, loss=0.0712, lr=1e-5]Steps:  95%|█████████▍| 14218/15001 [9:07:01<23:20,  1.79s/it, loss=0.0712, lr=1e-5]Steps:  95%|█████████▍| 14218/15001 [9:07:02<23:20,  1.79s/it, loss=0.298, lr=1e-5] Steps:  95%|█████████▍| 14219/15001 [9:07:03<23:04,  1.77s/it, loss=0.298, lr=1e-5]Steps:  95%|█████████▍| 14219/15001 [9:07:03<23:04,  1.77s/it, loss=0.3, lr=1e-5]  Steps:  95%|█████████▍| 14220/15001 [9:07:05<23:51,  1.83s/it, loss=0.3, lr=1e-5]Steps:  95%|█████████▍| 14220/15001 [9:07:05<23:51,  1.83s/it, loss=0.174, lr=1e-5]Steps:  95%|█████████▍| 14221/15001 [9:07:07<24:03,  1.85s/it, loss=0.174, lr=1e-5]Steps:  95%|█████████▍| 14221/15001 [9:07:07<24:03,  1.85s/it, loss=0.284, lr=1e-5]Steps:  95%|█████████▍| 14222/15001 [9:07:08<22:26,  1.73s/it, loss=0.284, lr=1e-5]Steps:  95%|█████████▍| 14222/15001 [9:07:09<22:26,  1.73s/it, loss=0.059, lr=1e-5]Steps:  95%|█████████▍| 14223/15001 [9:07:10<23:03,  1.78s/it, loss=0.059, lr=1e-5]Steps:  95%|█████████▍| 14223/15001 [9:07:11<23:03,  1.78s/it, loss=0.094, lr=1e-5]Steps:  95%|█████████▍| 14224/15001 [9:07:12<24:21,  1.88s/it, loss=0.094, lr=1e-5]Steps:  95%|█████████▍| 14224/15001 [9:07:12<24:21,  1.88s/it, loss=0.176, lr=1e-5]Steps:  95%|█████████▍| 14225/15001 [9:07:14<24:15,  1.88s/it, loss=0.176, lr=1e-5]Steps:  95%|█████████▍| 14225/15001 [9:07:14<24:15,  1.88s/it, loss=0.124, lr=1e-5]Steps:  95%|█████████▍| 14226/15001 [9:07:16<23:28,  1.82s/it, loss=0.124, lr=1e-5]Steps:  95%|█████████▍| 14226/15001 [9:07:16<23:28,  1.82s/it, loss=0.0516, lr=1e-5]Steps:  95%|█████████▍| 14227/15001 [9:07:18<25:04,  1.94s/it, loss=0.0516, lr=1e-5]Steps:  95%|█████████▍| 14227/15001 [9:07:18<25:04,  1.94s/it, loss=0.0815, lr=1e-5]Steps:  95%|█████████▍| 14228/15001 [9:07:20<25:03,  1.94s/it, loss=0.0815, lr=1e-5]Steps:  95%|█████████▍| 14228/15001 [9:07:20<25:03,  1.94s/it, loss=0.154, lr=1e-5] Steps:  95%|█████████▍| 14229/15001 [9:07:22<24:50,  1.93s/it, loss=0.154, lr=1e-5]Steps:  95%|█████████▍| 14229/15001 [9:07:22<24:50,  1.93s/it, loss=0.0421, lr=1e-5]Steps:  95%|█████████▍| 14230/15001 [9:07:24<26:00,  2.02s/it, loss=0.0421, lr=1e-5]Steps:  95%|█████████▍| 14230/15001 [9:07:24<26:00,  2.02s/it, loss=0.282, lr=1e-5] Steps:  95%|█████████▍| 14231/15001 [9:07:26<26:09,  2.04s/it, loss=0.282, lr=1e-5]Steps:  95%|█████████▍| 14231/15001 [9:07:26<26:09,  2.04s/it, loss=0.227, lr=1e-5]Steps:  95%|█████████▍| 14232/15001 [9:07:28<24:47,  1.93s/it, loss=0.227, lr=1e-5]Steps:  95%|█████████▍| 14232/15001 [9:07:28<24:47,  1.93s/it, loss=0.205, lr=1e-5]Steps:  95%|█████████▍| 14233/15001 [9:07:30<25:01,  1.96s/it, loss=0.205, lr=1e-5]Steps:  95%|█████████▍| 14233/15001 [9:07:30<25:01,  1.96s/it, loss=0.137, lr=1e-5]Steps:  95%|█████████▍| 14234/15001 [9:07:32<23:51,  1.87s/it, loss=0.137, lr=1e-5]Steps:  95%|█████████▍| 14234/15001 [9:07:32<23:51,  1.87s/it, loss=0.115, lr=1e-5]Steps:  95%|█████████▍| 14235/15001 [9:07:34<24:24,  1.91s/it, loss=0.115, lr=1e-5]Steps:  95%|█████████▍| 14235/15001 [9:07:34<24:24,  1.91s/it, loss=0.286, lr=1e-5]Steps:  95%|█████████▍| 14236/15001 [9:07:36<24:27,  1.92s/it, loss=0.286, lr=1e-5]Steps:  95%|█████████▍| 14236/15001 [9:07:36<24:27,  1.92s/it, loss=0.335, lr=1e-5]Steps:  95%|█████████▍| 14237/15001 [9:07:37<23:44,  1.86s/it, loss=0.335, lr=1e-5]Steps:  95%|█████████▍| 14237/15001 [9:07:37<23:44,  1.86s/it, loss=0.295, lr=1e-5]Steps:  95%|█████████▍| 14238/15001 [9:07:39<23:31,  1.85s/it, loss=0.295, lr=1e-5]Steps:  95%|█████████▍| 14238/15001 [9:07:39<23:31,  1.85s/it, loss=0.142, lr=1e-5]Steps:  95%|█████████▍| 14239/15001 [9:07:41<22:18,  1.76s/it, loss=0.142, lr=1e-5]Steps:  95%|█████████▍| 14239/15001 [9:07:41<22:18,  1.76s/it, loss=0.291, lr=1e-5]Steps:  95%|█████████▍| 14240/15001 [9:07:43<23:02,  1.82s/it, loss=0.291, lr=1e-5]Steps:  95%|█████████▍| 14240/15001 [9:07:43<23:02,  1.82s/it, loss=0.282, lr=1e-5]Steps:  95%|█████████▍| 14241/15001 [9:07:45<23:07,  1.83s/it, loss=0.282, lr=1e-5]Steps:  95%|█████████▍| 14241/15001 [9:07:45<23:07,  1.83s/it, loss=0.157, lr=1e-5]Steps:  95%|█████████▍| 14242/15001 [9:07:46<23:25,  1.85s/it, loss=0.157, lr=1e-5]Steps:  95%|█████████▍| 14242/15001 [9:07:47<23:25,  1.85s/it, loss=0.0959, lr=1e-5]Steps:  95%|█████████▍| 14243/15001 [9:07:48<23:11,  1.84s/it, loss=0.0959, lr=1e-5]Steps:  95%|█████████▍| 14243/15001 [9:07:48<23:11,  1.84s/it, loss=0.292, lr=1e-5] Steps:  95%|█████████▍| 14244/15001 [9:07:50<22:50,  1.81s/it, loss=0.292, lr=1e-5]Steps:  95%|█████████▍| 14244/15001 [9:07:50<22:50,  1.81s/it, loss=0.0621, lr=1e-5]Steps:  95%|█████████▍| 14245/15001 [9:07:52<23:07,  1.84s/it, loss=0.0621, lr=1e-5]Steps:  95%|█████████▍| 14245/15001 [9:07:52<23:07,  1.84s/it, loss=0.198, lr=1e-5] Steps:  95%|█████████▍| 14246/15001 [9:07:54<23:11,  1.84s/it, loss=0.198, lr=1e-5]Steps:  95%|█████████▍| 14246/15001 [9:07:54<23:11,  1.84s/it, loss=0.301, lr=1e-5]Steps:  95%|█████████▍| 14247/15001 [9:07:56<23:07,  1.84s/it, loss=0.301, lr=1e-5]Steps:  95%|█��███████▍| 14247/15001 [9:07:56<23:07,  1.84s/it, loss=0.0292, lr=1e-5]Steps:  95%|█████████▍| 14248/15001 [9:07:57<23:17,  1.86s/it, loss=0.0292, lr=1e-5]Steps:  95%|█████████▍| 14248/15001 [9:07:58<23:17,  1.86s/it, loss=0.128, lr=1e-5] Steps:  95%|█████████▍| 14249/15001 [9:07:59<23:18,  1.86s/it, loss=0.128, lr=1e-5]Steps:  95%|█████████▍| 14249/15001 [9:08:00<23:18,  1.86s/it, loss=0.0767, lr=1e-5]Steps:  95%|█████████▍| 14250/15001 [9:08:01<24:15,  1.94s/it, loss=0.0767, lr=1e-5]Steps:  95%|█████████▍| 14250/15001 [9:08:02<24:15,  1.94s/it, loss=0.185, lr=1e-5] Steps:  95%|█████████▌| 14251/15001 [9:08:04<24:48,  1.98s/it, loss=0.185, lr=1e-5]Steps:  95%|█████████▌| 14251/15001 [9:08:04<24:48,  1.98s/it, loss=0.056, lr=1e-5]Steps:  95%|█████████▌| 14252/15001 [9:08:05<24:09,  1.94s/it, loss=0.056, lr=1e-5]Steps:  95%|█████████▌| 14252/15001 [9:08:06<24:09,  1.94s/it, loss=0.142, lr=1e-5]Steps:  95%|█████████▌| 14253/15001 [9:08:07<24:19,  1.95s/it, loss=0.142, lr=1e-5]Steps:  95%|█████████▌| 14253/15001 [9:08:08<24:19,  1.95s/it, loss=0.118, lr=1e-5]Steps:  95%|█████████▌| 14254/15001 [9:08:09<24:19,  1.95s/it, loss=0.118, lr=1e-5]Steps:  95%|█████████▌| 14254/15001 [9:08:10<24:19,  1.95s/it, loss=0.0645, lr=1e-5]Steps:  95%|█████████▌| 14255/15001 [9:08:11<23:40,  1.90s/it, loss=0.0645, lr=1e-5]Steps:  95%|█████████▌| 14255/15001 [9:08:11<23:40,  1.90s/it, loss=0.134, lr=1e-5] Steps:  95%|█████████▌| 14256/15001 [9:08:13<22:49,  1.84s/it, loss=0.134, lr=1e-5]Steps:  95%|█████████▌| 14256/15001 [9:08:13<22:49,  1.84s/it, loss=0.15, lr=1e-5] Steps:  95%|█████████▌| 14257/15001 [9:08:15<23:54,  1.93s/it, loss=0.15, lr=1e-5]Steps:  95%|█████████▌| 14257/15001 [9:08:15<23:54,  1.93s/it, loss=0.185, lr=1e-5]Steps:  95%|█████████▌| 14258/15001 [9:08:17<23:25,  1.89s/it, loss=0.185, lr=1e-5]Steps:  95%|█████████▌| 14258/15001 [9:08:17<23:25,  1.89s/it, loss=0.197, lr=1e-5]Steps:  95%|█████████▌| 14259/15001 [9:08:19<23:00,  1.86s/it, loss=0.197, lr=1e-5]Steps:  95%|█████████▌| 14259/15001 [9:08:19<23:00,  1.86s/it, loss=0.292, lr=1e-5]Steps:  95%|█████████▌| 14260/15001 [9:08:20<22:12,  1.80s/it, loss=0.292, lr=1e-5]Steps:  95%|█████████▌| 14260/15001 [9:08:20<22:12,  1.80s/it, loss=0.221, lr=1e-5]Steps:  95%|█████████▌| 14261/15001 [9:08:22<22:44,  1.84s/it, loss=0.221, lr=1e-5]Steps:  95%|█████████▌| 14261/15001 [9:08:22<22:44,  1.84s/it, loss=0.14, lr=1e-5] Steps:  95%|█████████▌| 14262/15001 [9:08:24<22:31,  1.83s/it, loss=0.14, lr=1e-5]Steps:  95%|█████████▌| 14262/15001 [9:08:24<22:31,  1.83s/it, loss=0.0853, lr=1e-5]Steps:  95%|█████████▌| 14263/15001 [9:08:26<22:02,  1.79s/it, loss=0.0853, lr=1e-5]Steps:  95%|█████████▌| 14263/15001 [9:08:26<22:02,  1.79s/it, loss=0.195, lr=1e-5] Steps:  95%|█████████▌| 14264/15001 [9:08:27<22:15,  1.81s/it, loss=0.195, lr=1e-5]Steps:  95%|█████████▌| 14264/15001 [9:08:28<22:15,  1.81s/it, loss=0.171, lr=1e-5]Steps:  95%|█████████▌| 14265/15001 [9:08:29<21:41,  1.77s/it, loss=0.171, lr=1e-5]Steps:  95%|█████████▌| 14265/15001 [9:08:29<21:41,  1.77s/it, loss=0.201, lr=1e-5]Steps:  95%|█████████▌| 14266/15001 [9:08:31<22:27,  1.83s/it, loss=0.201, lr=1e-5]Steps:  95%|█████████▌| 14266/15001 [9:08:31<22:27,  1.83s/it, loss=0.181, lr=1e-5]Steps:  95%|█████████▌| 14267/15001 [9:08:33<22:05,  1.81s/it, loss=0.181, lr=1e-5]Steps:  95%|█████████▌| 14267/15001 [9:08:33<22:05,  1.81s/it, loss=0.108, lr=1e-5]Steps:  95%|█████████▌| 14268/15001 [9:08:35<21:23,  1.75s/it, loss=0.108, lr=1e-5]Steps:  95%|█████████▌| 14268/15001 [9:08:35<21:23,  1.75s/it, loss=0.0458, lr=1e-5]Steps:  95%|█████████▌| 14269/15001 [9:08:37<22:30,  1.85s/it, loss=0.0458, lr=1e-5]Steps:  95%|█████████▌| 14269/15001 [9:08:37<22:30,  1.85s/it, loss=0.112, lr=1e-5] Steps:  95%|█████████▌| 14270/15001 [9:08:38<21:29,  1.76s/it, loss=0.112, lr=1e-5]Steps:  95%|█████████▌| 14270/15001 [9:08:38<21:29,  1.76s/it, loss=0.0973, lr=1e-5]Steps:  95%|█████████▌| 14271/15001 [9:08:40<22:13,  1.83s/it, loss=0.0973, lr=1e-5]Steps:  95%|█████████▌| 14271/15001 [9:08:40<22:13,  1.83s/it, loss=0.116, lr=1e-5] Steps:  95%|████���████▌| 14272/15001 [9:08:42<23:34,  1.94s/it, loss=0.116, lr=1e-5]Steps:  95%|█████████▌| 14272/15001 [9:08:42<23:34,  1.94s/it, loss=0.133, lr=1e-5]Steps:  95%|█████████▌| 14273/15001 [9:08:44<23:35,  1.95s/it, loss=0.133, lr=1e-5]Steps:  95%|█████████▌| 14273/15001 [9:08:44<23:35,  1.95s/it, loss=0.163, lr=1e-5]Steps:  95%|█████████▌| 14274/15001 [9:08:46<23:42,  1.96s/it, loss=0.163, lr=1e-5]Steps:  95%|█████████▌| 14274/15001 [9:08:46<23:42,  1.96s/it, loss=0.00705, lr=1e-5]Steps:  95%|█████████▌| 14275/15001 [9:08:48<23:08,  1.91s/it, loss=0.00705, lr=1e-5]Steps:  95%|█████████▌| 14275/15001 [9:08:48<23:08,  1.91s/it, loss=0.213, lr=1e-5]  Steps:  95%|█████████▌| 14276/15001 [9:08:50<24:09,  2.00s/it, loss=0.213, lr=1e-5]Steps:  95%|█████████▌| 14276/15001 [9:08:50<24:09,  2.00s/it, loss=0.137, lr=1e-5]Steps:  95%|█████████▌| 14277/15001 [9:08:52<23:25,  1.94s/it, loss=0.137, lr=1e-5]Steps:  95%|█████████▌| 14277/15001 [9:08:52<23:25,  1.94s/it, loss=0.194, lr=1e-5]Steps:  95%|█████████▌| 14278/15001 [9:08:54<23:33,  1.95s/it, loss=0.194, lr=1e-5]Steps:  95%|█████████▌| 14278/15001 [9:08:54<23:33,  1.95s/it, loss=0.294, lr=1e-5]Steps:  95%|█████████▌| 14279/15001 [9:08:56<23:15,  1.93s/it, loss=0.294, lr=1e-5]Steps:  95%|█████████▌| 14279/15001 [9:08:56<23:15,  1.93s/it, loss=0.0757, lr=1e-5]Steps:  95%|█████████▌| 14280/15001 [9:08:58<21:51,  1.82s/it, loss=0.0757, lr=1e-5]Steps:  95%|█████████▌| 14280/15001 [9:08:58<21:51,  1.82s/it, loss=0.213, lr=1e-5] Steps:  95%|█████████▌| 14281/15001 [9:08:59<22:11,  1.85s/it, loss=0.213, lr=1e-5]Steps:  95%|█████████▌| 14281/15001 [9:08:59<22:11,  1.85s/it, loss=0.242, lr=1e-5]Steps:  95%|█████████▌| 14282/15001 [9:09:01<21:35,  1.80s/it, loss=0.242, lr=1e-5]Steps:  95%|█████████▌| 14282/15001 [9:09:01<21:35,  1.80s/it, loss=0.146, lr=1e-5]Steps:  95%|█████████▌| 14283/15001 [9:09:03<21:49,  1.82s/it, loss=0.146, lr=1e-5]Steps:  95%|█████████▌| 14283/15001 [9:09:03<21:49,  1.82s/it, loss=0.00656, lr=1e-5]Steps:  95%|█████████▌| 14284/15001 [9:09:05<22:21,  1.87s/it, loss=0.00656, lr=1e-5]Steps:  95%|█████████▌| 14284/15001 [9:09:05<22:21,  1.87s/it, loss=0.186, lr=1e-5]  Steps:  95%|█████████▌| 14285/15001 [9:09:07<22:04,  1.85s/it, loss=0.186, lr=1e-5]Steps:  95%|█████████▌| 14285/15001 [9:09:07<22:04,  1.85s/it, loss=0.111, lr=1e-5]Steps:  95%|█████████▌| 14286/15001 [9:09:09<21:43,  1.82s/it, loss=0.111, lr=1e-5]Steps:  95%|█████████▌| 14286/15001 [9:09:09<21:43,  1.82s/it, loss=0.182, lr=1e-5]Steps:  95%|█████████▌| 14287/15001 [9:09:10<21:59,  1.85s/it, loss=0.182, lr=1e-5]Steps:  95%|█████████▌| 14287/15001 [9:09:11<21:59,  1.85s/it, loss=0.125, lr=1e-5]Steps:  95%|█████████▌| 14288/15001 [9:09:12<21:38,  1.82s/it, loss=0.125, lr=1e-5]Steps:  95%|█████████▌| 14288/15001 [9:09:12<21:38,  1.82s/it, loss=0.109, lr=1e-5]Steps:  95%|█████████▌| 14289/15001 [9:09:14<21:41,  1.83s/it, loss=0.109, lr=1e-5]Steps:  95%|█████████▌| 14289/15001 [9:09:14<21:41,  1.83s/it, loss=0.195, lr=1e-5]Steps:  95%|█████████▌| 14290/15001 [9:09:16<21:39,  1.83s/it, loss=0.195, lr=1e-5]Steps:  95%|█████████▌| 14290/15001 [9:09:16<21:39,  1.83s/it, loss=0.16, lr=1e-5] Steps:  95%|█████████▌| 14291/15001 [9:09:17<20:34,  1.74s/it, loss=0.16, lr=1e-5]Steps:  95%|█████████▌| 14291/15001 [9:09:18<20:34,  1.74s/it, loss=0.172, lr=1e-5]Steps:  95%|█████████▌| 14292/15001 [9:09:19<21:18,  1.80s/it, loss=0.172, lr=1e-5]Steps:  95%|█████████▌| 14292/15001 [9:09:20<21:18,  1.80s/it, loss=0.238, lr=1e-5]Steps:  95%|█████████▌| 14293/15001 [9:09:21<21:22,  1.81s/it, loss=0.238, lr=1e-5]Steps:  95%|█████████▌| 14293/15001 [9:09:22<21:22,  1.81s/it, loss=0.369, lr=1e-5]Steps:  95%|█████████▌| 14294/15001 [9:09:23<22:20,  1.90s/it, loss=0.369, lr=1e-5]Steps:  95%|█████████▌| 14294/15001 [9:09:24<22:20,  1.90s/it, loss=0.155, lr=1e-5]Steps:  95%|█████████▌| 14295/15001 [9:09:26<23:39,  2.01s/it, loss=0.155, lr=1e-5]Steps:  95%|█████████▌| 14295/15001 [9:09:26<23:39,  2.01s/it, loss=0.193, lr=1e-5]Steps:  95%|█████████▌| 14296/15001 [9:09:27<23:16,  1.98s/it, loss=0.193, lr=1e-5]Steps:  95%|███████��█▌| 14296/15001 [9:09:28<23:16,  1.98s/it, loss=0.0199, lr=1e-5]Steps:  95%|█████████▌| 14297/15001 [9:09:29<23:15,  1.98s/it, loss=0.0199, lr=1e-5]Steps:  95%|█████████▌| 14297/15001 [9:09:30<23:15,  1.98s/it, loss=0.0379, lr=1e-5]Steps:  95%|█████████▌| 14298/15001 [9:09:32<23:55,  2.04s/it, loss=0.0379, lr=1e-5]Steps:  95%|█████████▌| 14298/15001 [9:09:32<23:55,  2.04s/it, loss=0.0421, lr=1e-5]Steps:  95%|█████████▌| 14299/15001 [9:09:34<23:55,  2.05s/it, loss=0.0421, lr=1e-5]Steps:  95%|█████████▌| 14299/15001 [9:09:34<23:55,  2.05s/it, loss=0.0935, lr=1e-5]Steps:  95%|█████████▌| 14300/15001 [9:09:35<23:04,  1.97s/it, loss=0.0935, lr=1e-5]Steps:  95%|█████████▌| 14300/15001 [9:09:36<23:04,  1.97s/it, loss=0.0281, lr=1e-5]Steps:  95%|█████████▌| 14301/15001 [9:09:37<21:59,  1.89s/it, loss=0.0281, lr=1e-5]Steps:  95%|█████████▌| 14301/15001 [9:09:37<21:59,  1.89s/it, loss=0.0538, lr=1e-5]Steps:  95%|█████████▌| 14302/15001 [9:09:39<22:13,  1.91s/it, loss=0.0538, lr=1e-5]Steps:  95%|█████████▌| 14302/15001 [9:09:39<22:13,  1.91s/it, loss=0.157, lr=1e-5] Steps:  95%|█████████▌| 14303/15001 [9:09:41<21:55,  1.89s/it, loss=0.157, lr=1e-5]Steps:  95%|█████████▌| 14303/15001 [9:09:41<21:55,  1.89s/it, loss=0.234, lr=1e-5]Steps:  95%|█████████▌| 14304/15001 [9:09:43<21:50,  1.88s/it, loss=0.234, lr=1e-5]Steps:  95%|█████████▌| 14304/15001 [9:09:43<21:50,  1.88s/it, loss=0.31, lr=1e-5] Steps:  95%|█████████▌| 14305/15001 [9:09:45<21:17,  1.84s/it, loss=0.31, lr=1e-5]Steps:  95%|█████████▌| 14305/15001 [9:09:45<21:17,  1.84s/it, loss=0.274, lr=1e-5]Steps:  95%|█████████▌| 14306/15001 [9:09:46<20:49,  1.80s/it, loss=0.274, lr=1e-5]Steps:  95%|█████████▌| 14306/15001 [9:09:47<20:49,  1.80s/it, loss=0.175, lr=1e-5]Steps:  95%|█████████▌| 14307/15001 [9:09:48<20:43,  1.79s/it, loss=0.175, lr=1e-5]Steps:  95%|█████████▌| 14307/15001 [9:09:48<20:43,  1.79s/it, loss=0.105, lr=1e-5]Steps:  95%|█████████▌| 14308/15001 [9:09:50<21:15,  1.84s/it, loss=0.105, lr=1e-5]Steps:  95%|█████████▌| 14308/15001 [9:09:50<21:15,  1.84s/it, loss=0.0433, lr=1e-5]Steps:  95%|█████████▌| 14309/15001 [9:09:52<21:14,  1.84s/it, loss=0.0433, lr=1e-5]Steps:  95%|█████████▌| 14309/15001 [9:09:52<21:14,  1.84s/it, loss=0.0912, lr=1e-5]Steps:  95%|█████████▌| 14310/15001 [9:09:54<20:44,  1.80s/it, loss=0.0912, lr=1e-5]Steps:  95%|█████████▌| 14310/15001 [9:09:54<20:44,  1.80s/it, loss=0.0789, lr=1e-5]Steps:  95%|█████████▌| 14311/15001 [9:09:55<20:46,  1.81s/it, loss=0.0789, lr=1e-5]Steps:  95%|█████████▌| 14311/15001 [9:09:56<20:46,  1.81s/it, loss=0.141, lr=1e-5] Steps:  95%|█████████▌| 14312/15001 [9:09:57<20:56,  1.82s/it, loss=0.141, lr=1e-5]Steps:  95%|█████████▌| 14312/15001 [9:09:57<20:56,  1.82s/it, loss=0.334, lr=1e-5]Steps:  95%|█████████▌| 14313/15001 [9:09:59<20:38,  1.80s/it, loss=0.334, lr=1e-5]Steps:  95%|█████████▌| 14313/15001 [9:09:59<20:38,  1.80s/it, loss=0.251, lr=1e-5]Steps:  95%|█████████▌| 14314/15001 [9:10:01<21:29,  1.88s/it, loss=0.251, lr=1e-5]Steps:  95%|█████████▌| 14314/15001 [9:10:01<21:29,  1.88s/it, loss=0.131, lr=1e-5]Steps:  95%|█████████▌| 14315/15001 [9:10:03<21:06,  1.85s/it, loss=0.131, lr=1e-5]Steps:  95%|█████████▌| 14315/15001 [9:10:03<21:06,  1.85s/it, loss=0.189, lr=1e-5]Steps:  95%|█████████▌| 14316/15001 [9:10:05<20:49,  1.82s/it, loss=0.189, lr=1e-5]Steps:  95%|█████████▌| 14316/15001 [9:10:05<20:49,  1.82s/it, loss=0.158, lr=1e-5]Steps:  95%|█████████▌| 14317/15001 [9:10:07<21:37,  1.90s/it, loss=0.158, lr=1e-5]Steps:  95%|█████████▌| 14317/15001 [9:10:07<21:37,  1.90s/it, loss=0.0862, lr=1e-5]Steps:  95%|█████████▌| 14318/15001 [9:10:09<22:16,  1.96s/it, loss=0.0862, lr=1e-5]Steps:  95%|█████████▌| 14318/15001 [9:10:09<22:16,  1.96s/it, loss=0.158, lr=1e-5] Steps:  95%|█████████▌| 14319/15001 [9:10:11<22:00,  1.94s/it, loss=0.158, lr=1e-5]Steps:  95%|█████████▌| 14319/15001 [9:10:11<22:00,  1.94s/it, loss=0.178, lr=1e-5]Steps:  95%|█████████▌| 14320/15001 [9:10:13<21:53,  1.93s/it, loss=0.178, lr=1e-5]Steps:  95%|█████████▌| 14320/15001 [9:10:13<21:53,  1.93s/it, loss=0.233, lr=1e-5]Steps:  95%|████████���▌| 14321/15001 [9:10:15<22:06,  1.95s/it, loss=0.233, lr=1e-5]Steps:  95%|█████████▌| 14321/15001 [9:10:15<22:06,  1.95s/it, loss=0.0686, lr=1e-5]Steps:  95%|█████████▌| 14322/15001 [9:10:17<22:11,  1.96s/it, loss=0.0686, lr=1e-5]Steps:  95%|█████████▌| 14322/15001 [9:10:17<22:11,  1.96s/it, loss=0.0365, lr=1e-5]Steps:  95%|█████████▌| 14323/15001 [9:10:18<21:55,  1.94s/it, loss=0.0365, lr=1e-5]Steps:  95%|█████████▌| 14323/15001 [9:10:19<21:55,  1.94s/it, loss=0.138, lr=1e-5] Steps:  95%|█████████▌| 14324/15001 [9:10:20<21:35,  1.91s/it, loss=0.138, lr=1e-5]Steps:  95%|█████████▌| 14324/15001 [9:10:21<21:35,  1.91s/it, loss=0.319, lr=1e-5]Steps:  95%|█████████▌| 14325/15001 [9:10:22<21:06,  1.87s/it, loss=0.319, lr=1e-5]Steps:  95%|█████████▌| 14325/15001 [9:10:22<21:06,  1.87s/it, loss=0.255, lr=1e-5]Steps:  96%|█████████▌| 14326/15001 [9:10:24<21:05,  1.87s/it, loss=0.255, lr=1e-5]Steps:  96%|█████████▌| 14326/15001 [9:10:24<21:05,  1.87s/it, loss=0.411, lr=1e-5]Steps:  96%|█████████▌| 14327/15001 [9:10:26<20:45,  1.85s/it, loss=0.411, lr=1e-5]Steps:  96%|█████████▌| 14327/15001 [9:10:26<20:45,  1.85s/it, loss=0.293, lr=1e-5]Steps:  96%|█████████▌| 14328/15001 [9:10:28<20:39,  1.84s/it, loss=0.293, lr=1e-5]Steps:  96%|█████████▌| 14328/15001 [9:10:28<20:39,  1.84s/it, loss=0.0637, lr=1e-5]Steps:  96%|█████████▌| 14329/15001 [9:10:29<19:58,  1.78s/it, loss=0.0637, lr=1e-5]Steps:  96%|█████████▌| 14329/15001 [9:10:30<19:58,  1.78s/it, loss=0.0858, lr=1e-5]Steps:  96%|█████████▌| 14330/15001 [9:10:31<20:53,  1.87s/it, loss=0.0858, lr=1e-5]Steps:  96%|█████████▌| 14330/15001 [9:10:31<20:53,  1.87s/it, loss=0.285, lr=1e-5] Steps:  96%|█████████▌| 14331/15001 [9:10:33<20:09,  1.81s/it, loss=0.285, lr=1e-5]Steps:  96%|█████████▌| 14331/15001 [9:10:33<20:09,  1.81s/it, loss=0.0822, lr=1e-5]Steps:  96%|█████████▌| 14332/15001 [9:10:35<20:47,  1.86s/it, loss=0.0822, lr=1e-5]Steps:  96%|█████████▌| 14332/15001 [9:10:35<20:47,  1.86s/it, loss=0.296, lr=1e-5] Steps:  96%|█████████▌| 14333/15001 [9:10:37<19:52,  1.78s/it, loss=0.296, lr=1e-5]Steps:  96%|█████████▌| 14333/15001 [9:10:37<19:52,  1.78s/it, loss=0.176, lr=1e-5]Steps:  96%|█████████▌| 14334/15001 [9:10:38<19:51,  1.79s/it, loss=0.176, lr=1e-5]Steps:  96%|█████████▌| 14334/15001 [9:10:38<19:51,  1.79s/it, loss=0.17, lr=1e-5] Steps:  96%|█████████▌| 14335/15001 [9:10:40<20:09,  1.82s/it, loss=0.17, lr=1e-5]Steps:  96%|█████████▌| 14335/15001 [9:10:40<20:09,  1.82s/it, loss=0.195, lr=1e-5]Steps:  96%|█████████▌| 14336/15001 [9:10:42<19:51,  1.79s/it, loss=0.195, lr=1e-5]Steps:  96%|█████████▌| 14336/15001 [9:10:42<19:51,  1.79s/it, loss=0.406, lr=1e-5]Steps:  96%|█████████▌| 14337/15001 [9:10:44<19:44,  1.78s/it, loss=0.406, lr=1e-5]Steps:  96%|█████████▌| 14337/15001 [9:10:44<19:44,  1.78s/it, loss=0.213, lr=1e-5]Steps:  96%|█████████▌| 14338/15001 [9:10:45<19:44,  1.79s/it, loss=0.213, lr=1e-5]Steps:  96%|█████████▌| 14338/15001 [9:10:46<19:44,  1.79s/it, loss=0.474, lr=1e-5]Steps:  96%|█████████▌| 14339/15001 [9:10:47<20:24,  1.85s/it, loss=0.474, lr=1e-5]Steps:  96%|█████████▌| 14339/15001 [9:10:48<20:24,  1.85s/it, loss=0.269, lr=1e-5]Steps:  96%|█████████▌| 14340/15001 [9:10:49<20:42,  1.88s/it, loss=0.269, lr=1e-5]Steps:  96%|█████████▌| 14340/15001 [9:10:50<20:42,  1.88s/it, loss=0.151, lr=1e-5]Steps:  96%|█████████▌| 14341/15001 [9:10:51<20:13,  1.84s/it, loss=0.151, lr=1e-5]Steps:  96%|█████████▌| 14341/15001 [9:10:51<20:13,  1.84s/it, loss=0.157, lr=1e-5]Steps:  96%|█████████▌| 14342/15001 [9:10:53<21:17,  1.94s/it, loss=0.157, lr=1e-5]Steps:  96%|█████████▌| 14342/15001 [9:10:53<21:17,  1.94s/it, loss=0.0747, lr=1e-5]Steps:  96%|█████████▌| 14343/15001 [9:10:55<21:26,  1.96s/it, loss=0.0747, lr=1e-5]Steps:  96%|█████████▌| 14343/15001 [9:10:55<21:26,  1.96s/it, loss=0.151, lr=1e-5] Steps:  96%|█████████▌| 14344/15001 [9:10:57<21:17,  1.94s/it, loss=0.151, lr=1e-5]Steps:  96%|█████████▌| 14344/15001 [9:10:57<21:17,  1.94s/it, loss=0.0239, lr=1e-5]Steps:  96%|█████████▌| 14345/15001 [9:10:59<21:23,  1.96s/it, loss=0.0239, lr=1e-5]Steps:  96%|█████████▌| 14345/15001 [9:10:59<21:23,  1.96s/it, loss=0.131, lr=1e-5] Steps:  96%|█████████▌| 14346/15001 [9:11:01<20:45,  1.90s/it, loss=0.131, lr=1e-5]Steps:  96%|█████████▌| 14346/15001 [9:11:01<20:45,  1.90s/it, loss=0.31, lr=1e-5] Steps:  96%|█████████▌| 14347/15001 [9:11:03<20:47,  1.91s/it, loss=0.31, lr=1e-5]Steps:  96%|█████████▌| 14347/15001 [9:11:03<20:47,  1.91s/it, loss=0.0773, lr=1e-5]Steps:  96%|█████████▌| 14348/15001 [9:11:05<20:21,  1.87s/it, loss=0.0773, lr=1e-5]Steps:  96%|█████████▌| 14348/15001 [9:11:05<20:21,  1.87s/it, loss=0.206, lr=1e-5] Steps:  96%|█████████▌| 14349/15001 [9:11:06<19:40,  1.81s/it, loss=0.206, lr=1e-5]Steps:  96%|█████████▌| 14349/15001 [9:11:07<19:40,  1.81s/it, loss=0.267, lr=1e-5]Steps:  96%|█████████▌| 14350/15001 [9:11:08<20:22,  1.88s/it, loss=0.267, lr=1e-5]Steps:  96%|█████████▌| 14350/15001 [9:11:09<20:22,  1.88s/it, loss=0.278, lr=1e-5]Steps:  96%|█████████▌| 14351/15001 [9:11:10<19:44,  1.82s/it, loss=0.278, lr=1e-5]Steps:  96%|█████████▌| 14351/15001 [9:11:10<19:44,  1.82s/it, loss=0.0953, lr=1e-5]Steps:  96%|█████████▌| 14352/15001 [9:11:12<19:39,  1.82s/it, loss=0.0953, lr=1e-5]Steps:  96%|█████████▌| 14352/15001 [9:11:12<19:39,  1.82s/it, loss=0.1, lr=1e-5]   Steps:  96%|█████████▌| 14353/15001 [9:11:14<19:49,  1.84s/it, loss=0.1, lr=1e-5]Steps:  96%|█████████▌| 14353/15001 [9:11:14<19:49,  1.84s/it, loss=0.186, lr=1e-5]Steps:  96%|█████████▌| 14354/15001 [9:11:16<20:05,  1.86s/it, loss=0.186, lr=1e-5]Steps:  96%|█████████▌| 14354/15001 [9:11:16<20:05,  1.86s/it, loss=0.101, lr=1e-5]Steps:  96%|█████████▌| 14355/15001 [9:11:17<19:05,  1.77s/it, loss=0.101, lr=1e-5]Steps:  96%|█████████▌| 14355/15001 [9:11:18<19:05,  1.77s/it, loss=0.244, lr=1e-5]Steps:  96%|█████████▌| 14356/15001 [9:11:19<19:24,  1.81s/it, loss=0.244, lr=1e-5]Steps:  96%|█████████▌| 14356/15001 [9:11:19<19:24,  1.81s/it, loss=0.0993, lr=1e-5]Steps:  96%|█████████▌| 14357/15001 [9:11:21<18:51,  1.76s/it, loss=0.0993, lr=1e-5]Steps:  96%|█████████▌| 14357/15001 [9:11:21<18:51,  1.76s/it, loss=0.112, lr=1e-5] Steps:  96%|█████████▌| 14358/15001 [9:11:23<19:33,  1.83s/it, loss=0.112, lr=1e-5]Steps:  96%|█████████▌| 14358/15001 [9:11:23<19:33,  1.83s/it, loss=0.132, lr=1e-5]Steps:  96%|█████████▌| 14359/15001 [9:11:25<19:55,  1.86s/it, loss=0.132, lr=1e-5]Steps:  96%|█████████▌| 14359/15001 [9:11:25<19:55,  1.86s/it, loss=0.12, lr=1e-5] Steps:  96%|█████████▌| 14360/15001 [9:11:26<18:52,  1.77s/it, loss=0.12, lr=1e-5]Steps:  96%|█████████▌| 14360/15001 [9:11:27<18:52,  1.77s/it, loss=0.0293, lr=1e-5]Steps:  96%|█████████▌| 14361/15001 [9:11:29<20:46,  1.95s/it, loss=0.0293, lr=1e-5]Steps:  96%|█████████▌| 14361/15001 [9:11:29<20:46,  1.95s/it, loss=0.217, lr=1e-5] Steps:  96%|█████████▌| 14362/15001 [9:11:31<20:28,  1.92s/it, loss=0.217, lr=1e-5]Steps:  96%|█████████▌| 14362/15001 [9:11:31<20:28,  1.92s/it, loss=0.0782, lr=1e-5]Steps:  96%|█████████▌| 14363/15001 [9:11:32<20:18,  1.91s/it, loss=0.0782, lr=1e-5]Steps:  96%|█████████▌| 14363/15001 [9:11:33<20:18,  1.91s/it, loss=0.156, lr=1e-5] Steps:  96%|█████████▌| 14364/15001 [9:11:34<19:45,  1.86s/it, loss=0.156, lr=1e-5]Steps:  96%|█████████▌| 14364/15001 [9:11:35<19:45,  1.86s/it, loss=0.132, lr=1e-5]Steps:  96%|█████████▌| 14365/15001 [9:11:36<20:49,  1.97s/it, loss=0.132, lr=1e-5]Steps:  96%|█████████▌| 14365/15001 [9:11:37<20:49,  1.97s/it, loss=0.133, lr=1e-5]Steps:  96%|█████████▌| 14366/15001 [9:11:39<21:24,  2.02s/it, loss=0.133, lr=1e-5]Steps:  96%|█████████▌| 14366/15001 [9:11:39<21:24,  2.02s/it, loss=0.221, lr=1e-5]Steps:  96%|█████████▌| 14367/15001 [9:11:40<20:43,  1.96s/it, loss=0.221, lr=1e-5]Steps:  96%|█████████▌| 14367/15001 [9:11:41<20:43,  1.96s/it, loss=0.0905, lr=1e-5]Steps:  96%|█████████▌| 14368/15001 [9:11:43<21:37,  2.05s/it, loss=0.0905, lr=1e-5]Steps:  96%|█████████▌| 14368/15001 [9:11:43<21:37,  2.05s/it, loss=0.155, lr=1e-5] Steps:  96%|█████████▌| 14369/15001 [9:11:44<20:00,  1.90s/it, loss=0.155, lr=1e-5]Steps:  96%|█████████▌| 14369/15001 [9:11:44<20:00,  1.90s/it, loss=0.0975, lr=1e-5]Steps:  96%|█████████▌| 14370/15001 [9:11:46<20:18,  1.93s/it, loss=0.0975, lr=1e-5]Steps:  96%|█████████▌| 14370/15001 [9:11:46<20:18,  1.93s/it, loss=0.0286, lr=1e-5]Steps:  96%|█████████▌| 14371/15001 [9:11:48<20:22,  1.94s/it, loss=0.0286, lr=1e-5]Steps:  96%|█████████▌| 14371/15001 [9:11:48<20:22,  1.94s/it, loss=0.145, lr=1e-5] Steps:  96%|█████████▌| 14372/15001 [9:11:50<20:02,  1.91s/it, loss=0.145, lr=1e-5]Steps:  96%|█████████▌| 14372/15001 [9:11:50<20:02,  1.91s/it, loss=0.303, lr=1e-5]Steps:  96%|█████████▌| 14373/15001 [9:11:52<19:13,  1.84s/it, loss=0.303, lr=1e-5]Steps:  96%|█████████▌| 14373/15001 [9:11:52<19:13,  1.84s/it, loss=0.225, lr=1e-5]Steps:  96%|█████████▌| 14374/15001 [9:11:53<18:47,  1.80s/it, loss=0.225, lr=1e-5]Steps:  96%|█████████▌| 14374/15001 [9:11:54<18:47,  1.80s/it, loss=0.0754, lr=1e-5]Steps:  96%|█████████▌| 14375/15001 [9:11:55<19:23,  1.86s/it, loss=0.0754, lr=1e-5]Steps:  96%|█████████▌| 14375/15001 [9:11:55<19:23,  1.86s/it, loss=0.211, lr=1e-5] Steps:  96%|█████████▌| 14376/15001 [9:11:57<19:19,  1.85s/it, loss=0.211, lr=1e-5]Steps:  96%|█████████▌| 14376/15001 [9:11:57<19:19,  1.85s/it, loss=0.23, lr=1e-5] Steps:  96%|█████████▌| 14377/15001 [9:11:59<18:32,  1.78s/it, loss=0.23, lr=1e-5]Steps:  96%|█████████▌| 14377/15001 [9:11:59<18:32,  1.78s/it, loss=0.0164, lr=1e-5]Steps:  96%|█████████▌| 14378/15001 [9:12:01<18:27,  1.78s/it, loss=0.0164, lr=1e-5]Steps:  96%|█████████▌| 14378/15001 [9:12:01<18:27,  1.78s/it, loss=0.0655, lr=1e-5]Steps:  96%|█████████▌| 14379/15001 [9:12:02<18:33,  1.79s/it, loss=0.0655, lr=1e-5]Steps:  96%|█████████▌| 14379/15001 [9:12:03<18:33,  1.79s/it, loss=0.201, lr=1e-5] Steps:  96%|█████████▌| 14380/15001 [9:12:04<18:41,  1.81s/it, loss=0.201, lr=1e-5]Steps:  96%|█████████▌| 14380/15001 [9:12:04<18:41,  1.81s/it, loss=0.144, lr=1e-5]Steps:  96%|█████████▌| 14381/15001 [9:12:06<18:59,  1.84s/it, loss=0.144, lr=1e-5]Steps:  96%|█████████▌| 14381/15001 [9:12:06<18:59,  1.84s/it, loss=0.0211, lr=1e-5]Steps:  96%|█████████▌| 14382/15001 [9:12:08<18:53,  1.83s/it, loss=0.0211, lr=1e-5]Steps:  96%|█████████▌| 14382/15001 [9:12:08<18:53,  1.83s/it, loss=0.0883, lr=1e-5]Steps:  96%|█████████▌| 14383/15001 [9:12:10<18:44,  1.82s/it, loss=0.0883, lr=1e-5]Steps:  96%|█████████▌| 14383/15001 [9:12:10<18:44,  1.82s/it, loss=0.462, lr=1e-5] Steps:  96%|█████████▌| 14384/15001 [9:12:12<18:36,  1.81s/it, loss=0.462, lr=1e-5]Steps:  96%|█████████▌| 14384/15001 [9:12:12<18:36,  1.81s/it, loss=0.169, lr=1e-5]Steps:  96%|█████████▌| 14385/15001 [9:12:13<18:04,  1.76s/it, loss=0.169, lr=1e-5]Steps:  96%|█████████▌| 14385/15001 [9:12:13<18:04,  1.76s/it, loss=0.305, lr=1e-5]Steps:  96%|█████████▌| 14386/15001 [9:12:15<18:31,  1.81s/it, loss=0.305, lr=1e-5]Steps:  96%|█████████▌| 14386/15001 [9:12:15<18:31,  1.81s/it, loss=0.212, lr=1e-5]Steps:  96%|█████████▌| 14387/15001 [9:12:17<19:34,  1.91s/it, loss=0.212, lr=1e-5]Steps:  96%|█████████▌| 14387/15001 [9:12:17<19:34,  1.91s/it, loss=0.207, lr=1e-5]Steps:  96%|█████████▌| 14388/15001 [9:12:19<19:51,  1.94s/it, loss=0.207, lr=1e-5]Steps:  96%|█████████▌| 14388/15001 [9:12:19<19:51,  1.94s/it, loss=0.172, lr=1e-5]Steps:  96%|█████████▌| 14389/15001 [9:12:21<20:35,  2.02s/it, loss=0.172, lr=1e-5]Steps:  96%|█████████▌| 14389/15001 [9:12:22<20:35,  2.02s/it, loss=0.145, lr=1e-5]Steps:  96%|█████████▌| 14390/15001 [9:12:24<20:50,  2.05s/it, loss=0.145, lr=1e-5]Steps:  96%|█████████▌| 14390/15001 [9:12:24<20:50,  2.05s/it, loss=0.182, lr=1e-5]Steps:  96%|█████████▌| 14391/15001 [9:12:26<20:55,  2.06s/it, loss=0.182, lr=1e-5]Steps:  96%|█████████▌| 14391/15001 [9:12:26<20:55,  2.06s/it, loss=0.123, lr=1e-5]Steps:  96%|█████████▌| 14392/15001 [9:12:27<19:54,  1.96s/it, loss=0.123, lr=1e-5]Steps:  96%|█████████▌| 14392/15001 [9:12:27<19:54,  1.96s/it, loss=0.0951, lr=1e-5]Steps:  96%|█████████▌| 14393/15001 [9:12:29<19:31,  1.93s/it, loss=0.0951, lr=1e-5]Steps:  96%|█████████▌| 14393/15001 [9:12:29<19:31,  1.93s/it, loss=0.263, lr=1e-5] Steps:  96%|█████████▌| 14394/15001 [9:12:31<19:03,  1.88s/it, loss=0.263, lr=1e-5]Steps:  96%|█████████▌| 14394/15001 [9:12:31<19:03,  1.88s/it, loss=0.305, lr=1e-5]Steps:  96%|█████████▌| 14395/15001 [9:12:32<17:36,  1.74s/it, loss=0.305, lr=1e-5]Steps:  96%|█████████▌| 14395/15001 [9:12:33<17:36,  1.74s/it, loss=0.11, lr=1e-5] Steps:  96%|█████████▌| 14396/15001 [9:12:35<18:54,  1.88s/it, loss=0.11, lr=1e-5]Steps:  96%|█████████▌| 14396/15001 [9:12:35<18:54,  1.88s/it, loss=0.165, lr=1e-5]Steps:  96%|█████████▌| 14397/15001 [9:12:36<18:03,  1.79s/it, loss=0.165, lr=1e-5]Steps:  96%|█████████▌| 14397/15001 [9:12:37<18:03,  1.79s/it, loss=0.0419, lr=1e-5]Steps:  96%|█████████▌| 14398/15001 [9:12:38<18:40,  1.86s/it, loss=0.0419, lr=1e-5]Steps:  96%|█████████▌| 14398/15001 [9:12:38<18:40,  1.86s/it, loss=0.122, lr=1e-5] Steps:  96%|█████████▌| 14399/15001 [9:12:40<18:29,  1.84s/it, loss=0.122, lr=1e-5]Steps:  96%|█████████▌| 14399/15001 [9:12:40<18:29,  1.84s/it, loss=0.12, lr=1e-5] Steps:  96%|█████████▌| 14400/15001 [9:12:42<17:52,  1.79s/it, loss=0.12, lr=1e-5]Steps:  96%|█████████▌| 14400/15001 [9:12:42<17:52,  1.79s/it, loss=0.125, lr=1e-5]Steps:  96%|█████████▌| 14401/15001 [9:12:44<18:37,  1.86s/it, loss=0.125, lr=1e-5]Steps:  96%|█████████▌| 14401/15001 [9:12:44<18:37,  1.86s/it, loss=0.0998, lr=1e-5]Steps:  96%|█████████▌| 14402/15001 [9:12:45<17:47,  1.78s/it, loss=0.0998, lr=1e-5]Steps:  96%|█████████▌| 14402/15001 [9:12:46<17:47,  1.78s/it, loss=0.268, lr=1e-5] Steps:  96%|█████████▌| 14403/15001 [9:12:47<18:31,  1.86s/it, loss=0.268, lr=1e-5]Steps:  96%|█████████▌| 14403/15001 [9:12:47<18:31,  1.86s/it, loss=0.2, lr=1e-5]  Steps:  96%|█████████▌| 14404/15001 [9:12:49<17:57,  1.80s/it, loss=0.2, lr=1e-5]Steps:  96%|█████████▌| 14404/15001 [9:12:49<17:57,  1.80s/it, loss=0.165, lr=1e-5]Steps:  96%|█████████▌| 14405/15001 [9:12:51<17:49,  1.79s/it, loss=0.165, lr=1e-5]Steps:  96%|█████████▌| 14405/15001 [9:12:51<17:49,  1.79s/it, loss=0.0356, lr=1e-5]Steps:  96%|█████████▌| 14406/15001 [9:12:53<18:21,  1.85s/it, loss=0.0356, lr=1e-5]Steps:  96%|█████████▌| 14406/15001 [9:12:53<18:21,  1.85s/it, loss=0.133, lr=1e-5] Steps:  96%|█████████▌| 14407/15001 [9:12:54<17:49,  1.80s/it, loss=0.133, lr=1e-5]Steps:  96%|█████████▌| 14407/15001 [9:12:55<17:49,  1.80s/it, loss=0.161, lr=1e-5]Steps:  96%|█████████▌| 14408/15001 [9:12:56<17:49,  1.80s/it, loss=0.161, lr=1e-5]Steps:  96%|█████████▌| 14408/15001 [9:12:56<17:49,  1.80s/it, loss=0.171, lr=1e-5]Steps:  96%|█████████▌| 14409/15001 [9:12:59<19:17,  1.96s/it, loss=0.171, lr=1e-5]Steps:  96%|█████████▌| 14409/15001 [9:12:59<19:17,  1.96s/it, loss=0.0241, lr=1e-5]Steps:  96%|█████████▌| 14410/15001 [9:13:01<19:18,  1.96s/it, loss=0.0241, lr=1e-5]Steps:  96%|█████████▌| 14410/15001 [9:13:01<19:18,  1.96s/it, loss=0.196, lr=1e-5] Steps:  96%|█████████▌| 14411/15001 [9:13:02<18:30,  1.88s/it, loss=0.196, lr=1e-5]Steps:  96%|█████████▌| 14411/15001 [9:13:03<18:30,  1.88s/it, loss=0.132, lr=1e-5]Steps:  96%|█████████▌| 14412/15001 [9:13:04<18:55,  1.93s/it, loss=0.132, lr=1e-5]Steps:  96%|█████████▌| 14412/15001 [9:13:05<18:55,  1.93s/it, loss=0.1, lr=1e-5]  Steps:  96%|█████████▌| 14413/15001 [9:13:07<20:07,  2.05s/it, loss=0.1, lr=1e-5]Steps:  96%|█████████▌| 14413/15001 [9:13:07<20:07,  2.05s/it, loss=0.239, lr=1e-5]Steps:  96%|█████████▌| 14414/15001 [9:13:09<19:54,  2.04s/it, loss=0.239, lr=1e-5]Steps:  96%|█████████▌| 14414/15001 [9:13:09<19:54,  2.04s/it, loss=0.174, lr=1e-5]Steps:  96%|█████████▌| 14415/15001 [9:13:10<19:13,  1.97s/it, loss=0.174, lr=1e-5]Steps:  96%|█████████▌| 14415/15001 [9:13:11<19:13,  1.97s/it, loss=0.223, lr=1e-5]Steps:  96%|█████████▌| 14416/15001 [9:13:12<18:39,  1.91s/it, loss=0.223, lr=1e-5]Steps:  96%|█████████▌| 14416/15001 [9:13:12<18:39,  1.91s/it, loss=0.224, lr=1e-5]Steps:  96%|█████████▌| 14417/15001 [9:13:14<17:23,  1.79s/it, loss=0.224, lr=1e-5]Steps:  96%|█████████▌| 14417/15001 [9:13:14<17:23,  1.79s/it, loss=0.0489, lr=1e-5]Steps:  96%|█████████▌| 14418/15001 [9:13:16<18:25,  1.90s/it, loss=0.0489, lr=1e-5]Steps:  96%|█████████▌| 14418/15001 [9:13:16<18:25,  1.90s/it, loss=0.3, lr=1e-5]   Steps:  96%|█████████▌| 14419/15001 [9:13:18<18:20,  1.89s/it, loss=0.3, lr=1e-5]Steps:  96%|█████████▌| 14419/15001 [9:13:18<18:20,  1.89s/it, loss=0.13, lr=1e-5]Steps:  96%|█████████▌| 14420/15001 [9:13:19<16:57,  1.75s/it, loss=0.13, lr=1e-5]Steps:  96%|█████████▌| 14420/15001 [9:13:20<16:57,  1.75s/it, loss=0.18, lr=1e-5]Steps:  96%|█████████▌| 14421/15001 [9:13:21<17:21,  1.79s/it, loss=0.18, lr=1e-5]Steps:  96%|█████████▌| 14421/15001 [9:13:21<17:21,  1.79s/it, loss=0.214, lr=1e-5]Steps:  96%|█████████▌| 14422/15001 [9:13:23<18:04,  1.87s/it, loss=0.214, lr=1e-5]Steps:  96%|█████████▌| 14422/15001 [9:13:23<18:04,  1.87s/it, loss=0.124, lr=1e-5]Steps:  96%|█████████▌| 14423/15001 [9:13:25<17:43,  1.84s/it, loss=0.124, lr=1e-5]Steps:  96%|█████████▌| 14423/15001 [9:13:25<17:43,  1.84s/it, loss=0.323, lr=1e-5]Steps:  96%|█████████▌| 14424/15001 [9:13:27<17:09,  1.78s/it, loss=0.323, lr=1e-5]Steps:  96%|█████████▌| 14424/15001 [9:13:27<17:09,  1.78s/it, loss=0.373, lr=1e-5]Steps:  96%|█████████▌| 14425/15001 [9:13:29<17:38,  1.84s/it, loss=0.373, lr=1e-5]Steps:  96%|█████████▌| 14425/15001 [9:13:29<17:38,  1.84s/it, loss=0.0576, lr=1e-5]Steps:  96%|█████████▌| 14426/15001 [9:13:30<17:02,  1.78s/it, loss=0.0576, lr=1e-5]Steps:  96%|█████████▌| 14426/15001 [9:13:30<17:02,  1.78s/it, loss=0.357, lr=1e-5] Steps:  96%|█████████▌| 14427/15001 [9:13:32<17:10,  1.80s/it, loss=0.357, lr=1e-5]Steps:  96%|█████████▌| 14427/15001 [9:13:32<17:10,  1.80s/it, loss=0.0197, lr=1e-5]Steps:  96%|█████████▌| 14428/15001 [9:13:34<17:28,  1.83s/it, loss=0.0197, lr=1e-5]Steps:  96%|█████████▌| 14428/15001 [9:13:34<17:28,  1.83s/it, loss=0.192, lr=1e-5] Steps:  96%|█████████▌| 14429/15001 [9:13:36<17:29,  1.84s/it, loss=0.192, lr=1e-5]Steps:  96%|█████████▌| 14429/15001 [9:13:36<17:29,  1.84s/it, loss=0.0542, lr=1e-5]Steps:  96%|█████████▌| 14430/15001 [9:13:37<16:50,  1.77s/it, loss=0.0542, lr=1e-5]Steps:  96%|█████████▌| 14430/15001 [9:13:38<16:50,  1.77s/it, loss=0.139, lr=1e-5] Steps:  96%|█████████▌| 14431/15001 [9:13:39<17:09,  1.81s/it, loss=0.139, lr=1e-5]Steps:  96%|█████████▌| 14431/15001 [9:13:39<17:09,  1.81s/it, loss=0.27, lr=1e-5] Steps:  96%|█████████▌| 14432/15001 [9:13:41<17:40,  1.86s/it, loss=0.27, lr=1e-5]Steps:  96%|█████████▌| 14432/15001 [9:13:41<17:40,  1.86s/it, loss=0.0735, lr=1e-5]Steps:  96%|█████████▌| 14433/15001 [9:13:43<17:16,  1.83s/it, loss=0.0735, lr=1e-5]Steps:  96%|█████████▌| 14433/15001 [9:13:43<17:16,  1.83s/it, loss=0.108, lr=1e-5] Steps:  96%|█████████▌| 14434/15001 [9:13:45<18:05,  1.91s/it, loss=0.108, lr=1e-5]Steps:  96%|█████████▌| 14434/15001 [9:13:45<18:05,  1.91s/it, loss=0.136, lr=1e-5]Steps:  96%|█████████▌| 14435/15001 [9:13:47<18:40,  1.98s/it, loss=0.136, lr=1e-5]Steps:  96%|█████████▌| 14435/15001 [9:13:48<18:40,  1.98s/it, loss=0.114, lr=1e-5]Steps:  96%|█████████▌| 14436/15001 [9:13:49<18:32,  1.97s/it, loss=0.114, lr=1e-5]Steps:  96%|█████████▌| 14436/15001 [9:13:50<18:32,  1.97s/it, loss=0.262, lr=1e-5]Steps:  96%|█████████▌| 14437/15001 [9:13:51<19:04,  2.03s/it, loss=0.262, lr=1e-5]Steps:  96%|█████████▌| 14437/15001 [9:13:52<19:04,  2.03s/it, loss=0.0923, lr=1e-5]Steps:  96%|█████████▌| 14438/15001 [9:13:53<18:42,  1.99s/it, loss=0.0923, lr=1e-5]Steps:  96%|█████████▌| 14438/15001 [9:13:53<18:42,  1.99s/it, loss=0.0844, lr=1e-5]Steps:  96%|█████████▋| 14439/15001 [9:13:55<17:46,  1.90s/it, loss=0.0844, lr=1e-5]Steps:  96%|█████████▋| 14439/15001 [9:13:55<17:46,  1.90s/it, loss=0.219, lr=1e-5] Steps:  96%|█████████▋| 14440/15001 [9:13:57<17:33,  1.88s/it, loss=0.219, lr=1e-5]Steps:  96%|█████████▋| 14440/15001 [9:13:57<17:33,  1.88s/it, loss=0.212, lr=1e-5]Steps:  96%|█████████▋| 14441/15001 [9:13:59<17:36,  1.89s/it, loss=0.212, lr=1e-5]Steps:  96%|█████████▋| 14441/15001 [9:13:59<17:36,  1.89s/it, loss=0.0718, lr=1e-5]Steps:  96%|█████████▋| 14442/15001 [9:14:00<17:08,  1.84s/it, loss=0.0718, lr=1e-5]Steps:  96%|█████████▋| 14442/15001 [9:14:01<17:08,  1.84s/it, loss=0.114, lr=1e-5] Steps:  96%|█████████▋| 14443/15001 [9:14:03<17:55,  1.93s/it, loss=0.114, lr=1e-5]Steps:  96%|█████████▋| 14443/15001 [9:14:03<17:55,  1.93s/it, loss=0.157, lr=1e-5]Steps:  96%|█████████▋| 14444/15001 [9:14:04<17:12,  1.85s/it, loss=0.157, lr=1e-5]Steps:  96%|█████████▋| 14444/15001 [9:14:04<17:12,  1.85s/it, loss=0.376, lr=1e-5]Steps:  96%|█████████▋| 14445/15001 [9:14:06<17:17,  1.87s/it, loss=0.376, lr=1e-5]Steps:  96%|█████████▋| 14445/15001 [9:14:06<17:17,  1.87s/it, loss=0.229, lr=1e-5]Steps:  96%|█████████▋| 14446/15001 [9:14:08<17:18,  1.87s/it, loss=0.229, lr=1e-5]Steps:  96%|█████████▋| 14446/15001 [9:14:08<17:18,  1.87s/it, loss=0.183, lr=1e-5]Steps:  96%|█████████▋| 14447/15001 [9:14:10<16:37,  1.80s/it, loss=0.183, lr=1e-5]Steps:  96%|█████████▋| 14447/15001 [9:14:10<16:37,  1.80s/it, loss=0.0845, lr=1e-5]Steps:  96%|█████████▋| 14448/15001 [9:14:11<16:12,  1.76s/it, loss=0.0845, lr=1e-5]Steps:  96%|█████████▋| 14448/15001 [9:14:12<16:12,  1.76s/it, loss=0.268, lr=1e-5] Steps:  96%|█████████▋| 14449/15001 [9:14:13<16:41,  1.81s/it, loss=0.268, lr=1e-5]Steps:  96%|█████████▋| 14449/15001 [9:14:13<16:41,  1.81s/it, loss=0.095, lr=1e-5]Steps:  96%|█████████▋| 14450/15001 [9:14:15<16:37,  1.81s/it, loss=0.095, lr=1e-5]Steps:  96%|█████████▋| 14450/15001 [9:14:15<16:37,  1.81s/it, loss=0.179, lr=1e-5]Steps:  96%|█████████▋| 14451/15001 [9:14:17<16:41,  1.82s/it, loss=0.179, lr=1e-5]Steps:  96%|█████████▋| 14451/15001 [9:14:17<16:41,  1.82s/it, loss=0.0643, lr=1e-5]Steps:  96%|█████████▋| 14452/15001 [9:14:18<15:53,  1.74s/it, loss=0.0643, lr=1e-5]Steps:  96%|█████████▋| 14452/15001 [9:14:19<15:53,  1.74s/it, loss=0.0545, lr=1e-5]Steps:  96%|█████████▋| 14453/15001 [9:14:20<15:52,  1.74s/it, loss=0.0545, lr=1e-5]Steps:  96%|█████████▋| 14453/15001 [9:14:21<15:52,  1.74s/it, loss=0.319, lr=1e-5] Steps:  96%|█████████▋| 14454/15001 [9:14:22<16:29,  1.81s/it, loss=0.319, lr=1e-5]Steps:  96%|█████████▋| 14454/15001 [9:14:22<16:29,  1.81s/it, loss=0.0606, lr=1e-5]Steps:  96%|█████████▋| 14455/15001 [9:14:24<16:39,  1.83s/it, loss=0.0606, lr=1e-5]Steps:  96%|█████████▋| 14455/15001 [9:14:24<16:39,  1.83s/it, loss=0.244, lr=1e-5] Steps:  96%|█████████▋| 14456/15001 [9:14:26<17:44,  1.95s/it, loss=0.244, lr=1e-5]Steps:  96%|█████████▋| 14456/15001 [9:14:26<17:44,  1.95s/it, loss=0.116, lr=1e-5]Steps:  96%|█████████▋| 14457/15001 [9:14:28<18:02,  1.99s/it, loss=0.116, lr=1e-5]Steps:  96%|█████████▋| 14457/15001 [9:14:28<18:02,  1.99s/it, loss=0.223, lr=1e-5]Steps:  96%|█████████▋| 14458/15001 [9:14:30<17:37,  1.95s/it, loss=0.223, lr=1e-5]Steps:  96%|█████████▋| 14458/15001 [9:14:30<17:37,  1.95s/it, loss=0.234, lr=1e-5]Steps:  96%|█████████▋| 14459/15001 [9:14:32<17:46,  1.97s/it, loss=0.234, lr=1e-5]Steps:  96%|█████████▋| 14459/15001 [9:14:32<17:46,  1.97s/it, loss=0.192, lr=1e-5]Steps:  96%|█████████▋| 14460/15001 [9:14:34<17:47,  1.97s/it, loss=0.192, lr=1e-5]Steps:  96%|█████████▋| 14460/15001 [9:14:34<17:47,  1.97s/it, loss=0.0351, lr=1e-5]Steps:  96%|█████████▋| 14461/15001 [9:14:36<17:02,  1.89s/it, loss=0.0351, lr=1e-5]Steps:  96%|█████████▋| 14461/15001 [9:14:36<17:02,  1.89s/it, loss=0.236, lr=1e-5] Steps:  96%|█████████▋| 14462/15001 [9:14:38<16:25,  1.83s/it, loss=0.236, lr=1e-5]Steps:  96%|█████████▋| 14462/15001 [9:14:38<16:25,  1.83s/it, loss=0.246, lr=1e-5]Steps:  96%|█████████▋| 14463/15001 [9:14:39<16:29,  1.84s/it, loss=0.246, lr=1e-5]Steps:  96%|█████████▋| 14463/15001 [9:14:40<16:29,  1.84s/it, loss=0.273, lr=1e-5]Steps:  96%|█████████▋| 14464/15001 [9:14:41<16:17,  1.82s/it, loss=0.273, lr=1e-5]Steps:  96%|█████████▋| 14464/15001 [9:14:41<16:17,  1.82s/it, loss=0.28, lr=1e-5] Steps:  96%|█████████▋| 14465/15001 [9:14:43<16:00,  1.79s/it, loss=0.28, lr=1e-5]Steps:  96%|█████████▋| 14465/15001 [9:14:43<16:00,  1.79s/it, loss=0.115, lr=1e-5]Steps:  96%|█████████▋| 14466/15001 [9:14:45<16:13,  1.82s/it, loss=0.115, lr=1e-5]Steps:  96%|█████████▋| 14466/15001 [9:14:45<16:13,  1.82s/it, loss=0.195, lr=1e-5]Steps:  96%|█████████▋| 14467/15001 [9:14:47<16:39,  1.87s/it, loss=0.195, lr=1e-5]Steps:  96%|█████████▋| 14467/15001 [9:14:47<16:39,  1.87s/it, loss=0.121, lr=1e-5]Steps:  96%|█████████▋| 14468/15001 [9:14:49<16:15,  1.83s/it, loss=0.121, lr=1e-5]Steps:  96%|█████████▋| 14468/15001 [9:14:49<16:15,  1.83s/it, loss=0.176, lr=1e-5]Steps:  96%|█████████▋| 14469/15001 [9:14:50<16:30,  1.86s/it, loss=0.176, lr=1e-5]Steps:  96%|█████████▋| 14469/15001 [9:14:51<16:30,  1.86s/it, loss=0.119, lr=1e-5]Steps:  96%|█████████▋| 14470/15001 [9:14:52<15:48,  1.79s/it, loss=0.119, lr=1e-5]Steps:  96%|█████████▋| 14470/15001 [9:14:52<15:48,  1.79s/it, loss=0.142, lr=1e-5]Steps:  96%|█████████▋| 14471/15001 [9:14:54<16:26,  1.86s/it, loss=0.142, lr=1e-5]Steps:  96%|█████████▋| 14471/15001 [9:14:54<16:26,  1.86s/it, loss=0.191, lr=1e-5]Steps:  96%|█████████▋| 14472/15001 [9:14:56<16:14,  1.84s/it, loss=0.191, lr=1e-5]Steps:  96%|█████████▋| 14472/15001 [9:14:56<16:14,  1.84s/it, loss=0.32, lr=1e-5] Steps:  96%|█████████▋| 14473/15001 [9:14:58<15:58,  1.82s/it, loss=0.32, lr=1e-5]Steps:  96%|█████████▋| 14473/15001 [9:14:58<15:58,  1.82s/it, loss=0.0562, lr=1e-5]Steps:  96%|█████████▋| 14474/15001 [9:14:59<15:49,  1.80s/it, loss=0.0562, lr=1e-5]Steps:  96%|█████████▋| 14474/15001 [9:15:00<15:49,  1.80s/it, loss=0.0774, lr=1e-5]Steps:  96%|█████████▋| 14475/15001 [9:15:01<16:02,  1.83s/it, loss=0.0774, lr=1e-5]Steps:  96%|█████████▋| 14475/15001 [9:15:01<16:02,  1.83s/it, loss=0.275, lr=1e-5] Steps:  97%|█████████▋| 14476/15001 [9:15:03<15:50,  1.81s/it, loss=0.275, lr=1e-5]Steps:  97%|█████████▋| 14476/15001 [9:15:03<15:50,  1.81s/it, loss=0.155, lr=1e-5]Steps:  97%|█████████▋| 14477/15001 [9:15:05<15:25,  1.77s/it, loss=0.155, lr=1e-5]Steps:  97%|█████████▋| 14477/15001 [9:15:05<15:25,  1.77s/it, loss=0.0979, lr=1e-5]Steps:  97%|█████████▋| 14478/15001 [9:15:07<15:53,  1.82s/it, loss=0.0979, lr=1e-5]Steps:  97%|█████████▋| 14478/15001 [9:15:07<15:53,  1.82s/it, loss=0.215, lr=1e-5] Steps:  97%|█████████▋| 14479/15001 [9:15:09<16:47,  1.93s/it, loss=0.215, lr=1e-5]Steps:  97%|█████████▋| 14479/15001 [9:15:09<16:47,  1.93s/it, loss=0.237, lr=1e-5]Steps:  97%|█████████▋| 14480/15001 [9:15:11<16:33,  1.91s/it, loss=0.237, lr=1e-5]Steps:  97%|█████████▋| 14480/15001 [9:15:11<16:33,  1.91s/it, loss=0.0498, lr=1e-5]Steps:  97%|█████████▋| 14481/15001 [9:15:13<16:29,  1.90s/it, loss=0.0498, lr=1e-5]Steps:  97%|█████████▋| 14481/15001 [9:15:13<16:29,  1.90s/it, loss=0.143, lr=1e-5] Steps:  97%|█████████▋| 14482/15001 [9:15:15<16:46,  1.94s/it, loss=0.143, lr=1e-5]Steps:  97%|█████████▋| 14482/15001 [9:15:15<16:46,  1.94s/it, loss=0.115, lr=1e-5]Steps:  97%|█████████▋| 14483/15001 [9:15:17<17:12,  1.99s/it, loss=0.115, lr=1e-5]Steps:  97%|█████████▋| 14483/15001 [9:15:17<17:12,  1.99s/it, loss=0.0969, lr=1e-5]Steps:  97%|█████████▋| 14484/15001 [9:15:18<16:20,  1.90s/it, loss=0.0969, lr=1e-5]Steps:  97%|█████████▋| 14484/15001 [9:15:19<16:20,  1.90s/it, loss=0.0726, lr=1e-5]Steps:  97%|█████████▋| 14485/15001 [9:15:20<16:12,  1.89s/it, loss=0.0726, lr=1e-5]Steps:  97%|█████████▋| 14485/15001 [9:15:20<16:12,  1.89s/it, loss=0.205, lr=1e-5] Steps:  97%|█████████▋| 14486/15001 [9:15:22<15:27,  1.80s/it, loss=0.205, lr=1e-5]Steps:  97%|█████████▋| 14486/15001 [9:15:22<15:27,  1.80s/it, loss=0.342, lr=1e-5]Steps:  97%|█████████▋| 14487/15001 [9:15:24<15:42,  1.83s/it, loss=0.342, lr=1e-5]Steps:  97%|█████████▋| 14487/15001 [9:15:24<15:42,  1.83s/it, loss=0.22, lr=1e-5] Steps:  97%|█████████▋| 14488/15001 [9:15:26<15:50,  1.85s/it, loss=0.22, lr=1e-5]Steps:  97%|█████████▋| 14488/15001 [9:15:26<15:50,  1.85s/it, loss=0.0569, lr=1e-5]Steps:  97%|█████████▋| 14489/15001 [9:15:28<16:01,  1.88s/it, loss=0.0569, lr=1e-5]Steps:  97%|█████████▋| 14489/15001 [9:15:28<16:01,  1.88s/it, loss=0.109, lr=1e-5] Steps:  97%|█████████▋| 14490/15001 [9:15:29<15:41,  1.84s/it, loss=0.109, lr=1e-5]Steps:  97%|█████████▋| 14490/15001 [9:15:30<15:41,  1.84s/it, loss=0.0403, lr=1e-5]Steps:  97%|█████████▋| 14491/15001 [9:15:31<15:09,  1.78s/it, loss=0.0403, lr=1e-5]Steps:  97%|█████████▋| 14491/15001 [9:15:31<15:09,  1.78s/it, loss=0.244, lr=1e-5] Steps:  97%|█████████▋| 14492/15001 [9:15:33<15:32,  1.83s/it, loss=0.244, lr=1e-5]Steps:  97%|█████████▋| 14492/15001 [9:15:33<15:32,  1.83s/it, loss=0.193, lr=1e-5]Steps:  97%|█████████▋| 14493/15001 [9:15:35<15:27,  1.83s/it, loss=0.193, lr=1e-5]Steps:  97%|█████████▋| 14493/15001 [9:15:35<15:27,  1.83s/it, loss=0.145, lr=1e-5]Steps:  97%|█████████▋| 14494/15001 [9:15:37<15:03,  1.78s/it, loss=0.145, lr=1e-5]Steps:  97%|█████████▋| 14494/15001 [9:15:37<15:03,  1.78s/it, loss=0.244, lr=1e-5]Steps:  97%|█████████▋| 14495/15001 [9:15:38<14:42,  1.74s/it, loss=0.244, lr=1e-5]Steps:  97%|█████████▋| 14495/15001 [9:15:39<14:42,  1.74s/it, loss=0.11, lr=1e-5] Steps:  97%|█████████▋| 14496/15001 [9:15:40<15:22,  1.83s/it, loss=0.11, lr=1e-5]Steps:  97%|█████████▋| 14496/15001 [9:15:40<15:22,  1.83s/it, loss=0.179, lr=1e-5]Steps:  97%|█████████▋| 14497/15001 [9:15:42<15:06,  1.80s/it, loss=0.179, lr=1e-5]Steps:  97%|█████████▋| 14497/15001 [9:15:42<15:06,  1.80s/it, loss=0.0647, lr=1e-5]Steps:  97%|█████████▋| 14498/15001 [9:15:44<15:04,  1.80s/it, loss=0.0647, lr=1e-5]Steps:  97%|█████████▋| 14498/15001 [9:15:44<15:04,  1.80s/it, loss=0.101, lr=1e-5] Steps:  97%|█████████▋| 14499/15001 [9:15:46<15:04,  1.80s/it, loss=0.101, lr=1e-5]Steps:  97%|█████████▋| 14499/15001 [9:15:46<15:04,  1.80s/it, loss=0.159, lr=1e-5]Steps:  97%|█████████▋| 14500/15001 [9:15:47<14:53,  1.78s/it, loss=0.159, lr=1e-5]02/04/2024 22:18:07 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1729.13it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps:  97%|█████████▋| 14500/15001 [9:19:27<14:53,  1.78s/it, loss=0.0257, lr=1e-5]Steps:  97%|█████████▋| 14501/15001 [9:19:28<9:23:17, 67.59s/it, loss=0.0257, lr=1e-5]Steps:  97%|█████████▋| 14501/15001 [9:19:28<9:23:17, 67.59s/it, loss=0.338, lr=1e-5] Steps:  97%|█████████▋| 14502/15001 [9:19:30<6:38:01, 47.86s/it, loss=0.338, lr=1e-5]Steps:  97%|█████████▋| 14502/15001 [9:19:30<6:38:01, 47.86s/it, loss=0.0662, lr=1e-5]Steps:  97%|█████████▋| 14503/15001 [9:19:32<4:42:37, 34.05s/it, loss=0.0662, lr=1e-5]Steps:  97%|█████████▋| 14503/15001 [9:19:32<4:42:37, 34.05s/it, loss=0.239, lr=1e-5] Steps:  97%|█████████▋| 14504/15001 [9:19:34<3:22:06, 24.40s/it, loss=0.239, lr=1e-5]Steps:  97%|█████████▋| 14504/15001 [9:19:34<3:22:06, 24.40s/it, loss=0.229, lr=1e-5]Steps:  97%|█████████▋| 14505/15001 [9:19:36<2:25:42, 17.63s/it, loss=0.229, lr=1e-5]Steps:  97%|█████████▋| 14505/15001 [9:19:36<2:25:42, 17.63s/it, loss=0.187, lr=1e-5]Steps:  97%|█████████▋| 14506/15001 [9:19:38<1:46:39, 12.93s/it, loss=0.187, lr=1e-5]Steps:  97%|█████████▋| 14506/15001 [9:19:38<1:46:39, 12.93s/it, loss=0.262, lr=1e-5]Steps:  97%|█████████▋| 14507/15001 [9:19:40<1:18:51,  9.58s/it, loss=0.262, lr=1e-5]Steps:  97%|█████████▋| 14507/15001 [9:19:40<1:18:51,  9.58s/it, loss=0.176, lr=1e-5]Steps:  97%|█████████▋| 14508/15001 [9:19:41<59:24,  7.23s/it, loss=0.176, lr=1e-5]  Steps:  97%|█████████▋| 14508/15001 [9:19:41<59:24,  7.23s/it, loss=0.133, lr=1e-5]Steps:  97%|█████████▋| 14509/15001 [9:19:43<46:40,  5.69s/it, loss=0.133, lr=1e-5]Steps:  97%|█████████▋| 14509/15001 [9:19:44<46:40,  5.69s/it, loss=0.0581, lr=1e-5]Steps:  97%|█████████▋| 14510/15001 [9:19:45<37:35,  4.59s/it, loss=0.0581, lr=1e-5]Steps:  97%|█████████▋| 14510/15001 [9:19:46<37:35,  4.59s/it, loss=0.158, lr=1e-5] Steps:  97%|█████████▋| 14511/15001 [9:19:47<31:05,  3.81s/it, loss=0.158, lr=1e-5]Steps:  97%|█████████▋| 14511/15001 [9:19:48<31:05,  3.81s/it, loss=0.379, lr=1e-5]Steps:  97%|█████████▋| 14512/15001 [9:19:49<26:36,  3.27s/it, loss=0.379, lr=1e-5]Steps:  97%|█████████▋| 14512/15001 [9:19:50<26:36,  3.27s/it, loss=0.119, lr=1e-5]Steps:  97%|█████████▋| 14513/15001 [9:19:51<23:37,  2.91s/it, loss=0.119, lr=1e-5]Steps:  97%|█████████▋| 14513/15001 [9:19:52<23:37,  2.91s/it, loss=0.147, lr=1e-5]Steps:  97%|█████████▋| 14514/15001 [9:19:53<21:01,  2.59s/it, loss=0.147, lr=1e-5]Steps:  97%|█████████▋| 14514/15001 [9:19:54<21:01,  2.59s/it, loss=0.106, lr=1e-5]Steps:  97%|█████████▋| 14515/15001 [9:19:55<19:18,  2.38s/it, loss=0.106, lr=1e-5]Steps:  97%|█████████▋| 14515/15001 [9:19:55<19:18,  2.38s/it, loss=0.123, lr=1e-5]Steps:  97%|█████████▋| 14516/15001 [9:19:57<18:03,  2.23s/it, loss=0.123, lr=1e-5]Steps:  97%|█████████▋| 14516/15001 [9:19:57<18:03,  2.23s/it, loss=0.0541, lr=1e-5]Steps:  97%|█████████▋| 14517/15001 [9:19:59<16:44,  2.08s/it, loss=0.0541, lr=1e-5]Steps:  97%|█████████▋| 14517/15001 [9:19:59<16:44,  2.08s/it, loss=0.0511, lr=1e-5]Steps:  97%|█████████▋| 14518/15001 [9:20:01<16:07,  2.00s/it, loss=0.0511, lr=1e-5]Steps:  97%|█████████▋| 14518/15001 [9:20:01<16:07,  2.00s/it, loss=0.448, lr=1e-5] Steps:  97%|█████████▋| 14519/15001 [9:20:03<15:50,  1.97s/it, loss=0.448, lr=1e-5]Steps:  97%|█████████▋| 14519/15001 [9:20:03<15:50,  1.97s/it, loss=0.178, lr=1e-5]Steps:  97%|█████████▋| 14520/15001 [9:20:04<15:17,  1.91s/it, loss=0.178, lr=1e-5]Steps:  97%|█████████▋| 14520/15001 [9:20:04<15:17,  1.91s/it, loss=0.0963, lr=1e-5]Steps:  97%|█████████▋| 14521/15001 [9:20:06<14:43,  1.84s/it, loss=0.0963, lr=1e-5]Steps:  97%|█████████▋| 14521/15001 [9:20:06<14:43,  1.84s/it, loss=0.217, lr=1e-5] Steps:  97%|█████████▋| 14522/15001 [9:20:08<14:54,  1.87s/it, loss=0.217, lr=1e-5]Steps:  97%|█████████▋| 14522/15001 [9:20:08<14:54,  1.87s/it, loss=0.187, lr=1e-5]Steps:  97%|█████████▋| 14523/15001 [9:20:10<14:42,  1.85s/it, loss=0.187, lr=1e-5]Steps:  97%|█████████▋| 14523/15001 [9:20:10<14:42,  1.85s/it, loss=0.204, lr=1e-5]Steps:  97%|█████████▋| 14524/15001 [9:20:12<15:13,  1.92s/it, loss=0.204, lr=1e-5]Steps:  97%|█████████▋| 14524/15001 [9:20:12<15:13,  1.92s/it, loss=0.245, lr=1e-5]Steps:  97%|█████████▋| 14525/15001 [9:20:13<14:11,  1.79s/it, loss=0.245, lr=1e-5]Steps:  97%|█████████▋| 14525/15001 [9:20:14<14:11,  1.79s/it, loss=0.195, lr=1e-5]Steps:  97%|█████████▋| 14526/15001 [9:20:15<14:44,  1.86s/it, loss=0.195, lr=1e-5]Steps:  97%|█████████▋| 14526/15001 [9:20:16<14:44,  1.86s/it, loss=0.196, lr=1e-5]Steps:  97%|█████████▋| 14527/15001 [9:20:17<14:43,  1.86s/it, loss=0.196, lr=1e-5]Steps:  97%|█████████▋| 14527/15001 [9:20:17<14:43,  1.86s/it, loss=0.0309, lr=1e-5]Steps:  97%|█████████▋| 14528/15001 [9:20:19<14:36,  1.85s/it, loss=0.0309, lr=1e-5]Steps:  97%|█████████▋| 14528/15001 [9:20:19<14:36,  1.85s/it, loss=0.218, lr=1e-5] Steps:  97%|█████████▋| 14529/15001 [9:20:21<14:52,  1.89s/it, loss=0.218, lr=1e-5]Steps:  97%|█████████▋| 14529/15001 [9:20:21<14:52,  1.89s/it, loss=0.165, lr=1e-5]Steps:  97%|█████████▋| 14530/15001 [9:20:23<14:26,  1.84s/it, loss=0.165, lr=1e-5]Steps:  97%|█████████▋| 14530/15001 [9:20:23<14:26,  1.84s/it, loss=0.0362, lr=1e-5]Steps:  97%|█████████▋| 14531/15001 [9:20:25<14:22,  1.83s/it, loss=0.0362, lr=1e-5]Steps:  97%|█████████▋| 14531/15001 [9:20:25<14:22,  1.83s/it, loss=0.185, lr=1e-5] Steps:  97%|█████████▋| 14532/15001 [9:20:27<14:44,  1.89s/it, loss=0.185, lr=1e-5]Steps:  97%|█████████▋| 14532/15001 [9:20:27<14:44,  1.89s/it, loss=0.157, lr=1e-5]Steps:  97%|█████████▋| 14533/15001 [9:20:28<14:51,  1.90s/it, loss=0.157, lr=1e-5]Steps:  97%|█████████▋| 14533/15001 [9:20:29<14:51,  1.90s/it, loss=0.133, lr=1e-5]Steps:  97%|█████████▋| 14534/15001 [9:20:30<14:53,  1.91s/it, loss=0.133, lr=1e-5]Steps:  97%|█████████▋| 14534/15001 [9:20:31<14:53,  1.91s/it, loss=0.271, lr=1e-5]Steps:  97%|█████████▋| 14535/15001 [9:20:33<15:39,  2.02s/it, loss=0.271, lr=1e-5]Steps:  97%|█████████▋| 14535/15001 [9:20:33<15:39,  2.02s/it, loss=0.107, lr=1e-5]Steps:  97%|█████████▋| 14536/15001 [9:20:35<15:40,  2.02s/it, loss=0.107, lr=1e-5]Steps:  97%|█████████▋| 14536/15001 [9:20:35<15:40,  2.02s/it, loss=0.111, lr=1e-5]Steps:  97%|█████████▋| 14537/15001 [9:20:37<15:11,  1.96s/it, loss=0.111, lr=1e-5]Steps:  97%|█████████▋| 14537/15001 [9:20:37<15:11,  1.96s/it, loss=0.17, lr=1e-5] Steps:  97%|█████████▋| 14538/15001 [9:20:38<14:54,  1.93s/it, loss=0.17, lr=1e-5]Steps:  97%|█████████▋| 14538/15001 [9:20:38<14:54,  1.93s/it, loss=0.0968, lr=1e-5]Steps:  97%|█████████▋| 14539/15001 [9:20:40<14:32,  1.89s/it, loss=0.0968, lr=1e-5]Steps:  97%|█████████▋| 14539/15001 [9:20:40<14:32,  1.89s/it, loss=0.213, lr=1e-5] Steps:  97%|█████████▋| 14540/15001 [9:20:42<14:33,  1.90s/it, loss=0.213, lr=1e-5]Steps:  97%|█████████▋| 14540/15001 [9:20:42<14:33,  1.90s/it, loss=0.189, lr=1e-5]Steps:  97%|█████████▋| 14541/15001 [9:20:44<14:20,  1.87s/it, loss=0.189, lr=1e-5]Steps:  97%|█████████▋| 14541/15001 [9:20:44<14:20,  1.87s/it, loss=0.187, lr=1e-5]Steps:  97%|█████████▋| 14542/15001 [9:20:46<14:07,  1.85s/it, loss=0.187, lr=1e-5]Steps:  97%|█████████▋| 14542/15001 [9:20:46<14:07,  1.85s/it, loss=0.28, lr=1e-5] Steps:  97%|█████████▋| 14543/15001 [9:20:47<13:43,  1.80s/it, loss=0.28, lr=1e-5]Steps:  97%|█████████▋| 14543/15001 [9:20:48<13:43,  1.80s/it, loss=0.172, lr=1e-5]Steps:  97%|█████████▋| 14544/15001 [9:20:49<14:20,  1.88s/it, loss=0.172, lr=1e-5]Steps:  97%|█████████▋| 14544/15001 [9:20:49<14:20,  1.88s/it, loss=0.174, lr=1e-5]Steps:  97%|█████████▋| 14545/15001 [9:20:51<13:33,  1.78s/it, loss=0.174, lr=1e-5]Steps:  97%|█████████▋| 14545/15001 [9:20:51<13:33,  1.78s/it, loss=0.134, lr=1e-5]Steps:  97%|█████████▋| 14546/15001 [9:20:53<14:21,  1.89s/it, loss=0.134, lr=1e-5]Steps:  97%|█████████▋| 14546/15001 [9:20:53<14:21,  1.89s/it, loss=0.23, lr=1e-5] Steps:  97%|█████████▋| 14547/15001 [9:20:55<13:55,  1.84s/it, loss=0.23, lr=1e-5]Steps:  97%|█████████▋| 14547/15001 [9:20:55<13:55,  1.84s/it, loss=0.135, lr=1e-5]Steps:  97%|█████████▋| 14548/15001 [9:20:57<13:43,  1.82s/it, loss=0.135, lr=1e-5]Steps:  97%|█████████▋| 14548/15001 [9:20:57<13:43,  1.82s/it, loss=0.124, lr=1e-5]Steps:  97%|█████████▋| 14549/15001 [9:20:58<13:22,  1.78s/it, loss=0.124, lr=1e-5]Steps:  97%|█████████▋| 14549/15001 [9:20:58<13:22,  1.78s/it, loss=0.0737, lr=1e-5]Steps:  97%|█████████▋| 14550/15001 [9:21:00<13:28,  1.79s/it, loss=0.0737, lr=1e-5]Steps:  97%|█████████▋| 14550/15001 [9:21:00<13:28,  1.79s/it, loss=0.0181, lr=1e-5]Steps:  97%|█████████▋| 14551/15001 [9:21:02<13:18,  1.78s/it, loss=0.0181, lr=1e-5]Steps:  97%|█████████▋| 14551/15001 [9:21:02<13:18,  1.78s/it, loss=0.159, lr=1e-5] Steps:  97%|█████████▋| 14552/15001 [9:21:04<13:30,  1.80s/it, loss=0.159, lr=1e-5]Steps:  97%|█████████▋| 14552/15001 [9:21:04<13:30,  1.80s/it, loss=0.378, lr=1e-5]Steps:  97%|█████████▋| 14553/15001 [9:21:06<13:46,  1.84s/it, loss=0.378, lr=1e-5]Steps:  97%|█████████▋| 14553/15001 [9:21:06<13:46,  1.84s/it, loss=0.214, lr=1e-5]Steps:  97%|█████████▋| 14554/15001 [9:21:07<13:23,  1.80s/it, loss=0.214, lr=1e-5]Steps:  97%|█████████▋| 14554/15001 [9:21:07<13:23,  1.80s/it, loss=0.086, lr=1e-5]Steps:  97%|█████████▋| 14555/15001 [9:21:09<13:24,  1.80s/it, loss=0.086, lr=1e-5]Steps:  97%|█████████▋| 14555/15001 [9:21:10<13:24,  1.80s/it, loss=0.0431, lr=1e-5]Steps:  97%|█████████▋| 14556/15001 [9:21:11<14:26,  1.95s/it, loss=0.0431, lr=1e-5]Steps:  97%|█████████▋| 14556/15001 [9:21:12<14:26,  1.95s/it, loss=0.176, lr=1e-5] Steps:  97%|█████████▋| 14557/15001 [9:21:13<14:15,  1.93s/it, loss=0.176, lr=1e-5]Steps:  97%|█████████▋| 14557/15001 [9:21:14<14:15,  1.93s/it, loss=0.1, lr=1e-5]  Steps:  97%|█████████▋| 14558/15001 [9:21:15<13:48,  1.87s/it, loss=0.1, lr=1e-5]Steps:  97%|█████████▋| 14558/15001 [9:21:15<13:48,  1.87s/it, loss=0.0868, lr=1e-5]Steps:  97%|█████████▋| 14559/15001 [9:21:17<14:06,  1.92s/it, loss=0.0868, lr=1e-5]Steps:  97%|█████████▋| 14559/15001 [9:21:17<14:06,  1.92s/it, loss=0.204, lr=1e-5] Steps:  97%|█████████▋| 14560/15001 [9:21:19<13:43,  1.87s/it, loss=0.204, lr=1e-5]Steps:  97%|█████████▋| 14560/15001 [9:21:19<13:43,  1.87s/it, loss=0.114, lr=1e-5]Steps:  97%|█████████▋| 14561/15001 [9:21:21<14:40,  2.00s/it, loss=0.114, lr=1e-5]Steps:  97%|█████████▋| 14561/15001 [9:21:21<14:40,  2.00s/it, loss=0.252, lr=1e-5]Steps:  97%|█████████▋| 14562/15001 [9:21:23<13:36,  1.86s/it, loss=0.252, lr=1e-5]Steps:  97%|█████████▋| 14562/15001 [9:21:23<13:36,  1.86s/it, loss=0.169, lr=1e-5]Steps:  97%|█████████▋| 14563/15001 [9:21:25<13:56,  1.91s/it, loss=0.169, lr=1e-5]Steps:  97%|█████████▋| 14563/15001 [9:21:25<13:56,  1.91s/it, loss=0.324, lr=1e-5]Steps:  97%|█████████▋| 14564/15001 [9:21:26<13:19,  1.83s/it, loss=0.324, lr=1e-5]Steps:  97%|█████████▋| 14564/15001 [9:21:27<13:19,  1.83s/it, loss=0.181, lr=1e-5]Steps:  97%|█████████▋| 14565/15001 [9:21:29<13:57,  1.92s/it, loss=0.181, lr=1e-5]Steps:  97%|█████████▋| 14565/15001 [9:21:29<13:57,  1.92s/it, loss=0.0921, lr=1e-5]Steps:  97%|█████████▋| 14566/15001 [9:21:30<13:41,  1.89s/it, loss=0.0921, lr=1e-5]Steps:  97%|█████████▋| 14566/15001 [9:21:30<13:41,  1.89s/it, loss=0.121, lr=1e-5] Steps:  97%|█████████▋| 14567/15001 [9:21:32<13:22,  1.85s/it, loss=0.121, lr=1e-5]Steps:  97%|█████████▋| 14567/15001 [9:21:32<13:22,  1.85s/it, loss=0.164, lr=1e-5]Steps:  97%|█████████▋| 14568/15001 [9:21:34<13:10,  1.83s/it, loss=0.164, lr=1e-5]Steps:  97%|█████████▋| 14568/15001 [9:21:34<13:10,  1.83s/it, loss=0.307, lr=1e-5]Steps:  97%|█████████▋| 14569/15001 [9:21:35<12:31,  1.74s/it, loss=0.307, lr=1e-5]Steps:  97%|█████████▋| 14569/15001 [9:21:36<12:31,  1.74s/it, loss=0.0566, lr=1e-5]Steps:  97%|█████████▋| 14570/15001 [9:21:38<13:27,  1.87s/it, loss=0.0566, lr=1e-5]Steps:  97%|█████████▋| 14570/15001 [9:21:38<13:27,  1.87s/it, loss=0.191, lr=1e-5] Steps:  97%|█████████▋| 14571/15001 [9:21:39<13:28,  1.88s/it, loss=0.191, lr=1e-5]Steps:  97%|█████████▋| 14571/15001 [9:21:40<13:28,  1.88s/it, loss=0.165, lr=1e-5]Steps:  97%|█████████▋| 14572/15001 [9:21:41<13:04,  1.83s/it, loss=0.165, lr=1e-5]Steps:  97%|█████████▋| 14572/15001 [9:21:41<13:04,  1.83s/it, loss=0.131, lr=1e-5]Steps:  97%|█████████▋| 14573/15001 [9:21:43<13:12,  1.85s/it, loss=0.131, lr=1e-5]Steps:  97%|█████████▋| 14573/15001 [9:21:43<13:12,  1.85s/it, loss=0.317, lr=1e-5]Steps:  97%|█████████▋| 14574/15001 [9:21:45<13:05,  1.84s/it, loss=0.317, lr=1e-5]Steps:  97%|█████████▋| 14574/15001 [9:21:45<13:05,  1.84s/it, loss=0.266, lr=1e-5]Steps:  97%|█████████▋| 14575/15001 [9:21:47<12:42,  1.79s/it, loss=0.266, lr=1e-5]Steps:  97%|█████████▋| 14575/15001 [9:21:47<12:42,  1.79s/it, loss=0.22, lr=1e-5] Steps:  97%|█████████▋| 14576/15001 [9:21:48<12:36,  1.78s/it, loss=0.22, lr=1e-5]Steps:  97%|█████████▋| 14576/15001 [9:21:49<12:36,  1.78s/it, loss=0.183, lr=1e-5]Steps:  97%|█████████▋| 14577/15001 [9:21:50<12:55,  1.83s/it, loss=0.183, lr=1e-5]Steps:  97%|█████████▋| 14577/15001 [9:21:51<12:55,  1.83s/it, loss=0.0544, lr=1e-5]Steps:  97%|█████████▋| 14578/15001 [9:21:52<13:28,  1.91s/it, loss=0.0544, lr=1e-5]Steps:  97%|█████████▋| 14578/15001 [9:21:53<13:28,  1.91s/it, loss=0.0556, lr=1e-5]Steps:  97%|█████████▋| 14579/15001 [9:21:54<13:42,  1.95s/it, loss=0.0556, lr=1e-5]Steps:  97%|█████████▋| 14579/15001 [9:21:54<13:42,  1.95s/it, loss=0.0922, lr=1e-5]Steps:  97%|█████████▋| 14580/15001 [9:21:56<13:41,  1.95s/it, loss=0.0922, lr=1e-5]Steps:  97%|█████████▋| 14580/15001 [9:21:56<13:41,  1.95s/it, loss=0.284, lr=1e-5] Steps:  97%|█████████▋| 14581/15001 [9:21:58<13:28,  1.92s/it, loss=0.284, lr=1e-5]Steps:  97%|█████████▋| 14581/15001 [9:21:58<13:28,  1.92s/it, loss=0.18, lr=1e-5] Steps:  97%|█████████▋| 14582/15001 [9:22:00<13:53,  1.99s/it, loss=0.18, lr=1e-5]Steps:  97%|█████████▋| 14582/15001 [9:22:01<13:53,  1.99s/it, loss=0.0215, lr=1e-5]Steps:  97%|█████████▋| 14583/15001 [9:22:02<14:03,  2.02s/it, loss=0.0215, lr=1e-5]Steps:  97%|█████████▋| 14583/15001 [9:22:03<14:03,  2.02s/it, loss=0.164, lr=1e-5] Steps:  97%|█████████▋| 14584/15001 [9:22:04<13:25,  1.93s/it, loss=0.164, lr=1e-5]Steps:  97%|█████████▋| 14584/15001 [9:22:04<13:25,  1.93s/it, loss=0.0316, lr=1e-5]Steps:  97%|█████████▋| 14585/15001 [9:22:06<12:41,  1.83s/it, loss=0.0316, lr=1e-5]Steps:  97%|█████████▋| 14585/15001 [9:22:06<12:41,  1.83s/it, loss=0.128, lr=1e-5] Steps:  97%|█████████▋| 14586/15001 [9:22:08<12:44,  1.84s/it, loss=0.128, lr=1e-5]Steps:  97%|█████████▋| 14586/15001 [9:22:08<12:44,  1.84s/it, loss=0.0362, lr=1e-5]Steps:  97%|█████████▋| 14587/15001 [9:22:10<13:14,  1.92s/it, loss=0.0362, lr=1e-5]Steps:  97%|█████████▋| 14587/15001 [9:22:10<13:14,  1.92s/it, loss=0.136, lr=1e-5] Steps:  97%|█████████▋| 14588/15001 [9:22:11<12:45,  1.85s/it, loss=0.136, lr=1e-5]Steps:  97%|█████████▋| 14588/15001 [9:22:12<12:45,  1.85s/it, loss=0.214, lr=1e-5]Steps:  97%|█████████▋| 14589/15001 [9:22:13<12:24,  1.81s/it, loss=0.214, lr=1e-5]Steps:  97%|█████████▋| 14589/15001 [9:22:13<12:24,  1.81s/it, loss=0.273, lr=1e-5]Steps:  97%|█████████▋| 14590/15001 [9:22:15<12:22,  1.81s/it, loss=0.273, lr=1e-5]Steps:  97%|█████████▋| 14590/15001 [9:22:15<12:22,  1.81s/it, loss=0.152, lr=1e-5]Steps:  97%|█████████▋| 14591/15001 [9:22:17<12:19,  1.80s/it, loss=0.152, lr=1e-5]Steps:  97%|█████████▋| 14591/15001 [9:22:17<12:19,  1.80s/it, loss=0.237, lr=1e-5]Steps:  97%|█████████▋| 14592/15001 [9:22:19<12:12,  1.79s/it, loss=0.237, lr=1e-5]Steps:  97%|█████████▋| 14592/15001 [9:22:19<12:12,  1.79s/it, loss=0.199, lr=1e-5]Steps:  97%|█████████▋| 14593/15001 [9:22:20<12:01,  1.77s/it, loss=0.199, lr=1e-5]Steps:  97%|█████████▋| 14593/15001 [9:22:21<12:01,  1.77s/it, loss=0.122, lr=1e-5]Steps:  97%|█████████▋| 14594/15001 [9:22:22<12:21,  1.82s/it, loss=0.122, lr=1e-5]Steps:  97%|█████████▋| 14594/15001 [9:22:22<12:21,  1.82s/it, loss=0.126, lr=1e-5]Steps:  97%|█████████▋| 14595/15001 [9:22:24<12:34,  1.86s/it, loss=0.126, lr=1e-5]Steps:  97%|█████████▋| 14595/15001 [9:22:24<12:34,  1.86s/it, loss=0.181, lr=1e-5]Steps:  97%|█████████▋| 14596/15001 [9:22:26<12:03,  1.79s/it, loss=0.181, lr=1e-5]Steps:  97%|█████████▋| 14596/15001 [9:22:26<12:03,  1.79s/it, loss=0.245, lr=1e-5]Steps:  97%|█████████▋| 14597/15001 [9:22:28<12:23,  1.84s/it, loss=0.245, lr=1e-5]Steps:  97%|█████████▋| 14597/15001 [9:22:28<12:23,  1.84s/it, loss=0.139, lr=1e-5]Steps:  97%|█████████▋| 14598/15001 [9:22:30<12:19,  1.83s/it, loss=0.139, lr=1e-5]Steps:  97%|█████████▋| 14598/15001 [9:22:30<12:19,  1.83s/it, loss=0.34, lr=1e-5] Steps:  97%|█████████▋| 14599/15001 [9:22:31<12:12,  1.82s/it, loss=0.34, lr=1e-5]Steps:  97%|█████████▋| 14599/15001 [9:22:31<12:12,  1.82s/it, loss=0.126, lr=1e-5]Steps:  97%|█████████▋| 14600/15001 [9:22:33<12:10,  1.82s/it, loss=0.126, lr=1e-5]Steps:  97%|█████████▋| 14600/15001 [9:22:33<12:10,  1.82s/it, loss=0.137, lr=1e-5]Steps:  97%|█████████▋| 14601/15001 [9:22:35<12:15,  1.84s/it, loss=0.137, lr=1e-5]Steps:  97%|█████████▋| 14601/15001 [9:22:35<12:15,  1.84s/it, loss=0.0476, lr=1e-5]Steps:  97%|█████████▋| 14602/15001 [9:22:37<13:04,  1.97s/it, loss=0.0476, lr=1e-5]Steps:  97%|█████████▋| 14602/15001 [9:22:37<13:04,  1.97s/it, loss=0.096, lr=1e-5] Steps:  97%|█████████▋| 14603/15001 [9:22:39<13:07,  1.98s/it, loss=0.096, lr=1e-5]Steps:  97%|█████████▋| 14603/15001 [9:22:39<13:07,  1.98s/it, loss=0.122, lr=1e-5]Steps:  97%|█████████▋| 14604/15001 [9:22:41<13:18,  2.01s/it, loss=0.122, lr=1e-5]Steps:  97%|█████████▋| 14604/15001 [9:22:41<13:18,  2.01s/it, loss=0.226, lr=1e-5]Steps:  97%|█████████▋| 14605/15001 [9:22:43<13:05,  1.98s/it, loss=0.226, lr=1e-5]Steps:  97%|█████████▋| 14605/15001 [9:22:44<13:05,  1.98s/it, loss=0.0702, lr=1e-5]Steps:  97%|█████████▋| 14606/15001 [9:22:45<12:55,  1.96s/it, loss=0.0702, lr=1e-5]Steps:  97%|█████████▋| 14606/15001 [9:22:45<12:55,  1.96s/it, loss=0.149, lr=1e-5] Steps:  97%|█████████▋| 14607/15001 [9:22:47<12:03,  1.84s/it, loss=0.149, lr=1e-5]Steps:  97%|█████████▋| 14607/15001 [9:22:47<12:03,  1.84s/it, loss=0.0746, lr=1e-5]Steps:  97%|█████████▋| 14608/15001 [9:22:49<12:31,  1.91s/it, loss=0.0746, lr=1e-5]Steps:  97%|█████████▋| 14608/15001 [9:22:49<12:31,  1.91s/it, loss=0.382, lr=1e-5] Steps:  97%|█████████▋| 14609/15001 [9:22:51<12:11,  1.87s/it, loss=0.382, lr=1e-5]Steps:  97%|█████████▋| 14609/15001 [9:22:51<12:11,  1.87s/it, loss=0.0432, lr=1e-5]Steps:  97%|█████████▋| 14610/15001 [9:22:52<11:46,  1.81s/it, loss=0.0432, lr=1e-5]Steps:  97%|█���███████▋| 14610/15001 [9:22:53<11:46,  1.81s/it, loss=0.148, lr=1e-5] Steps:  97%|█████████▋| 14611/15001 [9:22:54<11:57,  1.84s/it, loss=0.148, lr=1e-5]Steps:  97%|█████████▋| 14611/15001 [9:22:54<11:57,  1.84s/it, loss=0.155, lr=1e-5]Steps:  97%|█████████▋| 14612/15001 [9:22:56<11:35,  1.79s/it, loss=0.155, lr=1e-5]Steps:  97%|█████████▋| 14612/15001 [9:22:56<11:35,  1.79s/it, loss=0.217, lr=1e-5]Steps:  97%|█████████▋| 14613/15001 [9:22:58<11:41,  1.81s/it, loss=0.217, lr=1e-5]Steps:  97%|█████████▋| 14613/15001 [9:22:58<11:41,  1.81s/it, loss=0.0555, lr=1e-5]Steps:  97%|█████████▋| 14614/15001 [9:22:59<11:11,  1.73s/it, loss=0.0555, lr=1e-5]Steps:  97%|█████████▋| 14614/15001 [9:23:00<11:11,  1.73s/it, loss=0.174, lr=1e-5] Steps:  97%|█████████▋| 14615/15001 [9:23:01<11:22,  1.77s/it, loss=0.174, lr=1e-5]Steps:  97%|█████████▋| 14615/15001 [9:23:01<11:22,  1.77s/it, loss=0.0791, lr=1e-5]Steps:  97%|█████████▋| 14616/15001 [9:23:03<11:45,  1.83s/it, loss=0.0791, lr=1e-5]Steps:  97%|█████████▋| 14616/15001 [9:23:03<11:45,  1.83s/it, loss=0.187, lr=1e-5] Steps:  97%|█████████▋| 14617/15001 [9:23:05<11:30,  1.80s/it, loss=0.187, lr=1e-5]Steps:  97%|█████████▋| 14617/15001 [9:23:05<11:30,  1.80s/it, loss=0.0307, lr=1e-5]Steps:  97%|█████████▋| 14618/15001 [9:23:07<11:24,  1.79s/it, loss=0.0307, lr=1e-5]Steps:  97%|█████████▋| 14618/15001 [9:23:07<11:24,  1.79s/it, loss=0.267, lr=1e-5] Steps:  97%|█████████▋| 14619/15001 [9:23:09<11:50,  1.86s/it, loss=0.267, lr=1e-5]Steps:  97%|█████████▋| 14619/15001 [9:23:09<11:50,  1.86s/it, loss=0.217, lr=1e-5]Steps:  97%|█████████▋| 14620/15001 [9:23:10<11:39,  1.84s/it, loss=0.217, lr=1e-5]Steps:  97%|█████████▋| 14620/15001 [9:23:11<11:39,  1.84s/it, loss=0.122, lr=1e-5]Steps:  97%|█████████▋| 14621/15001 [9:23:12<11:46,  1.86s/it, loss=0.122, lr=1e-5]Steps:  97%|█████████▋| 14621/15001 [9:23:12<11:46,  1.86s/it, loss=0.26, lr=1e-5] Steps:  97%|█████████▋| 14622/15001 [9:23:14<11:17,  1.79s/it, loss=0.26, lr=1e-5]Steps:  97%|█████████▋| 14622/15001 [9:23:14<11:17,  1.79s/it, loss=0.302, lr=1e-5]Steps:  97%|█████████▋| 14623/15001 [9:23:16<11:35,  1.84s/it, loss=0.302, lr=1e-5]Steps:  97%|█████████▋| 14623/15001 [9:23:16<11:35,  1.84s/it, loss=0.207, lr=1e-5]Steps:  97%|█████████▋| 14624/15001 [9:23:18<11:56,  1.90s/it, loss=0.207, lr=1e-5]Steps:  97%|█████████▋| 14624/15001 [9:23:18<11:56,  1.90s/it, loss=0.195, lr=1e-5]Steps:  97%|█████████▋| 14625/15001 [9:23:20<12:04,  1.93s/it, loss=0.195, lr=1e-5]Steps:  97%|█████████▋| 14625/15001 [9:23:20<12:04,  1.93s/it, loss=0.176, lr=1e-5]Steps:  98%|█████████▊| 14626/15001 [9:23:22<12:17,  1.97s/it, loss=0.176, lr=1e-5]Steps:  98%|█████████▊| 14626/15001 [9:23:22<12:17,  1.97s/it, loss=0.307, lr=1e-5]Steps:  98%|█████████▊| 14627/15001 [9:23:24<11:54,  1.91s/it, loss=0.307, lr=1e-5]Steps:  98%|█████████▊| 14627/15001 [9:23:24<11:54,  1.91s/it, loss=0.173, lr=1e-5]Steps:  98%|█████████▊| 14628/15001 [9:23:26<12:01,  1.93s/it, loss=0.173, lr=1e-5]Steps:  98%|█████████▊| 14628/15001 [9:23:26<12:01,  1.93s/it, loss=0.0813, lr=1e-5]Steps:  98%|█████████▊| 14629/15001 [9:23:28<12:02,  1.94s/it, loss=0.0813, lr=1e-5]Steps:  98%|█████████▊| 14629/15001 [9:23:28<12:02,  1.94s/it, loss=0.249, lr=1e-5] Steps:  98%|█████████▊| 14630/15001 [9:23:30<12:11,  1.97s/it, loss=0.249, lr=1e-5]Steps:  98%|█████████▊| 14630/15001 [9:23:30<12:11,  1.97s/it, loss=0.416, lr=1e-5]Steps:  98%|█████████▊| 14631/15001 [9:23:32<11:56,  1.94s/it, loss=0.416, lr=1e-5]Steps:  98%|█████████▊| 14631/15001 [9:23:32<11:56,  1.94s/it, loss=0.238, lr=1e-5]Steps:  98%|█████████▊| 14632/15001 [9:23:33<11:42,  1.90s/it, loss=0.238, lr=1e-5]Steps:  98%|█████████▊| 14632/15001 [9:23:34<11:42,  1.90s/it, loss=0.0992, lr=1e-5]Steps:  98%|█████████▊| 14633/15001 [9:23:35<11:26,  1.87s/it, loss=0.0992, lr=1e-5]Steps:  98%|█████████▊| 14633/15001 [9:23:35<11:26,  1.87s/it, loss=0.215, lr=1e-5] Steps:  98%|█████████▊| 14634/15001 [9:23:37<11:13,  1.83s/it, loss=0.215, lr=1e-5]Steps:  98%|█████████▊| 14634/15001 [9:23:37<11:13,  1.83s/it, loss=0.178, lr=1e-5]Steps:  98%|████���████▊| 14635/15001 [9:23:39<11:00,  1.81s/it, loss=0.178, lr=1e-5]Steps:  98%|█████████▊| 14635/15001 [9:23:39<11:00,  1.81s/it, loss=0.208, lr=1e-5]Steps:  98%|█████████▊| 14636/15001 [9:23:40<10:40,  1.76s/it, loss=0.208, lr=1e-5]Steps:  98%|█████████▊| 14636/15001 [9:23:41<10:40,  1.76s/it, loss=0.269, lr=1e-5]Steps:  98%|█████████▊| 14637/15001 [9:23:42<10:42,  1.76s/it, loss=0.269, lr=1e-5]Steps:  98%|█████████▊| 14637/15001 [9:23:43<10:42,  1.76s/it, loss=0.189, lr=1e-5]Steps:  98%|█████████▊| 14638/15001 [9:23:44<11:04,  1.83s/it, loss=0.189, lr=1e-5]Steps:  98%|█████████▊| 14638/15001 [9:23:44<11:04,  1.83s/it, loss=0.333, lr=1e-5]Steps:  98%|█████████▊| 14639/15001 [9:23:46<11:23,  1.89s/it, loss=0.333, lr=1e-5]Steps:  98%|█████████▊| 14639/15001 [9:23:46<11:23,  1.89s/it, loss=0.195, lr=1e-5]Steps:  98%|█████████▊| 14640/15001 [9:23:48<11:00,  1.83s/it, loss=0.195, lr=1e-5]Steps:  98%|█████████▊| 14640/15001 [9:23:48<11:00,  1.83s/it, loss=0.266, lr=1e-5]Steps:  98%|█████████▊| 14641/15001 [9:23:50<10:54,  1.82s/it, loss=0.266, lr=1e-5]Steps:  98%|█████████▊| 14641/15001 [9:23:50<10:54,  1.82s/it, loss=0.117, lr=1e-5]Steps:  98%|█████████▊| 14642/15001 [9:23:51<10:49,  1.81s/it, loss=0.117, lr=1e-5]Steps:  98%|█████████▊| 14642/15001 [9:23:52<10:49,  1.81s/it, loss=0.184, lr=1e-5]Steps:  98%|█████████▊| 14643/15001 [9:23:53<10:58,  1.84s/it, loss=0.184, lr=1e-5]Steps:  98%|█████████▊| 14643/15001 [9:23:53<10:58,  1.84s/it, loss=0.249, lr=1e-5]Steps:  98%|█████████▊| 14644/15001 [9:23:55<10:55,  1.84s/it, loss=0.249, lr=1e-5]Steps:  98%|█████████▊| 14644/15001 [9:23:55<10:55,  1.84s/it, loss=0.0542, lr=1e-5]Steps:  98%|█████████▊| 14645/15001 [9:23:57<10:51,  1.83s/it, loss=0.0542, lr=1e-5]Steps:  98%|█████████▊| 14645/15001 [9:23:57<10:51,  1.83s/it, loss=0.177, lr=1e-5] Steps:  98%|█████████▊| 14646/15001 [9:23:59<10:54,  1.84s/it, loss=0.177, lr=1e-5]Steps:  98%|█████████▊| 14646/15001 [9:23:59<10:54,  1.84s/it, loss=0.131, lr=1e-5]Steps:  98%|█████████▊| 14647/15001 [9:24:01<10:46,  1.83s/it, loss=0.131, lr=1e-5]Steps:  98%|█████████▊| 14647/15001 [9:24:01<10:46,  1.83s/it, loss=0.344, lr=1e-5]Steps:  98%|█████████▊| 14648/15001 [9:24:03<11:06,  1.89s/it, loss=0.344, lr=1e-5]Steps:  98%|█████████▊| 14648/15001 [9:24:03<11:06,  1.89s/it, loss=0.245, lr=1e-5]Steps:  98%|█████████▊| 14649/15001 [9:24:05<11:26,  1.95s/it, loss=0.245, lr=1e-5]Steps:  98%|█████████▊| 14649/15001 [9:24:05<11:26,  1.95s/it, loss=0.0482, lr=1e-5]Steps:  98%|█████████▊| 14650/15001 [9:24:07<11:20,  1.94s/it, loss=0.0482, lr=1e-5]Steps:  98%|█████████▊| 14650/15001 [9:24:07<11:20,  1.94s/it, loss=0.0668, lr=1e-5]Steps:  98%|█████████▊| 14651/15001 [9:24:09<11:17,  1.94s/it, loss=0.0668, lr=1e-5]Steps:  98%|█████████▊| 14651/15001 [9:24:09<11:17,  1.94s/it, loss=0.0563, lr=1e-5]Steps:  98%|█████████▊| 14652/15001 [9:24:11<11:13,  1.93s/it, loss=0.0563, lr=1e-5]Steps:  98%|█████████▊| 14652/15001 [9:24:11<11:13,  1.93s/it, loss=0.225, lr=1e-5] Steps:  98%|█████████▊| 14653/15001 [9:24:12<11:14,  1.94s/it, loss=0.225, lr=1e-5]Steps:  98%|█████████▊| 14653/15001 [9:24:13<11:14,  1.94s/it, loss=0.159, lr=1e-5]Steps:  98%|█████████▊| 14654/15001 [9:24:14<10:42,  1.85s/it, loss=0.159, lr=1e-5]Steps:  98%|█████████▊| 14654/15001 [9:24:14<10:42,  1.85s/it, loss=0.138, lr=1e-5]Steps:  98%|█████████▊| 14655/15001 [9:24:16<10:31,  1.83s/it, loss=0.138, lr=1e-5]Steps:  98%|█████████▊| 14655/15001 [9:24:16<10:31,  1.83s/it, loss=0.141, lr=1e-5]Steps:  98%|█████████▊| 14656/15001 [9:24:18<10:54,  1.90s/it, loss=0.141, lr=1e-5]Steps:  98%|█████████▊| 14656/15001 [9:24:18<10:54,  1.90s/it, loss=0.0729, lr=1e-5]Steps:  98%|█████████▊| 14657/15001 [9:24:19<10:13,  1.78s/it, loss=0.0729, lr=1e-5]Steps:  98%|█████████▊| 14657/15001 [9:24:20<10:13,  1.78s/it, loss=0.186, lr=1e-5] Steps:  98%|█████████▊| 14658/15001 [9:24:21<10:19,  1.81s/it, loss=0.186, lr=1e-5]Steps:  98%|█████████▊| 14658/15001 [9:24:22<10:19,  1.81s/it, loss=0.23, lr=1e-5] Steps:  98%|█████████▊| 14659/15001 [9:24:23<10:34,  1.85s/it, loss=0.23, lr=1e-5]Steps:  98%|████████���▊| 14659/15001 [9:24:23<10:34,  1.85s/it, loss=0.134, lr=1e-5]Steps:  98%|█████████▊| 14660/15001 [9:24:25<10:17,  1.81s/it, loss=0.134, lr=1e-5]Steps:  98%|█████████▊| 14660/15001 [9:24:25<10:17,  1.81s/it, loss=0.323, lr=1e-5]Steps:  98%|█████████▊| 14661/15001 [9:24:27<10:14,  1.81s/it, loss=0.323, lr=1e-5]Steps:  98%|█████████▊| 14661/15001 [9:24:27<10:14,  1.81s/it, loss=0.0641, lr=1e-5]Steps:  98%|█████████▊| 14662/15001 [9:24:29<10:05,  1.79s/it, loss=0.0641, lr=1e-5]Steps:  98%|█████████▊| 14662/15001 [9:24:29<10:05,  1.79s/it, loss=0.113, lr=1e-5] Steps:  98%|█████████▊| 14663/15001 [9:24:30<10:09,  1.80s/it, loss=0.113, lr=1e-5]Steps:  98%|█████████▊| 14663/15001 [9:24:31<10:09,  1.80s/it, loss=0.114, lr=1e-5]Steps:  98%|█████████▊| 14664/15001 [9:24:32<10:01,  1.78s/it, loss=0.114, lr=1e-5]Steps:  98%|█████████▊| 14664/15001 [9:24:32<10:01,  1.78s/it, loss=0.506, lr=1e-5]Steps:  98%|█████████▊| 14665/15001 [9:24:34<10:34,  1.89s/it, loss=0.506, lr=1e-5]Steps:  98%|█████████▊| 14665/15001 [9:24:34<10:34,  1.89s/it, loss=0.189, lr=1e-5]Steps:  98%|█████████▊| 14666/15001 [9:24:36<10:22,  1.86s/it, loss=0.189, lr=1e-5]Steps:  98%|█████████▊| 14666/15001 [9:24:36<10:22,  1.86s/it, loss=0.15, lr=1e-5] Steps:  98%|█████████▊| 14667/15001 [9:24:38<09:57,  1.79s/it, loss=0.15, lr=1e-5]Steps:  98%|█████████▊| 14667/15001 [9:24:38<09:57,  1.79s/it, loss=0.196, lr=1e-5]Steps:  98%|█████████▊| 14668/15001 [9:24:39<09:57,  1.79s/it, loss=0.196, lr=1e-5]Steps:  98%|█████████▊| 14668/15001 [9:24:40<09:57,  1.79s/it, loss=0.0761, lr=1e-5]Steps:  98%|█████████▊| 14669/15001 [9:24:41<09:54,  1.79s/it, loss=0.0761, lr=1e-5]Steps:  98%|█████████▊| 14669/15001 [9:24:42<09:54,  1.79s/it, loss=0.183, lr=1e-5] Steps:  98%|█████████▊| 14670/15001 [9:24:44<10:42,  1.94s/it, loss=0.183, lr=1e-5]Steps:  98%|█████████▊| 14670/15001 [9:24:44<10:42,  1.94s/it, loss=0.146, lr=1e-5]Steps:  98%|█████████▊| 14671/15001 [9:24:45<10:30,  1.91s/it, loss=0.146, lr=1e-5]Steps:  98%|█████████▊| 14671/15001 [9:24:46<10:30,  1.91s/it, loss=0.278, lr=1e-5]Steps:  98%|█████████▊| 14672/15001 [9:24:47<10:44,  1.96s/it, loss=0.278, lr=1e-5]Steps:  98%|█████████▊| 14672/15001 [9:24:48<10:44,  1.96s/it, loss=0.0303, lr=1e-5]Steps:  98%|█████████▊| 14673/15001 [9:24:49<10:37,  1.94s/it, loss=0.0303, lr=1e-5]Steps:  98%|█████████▊| 14673/15001 [9:24:50<10:37,  1.94s/it, loss=0.152, lr=1e-5] Steps:  98%|█████████▊| 14674/15001 [9:24:51<10:31,  1.93s/it, loss=0.152, lr=1e-5]Steps:  98%|█████████▊| 14674/15001 [9:24:52<10:31,  1.93s/it, loss=0.228, lr=1e-5]Steps:  98%|█████████▊| 14675/15001 [9:24:53<10:29,  1.93s/it, loss=0.228, lr=1e-5]Steps:  98%|█████████▊| 14675/15001 [9:24:54<10:29,  1.93s/it, loss=0.271, lr=1e-5]Steps:  98%|█████████▊| 14676/15001 [9:24:55<10:29,  1.94s/it, loss=0.271, lr=1e-5]Steps:  98%|█████████▊| 14676/15001 [9:24:55<10:29,  1.94s/it, loss=0.261, lr=1e-5]Steps:  98%|█████████▊| 14677/15001 [9:24:57<10:18,  1.91s/it, loss=0.261, lr=1e-5]Steps:  98%|█████████▊| 14677/15001 [9:24:57<10:18,  1.91s/it, loss=0.116, lr=1e-5]Steps:  98%|█████████▊| 14678/15001 [9:24:59<10:01,  1.86s/it, loss=0.116, lr=1e-5]Steps:  98%|█████████▊| 14678/15001 [9:24:59<10:01,  1.86s/it, loss=0.323, lr=1e-5]Steps:  98%|█████████▊| 14679/15001 [9:25:01<09:52,  1.84s/it, loss=0.323, lr=1e-5]Steps:  98%|█████████▊| 14679/15001 [9:25:01<09:52,  1.84s/it, loss=0.205, lr=1e-5]Steps:  98%|█████████▊| 14680/15001 [9:25:02<09:37,  1.80s/it, loss=0.205, lr=1e-5]Steps:  98%|█████████▊| 14680/15001 [9:25:03<09:37,  1.80s/it, loss=0.177, lr=1e-5]Steps:  98%|█████████▊| 14681/15001 [9:25:04<09:59,  1.87s/it, loss=0.177, lr=1e-5]Steps:  98%|█████████▊| 14681/15001 [9:25:04<09:59,  1.87s/it, loss=0.182, lr=1e-5]Steps:  98%|█████████▊| 14682/15001 [9:25:06<09:40,  1.82s/it, loss=0.182, lr=1e-5]Steps:  98%|█████████▊| 14682/15001 [9:25:06<09:40,  1.82s/it, loss=0.333, lr=1e-5]Steps:  98%|█████████▊| 14683/15001 [9:25:08<09:48,  1.85s/it, loss=0.333, lr=1e-5]Steps:  98%|█████████▊| 14683/15001 [9:25:08<09:48,  1.85s/it, loss=0.245, lr=1e-5]Steps:  98%|█████████▊| 14684/15001 [9:25:10<09:50,  1.86s/it, loss=0.245, lr=1e-5]Steps:  98%|█████████▊| 14684/15001 [9:25:10<09:50,  1.86s/it, loss=0.203, lr=1e-5]Steps:  98%|█████████▊| 14685/15001 [9:25:11<09:35,  1.82s/it, loss=0.203, lr=1e-5]Steps:  98%|█████████▊| 14685/15001 [9:25:12<09:35,  1.82s/it, loss=0.177, lr=1e-5]Steps:  98%|█████████▊| 14686/15001 [9:25:13<09:15,  1.76s/it, loss=0.177, lr=1e-5]Steps:  98%|█████████▊| 14686/15001 [9:25:13<09:15,  1.76s/it, loss=0.1, lr=1e-5]  Steps:  98%|█████████▊| 14687/15001 [9:25:15<09:18,  1.78s/it, loss=0.1, lr=1e-5]Steps:  98%|█████████▊| 14687/15001 [9:25:15<09:18,  1.78s/it, loss=0.139, lr=1e-5]Steps:  98%|█████████▊| 14688/15001 [9:25:17<09:18,  1.78s/it, loss=0.139, lr=1e-5]Steps:  98%|█████████▊| 14688/15001 [9:25:17<09:18,  1.78s/it, loss=0.285, lr=1e-5]Steps:  98%|█████████▊| 14689/15001 [9:25:19<09:26,  1.81s/it, loss=0.285, lr=1e-5]Steps:  98%|█████████▊| 14689/15001 [9:25:19<09:26,  1.81s/it, loss=0.239, lr=1e-5]Steps:  98%|█████████▊| 14690/15001 [9:25:20<09:04,  1.75s/it, loss=0.239, lr=1e-5]Steps:  98%|█████████▊| 14690/15001 [9:25:21<09:04,  1.75s/it, loss=0.273, lr=1e-5]Steps:  98%|█████████▊| 14691/15001 [9:25:22<09:21,  1.81s/it, loss=0.273, lr=1e-5]Steps:  98%|█████████▊| 14691/15001 [9:25:22<09:21,  1.81s/it, loss=0.0775, lr=1e-5]Steps:  98%|█████████▊| 14692/15001 [9:25:24<09:15,  1.80s/it, loss=0.0775, lr=1e-5]Steps:  98%|█████████▊| 14692/15001 [9:25:24<09:15,  1.80s/it, loss=0.297, lr=1e-5] Steps:  98%|█████████▊| 14693/15001 [9:25:26<09:49,  1.91s/it, loss=0.297, lr=1e-5]Steps:  98%|█████████▊| 14693/15001 [9:25:26<09:49,  1.91s/it, loss=0.216, lr=1e-5]Steps:  98%|█████████▊| 14694/15001 [9:25:28<09:42,  1.90s/it, loss=0.216, lr=1e-5]Steps:  98%|█████████▊| 14694/15001 [9:25:28<09:42,  1.90s/it, loss=0.0927, lr=1e-5]Steps:  98%|█████████▊| 14695/15001 [9:25:30<09:34,  1.88s/it, loss=0.0927, lr=1e-5]Steps:  98%|█████████▊| 14695/15001 [9:25:30<09:34,  1.88s/it, loss=0.165, lr=1e-5] Steps:  98%|█████████▊| 14696/15001 [9:25:32<10:02,  1.97s/it, loss=0.165, lr=1e-5]Steps:  98%|█████████▊| 14696/15001 [9:25:32<10:02,  1.97s/it, loss=0.236, lr=1e-5]Steps:  98%|█████████▊| 14697/15001 [9:25:34<09:53,  1.95s/it, loss=0.236, lr=1e-5]Steps:  98%|█████████▊| 14697/15001 [9:25:34<09:53,  1.95s/it, loss=0.173, lr=1e-5]Steps:  98%|█████████▊| 14698/15001 [9:25:36<09:51,  1.95s/it, loss=0.173, lr=1e-5]Steps:  98%|█████████▊| 14698/15001 [9:25:36<09:51,  1.95s/it, loss=0.166, lr=1e-5]Steps:  98%|█████████▊| 14699/15001 [9:25:38<10:03,  2.00s/it, loss=0.166, lr=1e-5]Steps:  98%|█████████▊| 14699/15001 [9:25:38<10:03,  2.00s/it, loss=0.156, lr=1e-5]Steps:  98%|█████████▊| 14700/15001 [9:25:40<09:55,  1.98s/it, loss=0.156, lr=1e-5]Steps:  98%|█████████▊| 14700/15001 [9:25:40<09:55,  1.98s/it, loss=0.0607, lr=1e-5]Steps:  98%|█████████▊| 14701/15001 [9:25:42<09:38,  1.93s/it, loss=0.0607, lr=1e-5]Steps:  98%|█████████▊| 14701/15001 [9:25:42<09:38,  1.93s/it, loss=0.193, lr=1e-5] Steps:  98%|█████████▊| 14702/15001 [9:25:43<09:00,  1.81s/it, loss=0.193, lr=1e-5]Steps:  98%|█████████▊| 14702/15001 [9:25:44<09:00,  1.81s/it, loss=0.217, lr=1e-5]Steps:  98%|█████████▊| 14703/15001 [9:25:45<09:04,  1.83s/it, loss=0.217, lr=1e-5]Steps:  98%|█████████▊| 14703/15001 [9:25:45<09:04,  1.83s/it, loss=0.17, lr=1e-5] Steps:  98%|█████████▊| 14704/15001 [9:25:47<09:06,  1.84s/it, loss=0.17, lr=1e-5]Steps:  98%|█████████▊| 14704/15001 [9:25:47<09:06,  1.84s/it, loss=0.123, lr=1e-5]Steps:  98%|█████████▊| 14705/15001 [9:25:49<09:24,  1.91s/it, loss=0.123, lr=1e-5]Steps:  98%|█████████▊| 14705/15001 [9:25:49<09:24,  1.91s/it, loss=0.0771, lr=1e-5]Steps:  98%|█████████▊| 14706/15001 [9:25:51<09:14,  1.88s/it, loss=0.0771, lr=1e-5]Steps:  98%|█████████▊| 14706/15001 [9:25:51<09:14,  1.88s/it, loss=0.142, lr=1e-5] Steps:  98%|█████████▊| 14707/15001 [9:25:53<08:54,  1.82s/it, loss=0.142, lr=1e-5]Steps:  98%|█████████▊| 14707/15001 [9:25:53<08:54,  1.82s/it, loss=0.176, lr=1e-5]Steps:  98%|█████████▊| 14708/15001 [9:25:54<08:41,  1.78s/it, loss=0.176, lr=1e-5]Steps:  98%|█████████▊| 14708/15001 [9:25:54<08:41,  1.78s/it, loss=0.167, lr=1e-5]Steps:  98%|█████████▊| 14709/15001 [9:25:56<08:57,  1.84s/it, loss=0.167, lr=1e-5]Steps:  98%|█████████▊| 14709/15001 [9:25:56<08:57,  1.84s/it, loss=0.203, lr=1e-5]Steps:  98%|█████████▊| 14710/15001 [9:25:58<08:33,  1.77s/it, loss=0.203, lr=1e-5]Steps:  98%|█████████▊| 14710/15001 [9:25:58<08:33,  1.77s/it, loss=0.454, lr=1e-5]Steps:  98%|█████████▊| 14711/15001 [9:26:00<08:29,  1.76s/it, loss=0.454, lr=1e-5]Steps:  98%|█████████▊| 14711/15001 [9:26:00<08:29,  1.76s/it, loss=0.238, lr=1e-5]Steps:  98%|█████████▊| 14712/15001 [9:26:02<09:05,  1.89s/it, loss=0.238, lr=1e-5]Steps:  98%|█████████▊| 14712/15001 [9:26:02<09:05,  1.89s/it, loss=0.0215, lr=1e-5]Steps:  98%|█████████▊| 14713/15001 [9:26:03<08:31,  1.78s/it, loss=0.0215, lr=1e-5]Steps:  98%|█████████▊| 14713/15001 [9:26:04<08:31,  1.78s/it, loss=0.0781, lr=1e-5]Steps:  98%|█████████▊| 14714/15001 [9:26:05<09:00,  1.88s/it, loss=0.0781, lr=1e-5]Steps:  98%|█████████▊| 14714/15001 [9:26:05<09:00,  1.88s/it, loss=0.0632, lr=1e-5]Steps:  98%|█████████▊| 14715/15001 [9:26:07<08:33,  1.80s/it, loss=0.0632, lr=1e-5]Steps:  98%|█████████▊| 14715/15001 [9:26:07<08:33,  1.80s/it, loss=0.171, lr=1e-5] Steps:  98%|█████████▊| 14716/15001 [9:26:09<09:05,  1.91s/it, loss=0.171, lr=1e-5]Steps:  98%|█████████▊| 14716/15001 [9:26:09<09:05,  1.91s/it, loss=0.0866, lr=1e-5]Steps:  98%|█████████▊| 14717/15001 [9:26:11<09:09,  1.94s/it, loss=0.0866, lr=1e-5]Steps:  98%|█████████▊| 14717/15001 [9:26:11<09:09,  1.94s/it, loss=0.267, lr=1e-5] Steps:  98%|█████████▊| 14718/15001 [9:26:13<09:15,  1.96s/it, loss=0.267, lr=1e-5]Steps:  98%|█████████▊| 14718/15001 [9:26:13<09:15,  1.96s/it, loss=0.31, lr=1e-5] Steps:  98%|█████████▊| 14719/15001 [9:26:15<09:02,  1.92s/it, loss=0.31, lr=1e-5]Steps:  98%|█████████▊| 14719/15001 [9:26:15<09:02,  1.92s/it, loss=0.132, lr=1e-5]Steps:  98%|█████████▊| 14720/15001 [9:26:17<09:14,  1.97s/it, loss=0.132, lr=1e-5]Steps:  98%|█████████▊| 14720/15001 [9:26:17<09:14,  1.97s/it, loss=0.168, lr=1e-5]Steps:  98%|█████████▊| 14721/15001 [9:26:19<08:55,  1.91s/it, loss=0.168, lr=1e-5]Steps:  98%|█████████▊| 14721/15001 [9:26:19<08:55,  1.91s/it, loss=0.0473, lr=1e-5]Steps:  98%|█████████▊| 14722/15001 [9:26:21<08:52,  1.91s/it, loss=0.0473, lr=1e-5]Steps:  98%|█████████▊| 14722/15001 [9:26:21<08:52,  1.91s/it, loss=0.112, lr=1e-5] Steps:  98%|█████████▊| 14723/15001 [9:26:23<08:39,  1.87s/it, loss=0.112, lr=1e-5]Steps:  98%|█████████▊| 14723/15001 [9:26:23<08:39,  1.87s/it, loss=0.135, lr=1e-5]Steps:  98%|█████████▊| 14724/15001 [9:26:25<08:47,  1.90s/it, loss=0.135, lr=1e-5]Steps:  98%|█████████▊| 14724/15001 [9:26:25<08:47,  1.90s/it, loss=0.119, lr=1e-5]Steps:  98%|█████████▊| 14725/15001 [9:26:26<08:40,  1.88s/it, loss=0.119, lr=1e-5]Steps:  98%|█████████▊| 14725/15001 [9:26:26<08:40,  1.88s/it, loss=0.221, lr=1e-5]Steps:  98%|█████████▊| 14726/15001 [9:26:28<08:31,  1.86s/it, loss=0.221, lr=1e-5]Steps:  98%|█████████▊| 14726/15001 [9:26:28<08:31,  1.86s/it, loss=0.303, lr=1e-5]Steps:  98%|█████████▊| 14727/15001 [9:26:30<08:05,  1.77s/it, loss=0.303, lr=1e-5]Steps:  98%|█████████▊| 14727/15001 [9:26:30<08:05,  1.77s/it, loss=0.296, lr=1e-5]Steps:  98%|█████████▊| 14728/15001 [9:26:32<08:14,  1.81s/it, loss=0.296, lr=1e-5]Steps:  98%|█████████▊| 14728/15001 [9:26:32<08:14,  1.81s/it, loss=0.24, lr=1e-5] Steps:  98%|█████████▊| 14729/15001 [9:26:33<08:07,  1.79s/it, loss=0.24, lr=1e-5]Steps:  98%|█████████▊| 14729/15001 [9:26:34<08:07,  1.79s/it, loss=0.0931, lr=1e-5]Steps:  98%|█████████▊| 14730/15001 [9:26:35<08:08,  1.80s/it, loss=0.0931, lr=1e-5]Steps:  98%|█████████▊| 14730/15001 [9:26:35<08:08,  1.80s/it, loss=0.12, lr=1e-5]  Steps:  98%|█████████▊| 14731/15001 [9:26:37<08:10,  1.82s/it, loss=0.12, lr=1e-5]Steps:  98%|█████████▊| 14731/15001 [9:26:37<08:10,  1.82s/it, loss=0.0709, lr=1e-5]Steps:  98%|█████████▊| 14732/15001 [9:26:39<08:02,  1.79s/it, loss=0.0709, lr=1e-5]Steps:  98%|█████████▊| 14732/15001 [9:26:39<08:02,  1.79s/it, loss=0.0999, lr=1e-5]Steps:  98%|█████████▊| 14733/15001 [9:26:41<08:17,  1.86s/it, loss=0.0999, lr=1e-5]Steps:  98%|█████████▊| 14733/15001 [9:26:41<08:17,  1.86s/it, loss=0.202, lr=1e-5] Steps:  98%|█████████▊| 14734/15001 [9:26:42<07:58,  1.79s/it, loss=0.202, lr=1e-5]Steps:  98%|█████████▊| 14734/15001 [9:26:43<07:58,  1.79s/it, loss=0.107, lr=1e-5]Steps:  98%|█████████▊| 14735/15001 [9:26:44<07:51,  1.77s/it, loss=0.107, lr=1e-5]Steps:  98%|█████████▊| 14735/15001 [9:26:44<07:51,  1.77s/it, loss=0.135, lr=1e-5]Steps:  98%|█████████▊| 14736/15001 [9:26:46<08:06,  1.84s/it, loss=0.135, lr=1e-5]Steps:  98%|█████████▊| 14736/15001 [9:26:46<08:06,  1.84s/it, loss=0.176, lr=1e-5]Steps:  98%|█████████▊| 14737/15001 [9:26:48<07:48,  1.77s/it, loss=0.176, lr=1e-5]Steps:  98%|█████████▊| 14737/15001 [9:26:48<07:48,  1.77s/it, loss=0.135, lr=1e-5]Steps:  98%|█████████▊| 14738/15001 [9:26:50<07:42,  1.76s/it, loss=0.135, lr=1e-5]Steps:  98%|█████████▊| 14738/15001 [9:26:50<07:42,  1.76s/it, loss=0.257, lr=1e-5]Steps:  98%|█████████▊| 14739/15001 [9:26:52<08:08,  1.86s/it, loss=0.257, lr=1e-5]Steps:  98%|█████████▊| 14739/15001 [9:26:52<08:08,  1.86s/it, loss=0.13, lr=1e-5] Steps:  98%|█████████▊| 14740/15001 [9:26:54<08:17,  1.91s/it, loss=0.13, lr=1e-5]Steps:  98%|█████████▊| 14740/15001 [9:26:54<08:17,  1.91s/it, loss=0.0909, lr=1e-5]Steps:  98%|█████████▊| 14741/15001 [9:26:55<08:06,  1.87s/it, loss=0.0909, lr=1e-5]Steps:  98%|█████████▊| 14741/15001 [9:26:56<08:06,  1.87s/it, loss=0.115, lr=1e-5] Steps:  98%|█████████▊| 14742/15001 [9:26:57<08:09,  1.89s/it, loss=0.115, lr=1e-5]Steps:  98%|█████████▊| 14742/15001 [9:26:58<08:09,  1.89s/it, loss=0.0742, lr=1e-5]Steps:  98%|█████████▊| 14743/15001 [9:27:00<08:37,  2.01s/it, loss=0.0742, lr=1e-5]Steps:  98%|█████████▊| 14743/15001 [9:27:00<08:37,  2.01s/it, loss=0.227, lr=1e-5] Steps:  98%|█████████▊| 14744/15001 [9:27:02<08:32,  1.99s/it, loss=0.227, lr=1e-5]Steps:  98%|█████████▊| 14744/15001 [9:27:02<08:32,  1.99s/it, loss=0.141, lr=1e-5]Steps:  98%|█████████▊| 14745/15001 [9:27:04<08:51,  2.08s/it, loss=0.141, lr=1e-5]Steps:  98%|█████████▊| 14745/15001 [9:27:04<08:51,  2.08s/it, loss=0.399, lr=1e-5]Steps:  98%|█████████▊| 14746/15001 [9:27:05<07:54,  1.86s/it, loss=0.399, lr=1e-5]Steps:  98%|█████████▊| 14746/15001 [9:27:06<07:54,  1.86s/it, loss=0.103, lr=1e-5]Steps:  98%|█████████▊| 14747/15001 [9:27:07<08:24,  1.98s/it, loss=0.103, lr=1e-5]Steps:  98%|█████████▊| 14747/15001 [9:27:08<08:24,  1.98s/it, loss=0.178, lr=1e-5]Steps:  98%|█████████▊| 14748/15001 [9:27:09<08:02,  1.91s/it, loss=0.178, lr=1e-5]Steps:  98%|█████████▊| 14748/15001 [9:27:09<08:02,  1.91s/it, loss=0.0734, lr=1e-5]Steps:  98%|█████████▊| 14749/15001 [9:27:11<07:38,  1.82s/it, loss=0.0734, lr=1e-5]Steps:  98%|█████████▊| 14749/15001 [9:27:11<07:38,  1.82s/it, loss=0.109, lr=1e-5] Steps:  98%|█████████▊| 14750/15001 [9:27:13<07:43,  1.85s/it, loss=0.109, lr=1e-5]Steps:  98%|█████████▊| 14750/15001 [9:27:13<07:43,  1.85s/it, loss=0.0706, lr=1e-5]Steps:  98%|█████████▊| 14751/15001 [9:27:14<07:34,  1.82s/it, loss=0.0706, lr=1e-5]Steps:  98%|█████████▊| 14751/15001 [9:27:15<07:34,  1.82s/it, loss=0.212, lr=1e-5] Steps:  98%|█████████▊| 14752/15001 [9:27:17<07:55,  1.91s/it, loss=0.212, lr=1e-5]Steps:  98%|█████████▊| 14752/15001 [9:27:17<07:55,  1.91s/it, loss=0.129, lr=1e-5]Steps:  98%|█████████▊| 14753/15001 [9:27:18<07:40,  1.86s/it, loss=0.129, lr=1e-5]Steps:  98%|█████████▊| 14753/15001 [9:27:18<07:40,  1.86s/it, loss=0.0966, lr=1e-5]Steps:  98%|█████████▊| 14754/15001 [9:27:20<07:26,  1.81s/it, loss=0.0966, lr=1e-5]Steps:  98%|█████████▊| 14754/15001 [9:27:20<07:26,  1.81s/it, loss=0.22, lr=1e-5]  Steps:  98%|█████████▊| 14755/15001 [9:27:22<07:22,  1.80s/it, loss=0.22, lr=1e-5]Steps:  98%|█████████▊| 14755/15001 [9:27:22<07:22,  1.80s/it, loss=0.212, lr=1e-5]Steps:  98%|█████████▊| 14756/15001 [9:27:24<07:30,  1.84s/it, loss=0.212, lr=1e-5]Steps:  98%|█████████▊| 14756/15001 [9:27:24<07:30,  1.84s/it, loss=0.242, lr=1e-5]Steps:  98%|█████████▊| 14757/15001 [9:27:26<07:29,  1.84s/it, loss=0.242, lr=1e-5]Steps:  98%|█████████▊| 14757/15001 [9:27:26<07:29,  1.84s/it, loss=0.0711, lr=1e-5]Steps:  98%|█████████▊| 14758/15001 [9:27:27<07:24,  1.83s/it, loss=0.0711, lr=1e-5]Steps:  98%|█████████▊| 14758/15001 [9:27:28<07:24,  1.83s/it, loss=0.319, lr=1e-5] Steps:  98%|█████████▊| 14759/15001 [9:27:29<07:10,  1.78s/it, loss=0.319, lr=1e-5]Steps:  98%|█████████▊| 14759/15001 [9:27:29<07:10,  1.78s/it, loss=0.158, lr=1e-5]Steps:  98%|█████████▊| 14760/15001 [9:27:31<07:13,  1.80s/it, loss=0.158, lr=1e-5]Steps:  98%|█████████▊| 14760/15001 [9:27:31<07:13,  1.80s/it, loss=0.228, lr=1e-5]Steps:  98%|█████████▊| 14761/15001 [9:27:33<07:24,  1.85s/it, loss=0.228, lr=1e-5]Steps:  98%|█████████▊| 14761/15001 [9:27:33<07:24,  1.85s/it, loss=0.107, lr=1e-5]Steps:  98%|█████████▊| 14762/15001 [9:27:35<07:28,  1.88s/it, loss=0.107, lr=1e-5]Steps:  98%|█████████▊| 14762/15001 [9:27:35<07:28,  1.88s/it, loss=0.177, lr=1e-5]Steps:  98%|█████████▊| 14763/15001 [9:27:37<07:24,  1.87s/it, loss=0.177, lr=1e-5]Steps:  98%|█████████▊| 14763/15001 [9:27:37<07:24,  1.87s/it, loss=0.0822, lr=1e-5]Steps:  98%|█████████▊| 14764/15001 [9:27:39<07:46,  1.97s/it, loss=0.0822, lr=1e-5]Steps:  98%|█████████▊| 14764/15001 [9:27:39<07:46,  1.97s/it, loss=0.162, lr=1e-5] Steps:  98%|█████████▊| 14765/15001 [9:27:41<07:42,  1.96s/it, loss=0.162, lr=1e-5]Steps:  98%|█████████▊| 14765/15001 [9:27:41<07:42,  1.96s/it, loss=0.0739, lr=1e-5]Steps:  98%|█████████▊| 14766/15001 [9:27:42<07:20,  1.87s/it, loss=0.0739, lr=1e-5]Steps:  98%|█████████▊| 14766/15001 [9:27:43<07:20,  1.87s/it, loss=0.236, lr=1e-5] Steps:  98%|█████████▊| 14767/15001 [9:27:44<07:22,  1.89s/it, loss=0.236, lr=1e-5]Steps:  98%|█████████▊| 14767/15001 [9:27:45<07:22,  1.89s/it, loss=0.346, lr=1e-5]Steps:  98%|█████████▊| 14768/15001 [9:27:46<07:31,  1.94s/it, loss=0.346, lr=1e-5]Steps:  98%|█████████▊| 14768/15001 [9:27:47<07:31,  1.94s/it, loss=0.0395, lr=1e-5]Steps:  98%|█████████▊| 14769/15001 [9:27:49<07:38,  1.98s/it, loss=0.0395, lr=1e-5]Steps:  98%|█████████▊| 14769/15001 [9:27:49<07:38,  1.98s/it, loss=0.165, lr=1e-5] Steps:  98%|█████████▊| 14770/15001 [9:27:50<07:25,  1.93s/it, loss=0.165, lr=1e-5]Steps:  98%|█████████▊| 14770/15001 [9:27:50<07:25,  1.93s/it, loss=0.495, lr=1e-5]Steps:  98%|█████████▊| 14771/15001 [9:27:52<07:03,  1.84s/it, loss=0.495, lr=1e-5]Steps:  98%|█████████▊| 14771/15001 [9:27:52<07:03,  1.84s/it, loss=0.0439, lr=1e-5]Steps:  98%|█████████▊| 14772/15001 [9:27:54<07:15,  1.90s/it, loss=0.0439, lr=1e-5]Steps:  98%|█████████▊| 14772/15001 [9:27:54<07:15,  1.90s/it, loss=0.0959, lr=1e-5]Steps:  98%|█████████▊| 14773/15001 [9:27:56<06:57,  1.83s/it, loss=0.0959, lr=1e-5]Steps:  98%|█████████▊| 14773/15001 [9:27:56<06:57,  1.83s/it, loss=0.442, lr=1e-5] Steps:  98%|█████████▊| 14774/15001 [9:27:57<06:48,  1.80s/it, loss=0.442, lr=1e-5]Steps:  98%|█████████▊| 14774/15001 [9:27:58<06:48,  1.80s/it, loss=0.26, lr=1e-5] Steps:  98%|█████████▊| 14775/15001 [9:27:59<06:42,  1.78s/it, loss=0.26, lr=1e-5]Steps:  98%|█████████▊| 14775/15001 [9:27:59<06:42,  1.78s/it, loss=0.346, lr=1e-5]Steps:  99%|█████████▊| 14776/15001 [9:28:01<06:56,  1.85s/it, loss=0.346, lr=1e-5]Steps:  99%|█████████▊| 14776/15001 [9:28:01<06:56,  1.85s/it, loss=0.0112, lr=1e-5]Steps:  99%|█████████▊| 14777/15001 [9:28:03<06:38,  1.78s/it, loss=0.0112, lr=1e-5]Steps:  99%|█████████▊| 14777/15001 [9:28:03<06:38,  1.78s/it, loss=0.109, lr=1e-5] Steps:  99%|█████████▊| 14778/15001 [9:28:05<06:48,  1.83s/it, loss=0.109, lr=1e-5]Steps:  99%|█████████▊| 14778/15001 [9:28:05<06:48,  1.83s/it, loss=0.0953, lr=1e-5]Steps:  99%|█████████▊| 14779/15001 [9:28:07<06:54,  1.87s/it, loss=0.0953, lr=1e-5]Steps:  99%|█████████▊| 14779/15001 [9:28:07<06:54,  1.87s/it, loss=0.349, lr=1e-5] Steps:  99%|█████████▊| 14780/15001 [9:28:08<06:45,  1.84s/it, loss=0.349, lr=1e-5]Steps:  99%|█████████▊| 14780/15001 [9:28:09<06:45,  1.84s/it, loss=0.178, lr=1e-5]Steps:  99%|█████████▊| 14781/15001 [9:28:10<06:45,  1.84s/it, loss=0.178, lr=1e-5]Steps:  99%|█████████▊| 14781/15001 [9:28:10<06:45,  1.84s/it, loss=0.119, lr=1e-5]Steps:  99%|█████████▊| 14782/15001 [9:28:12<06:25,  1.76s/it, loss=0.119, lr=1e-5]Steps:  99%|█████████▊| 14782/15001 [9:28:12<06:25,  1.76s/it, loss=0.194, lr=1e-5]Steps:  99%|█████████▊| 14783/15001 [9:28:14<06:31,  1.80s/it, loss=0.194, lr=1e-5]Steps:  99%|█████████▊| 14783/15001 [9:28:14<06:31,  1.80s/it, loss=0.175, lr=1e-5]Steps:  99%|█████████▊| 14784/15001 [9:28:16<06:37,  1.83s/it, loss=0.175, lr=1e-5]Steps:  99%|█████████▊| 14784/15001 [9:28:16<06:37,  1.83s/it, loss=0.0647, lr=1e-5]Steps:  99%|█████████▊| 14785/15001 [9:28:18<06:37,  1.84s/it, loss=0.0647, lr=1e-5]Steps:  99%|█████████▊| 14785/15001 [9:28:18<06:37,  1.84s/it, loss=0.342, lr=1e-5] Steps:  99%|█████████▊| 14786/15001 [9:28:20<06:49,  1.90s/it, loss=0.342, lr=1e-5]Steps:  99%|█████████▊| 14786/15001 [9:28:20<06:49,  1.90s/it, loss=0.177, lr=1e-5]Steps:  99%|█████████▊| 14787/15001 [9:28:21<06:43,  1.89s/it, loss=0.177, lr=1e-5]Steps:  99%|█████████▊| 14787/15001 [9:28:22<06:43,  1.89s/it, loss=0.0882, lr=1e-5]Steps:  99%|█████████▊| 14788/15001 [9:28:23<06:43,  1.89s/it, loss=0.0882, lr=1e-5]Steps:  99%|█████████▊| 14788/15001 [9:28:24<06:43,  1.89s/it, loss=0.103, lr=1e-5] Steps:  99%|█████████▊| 14789/15001 [9:28:25<06:56,  1.96s/it, loss=0.103, lr=1e-5]Steps:  99%|█████████▊| 14789/15001 [9:28:26<06:56,  1.96s/it, loss=0.158, lr=1e-5]Steps:  99%|█████████▊| 14790/15001 [9:28:27<06:54,  1.96s/it, loss=0.158, lr=1e-5]Steps:  99%|█████████▊| 14790/15001 [9:28:28<06:54,  1.96s/it, loss=0.428, lr=1e-5]Steps:  99%|█████████▊| 14791/15001 [9:28:29<06:48,  1.95s/it, loss=0.428, lr=1e-5]Steps:  99%|█████████▊| 14791/15001 [9:28:29<06:48,  1.95s/it, loss=0.187, lr=1e-5]Steps:  99%|█████████▊| 14792/15001 [9:28:31<06:33,  1.88s/it, loss=0.187, lr=1e-5]Steps:  99%|█████████▊| 14792/15001 [9:28:31<06:33,  1.88s/it, loss=0.178, lr=1e-5]Steps:  99%|█████████▊| 14793/15001 [9:28:33<06:18,  1.82s/it, loss=0.178, lr=1e-5]Steps:  99%|█████████▊| 14793/15001 [9:28:33<06:18,  1.82s/it, loss=0.249, lr=1e-5]Steps:  99%|█████████▊| 14794/15001 [9:28:35<06:29,  1.88s/it, loss=0.249, lr=1e-5]Steps:  99%|█████████▊| 14794/15001 [9:28:35<06:29,  1.88s/it, loss=0.254, lr=1e-5]Steps:  99%|█████████▊| 14795/15001 [9:28:36<06:07,  1.78s/it, loss=0.254, lr=1e-5]Steps:  99%|█████████▊| 14795/15001 [9:28:37<06:07,  1.78s/it, loss=0.0639, lr=1e-5]Steps:  99%|█████████▊| 14796/15001 [9:28:38<06:15,  1.83s/it, loss=0.0639, lr=1e-5]Steps:  99%|█████████▊| 14796/15001 [9:28:38<06:15,  1.83s/it, loss=0.0202, lr=1e-5]Steps:  99%|█████████▊| 14797/15001 [9:28:40<06:04,  1.79s/it, loss=0.0202, lr=1e-5]Steps:  99%|█████████▊| 14797/15001 [9:28:40<06:04,  1.79s/it, loss=0.187, lr=1e-5] Steps:  99%|█████████▊| 14798/15001 [9:28:42<06:08,  1.82s/it, loss=0.187, lr=1e-5]Steps:  99%|█████████▊| 14798/15001 [9:28:42<06:08,  1.82s/it, loss=0.138, lr=1e-5]Steps:  99%|█████████▊| 14799/15001 [9:28:44<06:08,  1.83s/it, loss=0.138, lr=1e-5]Steps:  99%|█████████▊| 14799/15001 [9:28:44<06:08,  1.83s/it, loss=0.139, lr=1e-5]Steps:  99%|█████████▊| 14800/15001 [9:28:45<06:01,  1.80s/it, loss=0.139, lr=1e-5]Steps:  99%|█████████▊| 14800/15001 [9:28:46<06:01,  1.80s/it, loss=0.145, lr=1e-5]Steps:  99%|█████████▊| 14801/15001 [9:28:47<06:07,  1.84s/it, loss=0.145, lr=1e-5]Steps:  99%|█████████▊| 14801/15001 [9:28:47<06:07,  1.84s/it, loss=0.404, lr=1e-5]Steps:  99%|█████████▊| 14802/15001 [9:28:49<05:48,  1.75s/it, loss=0.404, lr=1e-5]Steps:  99%|█████████▊| 14802/15001 [9:28:49<05:48,  1.75s/it, loss=0.166, lr=1e-5]Steps:  99%|█████████▊| 14803/15001 [9:28:51<06:13,  1.88s/it, loss=0.166, lr=1e-5]Steps:  99%|█████████▊| 14803/15001 [9:28:51<06:13,  1.88s/it, loss=0.279, lr=1e-5]Steps:  99%|█████████▊| 14804/15001 [9:28:53<06:04,  1.85s/it, loss=0.279, lr=1e-5]Steps:  99%|█████████▊| 14804/15001 [9:28:53<06:04,  1.85s/it, loss=0.255, lr=1e-5]Steps:  99%|█████████▊| 14805/15001 [9:28:54<05:42,  1.75s/it, loss=0.255, lr=1e-5]Steps:  99%|█████████▊| 14805/15001 [9:28:55<05:42,  1.75s/it, loss=0.175, lr=1e-5]Steps:  99%|█████████▊| 14806/15001 [9:28:56<05:59,  1.84s/it, loss=0.175, lr=1e-5]Steps:  99%|█████████▊| 14806/15001 [9:28:57<05:59,  1.84s/it, loss=0.156, lr=1e-5]Steps:  99%|█████████▊| 14807/15001 [9:28:58<06:00,  1.86s/it, loss=0.156, lr=1e-5]Steps:  99%|█████████▊| 14807/15001 [9:28:58<06:00,  1.86s/it, loss=0.19, lr=1e-5] Steps:  99%|█████████▊| 14808/15001 [9:29:00<06:04,  1.89s/it, loss=0.19, lr=1e-5]Steps:  99%|█████████▊| 14808/15001 [9:29:00<06:04,  1.89s/it, loss=0.113, lr=1e-5]Steps:  99%|█████████▊| 14809/15001 [9:29:02<05:56,  1.86s/it, loss=0.113, lr=1e-5]Steps:  99%|█████████▊| 14809/15001 [9:29:02<05:56,  1.86s/it, loss=0.169, lr=1e-5]Steps:  99%|█████████▊| 14810/15001 [9:29:04<06:05,  1.92s/it, loss=0.169, lr=1e-5]Steps:  99%|█████████▊| 14810/15001 [9:29:04<06:05,  1.92s/it, loss=0.153, lr=1e-5]Steps:  99%|█████████▊| 14811/15001 [9:29:06<06:11,  1.95s/it, loss=0.153, lr=1e-5]Steps:  99%|█████████▊| 14811/15001 [9:29:06<06:11,  1.95s/it, loss=0.0776, lr=1e-5]Steps:  99%|█████████▊| 14812/15001 [9:29:08<06:18,  2.00s/it, loss=0.0776, lr=1e-5]Steps:  99%|█████████▊| 14812/15001 [9:29:08<06:18,  2.00s/it, loss=0.205, lr=1e-5] Steps:  99%|█████████▊| 14813/15001 [9:29:10<06:03,  1.93s/it, loss=0.205, lr=1e-5]Steps:  99%|█████████▊| 14813/15001 [9:29:10<06:03,  1.93s/it, loss=0.351, lr=1e-5]Steps:  99%|█████████▉| 14814/15001 [9:29:12<06:01,  1.93s/it, loss=0.351, lr=1e-5]Steps:  99%|█████████▉| 14814/15001 [9:29:12<06:01,  1.93s/it, loss=0.171, lr=1e-5]Steps:  99%|█████████▉| 14815/15001 [9:29:14<06:13,  2.01s/it, loss=0.171, lr=1e-5]Steps:  99%|█████████▉| 14815/15001 [9:29:14<06:13,  2.01s/it, loss=0.239, lr=1e-5]Steps:  99%|█████████▉| 14816/15001 [9:29:16<05:51,  1.90s/it, loss=0.239, lr=1e-5]Steps:  99%|█████████▉| 14816/15001 [9:29:16<05:51,  1.90s/it, loss=0.0852, lr=1e-5]Steps:  99%|█████████▉| 14817/15001 [9:29:18<05:50,  1.91s/it, loss=0.0852, lr=1e-5]Steps:  99%|█████████▉| 14817/15001 [9:29:18<05:50,  1.91s/it, loss=0.14, lr=1e-5]  Steps:  99%|█████████▉| 14818/15001 [9:29:20<05:45,  1.89s/it, loss=0.14, lr=1e-5]Steps:  99%|█████████▉| 14818/15001 [9:29:20<05:45,  1.89s/it, loss=0.249, lr=1e-5]Steps:  99%|█████████▉| 14819/15001 [9:29:21<05:42,  1.88s/it, loss=0.249, lr=1e-5]Steps:  99%|█████████▉| 14819/15001 [9:29:22<05:42,  1.88s/it, loss=0.148, lr=1e-5]Steps:  99%|█████████▉| 14820/15001 [9:29:23<05:14,  1.74s/it, loss=0.148, lr=1e-5]Steps:  99%|█████████▉| 14820/15001 [9:29:23<05:14,  1.74s/it, loss=0.203, lr=1e-5]Steps:  99%|█████████▉| 14821/15001 [9:29:25<05:29,  1.83s/it, loss=0.203, lr=1e-5]Steps:  99%|█████████▉| 14821/15001 [9:29:25<05:29,  1.83s/it, loss=0.209, lr=1e-5]Steps:  99%|█████████▉| 14822/15001 [9:29:27<05:36,  1.88s/it, loss=0.209, lr=1e-5]Steps:  99%|█████████▉| 14822/15001 [9:29:27<05:36,  1.88s/it, loss=0.182, lr=1e-5]Steps:  99%|█████████▉| 14823/15001 [9:29:29<05:28,  1.85s/it, loss=0.182, lr=1e-5]Steps:  99%|█████████▉| 14823/15001 [9:29:29<05:28,  1.85s/it, loss=0.162, lr=1e-5]Steps:  99%|█████████▉| 14824/15001 [9:29:31<05:29,  1.86s/it, loss=0.162, lr=1e-5]Steps:  99%|█████████▉| 14824/15001 [9:29:31<05:29,  1.86s/it, loss=0.072, lr=1e-5]Steps:  99%|█████████▉| 14825/15001 [9:29:32<05:22,  1.83s/it, loss=0.072, lr=1e-5]Steps:  99%|█████████▉| 14825/15001 [9:29:32<05:22,  1.83s/it, loss=0.052, lr=1e-5]Steps:  99%|█████████▉| 14826/15001 [9:29:34<05:20,  1.83s/it, loss=0.052, lr=1e-5]Steps:  99%|█████████▉| 14826/15001 [9:29:34<05:20,  1.83s/it, loss=0.134, lr=1e-5]Steps:  99%|█████████▉| 14827/15001 [9:29:36<05:06,  1.76s/it, loss=0.134, lr=1e-5]Steps:  99%|█████████▉| 14827/15001 [9:29:36<05:06,  1.76s/it, loss=0.132, lr=1e-5]Steps:  99%|█████████▉| 14828/15001 [9:29:38<05:08,  1.78s/it, loss=0.132, lr=1e-5]Steps:  99%|█████████▉| 14828/15001 [9:29:38<05:08,  1.78s/it, loss=0.12, lr=1e-5] Steps:  99%|█████████▉| 14829/15001 [9:29:40<05:20,  1.86s/it, loss=0.12, lr=1e-5]Steps:  99%|█████████▉| 14829/15001 [9:29:40<05:20,  1.86s/it, loss=0.0823, lr=1e-5]Steps:  99%|█████████▉| 14830/15001 [9:29:41<05:16,  1.85s/it, loss=0.0823, lr=1e-5]Steps:  99%|█████████▉| 14830/15001 [9:29:42<05:16,  1.85s/it, loss=0.255, lr=1e-5] Steps:  99%|█████████▉| 14831/15001 [9:29:43<05:12,  1.84s/it, loss=0.255, lr=1e-5]Steps:  99%|��████████▉| 14831/15001 [9:29:44<05:12,  1.84s/it, loss=0.111, lr=1e-5]Steps:  99%|█████████▉| 14832/15001 [9:29:45<05:28,  1.94s/it, loss=0.111, lr=1e-5]Steps:  99%|█████████▉| 14832/15001 [9:29:46<05:28,  1.94s/it, loss=0.214, lr=1e-5]Steps:  99%|█████████▉| 14833/15001 [9:29:47<05:28,  1.96s/it, loss=0.214, lr=1e-5]Steps:  99%|█████████▉| 14833/15001 [9:29:48<05:28,  1.96s/it, loss=0.211, lr=1e-5]Steps:  99%|█████████▉| 14834/15001 [9:29:49<05:25,  1.95s/it, loss=0.211, lr=1e-5]Steps:  99%|█████████▉| 14834/15001 [9:29:50<05:25,  1.95s/it, loss=0.139, lr=1e-5]Steps:  99%|█████████▉| 14835/15001 [9:29:52<05:32,  2.00s/it, loss=0.139, lr=1e-5]Steps:  99%|█████████▉| 14835/15001 [9:29:52<05:32,  2.00s/it, loss=0.128, lr=1e-5]Steps:  99%|█████████▉| 14836/15001 [9:29:53<05:18,  1.93s/it, loss=0.128, lr=1e-5]Steps:  99%|█████████▉| 14836/15001 [9:29:54<05:18,  1.93s/it, loss=0.129, lr=1e-5]Steps:  99%|█████████▉| 14837/15001 [9:29:55<05:16,  1.93s/it, loss=0.129, lr=1e-5]Steps:  99%|█████████▉| 14837/15001 [9:29:55<05:16,  1.93s/it, loss=0.143, lr=1e-5]Steps:  99%|█████████▉| 14838/15001 [9:29:57<05:21,  1.97s/it, loss=0.143, lr=1e-5]Steps:  99%|█████████▉| 14838/15001 [9:29:57<05:21,  1.97s/it, loss=0.212, lr=1e-5]Steps:  99%|█████████▉| 14839/15001 [9:29:59<05:13,  1.94s/it, loss=0.212, lr=1e-5]Steps:  99%|█████████▉| 14839/15001 [9:29:59<05:13,  1.94s/it, loss=0.263, lr=1e-5]Steps:  99%|█████████▉| 14840/15001 [9:30:01<05:05,  1.90s/it, loss=0.263, lr=1e-5]Steps:  99%|█████████▉| 14840/15001 [9:30:01<05:05,  1.90s/it, loss=0.352, lr=1e-5]Steps:  99%|█████████▉| 14841/15001 [9:30:03<04:55,  1.85s/it, loss=0.352, lr=1e-5]Steps:  99%|█████████▉| 14841/15001 [9:30:03<04:55,  1.85s/it, loss=0.0329, lr=1e-5]Steps:  99%|█████████▉| 14842/15001 [9:30:04<04:53,  1.85s/it, loss=0.0329, lr=1e-5]Steps:  99%|█████████▉| 14842/15001 [9:30:05<04:53,  1.85s/it, loss=0.0629, lr=1e-5]Steps:  99%|█████████▉| 14843/15001 [9:30:06<04:47,  1.82s/it, loss=0.0629, lr=1e-5]Steps:  99%|█████████▉| 14843/15001 [9:30:06<04:47,  1.82s/it, loss=0.0915, lr=1e-5]Steps:  99%|█████████▉| 14844/15001 [9:30:08<04:51,  1.86s/it, loss=0.0915, lr=1e-5]Steps:  99%|█████████▉| 14844/15001 [9:30:08<04:51,  1.86s/it, loss=0.0469, lr=1e-5]Steps:  99%|█████████▉| 14845/15001 [9:30:10<04:45,  1.83s/it, loss=0.0469, lr=1e-5]Steps:  99%|█████████▉| 14845/15001 [9:30:10<04:45,  1.83s/it, loss=0.19, lr=1e-5]  Steps:  99%|█████████▉| 14846/15001 [9:30:12<04:39,  1.80s/it, loss=0.19, lr=1e-5]Steps:  99%|█████████▉| 14846/15001 [9:30:12<04:39,  1.80s/it, loss=0.2, lr=1e-5] Steps:  99%|█████████▉| 14847/15001 [9:30:13<04:30,  1.76s/it, loss=0.2, lr=1e-5]Steps:  99%|█████████▉| 14847/15001 [9:30:14<04:30,  1.76s/it, loss=0.0294, lr=1e-5]Steps:  99%|█████████▉| 14848/15001 [9:30:15<04:41,  1.84s/it, loss=0.0294, lr=1e-5]Steps:  99%|█████████▉| 14848/15001 [9:30:16<04:41,  1.84s/it, loss=0.00849, lr=1e-5]Steps:  99%|█████████▉| 14849/15001 [9:30:17<04:42,  1.86s/it, loss=0.00849, lr=1e-5]Steps:  99%|█████████▉| 14849/15001 [9:30:17<04:42,  1.86s/it, loss=0.178, lr=1e-5]  Steps:  99%|█████████▉| 14850/15001 [9:30:19<04:31,  1.80s/it, loss=0.178, lr=1e-5]Steps:  99%|█████████▉| 14850/15001 [9:30:19<04:31,  1.80s/it, loss=0.348, lr=1e-5]Steps:  99%|█████████▉| 14851/15001 [9:30:21<04:41,  1.88s/it, loss=0.348, lr=1e-5]Steps:  99%|█████████▉| 14851/15001 [9:30:21<04:41,  1.88s/it, loss=0.257, lr=1e-5]Steps:  99%|█████████▉| 14852/15001 [9:30:23<04:27,  1.80s/it, loss=0.257, lr=1e-5]Steps:  99%|█████████▉| 14852/15001 [9:30:23<04:27,  1.80s/it, loss=0.201, lr=1e-5]Steps:  99%|█████████▉| 14853/15001 [9:30:25<04:35,  1.86s/it, loss=0.201, lr=1e-5]Steps:  99%|█████████▉| 14853/15001 [9:30:25<04:35,  1.86s/it, loss=0.136, lr=1e-5]Steps:  99%|█████████▉| 14854/15001 [9:30:27<04:36,  1.88s/it, loss=0.136, lr=1e-5]Steps:  99%|█████████▉| 14854/15001 [9:30:27<04:36,  1.88s/it, loss=0.236, lr=1e-5]Steps:  99%|█████████▉| 14855/15001 [9:30:29<04:39,  1.92s/it, loss=0.236, lr=1e-5]Steps:  99%|█████████▉| 14855/15001 [9:30:29<04:39,  1.92s/it, loss=0.207, lr=1e-5]Steps:  99%|████���████▉| 14856/15001 [9:30:31<04:39,  1.93s/it, loss=0.207, lr=1e-5]Steps:  99%|█████████▉| 14856/15001 [9:30:31<04:39,  1.93s/it, loss=0.185, lr=1e-5]Steps:  99%|█████████▉| 14857/15001 [9:30:32<04:38,  1.94s/it, loss=0.185, lr=1e-5]Steps:  99%|█████████▉| 14857/15001 [9:30:33<04:38,  1.94s/it, loss=0.18, lr=1e-5] Steps:  99%|█████████▉| 14858/15001 [9:30:34<04:27,  1.87s/it, loss=0.18, lr=1e-5]Steps:  99%|█████████▉| 14858/15001 [9:30:35<04:27,  1.87s/it, loss=0.222, lr=1e-5]Steps:  99%|█████████▉| 14859/15001 [9:30:36<04:43,  1.99s/it, loss=0.222, lr=1e-5]Steps:  99%|█████████▉| 14859/15001 [9:30:37<04:43,  1.99s/it, loss=0.109, lr=1e-5]Steps:  99%|█████████▉| 14860/15001 [9:30:38<04:38,  1.97s/it, loss=0.109, lr=1e-5]Steps:  99%|█████████▉| 14860/15001 [9:30:38<04:38,  1.97s/it, loss=0.185, lr=1e-5]Steps:  99%|█████████▉| 14861/15001 [9:30:40<04:18,  1.85s/it, loss=0.185, lr=1e-5]Steps:  99%|█████████▉| 14861/15001 [9:30:40<04:18,  1.85s/it, loss=0.108, lr=1e-5]Steps:  99%|█████████▉| 14862/15001 [9:30:42<04:19,  1.87s/it, loss=0.108, lr=1e-5]Steps:  99%|█████████▉| 14862/15001 [9:30:42<04:19,  1.87s/it, loss=0.0889, lr=1e-5]Steps:  99%|█████████▉| 14863/15001 [9:30:44<04:13,  1.84s/it, loss=0.0889, lr=1e-5]Steps:  99%|█████████▉| 14863/15001 [9:30:44<04:13,  1.84s/it, loss=0.28, lr=1e-5]  Steps:  99%|█████████▉| 14864/15001 [9:30:46<04:27,  1.95s/it, loss=0.28, lr=1e-5]Steps:  99%|█████████▉| 14864/15001 [9:30:46<04:27,  1.95s/it, loss=0.306, lr=1e-5]Steps:  99%|█████████▉| 14865/15001 [9:30:48<04:23,  1.94s/it, loss=0.306, lr=1e-5]Steps:  99%|█████████▉| 14865/15001 [9:30:48<04:23,  1.94s/it, loss=0.106, lr=1e-5]Steps:  99%|█████████▉| 14866/15001 [9:30:49<04:08,  1.84s/it, loss=0.106, lr=1e-5]Steps:  99%|█████████▉| 14866/15001 [9:30:49<04:08,  1.84s/it, loss=0.207, lr=1e-5]Steps:  99%|█████████▉| 14867/15001 [9:30:51<03:56,  1.76s/it, loss=0.207, lr=1e-5]Steps:  99%|█████████▉| 14867/15001 [9:30:51<03:56,  1.76s/it, loss=0.0989, lr=1e-5]Steps:  99%|█████████▉| 14868/15001 [9:30:53<04:02,  1.82s/it, loss=0.0989, lr=1e-5]Steps:  99%|█████████▉| 14868/15001 [9:30:53<04:02,  1.82s/it, loss=0.25, lr=1e-5]  Steps:  99%|█████████▉| 14869/15001 [9:30:55<03:56,  1.79s/it, loss=0.25, lr=1e-5]Steps:  99%|█████████▉| 14869/15001 [9:30:55<03:56,  1.79s/it, loss=0.328, lr=1e-5]Steps:  99%|█████████▉| 14870/15001 [9:30:57<04:01,  1.84s/it, loss=0.328, lr=1e-5]Steps:  99%|█████████▉| 14870/15001 [9:30:57<04:01,  1.84s/it, loss=0.221, lr=1e-5]Steps:  99%|█████████▉| 14871/15001 [9:30:58<04:00,  1.85s/it, loss=0.221, lr=1e-5]Steps:  99%|█████████▉| 14871/15001 [9:30:59<04:00,  1.85s/it, loss=0.0327, lr=1e-5]Steps:  99%|█████████▉| 14872/15001 [9:31:00<03:55,  1.83s/it, loss=0.0327, lr=1e-5]Steps:  99%|█████████▉| 14872/15001 [9:31:00<03:55,  1.83s/it, loss=0.0601, lr=1e-5]Steps:  99%|█████████▉| 14873/15001 [9:31:02<03:55,  1.84s/it, loss=0.0601, lr=1e-5]Steps:  99%|█████████▉| 14873/15001 [9:31:02<03:55,  1.84s/it, loss=0.13, lr=1e-5]  Steps:  99%|█████████▉| 14874/15001 [9:31:04<03:46,  1.78s/it, loss=0.13, lr=1e-5]Steps:  99%|█████████▉| 14874/15001 [9:31:04<03:46,  1.78s/it, loss=0.143, lr=1e-5]Steps:  99%|█████████▉| 14875/15001 [9:31:06<03:48,  1.81s/it, loss=0.143, lr=1e-5]Steps:  99%|█████████▉| 14875/15001 [9:31:06<03:48,  1.81s/it, loss=0.236, lr=1e-5]Steps:  99%|█████████▉| 14876/15001 [9:31:07<03:43,  1.79s/it, loss=0.236, lr=1e-5]Steps:  99%|█████████▉| 14876/15001 [9:31:08<03:43,  1.79s/it, loss=0.0493, lr=1e-5]Steps:  99%|█████████▉| 14877/15001 [9:31:10<03:55,  1.90s/it, loss=0.0493, lr=1e-5]Steps:  99%|█████████▉| 14877/15001 [9:31:10<03:55,  1.90s/it, loss=0.373, lr=1e-5] Steps:  99%|█████████▉| 14878/15001 [9:31:11<03:55,  1.92s/it, loss=0.373, lr=1e-5]Steps:  99%|█████████▉| 14878/15001 [9:31:12<03:55,  1.92s/it, loss=0.176, lr=1e-5]Steps:  99%|█████████▉| 14879/15001 [9:31:13<03:44,  1.84s/it, loss=0.176, lr=1e-5]Steps:  99%|█████████▉| 14879/15001 [9:31:14<03:44,  1.84s/it, loss=0.109, lr=1e-5]Steps:  99%|█████████▉| 14880/15001 [9:31:15<03:51,  1.91s/it, loss=0.109, lr=1e-5]Steps:  99%|█████████▉| 14880/15001 [9:31:16<03:51,  1.91s/it, loss=0.184, lr=1e-5]Steps:  99%|█████████▉| 14881/15001 [9:31:17<03:57,  1.98s/it, loss=0.184, lr=1e-5]Steps:  99%|█████████▉| 14881/15001 [9:31:18<03:57,  1.98s/it, loss=0.138, lr=1e-5]Steps:  99%|█████████▉| 14882/15001 [9:31:19<04:00,  2.02s/it, loss=0.138, lr=1e-5]Steps:  99%|█████████▉| 14882/15001 [9:31:20<04:00,  2.02s/it, loss=0.0153, lr=1e-5]Steps:  99%|█████████▉| 14883/15001 [9:31:21<03:54,  1.99s/it, loss=0.0153, lr=1e-5]Steps:  99%|█████████▉| 14883/15001 [9:31:21<03:54,  1.99s/it, loss=0.0763, lr=1e-5]Steps:  99%|█████████▉| 14884/15001 [9:31:23<03:46,  1.94s/it, loss=0.0763, lr=1e-5]Steps:  99%|█████████▉| 14884/15001 [9:31:23<03:46,  1.94s/it, loss=0.422, lr=1e-5] Steps:  99%|█████████▉| 14885/15001 [9:31:25<03:41,  1.91s/it, loss=0.422, lr=1e-5]Steps:  99%|█████████▉| 14885/15001 [9:31:25<03:41,  1.91s/it, loss=0.134, lr=1e-5]Steps:  99%|█████████▉| 14886/15001 [9:31:27<03:36,  1.88s/it, loss=0.134, lr=1e-5]Steps:  99%|█████████▉| 14886/15001 [9:31:27<03:36,  1.88s/it, loss=0.115, lr=1e-5]Steps:  99%|█████████▉| 14887/15001 [9:31:28<03:21,  1.77s/it, loss=0.115, lr=1e-5]Steps:  99%|█████████▉| 14887/15001 [9:31:29<03:21,  1.77s/it, loss=0.228, lr=1e-5]Steps:  99%|█████████▉| 14888/15001 [9:31:30<03:28,  1.84s/it, loss=0.228, lr=1e-5]Steps:  99%|█████████▉| 14888/15001 [9:31:31<03:28,  1.84s/it, loss=0.156, lr=1e-5]Steps:  99%|█████████▉| 14889/15001 [9:31:32<03:28,  1.86s/it, loss=0.156, lr=1e-5]Steps:  99%|█████████▉| 14889/15001 [9:31:32<03:28,  1.86s/it, loss=0.147, lr=1e-5]Steps:  99%|█████████▉| 14890/15001 [9:31:34<03:15,  1.76s/it, loss=0.147, lr=1e-5]Steps:  99%|█████████▉| 14890/15001 [9:31:34<03:15,  1.76s/it, loss=0.266, lr=1e-5]Steps:  99%|█████████▉| 14891/15001 [9:31:36<03:15,  1.78s/it, loss=0.266, lr=1e-5]Steps:  99%|█████████▉| 14891/15001 [9:31:36<03:15,  1.78s/it, loss=0.184, lr=1e-5]Steps:  99%|█████████▉| 14892/15001 [9:31:38<03:21,  1.84s/it, loss=0.184, lr=1e-5]Steps:  99%|█████████▉| 14892/15001 [9:31:38<03:21,  1.84s/it, loss=0.0483, lr=1e-5]Steps:  99%|█████████▉| 14893/15001 [9:31:39<03:16,  1.82s/it, loss=0.0483, lr=1e-5]Steps:  99%|█████████▉| 14893/15001 [9:31:39<03:16,  1.82s/it, loss=0.225, lr=1e-5] Steps:  99%|█████████▉| 14894/15001 [9:31:41<03:08,  1.76s/it, loss=0.225, lr=1e-5]Steps:  99%|█████████▉| 14894/15001 [9:31:41<03:08,  1.76s/it, loss=0.182, lr=1e-5]Steps:  99%|█████████▉| 14895/15001 [9:31:43<03:06,  1.76s/it, loss=0.182, lr=1e-5]Steps:  99%|█████████▉| 14895/15001 [9:31:43<03:06,  1.76s/it, loss=0.114, lr=1e-5]Steps:  99%|█████████▉| 14896/15001 [9:31:45<03:11,  1.83s/it, loss=0.114, lr=1e-5]Steps:  99%|█████████▉| 14896/15001 [9:31:45<03:11,  1.83s/it, loss=0.2, lr=1e-5]  Steps:  99%|█████████▉| 14897/15001 [9:31:46<03:05,  1.79s/it, loss=0.2, lr=1e-5]Steps:  99%|█████████▉| 14897/15001 [9:31:47<03:05,  1.79s/it, loss=0.0425, lr=1e-5]Steps:  99%|█████████▉| 14898/15001 [9:31:48<03:00,  1.75s/it, loss=0.0425, lr=1e-5]Steps:  99%|█████████▉| 14898/15001 [9:31:49<03:00,  1.75s/it, loss=0.0405, lr=1e-5]Steps:  99%|█████████▉| 14899/15001 [9:31:50<03:10,  1.87s/it, loss=0.0405, lr=1e-5]Steps:  99%|█████████▉| 14899/15001 [9:31:50<03:10,  1.87s/it, loss=0.24, lr=1e-5]  Steps:  99%|█████████▉| 14900/15001 [9:31:52<03:13,  1.92s/it, loss=0.24, lr=1e-5]Steps:  99%|█████████▉| 14900/15001 [9:31:52<03:13,  1.92s/it, loss=0.268, lr=1e-5]Steps:  99%|█████████▉| 14901/15001 [9:31:54<03:10,  1.90s/it, loss=0.268, lr=1e-5]Steps:  99%|█████████▉| 14901/15001 [9:31:54<03:10,  1.90s/it, loss=0.158, lr=1e-5]Steps:  99%|█████████▉| 14902/15001 [9:31:56<03:05,  1.88s/it, loss=0.158, lr=1e-5]Steps:  99%|█████████▉| 14902/15001 [9:31:56<03:05,  1.88s/it, loss=0.381, lr=1e-5]Steps:  99%|█████████▉| 14903/15001 [9:31:58<03:06,  1.90s/it, loss=0.381, lr=1e-5]Steps:  99%|█████████▉| 14903/15001 [9:31:58<03:06,  1.90s/it, loss=0.16, lr=1e-5] Steps:  99%|█████████▉| 14904/15001 [9:32:00<03:05,  1.91s/it, loss=0.16, lr=1e-5]Steps:  99%|█████████▉| 14904/15001 [9:32:00<03:05,  1.91s/it, loss=0.295, lr=1e-5]Steps:  99%|█████████▉| 14905/15001 [9:32:02<03:11,  1.99s/it, loss=0.295, lr=1e-5]Steps:  99%|█████████▉| 14905/15001 [9:32:02<03:11,  1.99s/it, loss=0.261, lr=1e-5]Steps:  99%|█████████▉| 14906/15001 [9:32:04<02:57,  1.86s/it, loss=0.261, lr=1e-5]Steps:  99%|█████████▉| 14906/15001 [9:32:04<02:57,  1.86s/it, loss=0.242, lr=1e-5]Steps:  99%|█████████▉| 14907/15001 [9:32:06<02:59,  1.91s/it, loss=0.242, lr=1e-5]Steps:  99%|█████████▉| 14907/15001 [9:32:06<02:59,  1.91s/it, loss=0.22, lr=1e-5] Steps:  99%|█████████▉| 14908/15001 [9:32:07<02:52,  1.85s/it, loss=0.22, lr=1e-5]Steps:  99%|█████████▉| 14908/15001 [9:32:07<02:52,  1.85s/it, loss=0.137, lr=1e-5]Steps:  99%|█████████▉| 14909/15001 [9:32:09<02:48,  1.83s/it, loss=0.137, lr=1e-5]Steps:  99%|█████████▉| 14909/15001 [9:32:09<02:48,  1.83s/it, loss=0.0984, lr=1e-5]Steps:  99%|█████████▉| 14910/15001 [9:32:11<02:42,  1.78s/it, loss=0.0984, lr=1e-5]Steps:  99%|█████████▉| 14910/15001 [9:32:11<02:42,  1.78s/it, loss=0.061, lr=1e-5] Steps:  99%|█████████▉| 14911/15001 [9:32:13<02:41,  1.80s/it, loss=0.061, lr=1e-5]Steps:  99%|█████████▉| 14911/15001 [9:32:13<02:41,  1.80s/it, loss=0.129, lr=1e-5]Steps:  99%|█████████▉| 14912/15001 [9:32:14<02:38,  1.78s/it, loss=0.129, lr=1e-5]Steps:  99%|█████████▉| 14912/15001 [9:32:15<02:38,  1.78s/it, loss=0.153, lr=1e-5]Steps:  99%|█████████▉| 14913/15001 [9:32:16<02:36,  1.77s/it, loss=0.153, lr=1e-5]Steps:  99%|█████████▉| 14913/15001 [9:32:16<02:36,  1.77s/it, loss=0.0392, lr=1e-5]Steps:  99%|█████████▉| 14914/15001 [9:32:18<02:36,  1.79s/it, loss=0.0392, lr=1e-5]Steps:  99%|█████████▉| 14914/15001 [9:32:18<02:36,  1.79s/it, loss=0.13, lr=1e-5]  Steps:  99%|█████████▉| 14915/15001 [9:32:20<02:38,  1.84s/it, loss=0.13, lr=1e-5]Steps:  99%|█████████▉| 14915/15001 [9:32:20<02:38,  1.84s/it, loss=0.116, lr=1e-5]Steps:  99%|█████████▉| 14916/15001 [9:32:22<02:35,  1.83s/it, loss=0.116, lr=1e-5]Steps:  99%|█████████▉| 14916/15001 [9:32:22<02:35,  1.83s/it, loss=0.228, lr=1e-5]Steps:  99%|█████████▉| 14917/15001 [9:32:23<02:30,  1.80s/it, loss=0.228, lr=1e-5]Steps:  99%|█████████▉| 14917/15001 [9:32:24<02:30,  1.80s/it, loss=0.117, lr=1e-5]Steps:  99%|█████████▉| 14918/15001 [9:32:25<02:29,  1.80s/it, loss=0.117, lr=1e-5]Steps:  99%|█████████▉| 14918/15001 [9:32:26<02:29,  1.80s/it, loss=0.253, lr=1e-5]Steps:  99%|█████████▉| 14919/15001 [9:32:27<02:34,  1.89s/it, loss=0.253, lr=1e-5]Steps:  99%|█████████▉| 14919/15001 [9:32:28<02:34,  1.89s/it, loss=0.189, lr=1e-5]Steps:  99%|█████████▉| 14920/15001 [9:32:29<02:32,  1.89s/it, loss=0.189, lr=1e-5]Steps:  99%|█████████▉| 14920/15001 [9:32:29<02:32,  1.89s/it, loss=0.206, lr=1e-5]Steps:  99%|█████████▉| 14921/15001 [9:32:31<02:30,  1.88s/it, loss=0.206, lr=1e-5]Steps:  99%|█████████▉| 14921/15001 [9:32:31<02:30,  1.88s/it, loss=0.0853, lr=1e-5]Steps:  99%|█████████▉| 14922/15001 [9:32:33<02:26,  1.85s/it, loss=0.0853, lr=1e-5]Steps:  99%|█████████▉| 14922/15001 [9:32:33<02:26,  1.85s/it, loss=0.36, lr=1e-5]  Steps:  99%|█████████▉| 14923/15001 [9:32:35<02:29,  1.92s/it, loss=0.36, lr=1e-5]Steps:  99%|█████████▉| 14923/15001 [9:32:35<02:29,  1.92s/it, loss=0.225, lr=1e-5]Steps:  99%|█████████▉| 14924/15001 [9:32:37<02:24,  1.88s/it, loss=0.225, lr=1e-5]Steps:  99%|█████████▉| 14924/15001 [9:32:37<02:24,  1.88s/it, loss=0.0208, lr=1e-5]Steps:  99%|█████████▉| 14925/15001 [9:32:39<02:29,  1.97s/it, loss=0.0208, lr=1e-5]Steps:  99%|█████████▉| 14925/15001 [9:32:39<02:29,  1.97s/it, loss=0.138, lr=1e-5] Steps: 100%|█████████▉| 14926/15001 [9:32:41<02:27,  1.97s/it, loss=0.138, lr=1e-5]Steps: 100%|█████████▉| 14926/15001 [9:32:41<02:27,  1.97s/it, loss=0.259, lr=1e-5]Steps: 100%|█████████▉| 14927/15001 [9:32:43<02:22,  1.93s/it, loss=0.259, lr=1e-5]Steps: 100%|█████████▉| 14927/15001 [9:32:43<02:22,  1.93s/it, loss=0.166, lr=1e-5]Steps: 100%|█████████▉| 14928/15001 [9:32:45<02:25,  1.99s/it, loss=0.166, lr=1e-5]Steps: 100%|█████████▉| 14928/15001 [9:32:45<02:25,  1.99s/it, loss=0.125, lr=1e-5]Steps: 100%|█████████▉| 14929/15001 [9:32:47<02:16,  1.90s/it, loss=0.125, lr=1e-5]Steps: 100%|█████████▉| 14929/15001 [9:32:47<02:16,  1.90s/it, loss=0.527, lr=1e-5]Steps: 100%|█████████▉| 14930/15001 [9:32:48<02:12,  1.86s/it, loss=0.527, lr=1e-5]Steps: 100%|█████████▉| 14930/15001 [9:32:49<02:12,  1.86s/it, loss=0.0963, lr=1e-5]Steps: 100%|█████████▉| 14931/15001 [9:32:50<02:10,  1.86s/it, loss=0.0963, lr=1e-5]Steps: 100%|█████████▉| 14931/15001 [9:32:50<02:10,  1.86s/it, loss=0.0437, lr=1e-5]Steps: 100%|█████████▉| 14932/15001 [9:32:52<02:08,  1.86s/it, loss=0.0437, lr=1e-5]Steps: 100%|█████████▉| 14932/15001 [9:32:52<02:08,  1.86s/it, loss=0.155, lr=1e-5] Steps: 100%|█████████▉| 14933/15001 [9:32:54<02:09,  1.91s/it, loss=0.155, lr=1e-5]Steps: 100%|█████████▉| 14933/15001 [9:32:54<02:09,  1.91s/it, loss=0.203, lr=1e-5]Steps: 100%|█████████▉| 14934/15001 [9:32:56<02:03,  1.85s/it, loss=0.203, lr=1e-5]Steps: 100%|█████████▉| 14934/15001 [9:32:56<02:03,  1.85s/it, loss=0.0966, lr=1e-5]Steps: 100%|█████████▉| 14935/15001 [9:32:58<02:00,  1.83s/it, loss=0.0966, lr=1e-5]Steps: 100%|█████████▉| 14935/15001 [9:32:58<02:00,  1.83s/it, loss=0.0657, lr=1e-5]Steps: 100%|█████████▉| 14936/15001 [9:32:59<01:57,  1.81s/it, loss=0.0657, lr=1e-5]Steps: 100%|█████████▉| 14936/15001 [9:32:59<01:57,  1.81s/it, loss=0.189, lr=1e-5] Steps: 100%|█████████▉| 14937/15001 [9:33:01<01:52,  1.75s/it, loss=0.189, lr=1e-5]Steps: 100%|█████████▉| 14937/15001 [9:33:01<01:52,  1.75s/it, loss=0.0994, lr=1e-5]Steps: 100%|█████████▉| 14938/15001 [9:33:03<01:48,  1.73s/it, loss=0.0994, lr=1e-5]Steps: 100%|█████████▉| 14938/15001 [9:33:03<01:48,  1.73s/it, loss=0.202, lr=1e-5] Steps: 100%|█████████▉| 14939/15001 [9:33:05<01:52,  1.81s/it, loss=0.202, lr=1e-5]Steps: 100%|█████████▉| 14939/15001 [9:33:05<01:52,  1.81s/it, loss=0.0646, lr=1e-5]Steps: 100%|█████████▉| 14940/15001 [9:33:06<01:48,  1.79s/it, loss=0.0646, lr=1e-5]Steps: 100%|█████████▉| 14940/15001 [9:33:07<01:48,  1.79s/it, loss=0.17, lr=1e-5]  Steps: 100%|█████████▉| 14941/15001 [9:33:08<01:44,  1.75s/it, loss=0.17, lr=1e-5]Steps: 100%|█████████▉| 14941/15001 [9:33:08<01:44,  1.75s/it, loss=0.128, lr=1e-5]Steps: 100%|█████████▉| 14942/15001 [9:33:10<01:49,  1.85s/it, loss=0.128, lr=1e-5]Steps: 100%|█████████▉| 14942/15001 [9:33:10<01:49,  1.85s/it, loss=0.2, lr=1e-5]  Steps: 100%|█████████▉| 14943/15001 [9:33:12<01:44,  1.81s/it, loss=0.2, lr=1e-5]Steps: 100%|█████████▉| 14943/15001 [9:33:12<01:44,  1.81s/it, loss=0.119, lr=1e-5]Steps: 100%|█████████▉| 14944/15001 [9:33:14<01:45,  1.85s/it, loss=0.119, lr=1e-5]Steps: 100%|█████████▉| 14944/15001 [9:33:14<01:45,  1.85s/it, loss=0.209, lr=1e-5]Steps: 100%|█████████▉| 14945/15001 [9:33:16<01:43,  1.84s/it, loss=0.209, lr=1e-5]Steps: 100%|█████████▉| 14945/15001 [9:33:16<01:43,  1.84s/it, loss=0.249, lr=1e-5]Steps: 100%|█████████▉| 14946/15001 [9:33:18<01:43,  1.89s/it, loss=0.249, lr=1e-5]Steps: 100%|█████████▉| 14946/15001 [9:33:18<01:43,  1.89s/it, loss=0.107, lr=1e-5]Steps: 100%|█████████▉| 14947/15001 [9:33:20<01:45,  1.94s/it, loss=0.107, lr=1e-5]Steps: 100%|█████████▉| 14947/15001 [9:33:20<01:45,  1.94s/it, loss=0.146, lr=1e-5]Steps: 100%|█████████▉| 14948/15001 [9:33:22<01:43,  1.94s/it, loss=0.146, lr=1e-5]Steps: 100%|█████████▉| 14948/15001 [9:33:22<01:43,  1.94s/it, loss=0.135, lr=1e-5]Steps: 100%|█████████▉| 14949/15001 [9:33:24<01:43,  1.99s/it, loss=0.135, lr=1e-5]Steps: 100%|█████████▉| 14949/15001 [9:33:24<01:43,  1.99s/it, loss=0.198, lr=1e-5]Steps: 100%|█████████▉| 14950/15001 [9:33:26<01:42,  2.02s/it, loss=0.198, lr=1e-5]Steps: 100%|█████████▉| 14950/15001 [9:33:26<01:42,  2.02s/it, loss=0.117, lr=1e-5]Steps: 100%|█████████▉| 14951/15001 [9:33:28<01:38,  1.97s/it, loss=0.117, lr=1e-5]Steps: 100%|█████████▉| 14951/15001 [9:33:28<01:38,  1.97s/it, loss=0.264, lr=1e-5]Steps: 100%|█████████▉| 14952/15001 [9:33:29<01:33,  1.90s/it, loss=0.264, lr=1e-5]Steps: 100%|█████████▉| 14952/15001 [9:33:30<01:33,  1.90s/it, loss=0.325, lr=1e-5]Steps: 100%|█████████▉| 14953/15001 [9:33:31<01:30,  1.88s/it, loss=0.325, lr=1e-5]Steps: 100%|█████████▉| 14953/15001 [9:33:31<01:30,  1.88s/it, loss=0.155, lr=1e-5]Steps: 100%|█████████▉| 14954/15001 [9:33:33<01:30,  1.92s/it, loss=0.155, lr=1e-5]Steps: 100%|█████████▉| 14954/15001 [9:33:33<01:30,  1.92s/it, loss=0.127, lr=1e-5]Steps: 100%|█████████▉| 14955/15001 [9:33:35<01:26,  1.87s/it, loss=0.127, lr=1e-5]Steps: 100%|█████████▉| 14955/15001 [9:33:35<01:26,  1.87s/it, loss=0.166, lr=1e-5]Steps: 100%|█████████▉| 14956/15001 [9:33:37<01:22,  1.83s/it, loss=0.166, lr=1e-5]Steps: 100%|█████████▉| 14956/15001 [9:33:37<01:22,  1.83s/it, loss=0.0441, lr=1e-5]Steps: 100%|█████████▉| 14957/15001 [9:33:39<01:20,  1.84s/it, loss=0.0441, lr=1e-5]Steps: 100%|█████████▉| 14957/15001 [9:33:39<01:20,  1.84s/it, loss=0.0939, lr=1e-5]Steps: 100%|█████████▉| 14958/15001 [9:33:40<01:18,  1.83s/it, loss=0.0939, lr=1e-5]Steps: 100%|█████████▉| 14958/15001 [9:33:40<01:18,  1.83s/it, loss=0.31, lr=1e-5]  Steps: 100%|█████████▉| 14959/15001 [9:33:42<01:13,  1.76s/it, loss=0.31, lr=1e-5]Steps: 100%|█████████▉| 14959/15001 [9:33:42<01:13,  1.76s/it, loss=0.23, lr=1e-5]Steps: 100%|█████████▉| 14960/15001 [9:33:44<01:12,  1.77s/it, loss=0.23, lr=1e-5]Steps: 100%|█████████▉| 14960/15001 [9:33:44<01:12,  1.77s/it, loss=0.116, lr=1e-5]Steps: 100%|█████████▉| 14961/15001 [9:33:46<01:11,  1.79s/it, loss=0.116, lr=1e-5]Steps: 100%|█████████▉| 14961/15001 [9:33:46<01:11,  1.79s/it, loss=0.192, lr=1e-5]Steps: 100%|█████████▉| 14962/15001 [9:33:48<01:13,  1.89s/it, loss=0.192, lr=1e-5]Steps: 100%|█████████▉| 14962/15001 [9:33:48<01:13,  1.89s/it, loss=0.313, lr=1e-5]Steps: 100%|█████████▉| 14963/15001 [9:33:49<01:09,  1.84s/it, loss=0.313, lr=1e-5]Steps: 100%|█████████▉| 14963/15001 [9:33:50<01:09,  1.84s/it, loss=0.0873, lr=1e-5]Steps: 100%|█████████▉| 14964/15001 [9:33:51<01:09,  1.89s/it, loss=0.0873, lr=1e-5]Steps: 100%|█████████▉| 14964/15001 [9:33:51<01:09,  1.89s/it, loss=0.115, lr=1e-5] Steps: 100%|█████████▉| 14965/15001 [9:33:53<01:03,  1.75s/it, loss=0.115, lr=1e-5]Steps: 100%|█████████▉| 14965/15001 [9:33:53<01:03,  1.75s/it, loss=0.13, lr=1e-5] Steps: 100%|█████████▉| 14966/15001 [9:33:55<01:03,  1.80s/it, loss=0.13, lr=1e-5]Steps: 100%|█████████▉| 14966/15001 [9:33:55<01:03,  1.80s/it, loss=0.167, lr=1e-5]Steps: 100%|█████████▉| 14967/15001 [9:33:57<01:02,  1.85s/it, loss=0.167, lr=1e-5]Steps: 100%|█████████▉| 14967/15001 [9:33:57<01:02,  1.85s/it, loss=0.0475, lr=1e-5]Steps: 100%|█████████▉| 14968/15001 [9:33:59<01:00,  1.83s/it, loss=0.0475, lr=1e-5]Steps: 100%|█████████▉| 14968/15001 [9:33:59<01:00,  1.83s/it, loss=0.156, lr=1e-5] Steps: 100%|█████████▉| 14969/15001 [9:34:01<01:00,  1.90s/it, loss=0.156, lr=1e-5]Steps: 100%|█████████▉| 14969/15001 [9:34:01<01:00,  1.90s/it, loss=0.0751, lr=1e-5]Steps: 100%|█████████▉| 14970/15001 [9:34:03<00:58,  1.89s/it, loss=0.0751, lr=1e-5]Steps: 100%|█████████▉| 14970/15001 [9:34:03<00:58,  1.89s/it, loss=0.136, lr=1e-5] Steps: 100%|█████████▉| 14971/15001 [9:34:04<00:56,  1.88s/it, loss=0.136, lr=1e-5]Steps: 100%|█████████▉| 14971/15001 [9:34:05<00:56,  1.88s/it, loss=0.141, lr=1e-5]Steps: 100%|█████████▉| 14972/15001 [9:34:06<00:55,  1.91s/it, loss=0.141, lr=1e-5]Steps: 100%|█████████▉| 14972/15001 [9:34:07<00:55,  1.91s/it, loss=0.22, lr=1e-5] Steps: 100%|█████████▉| 14973/15001 [9:34:08<00:55,  1.97s/it, loss=0.22, lr=1e-5]Steps: 100%|█████████▉| 14973/15001 [9:34:09<00:55,  1.97s/it, loss=0.23, lr=1e-5]Steps: 100%|█████████▉| 14974/15001 [9:34:10<00:52,  1.94s/it, loss=0.23, lr=1e-5]Steps: 100%|█████████▉| 14974/15001 [9:34:11<00:52,  1.94s/it, loss=0.116, lr=1e-5]Steps: 100%|█████████▉| 14975/15001 [9:34:12<00:51,  1.99s/it, loss=0.116, lr=1e-5]Steps: 100%|█████████▉| 14975/15001 [9:34:13<00:51,  1.99s/it, loss=0.269, lr=1e-5]Steps: 100%|█████████▉| 14976/15001 [9:34:14<00:47,  1.90s/it, loss=0.269, lr=1e-5]Steps: 100%|█████████▉| 14976/15001 [9:34:14<00:47,  1.90s/it, loss=0.17, lr=1e-5] Steps: 100%|█████████▉| 14977/15001 [9:34:16<00:46,  1.92s/it, loss=0.17, lr=1e-5]Steps: 100%|█████████▉| 14977/15001 [9:34:16<00:46,  1.92s/it, loss=0.236, lr=1e-5]Steps: 100%|█████████▉| 14978/15001 [9:34:18<00:43,  1.90s/it, loss=0.236, lr=1e-5]Steps: 100%|█████████▉| 14978/15001 [9:34:18<00:43,  1.90s/it, loss=0.384, lr=1e-5]Steps: 100%|█████████▉| 14979/15001 [9:34:19<00:38,  1.75s/it, loss=0.384, lr=1e-5]Steps: 100%|█████████▉| 14979/15001 [9:34:20<00:38,  1.75s/it, loss=0.255, lr=1e-5]Steps: 100%|█████████▉| 14980/15001 [9:34:21<00:38,  1.83s/it, loss=0.255, lr=1e-5]Steps: 100%|█████████▉| 14980/15001 [9:34:22<00:38,  1.83s/it, loss=0.0449, lr=1e-5]Steps: 100%|█████████▉| 14981/15001 [9:34:23<00:37,  1.89s/it, loss=0.0449, lr=1e-5]Steps: 100%|█████████▉| 14981/15001 [9:34:23<00:37,  1.89s/it, loss=0.0822, lr=1e-5]Steps: 100%|█████████▉| 14982/15001 [9:34:25<00:34,  1.79s/it, loss=0.0822, lr=1e-5]Steps: 100%|█████████▉| 14982/15001 [9:34:25<00:34,  1.79s/it, loss=0.125, lr=1e-5] Steps: 100%|█████████▉| 14983/15001 [9:34:27<00:32,  1.80s/it, loss=0.125, lr=1e-5]Steps: 100%|█████████▉| 14983/15001 [9:34:27<00:32,  1.80s/it, loss=0.265, lr=1e-5]Steps: 100%|█████████▉| 14984/15001 [9:34:28<00:30,  1.78s/it, loss=0.265, lr=1e-5]Steps: 100%|█████████▉| 14984/15001 [9:34:29<00:30,  1.78s/it, loss=0.278, lr=1e-5]Steps: 100%|█████████▉| 14985/15001 [9:34:30<00:29,  1.83s/it, loss=0.278, lr=1e-5]Steps: 100%|█████████▉| 14985/15001 [9:34:31<00:29,  1.83s/it, loss=0.239, lr=1e-5]Steps: 100%|█████████▉| 14986/15001 [9:34:32<00:27,  1.85s/it, loss=0.239, lr=1e-5]Steps: 100%|█████████▉| 14986/15001 [9:34:32<00:27,  1.85s/it, loss=0.166, lr=1e-5]Steps: 100%|█████████▉| 14987/15001 [9:34:34<00:25,  1.80s/it, loss=0.166, lr=1e-5]Steps: 100%|█████████▉| 14987/15001 [9:34:34<00:25,  1.80s/it, loss=0.192, lr=1e-5]Steps: 100%|█████████▉| 14988/15001 [9:34:36<00:22,  1.75s/it, loss=0.192, lr=1e-5]Steps: 100%|█████████▉| 14988/15001 [9:34:36<00:22,  1.75s/it, loss=0.0185, lr=1e-5]Steps: 100%|█████████▉| 14989/15001 [9:34:37<00:21,  1.77s/it, loss=0.0185, lr=1e-5]Steps: 100%|█████████▉| 14989/15001 [9:34:38<00:21,  1.77s/it, loss=0.213, lr=1e-5] Steps: 100%|█████████▉| 14990/15001 [9:34:39<00:20,  1.83s/it, loss=0.213, lr=1e-5]Steps: 100%|█████████▉| 14990/15001 [9:34:39<00:20,  1.83s/it, loss=0.471, lr=1e-5]Steps: 100%|█████████▉| 14991/15001 [9:34:41<00:18,  1.84s/it, loss=0.471, lr=1e-5]Steps: 100%|█████████▉| 14991/15001 [9:34:42<00:18,  1.84s/it, loss=0.049, lr=1e-5]Steps: 100%|█████████▉| 14992/15001 [9:34:43<00:17,  1.94s/it, loss=0.049, lr=1e-5]Steps: 100%|█████████▉| 14992/15001 [9:34:44<00:17,  1.94s/it, loss=0.189, lr=1e-5]Steps: 100%|█████████▉| 14993/15001 [9:34:45<00:15,  1.96s/it, loss=0.189, lr=1e-5]Steps: 100%|█████████▉| 14993/15001 [9:34:46<00:15,  1.96s/it, loss=0.351, lr=1e-5]Steps: 100%|█████████▉| 14994/15001 [9:34:48<00:14,  2.04s/it, loss=0.351, lr=1e-5]Steps: 100%|█████████▉| 14994/15001 [9:34:48<00:14,  2.04s/it, loss=0.0793, lr=1e-5]Steps: 100%|█████████▉| 14995/15001 [9:34:50<00:11,  1.97s/it, loss=0.0793, lr=1e-5]Steps: 100%|█████████▉| 14995/15001 [9:34:50<00:11,  1.97s/it, loss=0.351, lr=1e-5] Steps: 100%|█████████▉| 14996/15001 [9:34:52<00:10,  2.04s/it, loss=0.351, lr=1e-5]Steps: 100%|█████████▉| 14996/15001 [9:34:52<00:10,  2.04s/it, loss=0.0316, lr=1e-5]Steps: 100%|█████████▉| 14997/15001 [9:34:54<00:07,  1.98s/it, loss=0.0316, lr=1e-5]Steps: 100%|█████████▉| 14997/15001 [9:34:54<00:07,  1.98s/it, loss=0.168, lr=1e-5] Steps: 100%|█████████▉| 14998/15001 [9:34:55<00:05,  1.93s/it, loss=0.168, lr=1e-5]Steps: 100%|█████████▉| 14998/15001 [9:34:55<00:05,  1.93s/it, loss=0.26, lr=1e-5] Steps: 100%|█████████▉| 14999/15001 [9:34:57<00:03,  1.85s/it, loss=0.26, lr=1e-5]Steps: 100%|█████████▉| 14999/15001 [9:34:57<00:03,  1.85s/it, loss=0.298, lr=1e-5]Steps: 100%|█████████▉| 15000/15001 [9:34:59<00:01,  1.88s/it, loss=0.298, lr=1e-5]02/04/2024 22:37:18 - INFO - accelerate.accelerator - Saving current state to only_t5_large_controlnet/checkpoint-15000
+Configuration saved in only_t5_large_controlnet/checkpoint-15000/linear_projection/config.json
+Model weights saved in only_t5_large_controlnet/checkpoint-15000/linear_projection/diffusion_pytorch_model.safetensors
+Configuration saved in only_t5_large_controlnet/checkpoint-15000/controlnet/config.json
+Model weights saved in only_t5_large_controlnet/checkpoint-15000/controlnet/diffusion_pytorch_model.safetensors
+02/04/2024 22:37:55 - INFO - accelerate.checkpointing - Optimizer state saved in only_t5_large_controlnet/checkpoint-15000/optimizer.bin
+02/04/2024 22:37:55 - INFO - accelerate.checkpointing - Scheduler state saved in only_t5_large_controlnet/checkpoint-15000/scheduler.bin
+02/04/2024 22:37:55 - INFO - accelerate.checkpointing - Sampler state for dataloader 0 saved in only_t5_large_controlnet/checkpoint-15000/sampler.bin
+02/04/2024 22:37:56 - INFO - accelerate.checkpointing - Random states saved in only_t5_large_controlnet/checkpoint-15000/random_states_0.pkl
+02/04/2024 22:37:56 - INFO - __main__ - Saved state to only_t5_large_controlnet/checkpoint-15000
+02/04/2024 22:37:56 - INFO - __main__ - Running validation... 
+{'controlnet_tokenizer', 'controlnet_text_encoder', 'controlnet_text_embedding_linear_projection', 'controlnet', 'image_encoder'} was not found in config. Values will be initialized to default values.
+
+Loading pipeline components...:   0%|          | 0/6 [00:00<?, ?it/s][A{'timestep_spacing'} was not found in config. Values will be initialized to default values.
+Loaded scheduler as PNDMScheduler from `scheduler` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loaded feature_extractor as CLIPImageProcessor from `feature_extractor` subfolder of stabilityai/stable-diffusion-2-1-base.
+Loading pipeline components...: 100%|██████████| 6/6 [00:00<00:00, 1662.87it/s]
+{'lower_order_final', 'timestep_spacing', 'disable_corrector', 'thresholding', 'dynamic_thresholding_ratio', 'solver_type', 'predict_x0', 'use_karras_sigmas', 'solver_order', 'sample_max_value', 'solver_p'} was not found in config. Values will be initialized to default values.
+Steps: 100%|█████████▉| 15000/15001 [9:39:15<00:01,  1.88s/it, loss=0.0442, lr=1e-5]Steps: 100%|██████████| 15001/15001 [9:39:17<00:00, 78.68s/it, loss=0.0442, lr=1e-5]Steps: 100%|██████████| 15001/15001 [9:39:17<00:00, 78.68s/it, loss=0.113, lr=1e-5] Configuration saved in only_t5_large_controlnet/config.json
+Model weights saved in only_t5_large_controlnet/diffusion_pytorch_model.safetensors
+Configuration saved in only_t5_large_controlnet/config.json
+Model weights saved in only_t5_large_controlnet/diffusion_pytorch_model.safetensors
+
+diffusion_pytorch_model.safetensors:   0%|          | 0.00/1.46G [00:00<?, ?B/s][A
+
+diffusion_pytorch_model.safetensors:   0%|          | 0.00/4.20M [00:00<?, ?B/s][A[A
+
+
+optimizer.bin:   0%|          | 0.00/2.92G [00:00<?, ?B/s][A[A[A
+
+
+
+random_states_0.pkl:   0%|          | 0.00/16.1k [00:00<?, ?B/s][A[A[A[A
+
+
+
+
+Upload 6 LFS files:   0%|          | 0/6 [00:00<?, ?it/s][A[A[A[A[A
+
+
+
+
+
+scheduler.bin:   0%|          | 0.00/1.00k [00:00<?, ?B/s][A[A[A[A[A[A
+
+
+optimizer.bin:   0%|          | 983k/2.92G [00:00<04:58, 9.79MB/s][A[A[A
+
+diffusion_pytorch_model.safetensors:   9%|▉         | 393k/4.20M [00:00<00:01, 3.80MB/s][A[A
+diffusion_pytorch_model.safetensors:   0%|          | 410k/1.46G [00:00<06:17, 3.86MB/s][Ascheduler.bin: 100%|██████████| 1.00k/1.00k [00:00<00:00, 8.06kB/s]
+random_states_0.pkl: 100%|██████████| 16.1k/16.1k [00:00<00:00, 99.4kB/s]
+
+
+
+optimizer.bin:   0%|          | 8.39M/2.92G [00:00<01:02, 46.9MB/s][A[A[A
+
+diffusion_pytorch_model.safetensors:  82%|████████▏ | 3.44M/4.20M [00:00<00:00, 19.1MB/s][A[A
+diffusion_pytorch_model.safetensors:   0%|          | 3.42M/1.46G [00:00<01:18, 18.6MB/s][A
+
+
+
+diffusion_pytorch_model.safetensors:   0%|          | 0.00/4.20M [00:00<?, ?B/s][A[A[A[A
+diffusion_pytorch_model.safetensors:   1%|          | 12.2M/1.46G [00:00<00:30, 47.7MB/s][A
+
+
+
+diffusion_pytorch_model.safetensors:  63%|██████▎   | 2.65M/4.20M [00:00<00:00, 26.4MB/s][A[A[A[Adiffusion_pytorch_model.safetensors: 100%|██████████| 4.20M/4.20M [00:00<00:00, 10.0MB/s]
+diffusion_pytorch_model.safetensors: 100%|██████████| 4.20M/4.20M [00:00<00:00, 16.4MB/s]
+
+diffusion_pytorch_model.safetensors:   1%|          | 16.9M/1.46G [00:00<00:45, 31.9MB/s][A
+
+
+optimizer.bin:   1%|          | 16.0M/2.92G [00:00<01:42, 28.3MB/s][A[A[A
+
+
+optimizer.bin:   1%|          | 32.0M/2.92G [00:00<01:04, 44.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:   2%|▏         | 32.0M/1.46G [00:00<00:31, 45.4MB/s][A
+diffusion_pytorch_model.safetensors:   3%|▎         | 48.0M/1.46G [00:01<00:28, 49.5MB/s][A
+
+
+optimizer.bin:   2%|▏         | 48.0M/2.92G [00:01<01:25, 33.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:   4%|▍         | 64.0M/1.46G [00:01<00:27, 50.3MB/s][A
+
+
+optimizer.bin:   2%|▏         | 64.0M/2.92G [00:01<01:08, 41.5MB/s][A[A[A
+diffusion_pytorch_model.safetensors:   5%|▌         | 80.0M/1.46G [00:01<00:28, 47.6MB/s][A
+
+
+optimizer.bin:   3%|▎         | 80.0M/2.92G [00:01<00:56, 50.5MB/s][A[A[A
+diffusion_pytorch_model.safetensors:   7%|▋         | 96.0M/1.46G [00:02<00:25, 53.2MB/s][A
+
+
+optimizer.bin:   3%|▎         | 96.0M/2.92G [00:02<00:51, 54.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:   8%|▊         | 112M/1.46G [00:02<00:23, 56.9MB/s] [A
+
+
+optimizer.bin:   4%|▍         | 112M/2.92G [00:02<00:52, 53.7MB/s] [A[A[A
+diffusion_pytorch_model.safetensors:   9%|▉         | 128M/1.46G [00:02<00:23, 56.9MB/s][A
+
+
+optimizer.bin:   4%|▍         | 128M/2.92G [00:02<00:52, 52.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  10%|▉         | 144M/1.46G [00:02<00:21, 59.8MB/s][A
+
+
+optimizer.bin:   5%|▍         | 144M/2.92G [00:02<00:49, 56.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  11%|█         | 160M/1.46G [00:03<00:22, 58.6MB/s][A
+
+
+optimizer.bin:   5%|▌         | 160M/2.92G [00:03<00:46, 59.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  12%|█▏        | 176M/1.46G [00:03<00:22, 58.2MB/s][A
+
+
+optimizer.bin:   6%|▌         | 176M/2.92G [00:03<00:43, 62.5MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  13%|█▎        | 192M/1.46G [00:03<00:20, 60.6MB/s][A
+
+
+optimizer.bin:   7%|▋         | 192M/2.92G [00:03<00:41, 66.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  14%|█▍        | 208M/1.46G [00:03<00:21, 58.1MB/s][A
+
+
+optimizer.bin:   7%|▋         | 208M/2.92G [00:03<00:41, 65.4MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  15%|█▌        | 224M/1.46G [00:04<00:19, 63.2MB/s][A
+
+
+optimizer.bin:   8%|▊         | 224M/2.92G [00:04<00:44, 60.7MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  16%|█▋        | 240M/1.46G [00:04<00:19, 61.1MB/s][A
+
+
+optimizer.bin:   8%|▊         | 240M/2.92G [00:04<00:44, 60.5MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  18%|█▊        | 256M/1.46G [00:04<00:19, 62.1MB/s][A
+
+
+optimizer.bin:   9%|▉         | 256M/2.92G [00:04<00:43, 60.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  19%|█▊        | 272M/1.46G [00:04<00:19, 60.9MB/s][A
+
+
+optimizer.bin:   9%|▉         | 272M/2.92G [00:04<00:42, 62.3MB/s][A[A[A
+
+
+optimizer.bin:  10%|▉         | 288M/2.92G [00:05<00:40, 65.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  20%|█▉        | 288M/1.46G [00:05<00:23, 49.7MB/s][A
+
+
+optimizer.bin:  10%|█         | 304M/2.92G [00:05<00:49, 53.4MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  21%|██        | 304M/1.46G [00:05<00:22, 51.4MB/s][A
+
+
+optimizer.bin:  11%|█         | 320M/2.92G [00:05<00:45, 57.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  22%|██▏       | 320M/1.46G [00:05<00:20, 55.0MB/s][A
+
+
+optimizer.bin:  11%|█▏        | 336M/2.92G [00:06<00:43, 60.1MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  23%|██▎       | 336M/1.46G [00:06<00:19, 56.5MB/s][A
+
+
+optimizer.bin:  12%|█▏        | 352M/2.92G [00:06<00:41, 61.4MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  24%|██▍       | 352M/1.46G [00:06<00:18, 59.7MB/s][A
+diffusion_pytorch_model.safetensors:  25%|██▌       | 368M/1.46G [00:06<00:18, 58.4MB/s][A
+
+
+optimizer.bin:  13%|█▎        | 368M/2.92G [00:06<00:47, 54.0MB/s][A[A[A
+
+
+optimizer.bin:  13%|█▎        | 384M/2.92G [00:06<00:43, 58.7MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  26%|██▋       | 384M/1.46G [00:06<00:18, 57.7MB/s][A
+diffusion_pytorch_model.safetensors:  27%|██▋       | 400M/1.46G [00:07<00:17, 60.8MB/s][A
+
+
+optimizer.bin:  14%|█▎        | 400M/2.92G [00:07<00:42, 59.2MB/s][A[A[A
+
+
+optimizer.bin:  14%|█▍        | 416M/2.92G [00:07<00:39, 62.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  29%|██▊       | 416M/1.46G [00:07<00:17, 58.3MB/s][A
+
+
+optimizer.bin:  15%|█▍        | 432M/2.92G [00:07<00:39, 62.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  30%|██▉       | 432M/1.46G [00:07<00:17, 57.8MB/s][A
+
+
+optimizer.bin:  15%|█▌        | 448M/2.92G [00:07<00:41, 59.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  31%|███       | 448M/1.46G [00:08<00:17, 58.4MB/s][A
+
+
+optimizer.bin:  16%|█▌        | 464M/2.92G [00:08<00:42, 57.7MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  32%|███▏      | 464M/1.46G [00:08<00:16, 60.8MB/s][A
+
+
+optimizer.bin:  16%|█▋        | 480M/2.92G [00:08<00:41, 59.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  33%|███▎      | 480M/1.46G [00:08<00:16, 59.6MB/s][A
+diffusion_pytorch_model.safetensors:  34%|███▍      | 496M/1.46G [00:08<00:15, 61.2MB/s][A
+
+
+optimizer.bin:  17%|█▋        | 496M/2.92G [00:08<00:42, 57.1MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  35%|███▌      | 512M/1.46G [00:09<00:16, 57.1MB/s][A
+
+
+optimizer.bin:  18%|█▊        | 512M/2.92G [00:09<00:43, 55.3MB/s][A[A[A
+
+
+optimizer.bin:  18%|█▊        | 528M/2.92G [00:09<00:42, 56.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  36%|███▌      | 528M/1.46G [00:09<00:16, 55.2MB/s][A
+
+
+optimizer.bin:  19%|█▊        | 544M/2.92G [00:09<00:41, 57.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  37%|███▋      | 544M/1.46G [00:09<00:17, 52.4MB/s][A
+
+
+optimizer.bin:  19%|█▉        | 560M/2.92G [00:09<00:42, 55.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  38%|███▊      | 560M/1.46G [00:10<00:16, 55.1MB/s][A
+
+
+optimizer.bin:  20%|█▉        | 576M/2.92G [00:10<00:39, 59.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  40%|███▉      | 576M/1.46G [00:10<00:17, 49.7MB/s][A
+
+
+optimizer.bin:  20%|██        | 592M/2.92G [00:10<00:40, 57.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  41%|████      | 592M/1.46G [00:10<00:16, 51.2MB/s][A
+
+
+optimizer.bin:  21%|██        | 608M/2.92G [00:10<00:39, 58.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  42%|████▏     | 608M/1.46G [00:10<00:15, 54.5MB/s][A
+
+
+optimizer.bin:  21%|██▏       | 624M/2.92G [00:10<00:37, 61.7MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  43%|████▎     | 624M/1.46G [00:11<00:14, 56.7MB/s][A
+
+
+optimizer.bin:  22%|██▏       | 640M/2.92G [00:11<00:36, 63.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  44%|████▍     | 640M/1.46G [00:11<00:13, 59.8MB/s][A
+
+
+optimizer.bin:  22%|██▏       | 656M/2.92G [00:11<00:35, 64.5MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  45%|████▌     | 656M/1.46G [00:11<00:13, 59.6MB/s][A
+
+
+optimizer.bin:  23%|██▎       | 672M/2.92G [00:11<00:35, 62.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  46%|████▌     | 672M/1.46G [00:11<00:12, 62.6MB/s][A
+
+
+optimizer.bin:  24%|██▎       | 688M/2.92G [00:12<00:37, 60.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  47%|████▋     | 688M/1.46G [00:12<00:11, 64.2MB/s][A
+
+
+optimizer.bin:  24%|██▍       | 704M/2.92G [00:12<00:37, 58.5MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  48%|████▊     | 704M/1.46G [00:12<00:12, 59.5MB/s][A
+
+
+optimizer.bin:  25%|██▍       | 720M/2.92G [00:12<00:36, 60.4MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  49%|████▉     | 720M/1.46G [00:12<00:12, 60.1MB/s][A
+
+
+optimizer.bin:  25%|██▌       | 736M/2.92G [00:12<00:35, 61.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  51%|█████     | 736M/1.46G [00:12<00:11, 61.2MB/s][A
+
+
+optimizer.bin:  26%|██▌       | 752M/2.92G [00:13<00:34, 63.7MB/s][A[A[A
+
+
+optimizer.bin:  26%|██▋       | 768M/2.92G [00:13<00:33, 64.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  52%|█████▏    | 752M/1.46G [00:13<00:12, 58.4MB/s][A
+
+
+optimizer.bin:  27%|██▋       | 784M/2.92G [00:13<00:32, 64.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  53%|█████▎    | 768M/1.46G [00:13<00:12, 53.6MB/s][A
+
+
+optimizer.bin:  27%|██▋       | 800M/2.92G [00:13<00:33, 64.1MB/s][A[A[A
+
+
+optimizer.bin:  28%|██▊       | 816M/2.92G [00:13<00:30, 68.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  54%|█████▍    | 784M/1.46G [00:13<00:13, 51.3MB/s][A
+
+
+optimizer.bin:  28%|██▊       | 832M/2.92G [00:14<00:30, 69.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  55%|█████▍    | 800M/1.46G [00:14<00:12, 51.5MB/s][A
+
+
+optimizer.bin:  29%|██▉       | 848M/2.92G [00:14<00:35, 58.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  56%|█████▌    | 816M/1.46G [00:14<00:13, 46.6MB/s][A
+
+
+optimizer.bin:  30%|██▉       | 864M/2.92G [00:14<00:33, 62.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  57%|█████▋    | 832M/1.46G [00:15<00:13, 47.2MB/s][A
+
+
+optimizer.bin:  30%|███       | 880M/2.92G [00:15<00:33, 60.5MB/s][A[A[A
+
+
+optimizer.bin:  31%|███       | 896M/2.92G [00:15<00:31, 63.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  58%|█████▊    | 848M/1.46G [00:15<00:12, 48.4MB/s][A
+diffusion_pytorch_model.safetensors:  59%|█████▉    | 864M/1.46G [00:15<00:10, 54.3MB/s][A
+
+
+optimizer.bin:  31%|███       | 912M/2.92G [00:15<00:42, 47.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  60%|██████    | 880M/1.46G [00:15<00:10, 54.6MB/s][A
+
+
+optimizer.bin:  32%|███▏      | 928M/2.92G [00:16<00:37, 52.7MB/s][A[A[A
+
+
+optimizer.bin:  32%|███▏      | 944M/2.92G [00:16<00:34, 56.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  61%|██████▏   | 896M/1.46G [00:16<00:12, 45.5MB/s][A
+
+
+optimizer.bin:  33%|███▎      | 960M/2.92G [00:16<00:35, 55.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  63%|██████▎   | 912M/1.46G [00:16<00:10, 50.3MB/s][A
+
+
+optimizer.bin:  33%|███▎      | 976M/2.92G [00:16<00:32, 60.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  64%|██████▎   | 928M/1.46G [00:16<00:10, 48.8MB/s][A
+
+
+optimizer.bin:  34%|███▍      | 992M/2.92G [00:17<00:30, 63.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  65%|██████▍   | 944M/1.46G [00:17<00:09, 52.7MB/s][A
+
+
+optimizer.bin:  34%|███▍      | 1.01G/2.92G [00:17<00:29, 64.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  66%|██████▌   | 960M/1.46G [00:17<00:08, 58.0MB/s][A
+
+
+optimizer.bin:  35%|███▌      | 1.02G/2.92G [00:17<00:29, 64.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  67%|██████▋   | 976M/1.46G [00:17<00:08, 59.9MB/s][A
+
+
+optimizer.bin:  36%|███▌      | 1.04G/2.92G [00:17<00:29, 62.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  68%|██████▊   | 992M/1.46G [00:17<00:07, 62.1MB/s][A
+
+
+optimizer.bin:  36%|███▌      | 1.06G/2.92G [00:18<00:31, 59.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  69%|██████▉   | 1.01G/1.46G [00:18<00:06, 64.2MB/s][A
+
+
+optimizer.bin:  37%|███▋      | 1.07G/2.92G [00:18<00:31, 58.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  70%|███████   | 1.02G/1.46G [00:18<00:06, 62.1MB/s][A
+
+
+optimizer.bin:  37%|███▋      | 1.09G/2.92G [00:18<00:29, 63.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  71%|███████▏  | 1.04G/1.46G [00:18<00:06, 64.3MB/s][A
+
+
+optimizer.bin:  38%|███▊      | 1.10G/2.92G [00:18<00:28, 63.7MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  72%|███████▏  | 1.06G/1.46G [00:18<00:06, 63.4MB/s][A
+
+
+optimizer.bin:  38%|███▊      | 1.12G/2.92G [00:19<00:27, 64.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  74%|███████▎  | 1.07G/1.46G [00:19<00:06, 63.8MB/s][A
+
+
+optimizer.bin:  39%|███▉      | 1.14G/2.92G [00:19<00:29, 60.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  75%|███████▍  | 1.09G/1.46G [00:19<00:06, 60.2MB/s][A
+
+
+optimizer.bin:  39%|███▉      | 1.15G/2.92G [00:19<00:26, 66.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  76%|███████▌  | 1.10G/1.46G [00:19<00:05, 60.6MB/s][A
+
+
+optimizer.bin:  40%|███▉      | 1.17G/2.92G [00:19<00:26, 65.9MB/s][A[A[A
+
+
+optimizer.bin:  41%|████      | 1.18G/2.92G [00:20<00:26, 65.4MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  77%|███████▋  | 1.12G/1.46G [00:20<00:06, 53.9MB/s][A
+
+
+optimizer.bin:  41%|████      | 1.20G/2.92G [00:20<00:26, 66.1MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  78%|███████▊  | 1.14G/1.46G [00:20<00:06, 52.2MB/s][A
+diffusion_pytorch_model.safetensors:  79%|███████▉  | 1.15G/1.46G [00:20<00:05, 55.6MB/s][A
+
+
+optimizer.bin:  42%|████▏     | 1.22G/2.92G [00:20<00:32, 52.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  80%|████████  | 1.17G/1.46G [00:20<00:04, 59.7MB/s][A
+
+
+optimizer.bin:  42%|████▏     | 1.23G/2.92G [00:20<00:30, 55.4MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  81%|████████▏ | 1.18G/1.46G [00:21<00:04, 56.8MB/s][A
+
+
+optimizer.bin:  43%|████▎     | 1.25G/2.92G [00:21<00:30, 54.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  82%|████████▏ | 1.20G/1.46G [00:21<00:04, 60.5MB/s][A
+
+
+optimizer.bin:  43%|████▎     | 1.26G/2.92G [00:21<00:29, 56.4MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  83%|████████▎ | 1.22G/1.46G [00:21<00:04, 56.2MB/s][A
+
+
+optimizer.bin:  44%|████▍     | 1.28G/2.92G [00:21<00:33, 48.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  85%|████████▍ | 1.23G/1.46G [00:21<00:03, 57.7MB/s][A
+diffusion_pytorch_model.safetensors:  86%|████████▌ | 1.25G/1.46G [00:22<00:03, 57.2MB/s][A
+
+
+optimizer.bin:  44%|████▍     | 1.30G/2.92G [00:22<00:32, 49.7MB/s][A[A[A
+
+
+optimizer.bin:  45%|████▍     | 1.31G/2.92G [00:22<00:26, 61.6MB/s][A[A[A
+
+
+optimizer.bin:  45%|████▌     | 1.32G/2.92G [00:22<00:28, 56.8MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  87%|████████▋ | 1.26G/1.46G [00:22<00:03, 53.5MB/s][A
+
+
+optimizer.bin:  45%|████▌     | 1.33G/2.92G [00:22<00:31, 51.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  88%|████████▊ | 1.28G/1.46G [00:22<00:03, 53.2MB/s][A
+
+
+optimizer.bin:  46%|████▌     | 1.34G/2.92G [00:23<00:28, 54.5MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  89%|████████▉ | 1.30G/1.46G [00:23<00:02, 56.0MB/s][A
+
+
+optimizer.bin:  47%|████▋     | 1.36G/2.92G [00:23<00:28, 54.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  90%|█████████ | 1.31G/1.46G [00:23<00:02, 54.3MB/s][A
+
+
+optimizer.bin:  47%|████▋     | 1.38G/2.92G [00:23<00:31, 49.1MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  91%|█████████ | 1.33G/1.46G [00:23<00:02, 47.7MB/s][A
+
+
+optimizer.bin:  48%|████▊     | 1.39G/2.92G [00:24<00:30, 49.9MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  92%|█████████▏| 1.34G/1.46G [00:24<00:02, 50.5MB/s][A
+
+
+optimizer.bin:  48%|████▊     | 1.41G/2.92G [00:24<00:28, 52.3MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  93%|█████████▎| 1.36G/1.46G [00:24<00:01, 55.7MB/s][A
+
+
+optimizer.bin:  49%|████▊     | 1.42G/2.92G [00:24<00:26, 57.0MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  94%|█████████▍| 1.38G/1.46G [00:24<00:01, 57.6MB/s][A
+
+
+optimizer.bin:  49%|████▉     | 1.44G/2.92G [00:24<00:25, 57.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  96%|█████████▌| 1.39G/1.46G [00:24<00:01, 57.6MB/s][A
+
+
+optimizer.bin:  50%|████▉     | 1.46G/2.92G [00:25<00:25, 58.2MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  97%|█████████▋| 1.41G/1.46G [00:25<00:00, 56.9MB/s][A
+
+
+optimizer.bin:  50%|█████     | 1.47G/2.92G [00:25<00:26, 55.6MB/s][A[A[A
+diffusion_pytorch_model.safetensors:  98%|█████████▊| 1.42G/1.46G [00:25<00:00, 62.6MB/s][A
+diffusion_pytorch_model.safetensors:  99%|█████████▉| 1.44G/1.46G [00:25<00:00, 65.1MB/s][A
+
+
+optimizer.bin:  51%|█████     | 1.49G/2.92G [00:25<00:26, 54.1MB/s][A[A[A
+diffusion_pytorch_model.safetensors: 100%|█████████▉| 1.46G/1.46G [00:25<00:00, 64.6MB/s][A
+
+
+optimizer.bin:  51%|█████▏    | 1.50G/2.92G [00:25<00:25, 55.6MB/s][A[A[Adiffusion_pytorch_model.safetensors: 100%|██████████| 1.46G/1.46G [00:26<00:00, 56.0MB/s]
+
+
+
+
+
+Upload 6 LFS files:  17%|█▋        | 1/6 [00:26<02:11, 26.21s/it][A[A[A[A[A
+
+
+optimizer.bin:  52%|█████▏    | 1.52G/2.92G [00:26<00:26, 53.8MB/s][A[A[A
+
+
+optimizer.bin:  53%|█████▎    | 1.54G/2.92G [00:26<00:24, 57.3MB/s][A[A[A
+
+
+optimizer.bin:  53%|█████▎    | 1.55G/2.92G [00:26<00:23, 58.3MB/s][A[A[A
+
+
+optimizer.bin:  54%|█████▎    | 1.57G/2.92G [00:26<00:20, 65.2MB/s][A[A[A
+
+
+optimizer.bin:  54%|█████▍    | 1.58G/2.92G [00:27<00:21, 63.6MB/s][A[A[A
+
+
+optimizer.bin:  55%|█████▍    | 1.60G/2.92G [00:27<00:20, 65.4MB/s][A[A[A
+
+
+optimizer.bin:  55%|█████▌    | 1.62G/2.92G [00:27<00:20, 65.2MB/s][A[A[A
+
+
+optimizer.bin:  56%|█████▌    | 1.63G/2.92G [00:27<00:19, 66.5MB/s][A[A[A
+
+
+optimizer.bin:  56%|█████▋    | 1.65G/2.92G [00:28<00:18, 69.3MB/s][A[A[A
+
+
+optimizer.bin:  57%|█████▋    | 1.66G/2.92G [00:28<00:17, 71.1MB/s][A[A[A
+
+
+optimizer.bin:  57%|█████▋    | 1.68G/2.92G [00:28<00:17, 69.2MB/s][A[A[A
+
+
+optimizer.bin:  58%|█████▊    | 1.70G/2.92G [00:29<00:23, 53.1MB/s][A[A[A
+
+
+optimizer.bin:  59%|█████▊    | 1.71G/2.92G [00:29<00:21, 56.3MB/s][A[A[A
+
+
+optimizer.bin:  59%|█████▉    | 1.73G/2.92G [00:29<00:19, 60.5MB/s][A[A[A
+
+
+optimizer.bin:  60%|█████▉    | 1.74G/2.92G [00:29<00:17, 65.8MB/s][A[A[A
+
+
+optimizer.bin:  60%|██████    | 1.76G/2.92G [00:32<01:11, 16.3MB/s][A[A[A
+
+
+optimizer.bin:  61%|██████    | 1.78G/2.92G [00:32<00:55, 20.8MB/s][A[A[A
+
+
+optimizer.bin:  61%|██████▏   | 1.79G/2.92G [00:32<00:42, 26.7MB/s][A[A[A
+
+
+optimizer.bin:  62%|██████▏   | 1.81G/2.92G [00:33<00:34, 31.8MB/s][A[A[A
+
+
+optimizer.bin:  62%|██████▏   | 1.82G/2.92G [00:33<00:31, 35.4MB/s][A[A[A
+
+
+optimizer.bin:  63%|██████▎   | 1.84G/2.92G [00:33<00:26, 41.2MB/s][A[A[A
+
+
+optimizer.bin:  64%|██████▎   | 1.86G/2.92G [00:34<00:23, 44.5MB/s][A[A[A
+
+
+optimizer.bin:  64%|██████▍   | 1.87G/2.92G [00:34<00:20, 50.8MB/s][A[A[A
+
+
+optimizer.bin:  65%|██████▍   | 1.89G/2.92G [00:34<00:20, 50.5MB/s][A[A[A
+
+
+optimizer.bin:  65%|██████▌   | 1.90G/2.92G [00:34<00:19, 51.3MB/s][A[A[A
+
+
+optimizer.bin:  66%|██████▌   | 1.92G/2.92G [00:35<00:18, 55.7MB/s][A[A[A
+
+
+optimizer.bin:  66%|██████▌   | 1.94G/2.92G [00:35<00:16, 58.1MB/s][A[A[A
+
+
+optimizer.bin:  67%|██████▋   | 1.95G/2.92G [00:35<00:16, 57.3MB/s][A[A[A
+
+
+optimizer.bin:  67%|██████▋   | 1.97G/2.92G [00:35<00:15, 61.0MB/s][A[A[A
+
+
+optimizer.bin:  68%|██████▊   | 1.98G/2.92G [00:36<00:16, 57.2MB/s][A[A[A
+
+
+optimizer.bin:  68%|██████▊   | 2.00G/2.92G [00:36<00:19, 48.4MB/s][A[A[A
+
+
+optimizer.bin:  69%|██████▉   | 2.02G/2.92G [00:36<00:18, 50.1MB/s][A[A[A
+
+
+optimizer.bin:  70%|██████▉   | 2.03G/2.92G [00:37<00:16, 54.4MB/s][A[A[A
+
+
+optimizer.bin:  70%|███████   | 2.05G/2.92G [00:37<00:15, 57.2MB/s][A[A[A
+
+
+optimizer.bin:  71%|███████   | 2.06G/2.92G [00:37<00:14, 59.2MB/s][A[A[A
+
+
+optimizer.bin:  71%|███████   | 2.08G/2.92G [00:37<00:13, 60.5MB/s][A[A[A
+
+
+optimizer.bin:  72%|███████▏  | 2.10G/2.92G [00:38<00:20, 40.1MB/s][A[A[A
+
+
+optimizer.bin:  72%|███████▏  | 2.11G/2.92G [00:38<00:18, 43.5MB/s][A[A[A
+
+
+optimizer.bin:  73%|███████▎  | 2.13G/2.92G [00:39<00:15, 51.4MB/s][A[A[A
+
+
+optimizer.bin:  73%|███████▎  | 2.14G/2.92G [00:39<00:12, 59.9MB/s][A[A[A
+
+
+optimizer.bin:  74%|███████▍  | 2.16G/2.92G [00:39<00:12, 63.0MB/s][A[A[A
+
+
+optimizer.bin:  74%|███████▍  | 2.18G/2.92G [00:39<00:12, 59.3MB/s][A[A[A
+
+
+optimizer.bin:  75%|███████▌  | 2.19G/2.92G [00:40<00:11, 63.2MB/s][A[A[A
+
+
+optimizer.bin:  76%|███████▌  | 2.21G/2.92G [00:40<00:11, 63.9MB/s][A[A[A
+
+
+optimizer.bin:  76%|███████▌  | 2.22G/2.92G [00:40<00:16, 41.3MB/s][A[A[A
+
+
+optimizer.bin:  77%|███████▋  | 2.24G/2.92G [00:41<00:15, 44.8MB/s][A[A[A
+
+
+optimizer.bin:  77%|███████▋  | 2.26G/2.92G [00:41<00:14, 45.4MB/s][A[A[A
+
+
+optimizer.bin:  78%|███████▊  | 2.27G/2.92G [00:41<00:13, 48.8MB/s][A[A[A
+
+
+optimizer.bin:  78%|███████▊  | 2.29G/2.92G [00:42<00:11, 53.5MB/s][A[A[A
+
+
+optimizer.bin:  79%|███████▉  | 2.30G/2.92G [00:42<00:11, 53.5MB/s][A[A[A
+
+
+optimizer.bin:  79%|███████▉  | 2.32G/2.92G [00:42<00:10, 58.8MB/s][A[A[A
+
+
+optimizer.bin:  80%|███████▉  | 2.34G/2.92G [00:42<00:09, 59.1MB/s][A[A[A
+
+
+optimizer.bin:  80%|████████  | 2.35G/2.92G [00:43<00:09, 59.8MB/s][A[A[A
+
+
+optimizer.bin:  81%|████████  | 2.37G/2.92G [00:43<00:09, 58.6MB/s][A[A[A
+
+
+optimizer.bin:  82%|████████▏ | 2.38G/2.92G [00:43<00:09, 59.0MB/s][A[A[A
+
+
+optimizer.bin:  82%|████████▏ | 2.40G/2.92G [00:43<00:08, 64.6MB/s][A[A[A
+
+
+optimizer.bin:  83%|████████▎ | 2.42G/2.92G [00:44<00:08, 61.7MB/s][A[A[A
+
+
+optimizer.bin:  83%|████████▎ | 2.43G/2.92G [00:44<00:09, 53.6MB/s][A[A[A
+
+
+optimizer.bin:  84%|████████▍ | 2.45G/2.92G [00:44<00:08, 54.0MB/s][A[A[A
+
+
+optimizer.bin:  84%|████████▍ | 2.46G/2.92G [00:45<00:08, 56.3MB/s][A[A[A
+
+
+optimizer.bin:  85%|████████▍ | 2.48G/2.92G [00:45<00:07, 59.8MB/s][A[A[A
+
+
+optimizer.bin:  85%|████████▌ | 2.50G/2.92G [00:45<00:06, 63.2MB/s][A[A[A
+
+
+optimizer.bin:  86%|████████▌ | 2.51G/2.92G [00:45<00:06, 63.1MB/s][A[A[A
+
+
+optimizer.bin:  87%|████████▋ | 2.53G/2.92G [00:46<00:06, 59.5MB/s][A[A[A
+
+
+optimizer.bin:  87%|████████▋ | 2.54G/2.92G [00:46<00:06, 55.3MB/s][A[A[A
+
+
+optimizer.bin:  88%|████████▊ | 2.56G/2.92G [00:46<00:06, 59.6MB/s][A[A[A
+
+
+optimizer.bin:  88%|████████▊ | 2.58G/2.92G [00:46<00:06, 57.7MB/s][A[A[A
+
+
+optimizer.bin:  89%|████████▊ | 2.59G/2.92G [00:47<00:05, 59.9MB/s][A[A[A
+
+
+optimizer.bin:  89%|████████▉ | 2.61G/2.92G [00:47<00:05, 61.5MB/s][A[A[A
+
+
+optimizer.bin:  90%|████████▉ | 2.62G/2.92G [00:47<00:04, 65.9MB/s][A[A[A
+
+
+optimizer.bin:  90%|█████████ | 2.64G/2.92G [00:47<00:04, 68.4MB/s][A[A[A
+
+
+optimizer.bin:  91%|█████████ | 2.66G/2.92G [00:48<00:03, 71.3MB/s][A[A[A
+
+
+optimizer.bin:  91%|█████████▏| 2.67G/2.92G [00:48<00:03, 70.8MB/s][A[A[A
+
+
+optimizer.bin:  92%|█████████▏| 2.69G/2.92G [00:48<00:03, 65.5MB/s][A[A[A
+
+
+optimizer.bin:  93%|█████████▎| 2.70G/2.92G [00:48<00:03, 66.1MB/s][A[A[A
+
+
+optimizer.bin:  93%|█████████▎| 2.72G/2.92G [00:49<00:03, 65.1MB/s][A[A[A
+
+
+optimizer.bin:  94%|█████████▎| 2.74G/2.92G [00:49<00:02, 62.9MB/s][A[A[A
+
+
+optimizer.bin:  94%|█████████▍| 2.75G/2.92G [00:49<00:02, 65.6MB/s][A[A[A
+
+
+optimizer.bin:  95%|█████████▍| 2.77G/2.92G [00:49<00:02, 66.4MB/s][A[A[A
+
+
+optimizer.bin:  95%|█████████▌| 2.78G/2.92G [00:50<00:02, 65.3MB/s][A[A[A
+
+
+optimizer.bin:  96%|█████████▌| 2.80G/2.92G [00:50<00:02, 50.5MB/s][A[A[A
+
+
+optimizer.bin:  96%|█████████▋| 2.82G/2.92G [00:50<00:02, 50.7MB/s][A[A[A
+
+
+optimizer.bin:  97%|█████████▋| 2.83G/2.92G [00:51<00:01, 50.6MB/s][A[A[A
+
+
+optimizer.bin:  97%|█████████▋| 2.85G/2.92G [00:51<00:01, 47.8MB/s][A[A[A
+
+
+optimizer.bin:  98%|█████████▊| 2.86G/2.92G [00:51<00:01, 53.3MB/s][A[A[A
+
+
+optimizer.bin:  99%|█████████▊| 2.88G/2.92G [00:52<00:00, 57.9MB/s][A[A[A
+
+
+optimizer.bin:  99%|█████████▉| 2.90G/2.92G [00:52<00:00, 59.9MB/s][A[A[A
+
+
+optimizer.bin: 100%|█████████▉| 2.91G/2.92G [00:52<00:00, 58.2MB/s][A[A[Aoptimizer.bin: 100%|██████████| 2.92G/2.92G [00:52<00:00, 55.4MB/s]
+
+
+
+
+
+Upload 6 LFS files:  50%|█████     | 3/6 [00:53<00:50, 16.72s/it][A[A[A[A[AUpload 6 LFS files: 100%|██████████| 6/6 [00:53<00:00,  8.83s/it]