diff --git "a/nohup.out" "b/nohup.out"
--- "a/nohup.out"
+++ "b/nohup.out"
@@ -2,12 +2,12 @@ wandb: Currently logged in as: sanchit-gandhi (use `wandb login --relogin` to fo
 wandb: wandb version 0.12.17 is available!  To upgrade, please run:
 wandb:  $ pip install wandb --upgrade
 wandb: Tracking run with wandb version 0.12.15
-wandb: Run data is saved locally in /home/sanchitgandhi/flax-wav2vec2-2-bart-large-ls-960h-feature-encoder/wandb/run-20220530_120145-2k01y1ky
+wandb: Run data is saved locally in /home/sanchitgandhi/flax-wav2vec2-2-bart-large-ls-960h-feature-encoder/wandb/run-20220530_175928-2nzi0chc
 wandb: Run `wandb offline` to turn off syncing.
 wandb: Syncing run flax-wav2vec2-2-bart-large-ls-960h-feature-encoder
 wandb: ⭐️ View project at https://wandb.ai/sanchit-gandhi/librispeech_960h
-wandb: 🚀 View run at https://wandb.ai/sanchit-gandhi/librispeech_960h/runs/2k01y1ky
-05/30/2022 12:01:47 - INFO - __main__ - Training/evaluation parameters FlaxSeq2SeqTrainingArguments(
+wandb: 🚀 View run at https://wandb.ai/sanchit-gandhi/librispeech_960h/runs/2nzi0chc
+05/30/2022 17:59:29 - INFO - __main__ - Training/evaluation parameters FlaxSeq2SeqTrainingArguments(
 _n_gpu=-1,
 adafactor=False,
 adam_beta1=0.9,
@@ -40,7 +40,7 @@ fp16_opt_level=O1,
 generation_length_penalty=1.2,
 generation_max_length=40,
 generation_num_beams=1,
-gradient_accumulation_steps=1,
+gradient_accumulation_steps=2,
 gradient_checkpointing=True,
 greater_is_better=None,
 group_by_length=False,
@@ -76,7 +76,7 @@ output_dir=./,
 overwrite_output_dir=True,
 past_index=-1,
 per_device_eval_batch_size=4,
-per_device_train_batch_size=8,
+per_device_train_batch_size=4,
 precision=full,
 predict_with_generate=True,
 prediction_loss_only=False,
@@ -105,16 +105,12 @@ warmup_steps=500,
 weight_decay=0.0,
 xpu_backend=None,
 )
-05/30/2022 12:01:47 - INFO - __main__ - JAX devices: 8, matmul precision: default
-05/30/2022 12:01:47 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
-05/30/2022 12:01:49 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
-05/30/2022 12:01:50 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
-05/30/2022 12:01:50 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
-05/30/2022 12:01:51 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
-https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-scan/resolve/main/config.json not found in cache or force_download set to True, downloading to /home/sanchitgandhi/.cache/huggingface/transformers/tmp2_f644vh
-Downloading:   0% 0.00/6.84k [00:00<?, ?B/s]Downloading: 100% 6.84k/6.84k [00:00<00:00, 10.2MB/s]
-storing https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-scan/resolve/main/config.json in cache at /home/sanchitgandhi/.cache/huggingface/transformers/e6d3af8a2b6624d8adf8fc289717c121400164223b3e51d49b639aa34d1d3048.c9a58c9120361b7b034a0136cc74d5dce009e745c4cc111c255d5f3d0a9e2fd9
-creating metadata file for /home/sanchitgandhi/.cache/huggingface/transformers/e6d3af8a2b6624d8adf8fc289717c121400164223b3e51d49b639aa34d1d3048.c9a58c9120361b7b034a0136cc74d5dce009e745c4cc111c255d5f3d0a9e2fd9
+05/30/2022 17:59:29 - INFO - __main__ - JAX devices: 8, matmul precision: default
+05/30/2022 17:59:30 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
+05/30/2022 17:59:30 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
+05/30/2022 17:59:30 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
+05/30/2022 17:59:31 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
+05/30/2022 17:59:31 - WARNING - datasets.builder - Reusing dataset librispeech_asr (/home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb)
 loading configuration file https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-scan/resolve/main/config.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/e6d3af8a2b6624d8adf8fc289717c121400164223b3e51d49b639aa34d1d3048.c9a58c9120361b7b034a0136cc74d5dce009e745c4cc111c255d5f3d0a9e2fd9
 /home/sanchitgandhi/transformers/src/transformers/configuration_utils.py:358: UserWarning: Passing `gradient_checkpointing` to a config initialization is deprecated and will be removed in v5 Transformers. Using `model.gradient_checkpointing_enable()` instead, or if you are using the `Trainer` API, pass `gradient_checkpointing=True` in your `TrainingArguments`.
   warnings.warn(
@@ -426,68 +422,423 @@ loading file https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-sc
 loading file https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-scan/resolve/main/special_tokens_map.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/505d61b8f6e05764b5aec1483bfdd13a310681a5af54957263604323be3bbabf.a11ebb04664c067c8fe5ef8f8068b0f721263414a26058692f7b2e4ba2a1b342
 loading file https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-scan/resolve/main/tokenizer_config.json from cache at /home/sanchitgandhi/.cache/huggingface/transformers/ff79c23164eac352d7f9651f3c3774a962ce80f81460d9e17d689235fa34ee80.0e8b2b497f91e23302894a5c1f19ced6334b0abd450a7bce75a67bf0f9ee5c54
 loading weights file https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-scan/resolve/main/flax_model.msgpack from cache at /home/sanchitgandhi/.cache/huggingface/transformers/1279dc21f7dd9ed546f166e7e445e068b2672ddfa5386b2e3a3a973b8d668365.8e03496bb6919447aeb468483249e7b65dfb59c42989be9787af0aa6aa9b3f50
-tcmalloc: large alloc 2353618944 bytes == 0xa38a8000 @  0x7f47ee716680 0x7f47ee737824 0x5f8a01 0x648cf1 0x5c4676 0x4f290e 0x64f718 0x5048b3 0x56b1da 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x68d047 0x67e351 0x67e3cf 0x67e471 0x67e817 0x6b6fe2 0x6b736d 0x7f47ee5290b3 0x5fa5ce
+tcmalloc: large alloc 2353618944 bytes == 0xa2612000 @  0x7fb1de660680 0x7fb1de681824 0x5f8a01 0x648cf1 0x5c4676 0x4f290e 0x64f718 0x5048b3 0x56b1da 0x56939a 0x50aaa0 0x56c28c 0x56939a 0x5f6a13 0x56b0ae 0x56939a 0x68d047 0x67e351 0x67e3cf 0x67e471 0x67e817 0x6b6fe2 0x6b736d 0x7fb1de4730b3 0x5fa5ce
 /home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/tree_util.py:188: FutureWarning: jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() instead as a drop-in replacement.
   warnings.warn('jax.tree_util.tree_multimap() is deprecated. Please use jax.tree_util.tree_map() '
 All model checkpoint weights were used when initializing FlaxSpeechEncoderDecoderModel.
 
 All the weights of FlaxSpeechEncoderDecoderModel were initialized from the model checkpoint at sanchit-gandhi/flax-wav2vec2-2-bart-large-scan.
 If your task is similar to the task the model of the checkpoint was trained on, you can already use FlaxSpeechEncoderDecoderModel for predictions without further training.
-  0% 0/282 [00:00<?, ?ba/s]  0% 1/282 [00:00<00:30,  9.18ba/s] 18% 50/282 [00:00<00:00, 280.08ba/s] 34% 97/282 [00:00<00:00, 364.49ba/s] 52% 146/282 [00:00<00:00, 412.03ba/s] 69% 195/282 [00:00<00:00, 439.14ba/s] 87% 246/282 [00:00<00:00, 461.82ba/s]100% 282/282 [00:00<00:00, 413.62ba/s]
-  0% 0/3 [00:00<?, ?ba/s]100% 3/3 [00:00<00:00, 461.84ba/s]
-  0% 0/3 [00:00<?, ?ba/s]100% 3/3 [00:00<00:00, 450.77ba/s]
-  0% 0/3 [00:00<?, ?ba/s]100% 3/3 [00:00<00:00, 427.10ba/s]
-  0% 0/3 [00:00<?, ?ba/s]100% 3/3 [00:00<00:00, 489.47ba/s]
-preprocess train dataset:   0% 0/281241 [00:00<?, ?ex/s]preprocess train dataset:   0% 1/281241 [00:03<242:25:01,  3.10s/ex]preprocess train dataset:   0% 15/281241 [00:03<12:06:41,  6.45ex/s]preprocess train dataset:   0% 30/281241 [00:03<5:14:45, 14.89ex/s] preprocess train dataset:   0% 45/281241 [00:03<3:05:39, 25.24ex/s]preprocess train dataset:   0% 61/281241 [00:03<2:01:24, 38.60ex/s]preprocess train dataset:   0% 79/281241 [00:03<1:24:01, 55.77ex/s]preprocess train dataset:   0% 94/281241 [00:03<1:07:10, 69.76ex/s]preprocess train dataset:   0% 109/281241 [00:03<55:57, 83.74ex/s] preprocess train dataset:   0% 124/281241 [00:03<48:21, 96.89ex/s]preprocess train dataset:   0% 141/281241 [00:04<41:36, 112.61ex/s]preprocess train dataset:   0% 157/281241 [00:04<38:33, 121.49ex/s]preprocess train dataset:   0% 175/281241 [00:04<34:36, 135.36ex/s]preprocess train dataset:   0% 191/281241 [00:04<33:33, 139.61ex/s]preprocess train dataset:   0% 207/281241 [00:04<33:21, 140.40ex/s]preprocess train dataset:   0% 223/281241 [00:04<32:16, 145.09ex/s]preprocess train dataset:   0% 239/281241 [00:04<31:54, 146.80ex/s]preprocess train dataset:   0% 255/281241 [00:04<31:57, 146.53ex/s]preprocess train dataset:   0% 271/281241 [00:04<32:16, 145.13ex/s]preprocess train dataset:   0% 286/281241 [00:05<33:04, 141.60ex/s]preprocess train dataset:   0% 301/281241 [00:05<32:35, 143.67ex/s]preprocess train dataset:   0% 316/281241 [00:05<32:29, 144.12ex/s]preprocess train dataset:   0% 332/281241 [00:05<32:00, 146.26ex/s]preprocess train dataset:   0% 352/281241 [00:05<29:26, 158.98ex/s]preprocess train dataset:   0% 370/281241 [00:05<28:29, 164.34ex/s]preprocess train dataset:   0% 387/281241 [00:05<28:22, 164.94ex/s]preprocess train dataset:   0% 408/281241 [00:05<26:41, 175.41ex/s]preprocess train dataset:   0% 426/281241 [00:05<26:45, 174.91ex/s]preprocess train dataset:   0% 444/281241 [00:05<27:52, 167.93ex/s]preprocess train dataset:   0% 463/281241 [00:06<27:05, 172.75ex/s]preprocess train dataset:   0% 481/281241 [00:06<28:23, 164.77ex/s]preprocess train dataset:   0% 498/281241 [00:06<28:54, 161.87ex/s]preprocess train dataset:   0% 515/281241 [00:06<29:37, 157.93ex/s]preprocess train dataset:   0% 531/281241 [00:06<29:53, 156.53ex/s]preprocess train dataset:   0% 548/281241 [00:06<29:11, 160.30ex/s]preprocess train dataset:   0% 565/281241 [00:06<29:13, 160.06ex/s]preprocess train dataset:   0% 582/281241 [00:06<29:00, 161.28ex/s]preprocess train dataset:   0% 600/281241 [00:06<28:17, 165.31ex/s]preprocess train dataset:   0% 617/281241 [00:07<28:53, 161.92ex/s]preprocess train dataset:   0% 634/281241 [00:07<28:29, 164.10ex/s]preprocess train dataset:   0% 657/281241 [00:07<25:44, 181.63ex/s]preprocess train dataset:   0% 684/281241 [00:07<22:41, 206.13ex/s]preprocess train dataset:   0% 707/281241 [00:07<22:21, 209.13ex/s]preprocess train dataset:   0% 728/281241 [00:07<24:10, 193.38ex/s]preprocess train dataset:   0% 748/281241 [00:07<26:08, 178.87ex/s]preprocess train dataset:   0% 767/281241 [00:07<26:40, 175.24ex/s]preprocess train dataset:   0% 785/281241 [00:07<27:24, 170.50ex/s]preprocess train dataset:   0% 803/281241 [00:08<28:01, 166.79ex/s]preprocess train dataset:   0% 820/281241 [00:08<28:51, 161.94ex/s]preprocess train dataset:   0% 838/281241 [00:08<28:32, 163.71ex/s]preprocess train dataset:   0% 855/281241 [00:08<28:35, 163.45ex/s]preprocess train dataset:   0% 872/281241 [00:08<28:20, 164.84ex/s]preprocess train dataset:   0% 890/281241 [00:08<27:47, 168.11ex/s]preprocess train dataset:   0% 907/281241 [00:08<29:25, 158.77ex/s]preprocess train dataset:   0% 923/281241 [00:08<30:02, 155.53ex/s]preprocess train dataset:   0% 939/281241 [00:08<29:54, 156.18ex/s]preprocess train dataset:   0% 955/281241 [00:09<30:04, 155.36ex/s]preprocess train dataset:   0% 972/281241 [00:09<29:35, 157.83ex/s]preprocess train dataset:   0% 989/281241 [00:09<29:31, 158.18ex/s]preprocess train dataset:   0% 1005/281241 [00:12<4:32:37, 17.13ex/s]preprocess train dataset:   0% 1022/281241 [00:12<3:17:44, 23.62ex/s]preprocess train dataset:   0% 1042/281241 [00:12<2:18:51, 33.63ex/s]preprocess train dataset:   0% 1060/281241 [00:12<1:44:55, 44.51ex/s]preprocess train dataset:   0% 1076/281241 [00:12<1:24:22, 55.34ex/s]preprocess train dataset:   0% 1092/281241 [00:12<1:09:00, 67.66ex/s]preprocess train dataset:   0% 1108/281241 [00:12<58:02, 80.45ex/s]  preprocess train dataset:   0% 1124/281241 [00:12<50:05, 93.20ex/s]preprocess train dataset:   0% 1141/281241 [00:13<43:14, 107.94ex/s]preprocess train dataset:   0% 1158/281241 [00:13<38:35, 120.98ex/s]preprocess train dataset:   0% 1177/281241 [00:13<34:28, 135.41ex/s]preprocess train dataset:   0% 1194/281241 [00:13<32:24, 144.01ex/s]preprocess train dataset:   0% 1211/281241 [00:13<31:14, 149.42ex/s]preprocess train dataset:   0% 1229/281241 [00:13<30:08, 154.87ex/s]preprocess train dataset:   0% 1246/281241 [00:13<29:41, 157.16ex/s]preprocess train dataset:   0% 1263/281241 [00:13<29:10, 159.98ex/s]preprocess train dataset:   0% 1280/281241 [00:13<29:34, 157.77ex/s]preprocess train dataset:   0% 1297/281241 [00:13<29:27, 158.42ex/s]preprocess train dataset:   0% 1314/281241 [00:14<29:14, 159.52ex/s]preprocess train dataset:   0% 1331/281241 [00:14<29:57, 155.68ex/s]preprocess train dataset:   0% 1348/281241 [00:14<29:18, 159.13ex/s]preprocess train dataset:   0% 1367/281241 [00:14<28:19, 164.64ex/s]preprocess train dataset:   0% 1387/281241 [00:14<27:00, 172.71ex/s]preprocess train dataset:   0% 1405/281241 [00:14<28:31, 163.52ex/s]preprocess train dataset:   1% 1422/281241 [00:14<29:15, 159.40ex/s]preprocess train dataset:   1% 1439/281241 [00:14<29:33, 157.79ex/s]preprocess train dataset:   1% 1455/281241 [00:14<30:34, 152.55ex/s]preprocess train dataset:   1% 1471/281241 [00:15<30:34, 152.50ex/s]preprocess train dataset:   1% 1487/281241 [00:15<30:51, 151.08ex/s]preprocess train dataset:   1% 1503/281241 [00:15<30:34, 152.48ex/s]preprocess train dataset:   1% 1519/281241 [00:15<30:41, 151.87ex/s]preprocess train dataset:   1% 1535/281241 [00:15<30:36, 152.31ex/s]preprocess train dataset:   1% 1553/281241 [00:15<29:13, 159.50ex/s]preprocess train dataset:   1% 1571/281241 [00:15<28:20, 164.44ex/s]preprocess train dataset:   1% 1590/281241 [00:15<27:25, 169.99ex/s]preprocess train dataset:   1% 1608/281241 [00:15<27:23, 170.10ex/s]preprocess train dataset:   1% 1626/281241 [00:15<27:03, 172.21ex/s]preprocess train dataset:   1% 1645/281241 [00:16<26:17, 177.28ex/s]preprocess train dataset:   1% 1663/281241 [00:16<27:27, 169.70ex/s]preprocess train dataset:   1% 1681/281241 [00:16<27:52, 167.17ex/s]preprocess train dataset:   1% 1698/281241 [00:16<28:01, 166.28ex/s]preprocess train dataset:   1% 1715/281241 [00:16<28:25, 163.89ex/s]preprocess train dataset:   1% 1732/281241 [00:16<28:49, 161.64ex/s]preprocess train dataset:   1% 1749/281241 [00:16<28:51, 161.39ex/s]preprocess train dataset:   1% 1767/281241 [00:16<28:23, 164.08ex/s]preprocess train dataset:   1% 1785/281241 [00:16<27:46, 167.70ex/s]preprocess train dataset:   1% 1802/281241 [00:17<28:08, 165.53ex/s]preprocess train dataset:   1% 1819/281241 [00:17<28:07, 165.54ex/s]preprocess train dataset:   1% 1838/281241 [00:17<27:14, 170.95ex/s]preprocess train dataset:   1% 1856/281241 [00:17<27:10, 171.40ex/s]preprocess train dataset:   1% 1874/281241 [00:17<27:31, 169.17ex/s]preprocess train dataset:   1% 1891/281241 [00:17<27:41, 168.08ex/s]preprocess train dataset:   1% 1908/281241 [00:17<27:56, 166.58ex/s]preprocess train dataset:   1% 1926/281241 [00:17<27:38, 168.41ex/s]preprocess train dataset:   1% 1943/281241 [00:17<28:15, 164.72ex/s]preprocess train dataset:   1% 1961/281241 [00:18<27:57, 166.49ex/s]preprocess train dataset:   1% 1979/281241 [00:18<27:38, 168.43ex/s]preprocess train dataset:   1% 1999/281241 [00:18<26:18, 176.91ex/s]preprocess train dataset:   1% 2017/281241 [00:21<3:59:03, 19.47ex/s]preprocess train dataset:   1% 2034/281241 [00:21<2:59:04, 25.99ex/s]preprocess train dataset:   1% 2052/281241 [00:21<2:13:16, 34.92ex/s]preprocess train dataset:   1% 2071/281241 [00:21<1:39:28, 46.77ex/s]preprocess train dataset:   1% 2089/281241 [00:21<1:17:57, 59.68ex/s]preprocess train dataset:   1% 2106/281241 [00:21<1:04:06, 72.57ex/s]preprocess train dataset:   1% 2124/281241 [00:21<52:43, 88.23ex/s]  preprocess train dataset:   1% 2143/281241 [00:21<44:02, 105.61ex/s]preprocess train dataset:   1% 2161/281241 [00:21<39:46, 116.93ex/s]preprocess train dataset:   1% 2180/281241 [00:22<35:16, 131.83ex/s]preprocess train dataset:   1% 2198/281241 [00:22<32:47, 141.83ex/s]preprocess train dataset:   1% 2216/281241 [00:22<31:24, 148.04ex/s]preprocess train dataset:   1% 2234/281241 [00:22<30:42, 151.41ex/s]preprocess train dataset:   1% 2251/281241 [00:22<30:11, 154.03ex/s]preprocess train dataset:   1% 2269/281241 [00:22<29:12, 159.22ex/s]preprocess train dataset:   1% 2286/281241 [00:22<29:02, 160.11ex/s]preprocess train dataset:   1% 2303/281241 [00:22<28:59, 160.40ex/s]preprocess train dataset:   1% 2320/281241 [00:22<28:52, 160.97ex/s]preprocess train dataset:   1% 2337/281241 [00:23<28:56, 160.63ex/s]preprocess train dataset:   1% 2354/281241 [00:23<29:14, 158.97ex/s]preprocess train dataset:   1% 2371/281241 [00:23<29:04, 159.87ex/s]preprocess train dataset:   1% 2388/281241 [00:23<29:16, 158.78ex/s]preprocess train dataset:   1% 2404/281241 [00:23<29:24, 158.02ex/s]preprocess train dataset:   1% 2420/281241 [00:23<29:21, 158.31ex/s]preprocess train dataset:   1% 2436/281241 [00:23<29:21, 158.32ex/s]preprocess train dataset:   1% 2452/281241 [00:23<29:41, 156.45ex/s]preprocess train dataset:   1% 2468/281241 [00:23<29:56, 155.15ex/s]preprocess train dataset:   1% 2487/281241 [00:23<28:45, 161.58ex/s]preprocess train dataset:   1% 2504/281241 [00:24<28:39, 162.12ex/s]preprocess train dataset:   1% 2522/281241 [00:24<28:04, 165.48ex/s]preprocess train dataset:   1% 2539/281241 [00:24<28:20, 163.90ex/s]preprocess train dataset:   1% 2556/281241 [00:24<28:40, 161.94ex/s]preprocess train dataset:   1% 2573/281241 [00:24<28:28, 163.08ex/s]preprocess train dataset:   1% 2590/281241 [00:24<28:34, 162.55ex/s]preprocess train dataset:   1% 2607/281241 [00:24<28:18, 164.08ex/s]preprocess train dataset:   1% 2628/281241 [00:24<26:20, 176.33ex/s]preprocess train dataset:   1% 2646/281241 [00:24<26:31, 175.05ex/s]preprocess train dataset:   1% 2664/281241 [00:24<26:28, 175.39ex/s]preprocess train dataset:   1% 2682/281241 [00:25<26:18, 176.42ex/s]preprocess train dataset:   1% 2700/281241 [00:25<26:41, 173.96ex/s]preprocess train dataset:   1% 2718/281241 [00:25<26:37, 174.32ex/s]preprocess train dataset:   1% 2736/281241 [00:25<27:52, 166.51ex/s]preprocess train dataset:   1% 2753/281241 [00:25<28:41, 161.74ex/s]preprocess train dataset:   1% 2770/281241 [00:25<30:14, 153.46ex/s]preprocess train dataset:   1% 2786/281241 [00:25<32:31, 142.66ex/s]preprocess train dataset:   1% 2801/281241 [00:25<32:56, 140.85ex/s]preprocess train dataset:   1% 2816/281241 [00:26<33:25, 138.84ex/s]preprocess train dataset:   1% 2830/281241 [00:26<35:33, 130.52ex/s]preprocess train dataset:   1% 2844/281241 [00:26<36:53, 125.75ex/s]preprocess train dataset:   1% 2858/281241 [00:26<36:03, 128.67ex/s]preprocess train dataset:   1% 2873/281241 [00:26<35:04, 132.28ex/s]preprocess train dataset:   1% 2889/281241 [00:26<33:48, 137.21ex/s]preprocess train dataset:   1% 2904/281241 [00:26<33:24, 138.84ex/s]preprocess train dataset:   1% 2918/281241 [00:26<33:35, 138.10ex/s]preprocess train dataset:   1% 2933/281241 [00:26<32:56, 140.78ex/s]preprocess train dataset:   1% 2949/281241 [00:26<31:45, 146.08ex/s]preprocess train dataset:   1% 2967/281241 [00:27<29:58, 154.73ex/s]preprocess train dataset:   1% 2985/281241 [00:27<28:44, 161.40ex/s]preprocess train dataset:   1% 3002/281241 [00:29<4:03:03, 19.08ex/s]preprocess train dataset:   1% 3019/281241 [00:29<2:57:41, 26.10ex/s]preprocess train dataset:   1% 3035/281241 [00:30<2:14:55, 34.37ex/s]preprocess train dataset:   1% 3053/281241 [00:30<1:40:40, 46.06ex/s]preprocess train dataset:   1% 3069/281241 [00:30<1:20:25, 57.64ex/s]preprocess train dataset:   1% 3085/281241 [00:30<1:05:42, 70.56ex/s]preprocess train dataset:   1% 3102/281241 [00:30<54:02, 85.78ex/s]  preprocess train dataset:   1% 3118/281241 [00:30<46:45, 99.14ex/s]preprocess train dataset:   1% 3136/281241 [00:30<40:28, 114.50ex/s]preprocess train dataset:   1% 3155/281241 [00:30<35:19, 131.21ex/s]preprocess train dataset:   1% 3172/281241 [00:30<33:38, 137.75ex/s]preprocess train dataset:   1% 3192/281241 [00:31<30:37, 151.29ex/s]preprocess train dataset:   1% 3210/281241 [00:31<29:35, 156.63ex/s]preprocess train dataset:   1% 3228/281241 [00:31<28:28, 162.76ex/s]preprocess train dataset:   1% 3246/281241 [00:31<28:42, 161.40ex/s]preprocess train dataset:   1% 3263/281241 [00:31<29:12, 158.63ex/s]preprocess train dataset:   1% 3281/281241 [00:31<28:44, 161.18ex/s]preprocess train dataset:   1% 3298/281241 [00:31<28:59, 159.82ex/s]preprocess train dataset:   1% 3315/281241 [00:31<29:29, 157.04ex/s]preprocess train dataset:   1% 3333/281241 [00:31<28:24, 163.00ex/s]preprocess train dataset:   1% 3350/281241 [00:31<29:09, 158.87ex/s]preprocess train dataset:   1% 3367/281241 [00:32<28:39, 161.59ex/s]preprocess train dataset:   1% 3384/281241 [00:32<28:45, 161.02ex/s]preprocess train dataset:   1% 3401/281241 [00:32<29:23, 157.53ex/s]preprocess train dataset:   1% 3417/281241 [00:32<29:32, 156.73ex/s]preprocess train dataset:   1% 3433/281241 [00:32<29:50, 155.17ex/s]preprocess train dataset:   1% 3449/281241 [00:32<30:23, 152.35ex/s]preprocess train dataset:   1% 3466/281241 [00:32<29:51, 155.02ex/s]preprocess train dataset:   1% 3483/281241 [00:32<29:11, 158.59ex/s]preprocess train dataset:   1% 3500/281241 [00:32<29:05, 159.15ex/s]preprocess train dataset:   1% 3516/281241 [00:33<29:17, 158.04ex/s]preprocess train dataset:   1% 3534/281241 [00:33<28:33, 162.08ex/s]preprocess train dataset:   1% 3552/281241 [00:33<28:00, 165.22ex/s]preprocess train dataset:   1% 3569/281241 [00:33<28:03, 164.92ex/s]preprocess train dataset:   1% 3586/281241 [00:33<28:10, 164.23ex/s]preprocess train dataset:   1% 3603/281241 [00:33<28:05, 164.75ex/s]preprocess train dataset:   1% 3620/281241 [00:33<27:59, 165.34ex/s]preprocess train dataset:   1% 3637/281241 [00:33<28:21, 163.11ex/s]preprocess train dataset:   1% 3654/281241 [00:33<28:15, 163.70ex/s]preprocess train dataset:   1% 3673/281241 [00:33<27:06, 170.67ex/s]preprocess train dataset:   1% 3691/281241 [00:34<26:57, 171.57ex/s]preprocess train dataset:   1% 3709/281241 [00:34<27:57, 165.44ex/s]preprocess train dataset:   1% 3730/281241 [00:34<26:13, 176.32ex/s]preprocess train dataset:   1% 3748/281241 [00:34<26:19, 175.63ex/s]preprocess train dataset:   1% 3766/281241 [00:34<26:40, 173.37ex/s]preprocess train dataset:   1% 3784/281241 [00:34<27:45, 166.59ex/s]preprocess train dataset:   1% 3802/281241 [00:34<27:12, 169.91ex/s]preprocess train dataset:   1% 3820/281241 [00:34<26:46, 172.65ex/s]preprocess train dataset:   1% 3838/281241 [00:34<26:55, 171.69ex/s]preprocess train dataset:   1% 3856/281241 [00:35<26:56, 171.63ex/s]preprocess train dataset:   1% 3874/281241 [00:35<27:19, 169.22ex/s]preprocess train dataset:   1% 3892/281241 [00:35<27:01, 171.09ex/s]preprocess train dataset:   1% 3910/281241 [00:35<27:38, 167.20ex/s]preprocess train dataset:   1% 3927/281241 [00:35<28:17, 163.37ex/s]preprocess train dataset:   1% 3945/281241 [00:35<27:50, 166.04ex/s]preprocess train dataset:   1% 3962/281241 [00:35<28:34, 161.74ex/s]preprocess train dataset:   1% 3979/281241 [00:35<30:51, 149.75ex/s]preprocess train dataset:   1% 3995/281241 [00:35<33:14, 139.02ex/s]preprocess train dataset:   1% 4010/281241 [00:38<4:23:17, 17.55ex/s]preprocess train dataset:   1% 4028/281241 [00:38<3:07:40, 24.62ex/s]preprocess train dataset:   1% 4044/281241 [00:38<2:21:55, 32.55ex/s]preprocess train dataset:   1% 4060/281241 [00:39<1:49:20, 42.25ex/s]preprocess train dataset:   1% 4076/281241 [00:39<1:25:55, 53.76ex/s]preprocess train dataset:   1% 4092/281241 [00:39<1:09:15, 66.69ex/s]preprocess train dataset:   1% 4110/281241 [00:39<55:26, 83.32ex/s]  preprocess train dataset:   1% 4126/281241 [00:39<47:46, 96.67ex/s]preprocess train dataset:   1% 4144/281241 [00:39<40:48, 113.15ex/s]preprocess train dataset:   1% 4164/281241 [00:39<35:03, 131.69ex/s]preprocess train dataset:   1% 4182/281241 [00:39<32:39, 141.38ex/s]preprocess train dataset:   1% 4200/281241 [00:39<31:13, 147.88ex/s]preprocess train dataset:   1% 4217/281241 [00:40<31:02, 148.73ex/s]preprocess train dataset:   2% 4235/281241 [00:40<29:30, 156.44ex/s]preprocess train dataset:   2% 4252/281241 [00:40<29:14, 157.87ex/s]preprocess train dataset:   2% 4269/281241 [00:40<28:49, 160.15ex/s]preprocess train dataset:   2% 4287/281241 [00:40<28:12, 163.67ex/s]preprocess train dataset:   2% 4305/281241 [00:40<27:49, 165.84ex/s]preprocess train dataset:   2% 4325/281241 [00:40<26:33, 173.77ex/s]preprocess train dataset:   2% 4343/281241 [00:40<27:19, 168.90ex/s]preprocess train dataset:   2% 4361/281241 [00:40<27:43, 166.43ex/s]preprocess train dataset:   2% 4378/281241 [00:40<27:50, 165.76ex/s]preprocess train dataset:   2% 4395/281241 [00:41<28:50, 160.03ex/s]preprocess train dataset:   2% 4412/281241 [00:41<29:02, 158.83ex/s]preprocess train dataset:   2% 4429/281241 [00:41<28:58, 159.26ex/s]preprocess train dataset:   2% 4445/281241 [00:41<28:59, 159.15ex/s]preprocess train dataset:   2% 4462/281241 [00:41<28:27, 162.12ex/s]preprocess train dataset:   2% 4479/281241 [00:41<28:23, 162.47ex/s]preprocess train dataset:   2% 4496/281241 [00:41<28:43, 160.57ex/s]preprocess train dataset:   2% 4513/281241 [00:41<28:50, 159.96ex/s]preprocess train dataset:   2% 4530/281241 [00:41<28:33, 161.51ex/s]preprocess train dataset:   2% 4547/281241 [00:42<28:19, 162.77ex/s]preprocess train dataset:   2% 4569/281241 [00:42<26:04, 176.81ex/s]preprocess train dataset:   2% 4587/281241 [00:42<26:56, 171.17ex/s]preprocess train dataset:   2% 4607/281241 [00:42<26:05, 176.74ex/s]preprocess train dataset:   2% 4627/281241 [00:42<25:24, 181.46ex/s]preprocess train dataset:   2% 4646/281241 [00:42<25:20, 181.95ex/s]preprocess train dataset:   2% 4665/281241 [00:42<25:39, 179.64ex/s]preprocess train dataset:   2% 4683/281241 [00:42<26:39, 172.90ex/s]preprocess train dataset:   2% 4701/281241 [00:42<27:00, 170.67ex/s]preprocess train dataset:   2% 4722/281241 [00:43<25:24, 181.40ex/s]preprocess train dataset:   2% 4741/281241 [00:43<26:10, 176.06ex/s]preprocess train dataset:   2% 4759/281241 [00:43<26:48, 171.94ex/s]preprocess train dataset:   2% 4777/281241 [00:43<26:49, 171.76ex/s]preprocess train dataset:   2% 4795/281241 [00:43<27:40, 166.53ex/s]preprocess train dataset:   2% 4812/281241 [00:43<27:43, 166.13ex/s]preprocess train dataset:   2% 4829/281241 [00:43<28:13, 163.21ex/s]preprocess train dataset:   2% 4846/281241 [00:43<28:21, 162.45ex/s]preprocess train dataset:   2% 4863/281241 [00:43<28:16, 162.93ex/s]preprocess train dataset:   2% 4881/281241 [00:43<27:27, 167.77ex/s]preprocess train dataset:   2% 4898/281241 [00:44<27:36, 166.79ex/s]preprocess train dataset:   2% 4917/281241 [00:44<26:42, 172.45ex/s]preprocess train dataset:   2% 4935/281241 [00:44<28:52, 159.49ex/s]preprocess train dataset:   2% 4953/281241 [00:44<28:31, 161.46ex/s]preprocess train dataset:   2% 4972/281241 [00:44<27:14, 168.99ex/s]preprocess train dataset:   2% 4990/281241 [00:44<27:49, 165.48ex/s]preprocess train dataset:   2% 5007/281241 [00:47<4:03:30, 18.91ex/s]preprocess train dataset:   2% 5024/281241 [00:47<3:00:56, 25.44ex/s]preprocess train dataset:   2% 5043/281241 [00:47<2:11:42, 34.95ex/s]preprocess train dataset:   2% 5060/281241 [00:47<1:41:47, 45.22ex/s]preprocess train dataset:   2% 5076/281241 [00:47<1:21:30, 56.47ex/s]preprocess train dataset:   2% 5093/281241 [00:48<1:05:20, 70.43ex/s]preprocess train dataset:   2% 5112/281241 [00:48<52:37, 87.44ex/s]  preprocess train dataset:   2% 5129/281241 [00:48<45:28, 101.20ex/s]preprocess train dataset:   2% 5146/281241 [00:48<40:11, 114.51ex/s]preprocess train dataset:   2% 5164/281241 [00:48<35:58, 127.90ex/s]preprocess train dataset:   2% 5181/281241 [00:48<33:53, 135.78ex/s]preprocess train dataset:   2% 5203/281241 [00:48<29:41, 154.94ex/s]preprocess train dataset:   2% 5221/281241 [00:48<28:30, 161.34ex/s]preprocess train dataset:   2% 5239/281241 [00:48<27:52, 165.00ex/s]preprocess train dataset:   2% 5259/281241 [00:48<26:21, 174.49ex/s]preprocess train dataset:   2% 5285/281241 [00:49<23:19, 197.14ex/s]preprocess train dataset:   2% 5306/281241 [00:49<22:56, 200.51ex/s]preprocess train dataset:   2% 5329/281241 [00:49<22:13, 206.97ex/s]preprocess train dataset:   2% 5351/281241 [00:49<22:46, 201.93ex/s]preprocess train dataset:   2% 5376/281241 [00:49<21:34, 213.05ex/s]preprocess train dataset:   2% 5398/281241 [00:49<21:49, 210.71ex/s]preprocess train dataset:   2% 5420/281241 [00:49<23:08, 198.64ex/s]preprocess train dataset:   2% 5441/281241 [00:49<24:20, 188.84ex/s]preprocess train dataset:   2% 5461/281241 [00:49<25:52, 177.65ex/s]preprocess train dataset:   2% 5480/281241 [00:50<26:03, 176.35ex/s]preprocess train dataset:   2% 5499/281241 [00:50<25:50, 177.84ex/s]preprocess train dataset:   2% 5519/281241 [00:50<25:12, 182.27ex/s]preprocess train dataset:   2% 5538/281241 [00:50<25:27, 180.50ex/s]preprocess train dataset:   2% 5557/281241 [00:50<26:14, 175.14ex/s]preprocess train dataset:   2% 5575/281241 [00:50<26:45, 171.67ex/s]preprocess train dataset:   2% 5593/281241 [00:50<26:29, 173.44ex/s]preprocess train dataset:   2% 5611/281241 [00:50<27:10, 169.04ex/s]preprocess train dataset:   2% 5628/281241 [00:50<27:58, 164.21ex/s]preprocess train dataset:   2% 5645/281241 [00:51<30:00, 153.03ex/s]preprocess train dataset:   2% 5661/281241 [00:51<30:07, 152.50ex/s]preprocess train dataset:   2% 5677/281241 [00:51<29:59, 153.14ex/s]preprocess train dataset:   2% 5694/281241 [00:51<29:30, 155.62ex/s]preprocess train dataset:   2% 5711/281241 [00:51<28:49, 159.35ex/s]preprocess train dataset:   2% 5731/281241 [00:51<27:18, 168.12ex/s]preprocess train dataset:   2% 5748/281241 [00:51<27:56, 164.33ex/s]preprocess train dataset:   2% 5766/281241 [00:51<27:37, 166.21ex/s]preprocess train dataset:   2% 5786/281241 [00:51<26:38, 172.28ex/s]preprocess train dataset:   2% 5804/281241 [00:52<27:01, 169.85ex/s]preprocess train dataset:   2% 5822/281241 [00:52<27:04, 169.55ex/s]preprocess train dataset:   2% 5842/281241 [00:52<26:11, 175.27ex/s]preprocess train dataset:   2% 5860/281241 [00:52<26:46, 171.40ex/s]preprocess train dataset:   2% 5878/281241 [00:52<28:10, 162.85ex/s]preprocess train dataset:   2% 5895/281241 [00:52<28:24, 161.50ex/s]preprocess train dataset:   2% 5913/281241 [00:52<27:56, 164.27ex/s]preprocess train dataset:   2% 5930/281241 [00:52<28:38, 160.25ex/s]preprocess train dataset:   2% 5947/281241 [00:52<28:38, 160.20ex/s]preprocess train dataset:   2% 5964/281241 [00:53<29:23, 156.13ex/s]preprocess train dataset:   2% 5980/281241 [00:53<29:36, 154.97ex/s]preprocess train dataset:   2% 5997/281241 [00:53<29:28, 155.63ex/s]preprocess train dataset:   2% 6013/281241 [00:56<4:12:57, 18.13ex/s]preprocess train dataset:   2% 6029/281241 [00:56<3:08:01, 24.39ex/s]preprocess train dataset:   2% 6046/281241 [00:56<2:18:51, 33.03ex/s]preprocess train dataset:   2% 6065/281241 [00:56<1:41:17, 45.28ex/s]preprocess train dataset:   2% 6089/281241 [00:56<1:10:46, 64.80ex/s]preprocess train dataset:   2% 6110/281241 [00:56<55:36, 82.47ex/s]  preprocess train dataset:   2% 6131/281241 [00:56<45:08, 101.59ex/s]preprocess train dataset:   2% 6151/281241 [00:56<40:14, 113.93ex/s]preprocess train dataset:   2% 6170/281241 [00:56<36:44, 124.78ex/s]preprocess train dataset:   2% 6188/281241 [00:57<34:20, 133.52ex/s]preprocess train dataset:   2% 6206/281241 [00:57<33:01, 138.83ex/s]preprocess train dataset:   2% 6223/281241 [00:57<31:49, 144.04ex/s]preprocess train dataset:   2% 6240/281241 [00:57<30:52, 148.45ex/s]preprocess train dataset:   2% 6258/281241 [00:57<29:46, 153.95ex/s]preprocess train dataset:   2% 6276/281241 [00:57<28:50, 158.92ex/s]preprocess train dataset:   2% 6293/281241 [00:57<28:22, 161.53ex/s]preprocess train dataset:   2% 6310/281241 [00:57<28:31, 160.62ex/s]preprocess train dataset:   2% 6327/281241 [00:57<28:13, 162.34ex/s]preprocess train dataset:   2% 6344/281241 [00:57<27:58, 163.82ex/s]preprocess train dataset:   2% 6362/281241 [00:58<27:38, 165.72ex/s]preprocess train dataset:   2% 6380/281241 [00:58<27:06, 168.96ex/s]preprocess train dataset:   2% 6399/281241 [00:58<26:22, 173.64ex/s]preprocess train dataset:   2% 6418/281241 [00:58<25:57, 176.50ex/s]preprocess train dataset:   2% 6437/281241 [00:58<25:26, 180.02ex/s]preprocess train dataset:   2% 6456/281241 [00:58<25:49, 177.36ex/s]preprocess train dataset:   2% 6475/281241 [00:58<25:33, 179.21ex/s]preprocess train dataset:   2% 6493/281241 [00:58<26:50, 170.64ex/s]preprocess train dataset:   2% 6511/281241 [00:58<26:53, 170.23ex/s]preprocess train dataset:   2% 6529/281241 [00:59<27:29, 166.54ex/s]preprocess train dataset:   2% 6546/281241 [00:59<27:38, 165.62ex/s]preprocess train dataset:   2% 6564/281241 [00:59<27:15, 167.92ex/s]preprocess train dataset:   2% 6581/281241 [00:59<27:30, 166.43ex/s]preprocess train dataset:   2% 6598/281241 [00:59<27:33, 166.14ex/s]preprocess train dataset:   2% 6615/281241 [00:59<27:43, 165.05ex/s]preprocess train dataset:   2% 6632/281241 [00:59<28:35, 160.05ex/s]preprocess train dataset:   2% 6649/281241 [00:59<29:19, 156.10ex/s]preprocess train dataset:   2% 6666/281241 [00:59<28:59, 157.85ex/s]preprocess train dataset:   2% 6682/281241 [01:00<28:58, 157.92ex/s]preprocess train dataset:   2% 6699/281241 [01:00<28:32, 160.27ex/s]preprocess train dataset:   2% 6717/281241 [01:00<28:05, 162.91ex/s]preprocess train dataset:   2% 6734/281241 [01:00<28:23, 161.15ex/s]preprocess train dataset:   2% 6753/281241 [01:00<27:26, 166.66ex/s]preprocess train dataset:   2% 6770/281241 [01:00<27:26, 166.69ex/s]preprocess train dataset:   2% 6787/281241 [01:00<27:35, 165.77ex/s]preprocess train dataset:   2% 6806/281241 [01:00<26:54, 170.02ex/s]preprocess train dataset:   2% 6824/281241 [01:00<27:16, 167.68ex/s]preprocess train dataset:   2% 6845/281241 [01:00<25:52, 176.72ex/s]preprocess train dataset:   2% 6867/281241 [01:01<24:35, 185.93ex/s]preprocess train dataset:   2% 6888/281241 [01:01<24:01, 190.32ex/s]preprocess train dataset:   2% 6911/281241 [01:01<22:46, 200.76ex/s]preprocess train dataset:   2% 6935/281241 [01:01<21:49, 209.42ex/s]preprocess train dataset:   2% 6956/281241 [01:01<23:50, 191.73ex/s]preprocess train dataset:   2% 6976/281241 [01:01<24:50, 184.00ex/s]preprocess train dataset:   2% 6995/281241 [01:01<26:28, 172.66ex/s]preprocess train dataset:   2% 7013/281241 [01:04<3:49:47, 19.89ex/s]preprocess train dataset:   2% 7026/281241 [01:04<3:07:11, 24.41ex/s]preprocess train dataset:   3% 7039/281241 [01:05<2:31:45, 30.12ex/s]preprocess train dataset:   3% 7053/281241 [01:05<1:59:56, 38.10ex/s]preprocess train dataset:   3% 7067/281241 [01:05<1:36:01, 47.59ex/s]preprocess train dataset:   3% 7081/281241 [01:05<1:18:12, 58.43ex/s]preprocess train dataset:   3% 7095/281241 [01:05<1:05:44, 69.49ex/s]preprocess train dataset:   3% 7109/281241 [01:05<56:35, 80.73ex/s]  preprocess train dataset:   3% 7123/281241 [01:05<49:43, 91.87ex/s]preprocess train dataset:   3% 7137/281241 [01:05<46:26, 98.35ex/s]preprocess train dataset:   3% 7150/281241 [01:05<43:37, 104.70ex/s]preprocess train dataset:   3% 7164/281241 [01:05<40:41, 112.28ex/s]preprocess train dataset:   3% 7177/281241 [01:06<39:18, 116.22ex/s]preprocess train dataset:   3% 7192/281241 [01:06<37:08, 122.95ex/s]preprocess train dataset:   3% 7208/281241 [01:06<34:48, 131.19ex/s]preprocess train dataset:   3% 7222/281241 [01:06<34:57, 130.63ex/s]preprocess train dataset:   3% 7236/281241 [01:06<34:49, 131.14ex/s]preprocess train dataset:   3% 7250/281241 [01:06<34:17, 133.19ex/s]preprocess train dataset:   3% 7264/281241 [01:06<34:19, 133.01ex/s]preprocess train dataset:   3% 7278/281241 [01:06<33:54, 134.64ex/s]preprocess train dataset:   3% 7292/281241 [01:06<33:58, 134.36ex/s]preprocess train dataset:   3% 7307/281241 [01:07<33:45, 135.23ex/s]preprocess train dataset:   3% 7321/281241 [01:07<33:51, 134.80ex/s]preprocess train dataset:   3% 7337/281241 [01:07<32:15, 141.52ex/s]preprocess train dataset:   3% 7354/281241 [01:07<30:40, 148.85ex/s]preprocess train dataset:   3% 7372/281241 [01:07<29:05, 156.88ex/s]preprocess train dataset:   3% 7391/281241 [01:07<27:53, 163.65ex/s]preprocess train dataset:   3% 7408/281241 [01:07<27:34, 165.49ex/s]preprocess train dataset:   3% 7425/281241 [01:07<28:26, 160.43ex/s]preprocess train dataset:   3% 7442/281241 [01:07<29:07, 156.66ex/s]preprocess train dataset:   3% 7458/281241 [01:07<29:07, 156.70ex/s]preprocess train dataset:   3% 7475/281241 [01:08<28:43, 158.88ex/s]preprocess train dataset:   3% 7496/281241 [01:08<26:33, 171.79ex/s]preprocess train dataset:   3% 7514/281241 [01:08<26:17, 173.49ex/s]preprocess train dataset:   3% 7533/281241 [01:08<25:37, 178.00ex/s]preprocess train dataset:   3% 7551/281241 [01:08<25:32, 178.58ex/s]preprocess train dataset:   3% 7569/281241 [01:08<26:24, 172.75ex/s]preprocess train dataset:   3% 7587/281241 [01:08<26:34, 171.65ex/s]preprocess train dataset:   3% 7605/281241 [01:08<26:54, 169.51ex/s]preprocess train dataset:   3% 7622/281241 [01:08<27:20, 166.76ex/s]preprocess train dataset:   3% 7640/281241 [01:08<27:01, 168.70ex/s]preprocess train dataset:   3% 7658/281241 [01:09<26:41, 170.84ex/s]preprocess train dataset:   3% 7677/281241 [01:09<25:58, 175.50ex/s]preprocess train dataset:   3% 7695/281241 [01:09<26:15, 173.64ex/s]preprocess train dataset:   3% 7713/281241 [01:09<26:10, 174.16ex/s]preprocess train dataset:   3% 7731/281241 [01:09<26:05, 174.67ex/s]preprocess train dataset:   3% 7750/281241 [01:09<25:42, 177.26ex/s]preprocess train dataset:   3% 7770/281241 [01:09<25:12, 180.81ex/s]preprocess train dataset:   3% 7790/281241 [01:09<24:34, 185.43ex/s]preprocess train dataset:   3% 7810/281241 [01:09<24:08, 188.76ex/s]preprocess train dataset:   3% 7831/281241 [01:10<23:50, 191.08ex/s]preprocess train dataset:   3% 7855/281241 [01:10<22:12, 205.16ex/s]preprocess train dataset:   3% 7876/281241 [01:10<24:07, 188.85ex/s]preprocess train dataset:   3% 7896/281241 [01:10<24:49, 183.56ex/s]preprocess train dataset:   3% 7915/281241 [01:10<27:24, 166.25ex/s]preprocess train dataset:   3% 7933/281241 [01:10<28:05, 162.20ex/s]preprocess train dataset:   3% 7950/281241 [01:10<27:52, 163.44ex/s]preprocess train dataset:   3% 7968/281241 [01:10<27:26, 165.99ex/s]preprocess train dataset:   3% 7985/281241 [01:10<27:43, 164.31ex/s]preprocess train dataset:   3% 8002/281241 [01:13<3:59:30, 19.01ex/s]preprocess train dataset:   3% 8018/281241 [01:13<3:01:17, 25.12ex/s]preprocess train dataset:   3% 8036/281241 [01:14<2:13:13, 34.18ex/s]preprocess train dataset:   3% 8054/281241 [01:14<1:40:32, 45.29ex/s]preprocess train dataset:   3% 8070/281241 [01:14<1:20:50, 56.32ex/s]preprocess train dataset:   3% 8087/281241 [01:14<1:05:14, 69.78ex/s]preprocess train dataset:   3% 8103/281241 [01:14<55:08, 82.55ex/s]  preprocess train dataset:   3% 8119/281241 [01:14<48:04, 94.67ex/s]preprocess train dataset:   3% 8135/281241 [01:14<42:38, 106.76ex/s]preprocess train dataset:   3% 8152/281241 [01:14<37:56, 119.96ex/s]preprocess train dataset:   3% 8171/281241 [01:14<33:35, 135.46ex/s]preprocess train dataset:   3% 8190/281241 [01:14<30:40, 148.39ex/s]preprocess train dataset:   3% 8208/281241 [01:15<29:21, 154.97ex/s]preprocess train dataset:   3% 8226/281241 [01:15<28:10, 161.53ex/s]preprocess train dataset:   3% 8244/281241 [01:15<28:29, 159.67ex/s]preprocess train dataset:   3% 8261/281241 [01:15<28:10, 161.50ex/s]preprocess train dataset:   3% 8279/281241 [01:15<27:47, 163.74ex/s]preprocess train dataset:   3% 8299/281241 [01:15<26:23, 172.40ex/s]preprocess train dataset:   3% 8317/281241 [01:15<27:14, 166.97ex/s]preprocess train dataset:   3% 8334/281241 [01:15<27:28, 165.52ex/s]preprocess train dataset:   3% 8352/281241 [01:15<27:15, 166.87ex/s]preprocess train dataset:   3% 8369/281241 [01:16<27:09, 167.47ex/s]preprocess train dataset:   3% 8386/281241 [01:16<27:49, 163.41ex/s]preprocess train dataset:   3% 8403/281241 [01:16<28:16, 160.81ex/s]preprocess train dataset:   3% 8420/281241 [01:16<28:30, 159.46ex/s]preprocess train dataset:   3% 8437/281241 [01:16<28:02, 162.16ex/s]preprocess train dataset:   3% 8454/281241 [01:16<27:40, 164.28ex/s]preprocess train dataset:   3% 8471/281241 [01:16<28:05, 161.87ex/s]preprocess train dataset:   3% 8488/281241 [01:16<27:56, 162.70ex/s]preprocess train dataset:   3% 8506/281241 [01:16<27:23, 165.96ex/s]preprocess train dataset:   3% 8523/281241 [01:16<27:48, 163.48ex/s]preprocess train dataset:   3% 8540/281241 [01:17<27:45, 163.71ex/s]preprocess train dataset:   3% 8557/281241 [01:17<27:44, 163.78ex/s]preprocess train dataset:   3% 8576/281241 [01:17<26:39, 170.42ex/s]preprocess train dataset:   3% 8594/281241 [01:17<27:03, 167.91ex/s]preprocess train dataset:   3% 8612/281241 [01:17<26:38, 170.52ex/s]preprocess train dataset:   3% 8632/281241 [01:17<25:54, 175.35ex/s]preprocess train dataset:   3% 8650/281241 [01:17<26:02, 174.50ex/s]preprocess train dataset:   3% 8671/281241 [01:17<24:43, 183.73ex/s]preprocess train dataset:   3% 8690/281241 [01:17<25:28, 178.35ex/s]preprocess train dataset:   3% 8708/281241 [01:18<25:31, 177.95ex/s]preprocess train dataset:   3% 8726/281241 [01:18<26:31, 171.26ex/s]preprocess train dataset:   3% 8744/281241 [01:18<27:03, 167.83ex/s]preprocess train dataset:   3% 8761/281241 [01:18<27:22, 165.92ex/s]preprocess train dataset:   3% 8778/281241 [01:18<27:43, 163.83ex/s]preprocess train dataset:   3% 8795/281241 [01:18<27:44, 163.65ex/s]preprocess train dataset:   3% 8813/281241 [01:18<26:59, 168.22ex/s]preprocess train dataset:   3% 8830/281241 [01:18<26:58, 168.31ex/s]preprocess train dataset:   3% 8847/281241 [01:18<28:27, 159.57ex/s]preprocess train dataset:   3% 8864/281241 [01:19<30:47, 147.42ex/s]preprocess train dataset:   3% 8879/281241 [01:19<32:44, 138.61ex/s]preprocess train dataset:   3% 8894/281241 [01:19<33:14, 136.58ex/s]preprocess train dataset:   3% 8908/281241 [01:19<33:40, 134.78ex/s]preprocess train dataset:   3% 8922/281241 [01:19<33:27, 135.64ex/s]preprocess train dataset:   3% 8938/281241 [01:19<32:28, 139.78ex/s]preprocess train dataset:   3% 8953/281241 [01:19<31:53, 142.31ex/s]preprocess train dataset:   3% 8973/281241 [01:19<28:48, 157.52ex/s]preprocess train dataset:   3% 8991/281241 [01:19<28:07, 161.30ex/s]preprocess train dataset:   3% 9008/281241 [01:22<4:03:21, 18.64ex/s]preprocess train dataset:   3% 9027/281241 [01:22<2:52:40, 26.27ex/s]preprocess train dataset:   3% 9046/281241 [01:22<2:05:55, 36.03ex/s]preprocess train dataset:   3% 9064/281241 [01:23<1:35:45, 47.38ex/s]preprocess train dataset:   3% 9083/281241 [01:23<1:13:49, 61.44ex/s]preprocess train dataset:   3% 9100/281241 [01:23<1:01:59, 73.16ex/s]preprocess train dataset:   3% 9116/281241 [01:23<53:15, 85.16ex/s]  preprocess train dataset:   3% 9132/281241 [01:23<46:51, 96.79ex/s]preprocess train dataset:   3% 9148/281241 [01:23<41:57, 108.06ex/s]preprocess train dataset:   3% 9164/281241 [01:23<38:39, 117.29ex/s]preprocess train dataset:   3% 9180/281241 [01:23<36:21, 124.72ex/s]preprocess train dataset:   3% 9195/281241 [01:23<35:07, 129.08ex/s]preprocess train dataset:   3% 9212/281241 [01:23<32:38, 138.91ex/s]preprocess train dataset:   3% 9228/281241 [01:24<32:07, 141.11ex/s]preprocess train dataset:   3% 9244/281241 [01:24<32:03, 141.41ex/s]preprocess train dataset:   3% 9259/281241 [01:24<31:44, 142.79ex/s]preprocess train dataset:   3% 9274/281241 [01:24<31:30, 143.89ex/s]preprocess train dataset:   3% 9290/281241 [01:24<31:01, 146.08ex/s]preprocess train dataset:   3% 9307/281241 [01:24<29:48, 152.06ex/s]preprocess train dataset:   3% 9324/281241 [01:24<29:12, 155.12ex/s]preprocess train dataset:   3% 9340/281241 [01:24<28:57, 156.50ex/s]preprocess train dataset:   3% 9357/281241 [01:24<28:28, 159.09ex/s]preprocess train dataset:   3% 9375/281241 [01:25<27:45, 163.20ex/s]preprocess train dataset:   3% 9392/281241 [01:25<28:23, 159.58ex/s]preprocess train dataset:   3% 9409/281241 [01:25<28:42, 157.80ex/s]preprocess train dataset:   3% 9425/281241 [01:25<28:56, 156.57ex/s]preprocess train dataset:   3% 9442/281241 [01:25<28:16, 160.18ex/s]preprocess train dataset:   3% 9461/281241 [01:25<27:19, 165.79ex/s]preprocess train dataset:   3% 9478/281241 [01:25<27:44, 163.32ex/s]preprocess train dataset:   3% 9496/281241 [01:25<27:12, 166.45ex/s]preprocess train dataset:   3% 9513/281241 [01:25<27:16, 166.09ex/s]preprocess train dataset:   3% 9530/281241 [01:25<27:48, 162.80ex/s]preprocess train dataset:   3% 9547/281241 [01:26<27:42, 163.39ex/s]preprocess train dataset:   3% 9564/281241 [01:26<28:54, 156.66ex/s]preprocess train dataset:   3% 9580/281241 [01:26<29:29, 153.49ex/s]preprocess train dataset:   3% 9597/281241 [01:26<29:08, 155.37ex/s]preprocess train dataset:   3% 9613/281241 [01:26<29:40, 152.54ex/s]preprocess train dataset:   3% 9630/281241 [01:26<28:52, 156.76ex/s]preprocess train dataset:   3% 9646/281241 [01:26<29:17, 154.55ex/s]preprocess train dataset:   3% 9662/281241 [01:26<30:03, 150.60ex/s]preprocess train dataset:   3% 9679/281241 [01:26<29:23, 153.95ex/s]preprocess train dataset:   3% 9695/281241 [01:27<29:31, 153.27ex/s]preprocess train dataset:   3% 9711/281241 [01:27<29:37, 152.75ex/s]preprocess train dataset:   3% 9727/281241 [01:27<29:19, 154.29ex/s]preprocess train dataset:   3% 9744/281241 [01:27<28:40, 157.82ex/s]preprocess train dataset:   3% 9760/281241 [01:27<29:01, 155.89ex/s]preprocess train dataset:   3% 9780/281241 [01:27<27:00, 167.53ex/s]preprocess train dataset:   3% 9797/281241 [01:27<27:15, 165.93ex/s]preprocess train dataset:   3% 9814/281241 [01:27<27:39, 163.52ex/s]preprocess train dataset:   3% 9832/281241 [01:27<27:26, 164.82ex/s]preprocess train dataset:   4% 9850/281241 [01:27<26:54, 168.11ex/s]preprocess train dataset:   4% 9867/281241 [01:28<26:59, 167.60ex/s]preprocess train dataset:   4% 9884/281241 [01:28<27:23, 165.16ex/s]preprocess train dataset:   4% 9903/281241 [01:28<26:26, 171.05ex/s]preprocess train dataset:   4% 9921/281241 [01:28<26:50, 168.51ex/s]preprocess train dataset:   4% 9941/281241 [01:28<25:51, 174.84ex/s]preprocess train dataset:   4% 9959/281241 [01:28<25:54, 174.56ex/s]preprocess train dataset:   4% 9977/281241 [01:28<26:57, 167.72ex/s]preprocess train dataset:   4% 9994/281241 [01:28<27:24, 164.97ex/s]preprocess train dataset:   4% 10011/281241 [01:31<4:00:37, 18.79ex/s]preprocess train dataset:   4% 10027/281241 [01:31<3:01:07, 24.96ex/s]preprocess train dataset:   4% 10043/281241 [01:31<2:17:44, 32.82ex/s]preprocess train dataset:   4% 10059/281241 [01:32<1:46:32, 42.42ex/s]preprocess train dataset:   4% 10075/281241 [01:32<1:23:47, 53.94ex/s]preprocess train dataset:   4% 10090/281241 [01:32<1:08:45, 65.73ex/s]preprocess train dataset:   4% 10107/281241 [01:32<56:01, 80.65ex/s]  preprocess train dataset:   4% 10123/281241 [01:32<48:28, 93.23ex/s]preprocess train dataset:   4% 10138/281241 [01:32<43:27, 103.99ex/s]preprocess train dataset:   4% 10157/281241 [01:32<36:59, 122.16ex/s]preprocess train dataset:   4% 10175/281241 [01:32<33:14, 135.90ex/s]preprocess train dataset:   4% 10192/281241 [01:32<31:27, 143.57ex/s]preprocess train dataset:   4% 10210/281241 [01:32<29:45, 151.79ex/s]preprocess train dataset:   4% 10231/281241 [01:33<27:20, 165.19ex/s]preprocess train dataset:   4% 10249/281241 [01:33<27:02, 167.01ex/s]preprocess train dataset:   4% 10267/281241 [01:33<27:08, 166.42ex/s]preprocess train dataset:   4% 10285/281241 [01:33<27:04, 166.84ex/s]preprocess train dataset:   4% 10303/281241 [01:33<26:40, 169.32ex/s]preprocess train dataset:   4% 10321/281241 [01:33<26:32, 170.10ex/s]preprocess train dataset:   4% 10339/281241 [01:33<26:53, 167.85ex/s]preprocess train dataset:   4% 10358/281241 [01:33<26:23, 171.07ex/s]preprocess train dataset:   4% 10376/281241 [01:33<27:01, 167.08ex/s]preprocess train dataset:   4% 10393/281241 [01:34<27:04, 166.71ex/s]preprocess train dataset:   4% 10410/281241 [01:34<27:14, 165.69ex/s]preprocess train dataset:   4% 10428/281241 [01:34<27:03, 166.85ex/s]preprocess train dataset:   4% 10445/281241 [01:34<27:02, 166.95ex/s]preprocess train dataset:   4% 10462/281241 [01:34<27:41, 162.94ex/s]preprocess train dataset:   4% 10481/281241 [01:34<26:26, 170.64ex/s]preprocess train dataset:   4% 10499/281241 [01:34<26:48, 168.29ex/s]preprocess train dataset:   4% 10516/281241 [01:34<27:01, 166.96ex/s]preprocess train dataset:   4% 10534/281241 [01:34<26:34, 169.73ex/s]preprocess train dataset:   4% 10552/281241 [01:34<27:15, 165.51ex/s]preprocess train dataset:   4% 10569/281241 [01:35<27:28, 164.24ex/s]preprocess train dataset:   4% 10586/281241 [01:35<28:03, 160.74ex/s]preprocess train dataset:   4% 10603/281241 [01:35<28:24, 158.74ex/s]preprocess train dataset:   4% 10619/281241 [01:35<28:48, 156.55ex/s]preprocess train dataset:   4% 10635/281241 [01:35<29:08, 154.80ex/s]preprocess train dataset:   4% 10653/281241 [01:35<28:03, 160.69ex/s]preprocess train dataset:   4% 10670/281241 [01:35<28:11, 159.95ex/s]preprocess train dataset:   4% 10687/281241 [01:35<28:37, 157.50ex/s]preprocess train dataset:   4% 10704/281241 [01:35<28:14, 159.63ex/s]preprocess train dataset:   4% 10721/281241 [01:36<27:52, 161.78ex/s]preprocess train dataset:   4% 10741/281241 [01:36<26:16, 171.61ex/s]preprocess train dataset:   4% 10760/281241 [01:36<25:31, 176.57ex/s]preprocess train dataset:   4% 10783/281241 [01:36<23:35, 191.08ex/s]preprocess train dataset:   4% 10807/281241 [01:36<22:14, 202.64ex/s]preprocess train dataset:   4% 10832/281241 [01:36<21:05, 213.71ex/s]preprocess train dataset:   4% 10857/281241 [01:36<20:22, 221.18ex/s]preprocess train dataset:   4% 10880/281241 [01:36<20:35, 218.81ex/s]preprocess train dataset:   4% 10902/281241 [01:36<21:20, 211.09ex/s]preprocess train dataset:   4% 10924/281241 [01:36<21:19, 211.32ex/s]preprocess train dataset:   4% 10946/281241 [01:37<23:03, 195.30ex/s]preprocess train dataset:   4% 10966/281241 [01:37<22:59, 195.94ex/s]preprocess train dataset:   4% 10993/281241 [01:37<20:50, 216.12ex/s]preprocess train dataset:   4% 11015/281241 [01:40<2:52:34, 26.10ex/s]preprocess train dataset:   4% 11038/281241 [01:40<2:06:47, 35.52ex/s]preprocess train dataset:   4% 11056/281241 [01:40<1:41:18, 44.45ex/s]preprocess train dataset:   4% 11074/281241 [01:40<1:21:34, 55.19ex/s]preprocess train dataset:   4% 11092/281241 [01:40<1:07:15, 66.95ex/s]preprocess train dataset:   4% 11109/281241 [01:40<57:07, 78.82ex/s]  preprocess train dataset:   4% 11126/281241 [01:40<49:38, 90.70ex/s]preprocess train dataset:   4% 11142/281241 [01:40<43:51, 102.64ex/s]preprocess train dataset:   4% 11160/281241 [01:40<38:33, 116.76ex/s]preprocess train dataset:   4% 11178/281241 [01:40<34:27, 130.64ex/s]preprocess train dataset:   4% 11203/281241 [01:41<28:39, 157.00ex/s]preprocess train dataset:   4% 11222/281241 [01:41<28:48, 156.21ex/s]preprocess train dataset:   4% 11241/281241 [01:41<27:42, 162.44ex/s]preprocess train dataset:   4% 11259/281241 [01:41<27:12, 165.33ex/s]preprocess train dataset:   4% 11277/281241 [01:41<27:35, 163.04ex/s]preprocess train dataset:   4% 11296/281241 [01:41<26:39, 168.76ex/s]preprocess train dataset:   4% 11314/281241 [01:41<26:18, 171.00ex/s]preprocess train dataset:   4% 11332/281241 [01:41<26:08, 172.07ex/s]preprocess train dataset:   4% 11350/281241 [01:41<26:11, 171.76ex/s]preprocess train dataset:   4% 11369/281241 [01:42<25:44, 174.76ex/s]preprocess train dataset:   4% 11390/281241 [01:42<24:45, 181.61ex/s]preprocess train dataset:   4% 11411/281241 [01:42<23:57, 187.67ex/s]preprocess train dataset:   4% 11430/281241 [01:42<24:45, 181.69ex/s]preprocess train dataset:   4% 11449/281241 [01:42<25:14, 178.10ex/s]preprocess train dataset:   4% 11468/281241 [01:42<25:00, 179.76ex/s]preprocess train dataset:   4% 11489/281241 [01:42<24:08, 186.16ex/s]preprocess train dataset:   4% 11508/281241 [01:42<24:06, 186.51ex/s]preprocess train dataset:   4% 11527/281241 [01:42<24:11, 185.84ex/s]preprocess train dataset:   4% 11546/281241 [01:43<25:26, 176.62ex/s]preprocess train dataset:   4% 11564/281241 [01:43<26:41, 168.42ex/s]preprocess train dataset:   4% 11581/281241 [01:43<27:03, 166.14ex/s]preprocess train dataset:   4% 11598/281241 [01:43<27:05, 165.93ex/s]preprocess train dataset:   4% 11615/281241 [01:43<27:06, 165.82ex/s]preprocess train dataset:   4% 11632/281241 [01:43<27:49, 161.46ex/s]preprocess train dataset:   4% 11649/281241 [01:43<28:04, 160.07ex/s]preprocess train dataset:   4% 11667/281241 [01:43<27:09, 165.41ex/s]preprocess train dataset:   4% 11685/281241 [01:43<26:57, 166.60ex/s]preprocess train dataset:   4% 11702/281241 [01:43<26:58, 166.49ex/s]preprocess train dataset:   4% 11719/281241 [01:44<27:31, 163.17ex/s]preprocess train dataset:   4% 11736/281241 [01:44<27:17, 164.56ex/s]preprocess train dataset:   4% 11753/281241 [01:44<27:33, 162.98ex/s]preprocess train dataset:   4% 11770/281241 [01:44<27:51, 161.24ex/s]preprocess train dataset:   4% 11787/281241 [01:44<27:41, 162.20ex/s]preprocess train dataset:   4% 11804/281241 [01:44<27:28, 163.49ex/s]preprocess train dataset:   4% 11821/281241 [01:44<27:20, 164.21ex/s]preprocess train dataset:   4% 11838/281241 [01:44<27:13, 164.92ex/s]preprocess train dataset:   4% 11855/281241 [01:44<28:50, 155.67ex/s]preprocess train dataset:   4% 11871/281241 [01:45<29:37, 151.56ex/s]preprocess train dataset:   4% 11889/281241 [01:45<28:26, 157.81ex/s]preprocess train dataset:   4% 11906/281241 [01:45<28:09, 159.38ex/s]preprocess train dataset:   4% 11924/281241 [01:45<27:18, 164.35ex/s]preprocess train dataset:   4% 11941/281241 [01:45<27:39, 162.31ex/s]preprocess train dataset:   4% 11958/281241 [01:45<28:05, 159.74ex/s]preprocess train dataset:   4% 11975/281241 [01:45<27:40, 162.18ex/s]preprocess train dataset:   4% 11992/281241 [01:45<27:29, 163.20ex/s]preprocess train dataset:   4% 12009/281241 [01:48<3:37:16, 20.65ex/s]preprocess train dataset:   4% 12024/281241 [01:48<2:46:02, 27.02ex/s]preprocess train dataset:   4% 12040/281241 [01:48<2:05:37, 35.71ex/s]preprocess train dataset:   4% 12056/281241 [01:48<1:36:53, 46.30ex/s]preprocess train dataset:   4% 12074/281241 [01:48<1:13:42, 60.86ex/s]preprocess train dataset:   4% 12091/281241 [01:48<59:24, 75.52ex/s]  preprocess train dataset:   4% 12111/281241 [01:48<47:11, 95.06ex/s]preprocess train dataset:   4% 12130/281241 [01:48<39:58, 112.18ex/s]preprocess train dataset:   4% 12148/281241 [01:49<35:55, 124.84ex/s]preprocess train dataset:   4% 12166/281241 [01:49<33:03, 135.63ex/s]preprocess train dataset:   4% 12184/281241 [01:49<31:13, 143.63ex/s]preprocess train dataset:   4% 12202/281241 [01:49<30:16, 148.12ex/s]preprocess train dataset:   4% 12219/281241 [01:49<29:46, 150.62ex/s]preprocess train dataset:   4% 12236/281241 [01:49<29:03, 154.28ex/s]preprocess train dataset:   4% 12253/281241 [01:49<28:41, 156.29ex/s]preprocess train dataset:   4% 12270/281241 [01:49<28:14, 158.74ex/s]preprocess train dataset:   4% 12287/281241 [01:49<28:54, 155.10ex/s]preprocess train dataset:   4% 12304/281241 [01:50<28:28, 157.43ex/s]preprocess train dataset:   4% 12321/281241 [01:50<28:32, 157.05ex/s]preprocess train dataset:   4% 12340/281241 [01:50<27:04, 165.49ex/s]preprocess train dataset:   4% 12357/281241 [01:50<26:54, 166.55ex/s]preprocess train dataset:   4% 12376/281241 [01:50<26:13, 170.85ex/s]preprocess train dataset:   4% 12396/281241 [01:50<25:18, 177.06ex/s]preprocess train dataset:   4% 12415/281241 [01:50<25:12, 177.76ex/s]preprocess train dataset:   4% 12434/281241 [01:50<24:49, 180.42ex/s]preprocess train dataset:   4% 12453/281241 [01:50<24:50, 180.37ex/s]preprocess train dataset:   4% 12472/281241 [01:51<25:25, 176.24ex/s]preprocess train dataset:   4% 12490/281241 [01:51<26:08, 171.39ex/s]preprocess train dataset:   4% 12508/281241 [01:51<26:57, 166.18ex/s]preprocess train dataset:   4% 12525/281241 [01:51<27:56, 160.33ex/s]preprocess train dataset:   4% 12544/281241 [01:51<26:43, 167.53ex/s]preprocess train dataset:   4% 12565/281241 [01:51<25:08, 178.11ex/s]preprocess train dataset:   4% 12584/281241 [01:51<24:46, 180.68ex/s]preprocess train dataset:   4% 12603/281241 [01:51<25:48, 173.54ex/s]preprocess train dataset:   4% 12622/281241 [01:51<25:25, 176.12ex/s]preprocess train dataset:   4% 12641/281241 [01:51<25:09, 177.90ex/s]preprocess train dataset:   5% 12659/281241 [01:52<25:57, 172.39ex/s]preprocess train dataset:   5% 12677/281241 [01:52<26:31, 168.78ex/s]preprocess train dataset:   5% 12697/281241 [01:52<25:42, 174.15ex/s]preprocess train dataset:   5% 12715/281241 [01:52<26:23, 169.53ex/s]preprocess train dataset:   5% 12732/281241 [01:52<26:52, 166.50ex/s]preprocess train dataset:   5% 12749/281241 [01:52<27:10, 164.69ex/s]preprocess train dataset:   5% 12766/281241 [01:52<27:47, 160.99ex/s]preprocess train dataset:   5% 12783/281241 [01:52<27:27, 162.93ex/s]preprocess train dataset:   5% 12801/281241 [01:52<26:52, 166.50ex/s]preprocess train dataset:   5% 12819/281241 [01:53<26:19, 169.92ex/s]preprocess train dataset:   5% 12837/281241 [01:53<25:59, 172.13ex/s]preprocess train dataset:   5% 12855/281241 [01:53<26:04, 171.53ex/s]preprocess train dataset:   5% 12873/281241 [01:53<26:50, 166.59ex/s]preprocess train dataset:   5% 12890/281241 [01:53<27:01, 165.50ex/s]preprocess train dataset:   5% 12908/281241 [01:53<26:22, 169.61ex/s]preprocess train dataset:   5% 12926/281241 [01:53<26:15, 170.25ex/s]preprocess train dataset:   5% 12944/281241 [01:53<26:03, 171.59ex/s]preprocess train dataset:   5% 12962/281241 [01:53<26:06, 171.21ex/s]preprocess train dataset:   5% 12980/281241 [01:54<26:25, 169.24ex/s]preprocess train dataset:   5% 12997/281241 [01:54<27:00, 165.51ex/s]preprocess train dataset:   5% 13014/281241 [01:57<4:15:54, 17.47ex/s]preprocess train dataset:   5% 13028/281241 [01:57<3:19:13, 22.44ex/s]preprocess train dataset:   5% 13042/281241 [01:57<2:34:34, 28.92ex/s]preprocess train dataset:   5% 13055/281241 [01:57<2:03:08, 36.30ex/s]preprocess train dataset:   5% 13069/281241 [01:57<1:36:59, 46.08ex/s]preprocess train dataset:   5% 13083/281241 [01:57<1:18:43, 56.78ex/s]preprocess train dataset:   5% 13100/281241 [01:57<1:01:47, 72.32ex/s]preprocess train dataset:   5% 13114/281241 [01:57<53:39, 83.28ex/s]  preprocess train dataset:   5% 13129/281241 [01:58<46:36, 95.88ex/s]preprocess train dataset:   5% 13146/281241 [01:58<40:13, 111.08ex/s]preprocess train dataset:   5% 13161/281241 [01:58<37:12, 120.09ex/s]preprocess train dataset:   5% 13177/281241 [01:58<34:55, 127.91ex/s]preprocess train dataset:   5% 13193/281241 [01:58<33:12, 134.52ex/s]preprocess train dataset:   5% 13209/281241 [01:58<31:52, 140.12ex/s]preprocess train dataset:   5% 13225/281241 [01:58<30:46, 145.14ex/s]preprocess train dataset:   5% 13241/281241 [01:58<29:57, 149.08ex/s]preprocess train dataset:   5% 13262/281241 [01:58<27:07, 164.66ex/s]preprocess train dataset:   5% 13281/281241 [01:58<26:06, 171.02ex/s]preprocess train dataset:   5% 13299/281241 [01:59<27:21, 163.24ex/s]preprocess train dataset:   5% 13316/281241 [01:59<28:36, 156.09ex/s]preprocess train dataset:   5% 13332/281241 [01:59<29:06, 153.43ex/s]preprocess train dataset:   5% 13348/281241 [01:59<29:00, 153.95ex/s]preprocess train dataset:   5% 13364/281241 [01:59<30:17, 147.38ex/s]preprocess train dataset:   5% 13381/281241 [01:59<29:26, 151.64ex/s]preprocess train dataset:   5% 13398/281241 [01:59<28:47, 155.02ex/s]preprocess train dataset:   5% 13418/281241 [01:59<26:55, 165.77ex/s]preprocess train dataset:   5% 13435/281241 [01:59<26:53, 165.94ex/s]preprocess train dataset:   5% 13455/281241 [02:00<25:24, 175.69ex/s]preprocess train dataset:   5% 13474/281241 [02:00<25:05, 177.91ex/s]preprocess train dataset:   5% 13492/281241 [02:00<25:46, 173.14ex/s]preprocess train dataset:   5% 13510/281241 [02:00<26:29, 168.41ex/s]preprocess train dataset:   5% 13527/281241 [02:00<27:22, 163.01ex/s]preprocess train dataset:   5% 13545/281241 [02:00<26:58, 165.38ex/s]preprocess train dataset:   5% 13562/281241 [02:00<27:31, 162.04ex/s]preprocess train dataset:   5% 13579/281241 [02:00<27:29, 162.26ex/s]preprocess train dataset:   5% 13596/281241 [02:00<27:18, 163.39ex/s]preprocess train dataset:   5% 13615/281241 [02:01<26:21, 169.21ex/s]preprocess train dataset:   5% 13635/281241 [02:01<25:08, 177.46ex/s]preprocess train dataset:   5% 13653/281241 [02:01<25:42, 173.43ex/s]preprocess train dataset:   5% 13671/281241 [02:01<25:58, 171.67ex/s]preprocess train dataset:   5% 13689/281241 [02:01<26:30, 168.19ex/s]preprocess train dataset:   5% 13707/281241 [02:01<26:02, 171.26ex/s]preprocess train dataset:   5% 13725/281241 [02:01<26:06, 170.81ex/s]preprocess train dataset:   5% 13743/281241 [02:01<26:22, 169.03ex/s]preprocess train dataset:   5% 13761/281241 [02:01<26:12, 170.09ex/s]preprocess train dataset:   5% 13784/281241 [02:01<23:51, 186.80ex/s]preprocess train dataset:   5% 13803/281241 [02:02<23:50, 186.93ex/s]preprocess train dataset:   5% 13822/281241 [02:02<24:30, 181.89ex/s]preprocess train dataset:   5% 13841/281241 [02:02<24:30, 181.82ex/s]preprocess train dataset:   5% 13860/281241 [02:02<24:28, 182.10ex/s]preprocess train dataset:   5% 13879/281241 [02:02<24:35, 181.20ex/s]preprocess train dataset:   5% 13898/281241 [02:02<24:46, 179.80ex/s]preprocess train dataset:   5% 13917/281241 [02:02<24:49, 179.44ex/s]preprocess train dataset:   5% 13935/281241 [02:02<25:14, 176.51ex/s]preprocess train dataset:   5% 13953/281241 [02:02<25:13, 176.62ex/s]preprocess train dataset:   5% 13972/281241 [02:03<24:59, 178.27ex/s]preprocess train dataset:   5% 13990/281241 [02:03<24:56, 178.57ex/s]preprocess train dataset:   5% 14008/281241 [02:06<4:12:47, 17.62ex/s]preprocess train dataset:   5% 14025/281241 [02:06<3:08:41, 23.60ex/s]preprocess train dataset:   5% 14041/281241 [02:06<2:24:14, 30.88ex/s]preprocess train dataset:   5% 14058/281241 [02:06<1:49:30, 40.66ex/s]preprocess train dataset:   5% 14074/281241 [02:06<1:27:07, 51.11ex/s]preprocess train dataset:   5% 14093/281241 [02:06<1:06:46, 66.68ex/s]preprocess train dataset:   5% 14111/281241 [02:06<54:06, 82.27ex/s]  preprocess train dataset:   5% 14128/281241 [02:07<46:16, 96.21ex/s]preprocess train dataset:   5% 14145/281241 [02:07<40:56, 108.72ex/s]preprocess train dataset:   5% 14163/281241 [02:07<36:22, 122.38ex/s]preprocess train dataset:   5% 14180/281241 [02:07<33:56, 131.16ex/s]preprocess train dataset:   5% 14197/281241 [02:07<31:46, 140.10ex/s]preprocess train dataset:   5% 14214/281241 [02:07<30:42, 144.90ex/s]preprocess train dataset:   5% 14232/281241 [02:07<29:05, 152.93ex/s]preprocess train dataset:   5% 14249/281241 [02:07<29:05, 152.93ex/s]preprocess train dataset:   5% 14269/281241 [02:07<27:03, 164.48ex/s]preprocess train dataset:   5% 14287/281241 [02:08<26:22, 168.70ex/s]preprocess train dataset:   5% 14306/281241 [02:08<25:32, 174.15ex/s]preprocess train dataset:   5% 14324/281241 [02:08<26:15, 169.36ex/s]preprocess train dataset:   5% 14343/281241 [02:08<25:51, 172.06ex/s]preprocess train dataset:   5% 14361/281241 [02:08<25:56, 171.45ex/s]preprocess train dataset:   5% 14379/281241 [02:08<25:59, 171.07ex/s]preprocess train dataset:   5% 14397/281241 [02:08<26:10, 169.96ex/s]preprocess train dataset:   5% 14415/281241 [02:08<26:20, 168.84ex/s]preprocess train dataset:   5% 14434/281241 [02:08<25:36, 173.62ex/s]preprocess train dataset:   5% 14452/281241 [02:08<25:59, 171.07ex/s]preprocess train dataset:   5% 14470/281241 [02:09<26:36, 167.10ex/s]preprocess train dataset:   5% 14487/281241 [02:09<27:00, 164.60ex/s]preprocess train dataset:   5% 14508/281241 [02:09<25:26, 174.70ex/s]preprocess train dataset:   5% 14528/281241 [02:09<24:40, 180.18ex/s]preprocess train dataset:   5% 14547/281241 [02:09<24:51, 178.78ex/s]preprocess train dataset:   5% 14567/281241 [02:09<24:24, 182.03ex/s]preprocess train dataset:   5% 14586/281241 [02:09<25:38, 173.30ex/s]preprocess train dataset:   5% 14604/281241 [02:09<26:07, 170.15ex/s]preprocess train dataset:   5% 14622/281241 [02:09<26:40, 166.61ex/s]preprocess train dataset:   5% 14639/281241 [02:10<26:54, 165.14ex/s]preprocess train dataset:   5% 14660/281241 [02:10<25:10, 176.46ex/s]preprocess train dataset:   5% 14678/281241 [02:10<25:47, 172.22ex/s]preprocess train dataset:   5% 14696/281241 [02:10<26:14, 169.24ex/s]preprocess train dataset:   5% 14713/281241 [02:10<27:10, 163.45ex/s]preprocess train dataset:   5% 14731/281241 [02:10<26:49, 165.56ex/s]preprocess train dataset:   5% 14750/281241 [02:10<26:11, 169.63ex/s]preprocess train dataset:   5% 14770/281241 [02:10<24:55, 178.17ex/s]preprocess train dataset:   5% 14788/281241 [02:10<25:34, 173.60ex/s]preprocess train dataset:   5% 14806/281241 [02:11<25:23, 174.85ex/s]preprocess train dataset:   5% 14824/281241 [02:11<25:14, 175.90ex/s]preprocess train dataset:   5% 14842/281241 [02:11<25:58, 170.95ex/s]preprocess train dataset:   5% 14860/281241 [02:11<26:08, 169.79ex/s]preprocess train dataset:   5% 14878/281241 [02:11<26:47, 165.66ex/s]preprocess train dataset:   5% 14896/281241 [02:11<26:32, 167.25ex/s]preprocess train dataset:   5% 14914/281241 [02:11<26:22, 168.25ex/s]preprocess train dataset:   5% 14931/281241 [02:11<26:57, 164.60ex/s]preprocess train dataset:   5% 14948/281241 [02:11<27:39, 160.46ex/s]preprocess train dataset:   5% 14966/281241 [02:12<27:00, 164.30ex/s]preprocess train dataset:   5% 14983/281241 [02:12<27:23, 161.99ex/s]preprocess train dataset:   5% 15000/281241 [02:14<3:51:13, 19.19ex/s]preprocess train dataset:   5% 15015/281241 [02:14<2:56:42, 25.11ex/s]preprocess train dataset:   5% 15031/281241 [02:15<2:13:15, 33.29ex/s]preprocess train dataset:   5% 15047/281241 [02:15<1:42:19, 43.36ex/s]preprocess train dataset:   5% 15064/281241 [02:15<1:19:09, 56.04ex/s]preprocess train dataset:   5% 15082/281241 [02:15<1:02:18, 71.20ex/s]preprocess train dataset:   5% 15098/281241 [02:15<52:30, 84.48ex/s]  preprocess train dataset:   5% 15114/281241 [02:15<45:40, 97.11ex/s]preprocess train dataset:   5% 15131/281241 [02:15<39:48, 111.43ex/s]preprocess train dataset:   5% 15148/281241 [02:15<35:45, 124.04ex/s]preprocess train dataset:   5% 15165/281241 [02:15<33:06, 133.97ex/s]preprocess train dataset:   5% 15182/281241 [02:16<31:32, 140.61ex/s]preprocess train dataset:   5% 15199/281241 [02:16<30:55, 143.36ex/s]preprocess train dataset:   5% 15215/281241 [02:16<30:31, 145.28ex/s]preprocess train dataset:   5% 15233/281241 [02:16<28:55, 153.23ex/s]preprocess train dataset:   5% 15250/281241 [02:16<28:56, 153.16ex/s]preprocess train dataset:   5% 15266/281241 [02:16<29:00, 152.80ex/s]preprocess train dataset:   5% 15288/281241 [02:16<25:58, 170.70ex/s]preprocess train dataset:   5% 15306/281241 [02:16<25:34, 173.26ex/s]preprocess train dataset:   5% 15324/281241 [02:16<25:35, 173.21ex/s]preprocess train dataset:   5% 15342/281241 [02:16<25:19, 174.97ex/s]preprocess train dataset:   5% 15362/281241 [02:17<24:38, 179.79ex/s]preprocess train dataset:   5% 15381/281241 [02:17<25:20, 174.89ex/s]preprocess train dataset:   5% 15401/281241 [02:17<24:35, 180.14ex/s]preprocess train dataset:   5% 15420/281241 [02:17<24:33, 180.39ex/s]preprocess train dataset:   5% 15439/281241 [02:17<24:58, 177.36ex/s]preprocess train dataset:   5% 15457/281241 [02:17<25:24, 174.38ex/s]preprocess train dataset:   6% 15478/281241 [02:17<24:19, 182.10ex/s]preprocess train dataset:   6% 15497/281241 [02:17<25:15, 175.36ex/s]preprocess train dataset:   6% 15516/281241 [02:17<25:03, 176.75ex/s]preprocess train dataset:   6% 15534/281241 [02:18<25:32, 173.37ex/s]preprocess train dataset:   6% 15552/281241 [02:18<25:58, 170.50ex/s]preprocess train dataset:   6% 15570/281241 [02:18<26:28, 167.26ex/s]preprocess train dataset:   6% 15587/281241 [02:18<26:59, 164.08ex/s]preprocess train dataset:   6% 15604/281241 [02:18<27:31, 160.83ex/s]preprocess train dataset:   6% 15621/281241 [02:18<28:09, 157.20ex/s]preprocess train dataset:   6% 15639/281241 [02:18<27:15, 162.39ex/s]preprocess train dataset:   6% 15656/281241 [02:18<27:12, 162.65ex/s]preprocess train dataset:   6% 15673/281241 [02:18<27:07, 163.17ex/s]preprocess train dataset:   6% 15693/281241 [02:19<25:38, 172.63ex/s]preprocess train dataset:   6% 15711/281241 [02:19<25:40, 172.39ex/s]preprocess train dataset:   6% 15729/281241 [02:19<25:54, 170.80ex/s]preprocess train dataset:   6% 15752/281241 [02:19<23:46, 186.06ex/s]preprocess train dataset:   6% 15776/281241 [02:19<22:03, 200.52ex/s]preprocess train dataset:   6% 15797/281241 [02:19<22:19, 198.24ex/s]preprocess train dataset:   6% 15817/281241 [02:19<22:24, 197.49ex/s]preprocess train dataset:   6% 15837/281241 [02:19<22:39, 195.17ex/s]preprocess train dataset:   6% 15857/281241 [02:19<24:21, 181.64ex/s]preprocess train dataset:   6% 15876/281241 [02:20<26:20, 167.89ex/s]preprocess train dataset:   6% 15896/281241 [02:20<25:12, 175.41ex/s]preprocess train dataset:   6% 15914/281241 [02:20<25:12, 175.44ex/s]preprocess train dataset:   6% 15932/281241 [02:20<25:05, 176.22ex/s]preprocess train dataset:   6% 15950/281241 [02:20<24:56, 177.29ex/s]preprocess train dataset:   6% 15972/281241 [02:20<23:33, 187.63ex/s]preprocess train dataset:   6% 15991/281241 [02:20<23:41, 186.55ex/s]preprocess train dataset:   6% 16010/281241 [02:23<3:25:03, 21.56ex/s]preprocess train dataset:   6% 16028/281241 [02:23<2:34:00, 28.70ex/s]preprocess train dataset:   6% 16045/281241 [02:23<1:58:45, 37.22ex/s]preprocess train dataset:   6% 16064/281241 [02:23<1:29:29, 49.39ex/s]preprocess train dataset:   6% 16081/281241 [02:23<1:12:10, 61.23ex/s]preprocess train dataset:   6% 16099/281241 [02:23<58:10, 75.96ex/s]  preprocess train dataset:   6% 16116/281241 [02:23<48:56, 90.28ex/s]preprocess train dataset:   6% 16135/281241 [02:24<41:00, 107.73ex/s]preprocess train dataset:   6% 16153/281241 [02:24<36:43, 120.33ex/s]preprocess train dataset:   6% 16171/281241 [02:24<33:56, 130.14ex/s]preprocess train dataset:   6% 16189/281241 [02:24<31:34, 139.93ex/s]preprocess train dataset:   6% 16206/281241 [02:24<31:20, 140.94ex/s]preprocess train dataset:   6% 16223/281241 [02:24<29:57, 147.42ex/s]preprocess train dataset:   6% 16240/281241 [02:24<28:56, 152.65ex/s]preprocess train dataset:   6% 16257/281241 [02:24<28:40, 153.99ex/s]preprocess train dataset:   6% 16274/281241 [02:24<28:42, 153.85ex/s]preprocess train dataset:   6% 16290/281241 [02:25<28:35, 154.43ex/s]preprocess train dataset:   6% 16306/281241 [02:25<28:34, 154.50ex/s]preprocess train dataset:   6% 16323/281241 [02:25<27:56, 157.97ex/s]preprocess train dataset:   6% 16340/281241 [02:25<27:24, 161.05ex/s]preprocess train dataset:   6% 16357/281241 [02:25<28:06, 157.10ex/s]preprocess train dataset:   6% 16374/281241 [02:25<27:33, 160.19ex/s]preprocess train dataset:   6% 16392/281241 [02:25<26:38, 165.66ex/s]preprocess train dataset:   6% 16410/281241 [02:25<26:16, 168.01ex/s]preprocess train dataset:   6% 16427/281241 [02:25<27:17, 161.71ex/s]preprocess train dataset:   6% 16444/281241 [02:26<27:48, 158.75ex/s]preprocess train dataset:   6% 16463/281241 [02:26<26:25, 167.00ex/s]preprocess train dataset:   6% 16480/281241 [02:26<26:50, 164.41ex/s]preprocess train dataset:   6% 16497/281241 [02:26<27:08, 162.56ex/s]preprocess train dataset:   6% 16514/281241 [02:26<27:57, 157.79ex/s]preprocess train dataset:   6% 16531/281241 [02:26<27:22, 161.13ex/s]preprocess train dataset:   6% 16548/281241 [02:26<27:43, 159.15ex/s]preprocess train dataset:   6% 16564/281241 [02:26<27:40, 159.36ex/s]preprocess train dataset:   6% 16581/281241 [02:26<27:26, 160.73ex/s]preprocess train dataset:   6% 16602/281241 [02:26<25:17, 174.36ex/s]preprocess train dataset:   6% 16620/281241 [02:27<25:04, 175.84ex/s]preprocess train dataset:   6% 16644/281241 [02:27<22:48, 193.28ex/s]preprocess train dataset:   6% 16664/281241 [02:27<22:45, 193.70ex/s]preprocess train dataset:   6% 16685/281241 [02:27<22:31, 195.74ex/s]preprocess train dataset:   6% 16705/281241 [02:27<22:40, 194.44ex/s]preprocess train dataset:   6% 16725/281241 [02:27<23:29, 187.70ex/s]preprocess train dataset:   6% 16744/281241 [02:27<23:59, 183.76ex/s]preprocess train dataset:   6% 16763/281241 [02:27<24:41, 178.51ex/s]preprocess train dataset:   6% 16781/281241 [02:27<24:54, 176.93ex/s]preprocess train dataset:   6% 16799/281241 [02:28<25:08, 175.25ex/s]preprocess train dataset:   6% 16818/281241 [02:28<24:35, 179.21ex/s]preprocess train dataset:   6% 16836/281241 [02:28<25:42, 171.40ex/s]preprocess train dataset:   6% 16857/281241 [02:28<24:12, 181.98ex/s]preprocess train dataset:   6% 16877/281241 [02:28<23:40, 186.12ex/s]preprocess train dataset:   6% 16896/281241 [02:28<23:39, 186.17ex/s]preprocess train dataset:   6% 16915/281241 [02:28<23:54, 184.23ex/s]preprocess train dataset:   6% 16936/281241 [02:28<23:26, 187.96ex/s]preprocess train dataset:   6% 16955/281241 [02:28<23:45, 185.45ex/s]preprocess train dataset:   6% 16974/281241 [02:28<24:03, 183.03ex/s]preprocess train dataset:   6% 16993/281241 [02:29<24:32, 179.49ex/s]preprocess train dataset:   6% 17011/281241 [02:31<3:31:50, 20.79ex/s]preprocess train dataset:   6% 17031/281241 [02:31<2:32:50, 28.81ex/s]preprocess train dataset:   6% 17049/281241 [02:32<1:56:23, 37.83ex/s]preprocess train dataset:   6% 17065/281241 [02:32<1:33:04, 47.31ex/s]preprocess train dataset:   6% 17083/281241 [02:32<1:12:58, 60.34ex/s]preprocess train dataset:   6% 17099/281241 [02:32<1:01:00, 72.16ex/s]preprocess train dataset:   6% 17115/281241 [02:32<51:58, 84.70ex/s]  preprocess train dataset:   6% 17133/281241 [02:32<43:54, 100.24ex/s]preprocess train dataset:   6% 17152/281241 [02:32<37:39, 116.88ex/s]preprocess train dataset:   6% 17169/281241 [02:32<34:25, 127.87ex/s]preprocess train dataset:   6% 17187/281241 [02:32<31:38, 139.06ex/s]preprocess train dataset:   6% 17206/281241 [02:33<29:01, 151.58ex/s]preprocess train dataset:   6% 17224/281241 [02:33<28:53, 152.27ex/s]preprocess train dataset:   6% 17241/281241 [02:33<29:31, 149.03ex/s]preprocess train dataset:   6% 17258/281241 [02:33<29:26, 149.47ex/s]preprocess train dataset:   6% 17274/281241 [02:33<29:30, 149.13ex/s]preprocess train dataset:   6% 17290/281241 [02:33<28:56, 152.04ex/s]preprocess train dataset:   6% 17308/281241 [02:33<27:31, 159.85ex/s]preprocess train dataset:   6% 17327/281241 [02:33<26:10, 168.08ex/s]preprocess train dataset:   6% 17345/281241 [02:33<26:49, 164.01ex/s]preprocess train dataset:   6% 17362/281241 [02:33<26:54, 163.39ex/s]preprocess train dataset:   6% 17380/281241 [02:34<26:17, 167.25ex/s]preprocess train dataset:   6% 17399/281241 [02:34<25:27, 172.76ex/s]preprocess train dataset:   6% 17417/281241 [02:34<26:29, 166.02ex/s]preprocess train dataset:   6% 17434/281241 [02:34<27:31, 159.69ex/s]preprocess train dataset:   6% 17451/281241 [02:34<27:43, 158.61ex/s]preprocess train dataset:   6% 17468/281241 [02:34<27:25, 160.26ex/s]preprocess train dataset:   6% 17485/281241 [02:34<27:13, 161.46ex/s]preprocess train dataset:   6% 17502/281241 [02:34<27:16, 161.14ex/s]preprocess train dataset:   6% 17522/281241 [02:34<25:47, 170.41ex/s]preprocess train dataset:   6% 17540/281241 [02:35<26:15, 167.39ex/s]preprocess train dataset:   6% 17557/281241 [02:35<26:34, 165.35ex/s]preprocess train dataset:   6% 17575/281241 [02:35<26:23, 166.49ex/s]preprocess train dataset:   6% 17595/281241 [02:35<25:17, 173.76ex/s]preprocess train dataset:   6% 17614/281241 [02:35<24:53, 176.54ex/s]preprocess train dataset:   6% 17632/281241 [02:35<26:10, 167.80ex/s]preprocess train dataset:   6% 17650/281241 [02:35<25:59, 169.07ex/s]preprocess train dataset:   6% 17667/281241 [02:35<26:40, 164.67ex/s]preprocess train dataset:   6% 17684/281241 [02:35<27:16, 161.06ex/s]preprocess train dataset:   6% 17702/281241 [02:36<26:33, 165.41ex/s]preprocess train dataset:   6% 17720/281241 [02:36<26:00, 168.91ex/s]preprocess train dataset:   6% 17738/281241 [02:36<25:55, 169.35ex/s]preprocess train dataset:   6% 17755/281241 [02:36<26:03, 168.57ex/s]preprocess train dataset:   6% 17772/281241 [02:36<26:27, 165.93ex/s]preprocess train dataset:   6% 17789/281241 [02:36<26:23, 166.34ex/s]preprocess train dataset:   6% 17807/281241 [02:36<26:01, 168.73ex/s]preprocess train dataset:   6% 17825/281241 [02:36<25:53, 169.55ex/s]preprocess train dataset:   6% 17843/281241 [02:36<25:32, 171.89ex/s]preprocess train dataset:   6% 17861/281241 [02:36<26:48, 163.77ex/s]preprocess train dataset:   6% 17878/281241 [02:37<27:52, 157.50ex/s]preprocess train dataset:   6% 17894/281241 [02:37<29:06, 150.79ex/s]preprocess train dataset:   6% 17910/281241 [02:37<29:15, 149.97ex/s]preprocess train dataset:   6% 17926/281241 [02:37<30:04, 145.93ex/s]preprocess train dataset:   6% 17942/281241 [02:37<29:28, 148.85ex/s]preprocess train dataset:   6% 17958/281241 [02:37<29:01, 151.20ex/s]preprocess train dataset:   6% 17976/281241 [02:37<27:38, 158.71ex/s]preprocess train dataset:   6% 17992/281241 [02:37<27:46, 158.01ex/s]preprocess train dataset:   6% 18008/281241 [02:40<4:17:06, 17.06ex/s]preprocess train dataset:   6% 18025/281241 [02:40<3:06:07, 23.57ex/s]preprocess train dataset:   6% 18042/281241 [02:41<2:17:27, 31.91ex/s]preprocess train dataset:   6% 18060/281241 [02:41<1:42:00, 43.00ex/s]preprocess train dataset:   6% 18077/281241 [02:41<1:19:17, 55.32ex/s]preprocess train dataset:   6% 18093/281241 [02:41<1:04:33, 67.94ex/s]preprocess train dataset:   6% 18110/281241 [02:41<53:06, 82.57ex/s]  preprocess train dataset:   6% 18127/281241 [02:41<44:51, 97.74ex/s]preprocess train dataset:   6% 18144/281241 [02:41<39:30, 110.98ex/s]preprocess train dataset:   6% 18161/281241 [02:41<36:04, 121.54ex/s]preprocess train dataset:   6% 18178/281241 [02:41<33:13, 131.98ex/s]preprocess train dataset:   6% 18195/281241 [02:41<31:12, 140.52ex/s]preprocess train dataset:   6% 18213/281241 [02:42<29:28, 148.71ex/s]preprocess train dataset:   6% 18231/281241 [02:42<27:54, 157.06ex/s]preprocess train dataset:   6% 18249/281241 [02:42<27:06, 161.70ex/s]preprocess train dataset:   6% 18267/281241 [02:42<27:29, 159.42ex/s]preprocess train dataset:   7% 18285/281241 [02:42<26:38, 164.46ex/s]preprocess train dataset:   7% 18302/281241 [02:42<26:49, 163.38ex/s]preprocess train dataset:   7% 18319/281241 [02:42<27:45, 157.87ex/s]preprocess train dataset:   7% 18336/281241 [02:42<27:22, 160.09ex/s]preprocess train dataset:   7% 18353/281241 [02:42<27:40, 158.28ex/s]preprocess train dataset:   7% 18369/281241 [02:43<28:19, 154.65ex/s]preprocess train dataset:   7% 18385/281241 [02:43<28:44, 152.41ex/s]preprocess train dataset:   7% 18401/281241 [02:43<28:25, 154.15ex/s]preprocess train dataset:   7% 18418/281241 [02:43<28:01, 156.30ex/s]preprocess train dataset:   7% 18435/281241 [02:43<27:43, 158.00ex/s]preprocess train dataset:   7% 18452/281241 [02:43<27:34, 158.84ex/s]preprocess train dataset:   7% 18469/281241 [02:43<27:06, 161.55ex/s]preprocess train dataset:   7% 18486/281241 [02:43<27:09, 161.25ex/s]preprocess train dataset:   7% 18503/281241 [02:43<27:07, 161.46ex/s]preprocess train dataset:   7% 18522/281241 [02:43<26:02, 168.12ex/s]preprocess train dataset:   7% 18540/281241 [02:44<25:33, 171.36ex/s]preprocess train dataset:   7% 18561/281241 [02:44<24:03, 182.00ex/s]preprocess train dataset:   7% 18580/281241 [02:44<24:32, 178.35ex/s]preprocess train dataset:   7% 18600/281241 [02:44<23:58, 182.64ex/s]preprocess train dataset:   7% 18619/281241 [02:44<24:47, 176.53ex/s]preprocess train dataset:   7% 18637/281241 [02:44<25:29, 171.67ex/s]preprocess train dataset:   7% 18655/281241 [02:44<26:04, 167.83ex/s]preprocess train dataset:   7% 18672/281241 [02:44<26:37, 164.33ex/s]preprocess train dataset:   7% 18689/281241 [02:44<26:31, 164.95ex/s]preprocess train dataset:   7% 18706/281241 [02:45<27:22, 159.83ex/s]preprocess train dataset:   7% 18723/281241 [02:45<27:34, 158.71ex/s]preprocess train dataset:   7% 18739/281241 [02:45<27:44, 157.72ex/s]preprocess train dataset:   7% 18755/281241 [02:45<27:51, 156.99ex/s]preprocess train dataset:   7% 18772/281241 [02:45<27:23, 159.68ex/s]preprocess train dataset:   7% 18789/281241 [02:45<27:08, 161.18ex/s]preprocess train dataset:   7% 18808/281241 [02:45<25:47, 169.55ex/s]preprocess train dataset:   7% 18825/281241 [02:45<26:39, 164.06ex/s]preprocess train dataset:   7% 18842/281241 [02:45<27:21, 159.83ex/s]preprocess train dataset:   7% 18864/281241 [02:45<25:11, 173.60ex/s]preprocess train dataset:   7% 18882/281241 [02:46<26:38, 164.12ex/s]preprocess train dataset:   7% 18899/281241 [02:46<28:20, 154.31ex/s]preprocess train dataset:   7% 18915/281241 [02:46<29:03, 150.42ex/s]preprocess train dataset:   7% 18931/281241 [02:46<29:40, 147.36ex/s]preprocess train dataset:   7% 18946/281241 [02:46<30:19, 144.16ex/s]preprocess train dataset:   7% 18961/281241 [02:46<31:03, 140.75ex/s]preprocess train dataset:   7% 18977/281241 [02:46<30:02, 145.49ex/s]preprocess train dataset:   7% 18997/281241 [02:46<27:33, 158.64ex/s]preprocess train dataset:   7% 19013/281241 [02:49<3:49:28, 19.05ex/s]preprocess train dataset:   7% 19031/281241 [02:49<2:45:26, 26.42ex/s]preprocess train dataset:   7% 19049/281241 [02:49<2:01:42, 35.91ex/s]preprocess train dataset:   7% 19065/281241 [02:49<1:35:02, 45.97ex/s]preprocess train dataset:   7% 19086/281241 [02:50<1:09:42, 62.68ex/s]preprocess train dataset:   7% 19103/281241 [02:50<57:26, 76.05ex/s]  preprocess train dataset:   7% 19122/281241 [02:50<47:03, 92.84ex/s]preprocess train dataset:   7% 19139/281241 [02:50<41:26, 105.41ex/s]preprocess train dataset:   7% 19156/281241 [02:50<36:59, 118.07ex/s]preprocess train dataset:   7% 19175/281241 [02:50<32:54, 132.71ex/s]preprocess train dataset:   7% 19193/281241 [02:50<31:42, 137.76ex/s]preprocess train dataset:   7% 19210/281241 [02:50<30:28, 143.29ex/s]preprocess train dataset:   7% 19227/281241 [02:50<29:09, 149.73ex/s]preprocess train dataset:   7% 19249/281241 [02:50<26:13, 166.47ex/s]preprocess train dataset:   7% 19271/281241 [02:51<24:08, 180.89ex/s]preprocess train dataset:   7% 19291/281241 [02:51<23:43, 184.05ex/s]preprocess train dataset:   7% 19312/281241 [02:51<23:03, 189.38ex/s]preprocess train dataset:   7% 19332/281241 [02:51<24:20, 179.36ex/s]preprocess train dataset:   7% 19351/281241 [02:51<25:43, 169.69ex/s]preprocess train dataset:   7% 19369/281241 [02:51<26:14, 166.37ex/s]preprocess train dataset:   7% 19386/281241 [02:51<26:40, 163.62ex/s]preprocess train dataset:   7% 19403/281241 [02:51<27:06, 161.00ex/s]preprocess train dataset:   7% 19420/281241 [02:51<27:15, 160.09ex/s]preprocess train dataset:   7% 19437/281241 [02:52<28:24, 153.57ex/s]preprocess train dataset:   7% 19453/281241 [02:52<29:57, 145.63ex/s]preprocess train dataset:   7% 19469/281241 [02:52<29:17, 148.98ex/s]preprocess train dataset:   7% 19488/281241 [02:52<27:29, 158.73ex/s]preprocess train dataset:   7% 19505/281241 [02:52<27:32, 158.39ex/s]preprocess train dataset:   7% 19523/281241 [02:52<26:48, 162.72ex/s]preprocess train dataset:   7% 19541/281241 [02:52<26:07, 166.94ex/s]preprocess train dataset:   7% 19560/281241 [02:52<25:13, 172.94ex/s]preprocess train dataset:   7% 19580/281241 [02:52<24:13, 179.98ex/s]preprocess train dataset:   7% 19599/281241 [02:53<24:58, 174.56ex/s]preprocess train dataset:   7% 19617/281241 [02:53<25:38, 170.06ex/s]preprocess train dataset:   7% 19635/281241 [02:53<25:41, 169.67ex/s]preprocess train dataset:   7% 19653/281241 [02:53<27:00, 161.40ex/s]preprocess train dataset:   7% 19671/281241 [02:53<26:32, 164.27ex/s]preprocess train dataset:   7% 19688/281241 [02:53<27:45, 157.03ex/s]preprocess train dataset:   7% 19705/281241 [02:53<27:19, 159.50ex/s]preprocess train dataset:   7% 19722/281241 [02:53<27:11, 160.26ex/s]preprocess train dataset:   7% 19739/281241 [02:53<27:37, 157.81ex/s]preprocess train dataset:   7% 19755/281241 [02:54<28:14, 154.30ex/s]preprocess train dataset:   7% 19771/281241 [02:54<28:34, 152.54ex/s]preprocess train dataset:   7% 19788/281241 [02:54<27:45, 157.00ex/s]preprocess train dataset:   7% 19808/281241 [02:54<25:44, 169.27ex/s]preprocess train dataset:   7% 19827/281241 [02:54<25:09, 173.13ex/s]preprocess train dataset:   7% 19845/281241 [02:54<26:20, 165.43ex/s]preprocess train dataset:   7% 19862/281241 [02:54<26:40, 163.27ex/s]preprocess train dataset:   7% 19880/281241 [02:54<26:02, 167.22ex/s]preprocess train dataset:   7% 19897/281241 [02:54<26:30, 164.36ex/s]preprocess train dataset:   7% 19916/281241 [02:54<25:32, 170.53ex/s]preprocess train dataset:   7% 19936/281241 [02:55<24:36, 176.92ex/s]preprocess train dataset:   7% 19960/281241 [02:55<22:24, 194.27ex/s]preprocess train dataset:   7% 19983/281241 [02:55<21:21, 203.92ex/s]preprocess train dataset:   7% 20004/281241 [02:58<3:14:10, 22.42ex/s]preprocess train dataset:   7% 20025/281241 [02:58<2:22:18, 30.59ex/s]preprocess train dataset:   7% 20048/281241 [02:58<1:42:57, 42.28ex/s]preprocess train dataset:   7% 20071/281241 [02:58<1:16:48, 56.67ex/s]preprocess train dataset:   7% 20091/281241 [02:58<1:02:03, 70.14ex/s]preprocess train dataset:   7% 20111/281241 [02:58<51:11, 85.02ex/s]  preprocess train dataset:   7% 20130/281241 [02:58<44:10, 98.51ex/s]preprocess train dataset:   7% 20149/281241 [02:58<38:37, 112.65ex/s]preprocess train dataset:   7% 20168/281241 [02:59<34:17, 126.87ex/s]preprocess train dataset:   7% 20187/281241 [02:59<31:06, 139.89ex/s]preprocess train dataset:   7% 20206/281241 [02:59<29:26, 147.77ex/s]preprocess train dataset:   7% 20225/281241 [02:59<27:59, 155.42ex/s]preprocess train dataset:   7% 20243/281241 [02:59<27:18, 159.25ex/s]preprocess train dataset:   7% 20262/281241 [02:59<26:00, 167.20ex/s]preprocess train dataset:   7% 20282/281241 [02:59<24:44, 175.77ex/s]preprocess train dataset:   7% 20301/281241 [02:59<24:26, 177.98ex/s]preprocess train dataset:   7% 20321/281241 [02:59<24:03, 180.73ex/s]preprocess train dataset:   7% 20340/281241 [03:00<25:01, 173.73ex/s]preprocess train dataset:   7% 20358/281241 [03:00<25:51, 168.11ex/s]preprocess train dataset:   7% 20376/281241 [03:00<26:48, 162.23ex/s]preprocess train dataset:   7% 20393/281241 [03:00<27:01, 160.82ex/s]preprocess train dataset:   7% 20410/281241 [03:00<28:00, 155.25ex/s]preprocess train dataset:   7% 20427/281241 [03:00<27:38, 157.23ex/s]preprocess train dataset:   7% 20443/281241 [03:00<27:46, 156.45ex/s]preprocess train dataset:   7% 20459/281241 [03:00<27:59, 155.27ex/s]preprocess train dataset:   7% 20475/281241 [03:00<28:07, 154.49ex/s]preprocess train dataset:   7% 20491/281241 [03:00<28:19, 153.42ex/s]preprocess train dataset:   7% 20508/281241 [03:01<27:59, 155.29ex/s]preprocess train dataset:   7% 20528/281241 [03:01<26:20, 164.98ex/s]preprocess train dataset:   7% 20549/281241 [03:01<24:35, 176.63ex/s]preprocess train dataset:   7% 20570/281241 [03:01<23:31, 184.66ex/s]preprocess train dataset:   7% 20589/281241 [03:01<24:53, 174.55ex/s]preprocess train dataset:   7% 20607/281241 [03:01<24:59, 173.83ex/s]preprocess train dataset:   7% 20625/281241 [03:01<24:45, 175.42ex/s]preprocess train dataset:   7% 20643/281241 [03:01<25:29, 170.33ex/s]preprocess train dataset:   7% 20661/281241 [03:01<25:49, 168.18ex/s]preprocess train dataset:   7% 20678/281241 [03:02<25:49, 168.20ex/s]preprocess train dataset:   7% 20696/281241 [03:02<25:28, 170.40ex/s]preprocess train dataset:   7% 20714/281241 [03:02<25:59, 167.07ex/s]preprocess train dataset:   7% 20732/281241 [03:02<25:31, 170.05ex/s]preprocess train dataset:   7% 20752/281241 [03:02<24:30, 177.09ex/s]preprocess train dataset:   7% 20772/281241 [03:02<23:39, 183.51ex/s]preprocess train dataset:   7% 20796/281241 [03:02<22:01, 197.06ex/s]preprocess train dataset:   7% 20816/281241 [03:02<23:09, 187.44ex/s]preprocess train dataset:   7% 20838/281241 [03:02<22:18, 194.55ex/s]preprocess train dataset:   7% 20861/281241 [03:03<21:26, 202.47ex/s]preprocess train dataset:   7% 20886/281241 [03:03<20:18, 213.71ex/s]preprocess train dataset:   7% 20909/281241 [03:03<20:03, 216.23ex/s]preprocess train dataset:   7% 20931/281241 [03:03<22:33, 192.37ex/s]preprocess train dataset:   7% 20951/281241 [03:03<23:53, 181.52ex/s]preprocess train dataset:   7% 20970/281241 [03:03<24:13, 179.12ex/s]preprocess train dataset:   7% 20989/281241 [03:03<24:38, 176.02ex/s]preprocess train dataset:   7% 21007/281241 [03:06<3:23:19, 21.33ex/s]preprocess train dataset:   7% 21026/281241 [03:06<2:30:39, 28.79ex/s]preprocess train dataset:   7% 21043/281241 [03:06<1:56:48, 37.13ex/s]preprocess train dataset:   7% 21061/281241 [03:06<1:30:07, 48.11ex/s]preprocess train dataset:   7% 21080/281241 [03:06<1:09:52, 62.05ex/s]preprocess train dataset:   8% 21097/281241 [03:07<57:50, 74.96ex/s]  preprocess train dataset:   8% 21114/281241 [03:07<48:38, 89.12ex/s]preprocess train dataset:   8% 21132/281241 [03:07<41:39, 104.07ex/s]preprocess train dataset:   8% 21149/281241 [03:07<37:42, 114.95ex/s]preprocess train dataset:   8% 21166/281241 [03:07<35:33, 121.90ex/s]preprocess train dataset:   8% 21182/281241 [03:07<34:11, 126.77ex/s]preprocess train dataset:   8% 21198/281241 [03:07<32:08, 134.82ex/s]preprocess train dataset:   8% 21214/281241 [03:07<31:10, 139.05ex/s]preprocess train dataset:   8% 21231/281241 [03:07<29:36, 146.40ex/s]preprocess train dataset:   8% 21248/281241 [03:07<28:32, 151.78ex/s]preprocess train dataset:   8% 21265/281241 [03:08<27:47, 155.91ex/s]preprocess train dataset:   8% 21284/281241 [03:08<26:32, 163.25ex/s]preprocess train dataset:   8% 21302/281241 [03:08<25:53, 167.27ex/s]preprocess train dataset:   8% 21320/281241 [03:08<25:32, 169.60ex/s]preprocess train dataset:   8% 21338/281241 [03:08<25:09, 172.15ex/s]preprocess train dataset:   8% 21356/281241 [03:08<25:29, 169.88ex/s]preprocess train dataset:   8% 21374/281241 [03:08<26:05, 165.96ex/s]preprocess train dataset:   8% 21391/281241 [03:08<26:38, 162.60ex/s]preprocess train dataset:   8% 21408/281241 [03:08<26:21, 164.25ex/s]preprocess train dataset:   8% 21425/281241 [03:09<27:15, 158.81ex/s]preprocess train dataset:   8% 21441/281241 [03:09<28:23, 152.52ex/s]preprocess train dataset:   8% 21458/281241 [03:09<27:46, 155.85ex/s]preprocess train dataset:   8% 21474/281241 [03:09<28:44, 150.63ex/s]preprocess train dataset:   8% 21493/281241 [03:09<26:50, 161.29ex/s]preprocess train dataset:   8% 21513/281241 [03:09<25:35, 169.13ex/s]preprocess train dataset:   8% 21531/281241 [03:09<25:55, 166.91ex/s]preprocess train dataset:   8% 21550/281241 [03:09<24:59, 173.24ex/s]preprocess train dataset:   8% 21569/281241 [03:09<24:38, 175.57ex/s]preprocess train dataset:   8% 21587/281241 [03:10<25:21, 170.63ex/s]preprocess train dataset:   8% 21605/281241 [03:10<26:18, 164.46ex/s]preprocess train dataset:   8% 21623/281241 [03:10<25:55, 166.86ex/s]preprocess train dataset:   8% 21643/281241 [03:10<24:50, 174.15ex/s]preprocess train dataset:   8% 21662/281241 [03:10<24:27, 176.92ex/s]preprocess train dataset:   8% 21680/281241 [03:10<25:22, 170.51ex/s]preprocess train dataset:   8% 21699/281241 [03:10<24:37, 175.70ex/s]preprocess train dataset:   8% 21717/281241 [03:10<25:22, 170.46ex/s]preprocess train dataset:   8% 21735/281241 [03:10<26:15, 164.71ex/s]preprocess train dataset:   8% 21753/281241 [03:11<26:07, 165.58ex/s]preprocess train dataset:   8% 21770/281241 [03:11<27:16, 158.51ex/s]preprocess train dataset:   8% 21788/281241 [03:11<26:52, 160.91ex/s]preprocess train dataset:   8% 21805/281241 [03:11<26:45, 161.59ex/s]preprocess train dataset:   8% 21822/281241 [03:11<28:34, 151.29ex/s]preprocess train dataset:   8% 21838/281241 [03:11<29:26, 146.84ex/s]preprocess train dataset:   8% 21856/281241 [03:11<28:06, 153.84ex/s]preprocess train dataset:   8% 21872/281241 [03:11<28:24, 152.18ex/s]preprocess train dataset:   8% 21888/281241 [03:11<29:21, 147.27ex/s]preprocess train dataset:   8% 21903/281241 [03:12<29:36, 145.98ex/s]preprocess train dataset:   8% 21920/281241 [03:12<28:35, 151.14ex/s]preprocess train dataset:   8% 21937/281241 [03:12<27:53, 154.92ex/s]preprocess train dataset:   8% 21955/281241 [03:12<27:01, 159.92ex/s]preprocess train dataset:   8% 21974/281241 [03:12<25:53, 166.92ex/s]preprocess train dataset:   8% 21994/281241 [03:12<24:35, 175.69ex/s]preprocess train dataset:   8% 22012/281241 [03:15<3:59:59, 18.00ex/s]preprocess train dataset:   8% 22030/281241 [03:15<2:56:03, 24.54ex/s]preprocess train dataset:   8% 22046/281241 [03:15<2:15:32, 31.87ex/s]preprocess train dataset:   8% 22061/281241 [03:15<1:46:59, 40.37ex/s]preprocess train dataset:   8% 22078/281241 [03:16<1:22:24, 52.41ex/s]preprocess train dataset:   8% 22094/281241 [03:16<1:07:09, 64.32ex/s]preprocess train dataset:   8% 22112/281241 [03:16<53:47, 80.30ex/s]  preprocess train dataset:   8% 22128/281241 [03:16<46:50, 92.20ex/s]preprocess train dataset:   8% 22144/281241 [03:16<41:59, 102.85ex/s]preprocess train dataset:   8% 22160/281241 [03:16<37:59, 113.65ex/s]preprocess train dataset:   8% 22178/281241 [03:16<34:01, 126.90ex/s]preprocess train dataset:   8% 22194/281241 [03:16<32:26, 133.06ex/s]preprocess train dataset:   8% 22210/281241 [03:16<31:02, 139.09ex/s]preprocess train dataset:   8% 22227/281241 [03:17<29:42, 145.31ex/s]preprocess train dataset:   8% 22243/281241 [03:17<29:14, 147.64ex/s]preprocess train dataset:   8% 22261/281241 [03:17<27:37, 156.20ex/s]preprocess train dataset:   8% 22278/281241 [03:17<27:52, 154.81ex/s]preprocess train dataset:   8% 22294/281241 [03:17<27:46, 155.38ex/s]preprocess train dataset:   8% 22311/281241 [03:17<27:17, 158.11ex/s]preprocess train dataset:   8% 22328/281241 [03:17<27:20, 157.86ex/s]preprocess train dataset:   8% 22344/281241 [03:17<28:00, 154.06ex/s]preprocess train dataset:   8% 22361/281241 [03:17<27:27, 157.18ex/s]preprocess train dataset:   8% 22377/281241 [03:17<27:43, 155.60ex/s]preprocess train dataset:   8% 22393/281241 [03:18<27:42, 155.73ex/s]preprocess train dataset:   8% 22410/281241 [03:18<27:29, 156.93ex/s]preprocess train dataset:   8% 22429/281241 [03:18<26:14, 164.35ex/s]preprocess train dataset:   8% 22447/281241 [03:18<25:43, 167.65ex/s]preprocess train dataset:   8% 22465/281241 [03:18<25:16, 170.59ex/s]preprocess train dataset:   8% 22483/281241 [03:18<25:29, 169.20ex/s]preprocess train dataset:   8% 22501/281241 [03:18<25:27, 169.33ex/s]preprocess train dataset:   8% 22521/281241 [03:18<24:33, 175.54ex/s]preprocess train dataset:   8% 22539/281241 [03:18<25:03, 172.09ex/s]preprocess train dataset:   8% 22557/281241 [03:19<26:03, 165.41ex/s]preprocess train dataset:   8% 22574/281241 [03:19<25:59, 165.87ex/s]preprocess train dataset:   8% 22591/281241 [03:19<26:05, 165.27ex/s]preprocess train dataset:   8% 22608/281241 [03:19<26:38, 161.75ex/s]preprocess train dataset:   8% 22626/281241 [03:19<25:58, 165.98ex/s]preprocess train dataset:   8% 22644/281241 [03:19<25:38, 168.12ex/s]preprocess train dataset:   8% 22662/281241 [03:19<25:17, 170.45ex/s]preprocess train dataset:   8% 22680/281241 [03:19<25:10, 171.14ex/s]preprocess train dataset:   8% 22698/281241 [03:19<25:16, 170.44ex/s]preprocess train dataset:   8% 22716/281241 [03:20<26:29, 162.68ex/s]preprocess train dataset:   8% 22733/281241 [03:20<28:33, 150.83ex/s]preprocess train dataset:   8% 22749/281241 [03:20<28:09, 153.02ex/s]preprocess train dataset:   8% 22765/281241 [03:20<28:27, 151.38ex/s]preprocess train dataset:   8% 22781/281241 [03:20<29:12, 147.50ex/s]preprocess train dataset:   8% 22796/281241 [03:20<29:27, 146.23ex/s]preprocess train dataset:   8% 22811/281241 [03:20<30:10, 142.70ex/s]preprocess train dataset:   8% 22828/281241 [03:20<29:07, 147.88ex/s]preprocess train dataset:   8% 22844/281241 [03:20<28:43, 149.90ex/s]preprocess train dataset:   8% 22860/281241 [03:21<28:52, 149.16ex/s]preprocess train dataset:   8% 22876/281241 [03:21<28:36, 150.54ex/s]preprocess train dataset:   8% 22893/281241 [03:21<27:53, 154.37ex/s]preprocess train dataset:   8% 22909/281241 [03:21<28:20, 151.96ex/s]preprocess train dataset:   8% 22926/281241 [03:21<27:31, 156.42ex/s]preprocess train dataset:   8% 22942/281241 [03:21<27:59, 153.80ex/s]preprocess train dataset:   8% 22958/281241 [03:21<27:53, 154.30ex/s]preprocess train dataset:   8% 22974/281241 [03:21<28:00, 153.68ex/s]preprocess train dataset:   8% 22990/281241 [03:21<28:02, 153.45ex/s]preprocess train dataset:   8% 23006/281241 [03:24<4:08:04, 17.35ex/s]preprocess train dataset:   8% 23021/281241 [03:24<3:05:48, 23.16ex/s]preprocess train dataset:   8% 23037/281241 [03:24<2:17:46, 31.23ex/s]preprocess train dataset:   8% 23055/281241 [03:25<1:40:38, 42.76ex/s]preprocess train dataset:   8% 23071/281241 [03:25<1:19:24, 54.19ex/s]preprocess train dataset:   8% 23087/281241 [03:25<1:04:27, 66.74ex/s]preprocess train dataset:   8% 23106/281241 [03:25<50:52, 84.55ex/s]  preprocess train dataset:   8% 23123/281241 [03:25<43:33, 98.75ex/s]preprocess train dataset:   8% 23139/281241 [03:25<38:57, 110.40ex/s]preprocess train dataset:   8% 23157/281241 [03:25<34:25, 124.93ex/s]preprocess train dataset:   8% 23175/281241 [03:25<31:20, 137.27ex/s]preprocess train dataset:   8% 23192/281241 [03:25<29:58, 143.48ex/s]preprocess train dataset:   8% 23210/281241 [03:25<28:16, 152.06ex/s]preprocess train dataset:   8% 23227/281241 [03:26<28:00, 153.50ex/s]preprocess train dataset:   8% 23244/281241 [03:26<27:13, 157.91ex/s]preprocess train dataset:   8% 23262/281241 [03:26<26:27, 162.47ex/s]preprocess train dataset:   8% 23279/281241 [03:26<26:21, 163.13ex/s]preprocess train dataset:   8% 23296/281241 [03:26<26:03, 165.00ex/s]preprocess train dataset:   8% 23314/281241 [03:26<25:39, 167.58ex/s]preprocess train dataset:   8% 23332/281241 [03:26<25:13, 170.46ex/s]preprocess train dataset:   8% 23350/281241 [03:26<25:43, 167.11ex/s]preprocess train dataset:   8% 23368/281241 [03:26<25:35, 167.98ex/s]preprocess train dataset:   8% 23385/281241 [03:26<25:57, 165.54ex/s]preprocess train dataset:   8% 23402/281241 [03:27<26:48, 160.27ex/s]preprocess train dataset:   8% 23419/281241 [03:27<26:54, 159.74ex/s]preprocess train dataset:   8% 23437/281241 [03:27<26:09, 164.29ex/s]preprocess train dataset:   8% 23459/281241 [03:27<24:08, 177.95ex/s]preprocess train dataset:   8% 23477/281241 [03:27<24:51, 172.77ex/s]preprocess train dataset:   8% 23497/281241 [03:27<23:57, 179.31ex/s]preprocess train dataset:   8% 23518/281241 [03:27<22:52, 187.75ex/s]preprocess train dataset:   8% 23545/281241 [03:27<20:21, 210.88ex/s]preprocess train dataset:   8% 23568/281241 [03:27<19:50, 216.36ex/s]preprocess train dataset:   8% 23590/281241 [03:28<20:05, 213.77ex/s]preprocess train dataset:   8% 23617/281241 [03:28<18:56, 226.60ex/s]preprocess train dataset:   8% 23640/281241 [03:28<21:06, 203.41ex/s]preprocess train dataset:   8% 23661/281241 [03:28<22:27, 191.09ex/s]preprocess train dataset:   8% 23681/281241 [03:28<23:12, 184.94ex/s]preprocess train dataset:   8% 23700/281241 [03:28<23:24, 183.32ex/s]preprocess train dataset:   8% 23722/281241 [03:28<22:15, 192.77ex/s]preprocess train dataset:   8% 23742/281241 [03:28<22:25, 191.42ex/s]preprocess train dataset:   8% 23762/281241 [03:28<22:57, 186.96ex/s]preprocess train dataset:   8% 23781/281241 [03:29<23:16, 184.35ex/s]preprocess train dataset:   8% 23800/281241 [03:29<23:43, 180.85ex/s]preprocess train dataset:   8% 23819/281241 [03:29<23:23, 183.41ex/s]preprocess train dataset:   8% 23838/281241 [03:29<23:18, 184.11ex/s]preprocess train dataset:   8% 23857/281241 [03:29<24:12, 177.14ex/s]preprocess train dataset:   8% 23875/281241 [03:29<24:48, 172.93ex/s]preprocess train dataset:   8% 23893/281241 [03:29<24:39, 173.91ex/s]preprocess train dataset:   9% 23911/281241 [03:29<24:44, 173.31ex/s]preprocess train dataset:   9% 23930/281241 [03:29<24:28, 175.23ex/s]preprocess train dataset:   9% 23948/281241 [03:30<24:35, 174.40ex/s]preprocess train dataset:   9% 23967/281241 [03:30<24:00, 178.55ex/s]preprocess train dataset:   9% 23988/281241 [03:30<23:17, 184.04ex/s]preprocess train dataset:   9% 24007/281241 [03:32<3:18:44, 21.57ex/s]preprocess train dataset:   9% 24025/281241 [03:33<2:28:58, 28.78ex/s]preprocess train dataset:   9% 24043/281241 [03:33<1:53:03, 37.92ex/s]preprocess train dataset:   9% 24059/281241 [03:33<1:30:02, 47.61ex/s]preprocess train dataset:   9% 24094/281241 [03:33<54:41, 78.37ex/s]  preprocess train dataset:   9% 24128/281241 [03:33<38:37, 110.95ex/s]preprocess train dataset:   9% 24153/281241 [03:33<33:17, 128.72ex/s]preprocess train dataset:   9% 24177/281241 [03:33<31:50, 134.56ex/s]preprocess train dataset:   9% 24198/281241 [03:33<29:35, 144.77ex/s]preprocess train dataset:   9% 24219/281241 [03:33<28:45, 148.94ex/s]preprocess train dataset:   9% 24240/281241 [03:34<26:47, 159.88ex/s]preprocess train dataset:   9% 24260/281241 [03:34<25:57, 165.02ex/s]preprocess train dataset:   9% 24279/281241 [03:34<26:45, 160.05ex/s]preprocess train dataset:   9% 24297/281241 [03:34<26:45, 160.01ex/s]preprocess train dataset:   9% 24315/281241 [03:34<27:13, 157.25ex/s]preprocess train dataset:   9% 24333/281241 [03:34<26:32, 161.28ex/s]preprocess train dataset:   9% 24351/281241 [03:34<26:11, 163.49ex/s]preprocess train dataset:   9% 24368/281241 [03:34<26:30, 161.52ex/s]preprocess train dataset:   9% 24385/281241 [03:34<26:16, 162.91ex/s]preprocess train dataset:   9% 24403/281241 [03:35<25:46, 166.04ex/s]preprocess train dataset:   9% 24424/281241 [03:35<24:08, 177.30ex/s]preprocess train dataset:   9% 24445/281241 [03:35<23:06, 185.26ex/s]preprocess train dataset:   9% 24464/281241 [03:35<23:00, 186.00ex/s]preprocess train dataset:   9% 24483/281241 [03:35<23:43, 180.43ex/s]preprocess train dataset:   9% 24505/281241 [03:35<22:34, 189.56ex/s]preprocess train dataset:   9% 24525/281241 [03:35<22:17, 191.90ex/s]preprocess train dataset:   9% 24545/281241 [03:35<23:36, 181.17ex/s]preprocess train dataset:   9% 24564/281241 [03:35<23:58, 178.40ex/s]preprocess train dataset:   9% 24582/281241 [03:36<24:00, 178.20ex/s]preprocess train dataset:   9% 24600/281241 [03:36<24:28, 174.80ex/s]preprocess train dataset:   9% 24618/281241 [03:36<24:56, 171.47ex/s]preprocess train dataset:   9% 24636/281241 [03:36<25:56, 164.90ex/s]preprocess train dataset:   9% 24653/281241 [03:36<26:22, 162.12ex/s]preprocess train dataset:   9% 24671/281241 [03:36<25:53, 165.14ex/s]preprocess train dataset:   9% 24688/281241 [03:36<25:54, 165.08ex/s]preprocess train dataset:   9% 24705/281241 [03:36<25:44, 166.08ex/s]preprocess train dataset:   9% 24722/281241 [03:36<26:33, 160.96ex/s]preprocess train dataset:   9% 24743/281241 [03:37<24:50, 172.05ex/s]preprocess train dataset:   9% 24761/281241 [03:37<24:53, 171.69ex/s]preprocess train dataset:   9% 24780/281241 [03:37<24:09, 176.90ex/s]preprocess train dataset:   9% 24799/281241 [03:37<23:42, 180.33ex/s]preprocess train dataset:   9% 24818/281241 [03:37<24:04, 177.51ex/s]preprocess train dataset:   9% 24837/281241 [03:37<23:43, 180.07ex/s]preprocess train dataset:   9% 24856/281241 [03:37<23:29, 181.90ex/s]preprocess train dataset:   9% 24875/281241 [03:37<23:21, 182.86ex/s]preprocess train dataset:   9% 24894/281241 [03:37<23:11, 184.18ex/s]preprocess train dataset:   9% 24913/281241 [03:37<24:08, 177.00ex/s]preprocess train dataset:   9% 24931/281241 [03:38<25:01, 170.65ex/s]preprocess train dataset:   9% 24949/281241 [03:38<25:45, 165.84ex/s]preprocess train dataset:   9% 24966/281241 [03:38<26:39, 160.21ex/s]preprocess train dataset:   9% 24984/281241 [03:38<25:57, 164.55ex/s]preprocess train dataset:   9% 25001/281241 [03:40<3:22:36, 21.08ex/s]preprocess train dataset:   9% 25016/281241 [03:41<2:36:14, 27.33ex/s]preprocess train dataset:   9% 25032/281241 [03:41<1:58:52, 35.92ex/s]preprocess train dataset:   9% 25049/281241 [03:41<1:30:46, 47.04ex/s]preprocess train dataset:   9% 25064/281241 [03:41<1:13:29, 58.10ex/s]preprocess train dataset:   9% 25081/281241 [03:41<58:40, 72.76ex/s]  preprocess train dataset:   9% 25097/281241 [03:41<49:51, 85.61ex/s]preprocess train dataset:   9% 25114/281241 [03:41<42:30, 100.43ex/s]preprocess train dataset:   9% 25130/281241 [03:41<38:18, 111.44ex/s]preprocess train dataset:   9% 25148/281241 [03:41<33:58, 125.65ex/s]preprocess train dataset:   9% 25164/281241 [03:42<32:15, 132.30ex/s]preprocess train dataset:   9% 25180/281241 [03:42<31:13, 136.65ex/s]preprocess train dataset:   9% 25196/281241 [03:42<30:06, 141.75ex/s]preprocess train dataset:   9% 25212/281241 [03:42<29:23, 145.15ex/s]preprocess train dataset:   9% 25231/281241 [03:42<27:29, 155.23ex/s]preprocess train dataset:   9% 25249/281241 [03:42<26:21, 161.85ex/s]preprocess train dataset:   9% 25267/281241 [03:42<25:37, 166.49ex/s]preprocess train dataset:   9% 25286/281241 [03:42<24:54, 171.22ex/s]preprocess train dataset:   9% 25304/281241 [03:42<25:57, 164.36ex/s]preprocess train dataset:   9% 25321/281241 [03:42<25:55, 164.56ex/s]preprocess train dataset:   9% 25338/281241 [03:43<25:41, 165.96ex/s]preprocess train dataset:   9% 25357/281241 [03:43<25:07, 169.78ex/s]preprocess train dataset:   9% 25375/281241 [03:43<25:37, 166.37ex/s]preprocess train dataset:   9% 25392/281241 [03:43<26:24, 161.44ex/s]preprocess train dataset:   9% 25409/281241 [03:43<26:37, 160.14ex/s]preprocess train dataset:   9% 25426/281241 [03:43<27:05, 157.39ex/s]preprocess train dataset:   9% 25442/281241 [03:43<27:16, 156.34ex/s]preprocess train dataset:   9% 25459/281241 [03:43<26:58, 158.06ex/s]preprocess train dataset:   9% 25477/281241 [03:43<26:09, 162.95ex/s]preprocess train dataset:   9% 25494/281241 [03:44<26:10, 162.85ex/s]preprocess train dataset:   9% 25512/281241 [03:44<25:25, 167.67ex/s]preprocess train dataset:   9% 25529/281241 [03:44<25:39, 166.06ex/s]preprocess train dataset:   9% 25547/281241 [03:44<25:34, 166.67ex/s]preprocess train dataset:   9% 25564/281241 [03:44<25:44, 165.54ex/s]preprocess train dataset:   9% 25581/281241 [03:44<26:07, 163.11ex/s]preprocess train dataset:   9% 25598/281241 [03:44<26:06, 163.19ex/s]preprocess train dataset:   9% 25615/281241 [03:44<26:14, 162.39ex/s]preprocess train dataset:   9% 25632/281241 [03:44<26:56, 158.12ex/s]preprocess train dataset:   9% 25649/281241 [03:44<26:23, 161.43ex/s]preprocess train dataset:   9% 25666/281241 [03:45<26:20, 161.72ex/s]preprocess train dataset:   9% 25683/281241 [03:45<26:03, 163.40ex/s]preprocess train dataset:   9% 25700/281241 [03:45<26:35, 160.14ex/s]preprocess train dataset:   9% 25717/281241 [03:45<27:05, 157.21ex/s]preprocess train dataset:   9% 25733/281241 [03:45<27:16, 156.11ex/s]preprocess train dataset:   9% 25750/281241 [03:45<26:40, 159.66ex/s]preprocess train dataset:   9% 25767/281241 [03:45<26:27, 160.96ex/s]preprocess train dataset:   9% 25784/281241 [03:45<27:04, 157.26ex/s]preprocess train dataset:   9% 25801/281241 [03:45<26:46, 159.02ex/s]preprocess train dataset:   9% 25818/281241 [03:46<26:32, 160.35ex/s]preprocess train dataset:   9% 25840/281241 [03:46<24:18, 175.10ex/s]preprocess train dataset:   9% 25858/281241 [03:46<25:08, 169.25ex/s]preprocess train dataset:   9% 25875/281241 [03:46<25:19, 168.11ex/s]preprocess train dataset:   9% 25894/281241 [03:46<24:25, 174.20ex/s]preprocess train dataset:   9% 25914/281241 [03:46<23:28, 181.26ex/s]preprocess train dataset:   9% 25933/281241 [03:46<23:14, 183.13ex/s]preprocess train dataset:   9% 25952/281241 [03:46<23:23, 181.91ex/s]preprocess train dataset:   9% 25972/281241 [03:46<23:04, 184.33ex/s]preprocess train dataset:   9% 25991/281241 [03:46<23:17, 182.60ex/s]preprocess train dataset:   9% 26010/281241 [03:50<3:58:29, 17.84ex/s]preprocess train dataset:   9% 26027/281241 [03:50<2:59:42, 23.67ex/s]preprocess train dataset:   9% 26043/281241 [03:50<2:18:35, 30.69ex/s]preprocess train dataset:   9% 26063/281241 [03:50<1:40:42, 42.23ex/s]preprocess train dataset:   9% 26081/281241 [03:50<1:17:59, 54.52ex/s]preprocess train dataset:   9% 26099/281241 [03:50<1:02:21, 68.19ex/s]preprocess train dataset:   9% 26117/281241 [03:50<51:07, 83.17ex/s]  preprocess train dataset:   9% 26135/281241 [03:51<43:22, 98.02ex/s]preprocess train dataset:   9% 26155/281241 [03:51<36:36, 116.13ex/s]preprocess train dataset:   9% 26178/281241 [03:51<30:27, 139.61ex/s]preprocess train dataset:   9% 26198/281241 [03:51<27:51, 152.54ex/s]preprocess train dataset:   9% 26218/281241 [03:51<27:39, 153.66ex/s]preprocess train dataset:   9% 26237/281241 [03:51<27:45, 153.12ex/s]preprocess train dataset:   9% 26255/281241 [03:51<26:40, 159.29ex/s]preprocess train dataset:   9% 26273/281241 [03:51<27:05, 156.82ex/s]preprocess train dataset:   9% 26290/281241 [03:51<26:40, 159.29ex/s]preprocess train dataset:   9% 26307/281241 [03:52<26:52, 158.11ex/s]preprocess train dataset:   9% 26324/281241 [03:52<26:26, 160.63ex/s]preprocess train dataset:   9% 26341/281241 [03:52<26:57, 157.56ex/s]preprocess train dataset:   9% 26358/281241 [03:52<26:49, 158.36ex/s]preprocess train dataset:   9% 26375/281241 [03:52<27:00, 157.32ex/s]preprocess train dataset:   9% 26392/281241 [03:52<26:44, 158.87ex/s]preprocess train dataset:   9% 26408/281241 [03:52<26:59, 157.35ex/s]preprocess train dataset:   9% 26426/281241 [03:52<26:01, 163.21ex/s]preprocess train dataset:   9% 26444/281241 [03:52<25:29, 166.62ex/s]preprocess train dataset:   9% 26462/281241 [03:52<25:18, 167.78ex/s]preprocess train dataset:   9% 26480/281241 [03:53<24:55, 170.38ex/s]preprocess train dataset:   9% 26498/281241 [03:53<25:18, 167.78ex/s]preprocess train dataset:   9% 26515/281241 [03:53<25:38, 165.55ex/s]preprocess train dataset:   9% 26532/281241 [03:53<26:02, 163.03ex/s]preprocess train dataset:   9% 26549/281241 [03:53<25:54, 163.85ex/s]preprocess train dataset:   9% 26567/281241 [03:53<25:15, 168.08ex/s]preprocess train dataset:   9% 26584/281241 [03:53<25:31, 166.26ex/s]preprocess train dataset:   9% 26601/281241 [03:53<25:44, 164.85ex/s]preprocess train dataset:   9% 26618/281241 [03:53<26:20, 161.07ex/s]preprocess train dataset:   9% 26637/281241 [03:54<25:04, 169.27ex/s]preprocess train dataset:   9% 26654/281241 [03:54<25:21, 167.32ex/s]preprocess train dataset:   9% 26672/281241 [03:54<25:15, 168.00ex/s]preprocess train dataset:   9% 26689/281241 [03:54<25:34, 165.87ex/s]preprocess train dataset:   9% 26707/281241 [03:54<25:18, 167.57ex/s]preprocess train dataset:  10% 26725/281241 [03:54<24:48, 170.97ex/s]preprocess train dataset:  10% 26744/281241 [03:54<24:21, 174.19ex/s]preprocess train dataset:  10% 26765/281241 [03:54<23:30, 180.46ex/s]preprocess train dataset:  10% 26784/281241 [03:54<23:42, 178.85ex/s]preprocess train dataset:  10% 26802/281241 [03:54<24:20, 174.19ex/s]preprocess train dataset:  10% 26820/281241 [03:55<25:34, 165.81ex/s]preprocess train dataset:  10% 26837/281241 [03:55<26:20, 160.98ex/s]preprocess train dataset:  10% 26854/281241 [03:55<27:37, 153.48ex/s]preprocess train dataset:  10% 26870/281241 [03:55<28:54, 146.68ex/s]preprocess train dataset:  10% 26885/281241 [03:55<29:16, 144.81ex/s]preprocess train dataset:  10% 26900/281241 [03:55<29:06, 145.60ex/s]preprocess train dataset:  10% 26918/281241 [03:55<27:37, 153.48ex/s]preprocess train dataset:  10% 26934/281241 [03:55<29:17, 144.72ex/s]preprocess train dataset:  10% 26949/281241 [03:56<29:31, 143.55ex/s]preprocess train dataset:  10% 26965/281241 [03:56<28:39, 147.85ex/s]preprocess train dataset:  10% 26981/281241 [03:56<28:31, 148.59ex/s]preprocess train dataset:  10% 26996/281241 [03:56<29:29, 143.66ex/s]preprocess train dataset:  10% 27011/281241 [03:59<4:28:22, 15.79ex/s]preprocess train dataset:  10% 27026/281241 [03:59<3:18:06, 21.39ex/s]preprocess train dataset:  10% 27043/281241 [03:59<2:22:54, 29.64ex/s]preprocess train dataset:  10% 27059/281241 [03:59<1:47:51, 39.27ex/s]preprocess train dataset:  10% 27077/281241 [03:59<1:20:33, 52.58ex/s]preprocess train dataset:  10% 27094/281241 [03:59<1:03:58, 66.20ex/s]preprocess train dataset:  10% 27112/281241 [03:59<51:20, 82.49ex/s]  preprocess train dataset:  10% 27128/281241 [04:00<44:16, 95.66ex/s]preprocess train dataset:  10% 27146/281241 [04:00<38:09, 110.98ex/s]preprocess train dataset:  10% 27163/281241 [04:00<34:37, 122.31ex/s]preprocess train dataset:  10% 27182/281241 [04:00<31:07, 136.07ex/s]preprocess train dataset:  10% 27199/281241 [04:00<30:30, 138.78ex/s]preprocess train dataset:  10% 27216/281241 [04:00<29:03, 145.72ex/s]preprocess train dataset:  10% 27233/281241 [04:00<27:58, 151.31ex/s]preprocess train dataset:  10% 27251/281241 [04:00<27:03, 156.45ex/s]preprocess train dataset:  10% 27268/281241 [04:00<27:03, 156.42ex/s]preprocess train dataset:  10% 27285/281241 [04:01<26:45, 158.14ex/s]preprocess train dataset:  10% 27303/281241 [04:01<25:50, 163.81ex/s]preprocess train dataset:  10% 27320/281241 [04:01<26:12, 161.48ex/s]preprocess train dataset:  10% 27337/281241 [04:01<26:17, 160.93ex/s]preprocess train dataset:  10% 27354/281241 [04:01<26:21, 160.55ex/s]preprocess train dataset:  10% 27371/281241 [04:01<26:08, 161.81ex/s]preprocess train dataset:  10% 27388/281241 [04:01<26:18, 160.86ex/s]preprocess train dataset:  10% 27407/281241 [04:01<25:29, 165.95ex/s]preprocess train dataset:  10% 27425/281241 [04:01<25:03, 168.85ex/s]preprocess train dataset:  10% 27443/281241 [04:01<24:45, 170.87ex/s]preprocess train dataset:  10% 27462/281241 [04:02<24:02, 175.90ex/s]preprocess train dataset:  10% 27482/281241 [04:02<23:22, 180.99ex/s]preprocess train dataset:  10% 27501/281241 [04:02<23:34, 179.41ex/s]preprocess train dataset:  10% 27519/281241 [04:02<24:05, 175.56ex/s]preprocess train dataset:  10% 27537/281241 [04:02<24:33, 172.17ex/s]preprocess train dataset:  10% 27557/281241 [04:02<23:38, 178.81ex/s]preprocess train dataset:  10% 27575/281241 [04:02<24:02, 175.82ex/s]preprocess train dataset:  10% 27593/281241 [04:02<25:10, 167.96ex/s]preprocess train dataset:  10% 27610/281241 [04:02<25:09, 168.05ex/s]preprocess train dataset:  10% 27627/281241 [04:03<26:25, 159.99ex/s]preprocess train dataset:  10% 27644/281241 [04:03<26:59, 156.59ex/s]preprocess train dataset:  10% 27660/281241 [04:03<26:56, 156.91ex/s]preprocess train dataset:  10% 27676/281241 [04:03<26:58, 156.66ex/s]preprocess train dataset:  10% 27694/281241 [04:03<26:03, 162.13ex/s]preprocess train dataset:  10% 27714/281241 [04:03<24:28, 172.66ex/s]preprocess train dataset:  10% 27734/281241 [04:03<23:42, 178.20ex/s]preprocess train dataset:  10% 27755/281241 [04:03<22:52, 184.73ex/s]preprocess train dataset:  10% 27775/281241 [04:03<22:26, 188.27ex/s]preprocess train dataset:  10% 27798/281241 [04:03<21:17, 198.32ex/s]preprocess train dataset:  10% 27818/281241 [04:04<22:15, 189.72ex/s]preprocess train dataset:  10% 27838/281241 [04:04<23:11, 182.12ex/s]preprocess train dataset:  10% 27857/281241 [04:04<25:22, 166.40ex/s]preprocess train dataset:  10% 27874/281241 [04:04<26:30, 159.29ex/s]preprocess train dataset:  10% 27891/281241 [04:04<27:40, 152.57ex/s]preprocess train dataset:  10% 27907/281241 [04:04<28:12, 149.69ex/s]preprocess train dataset:  10% 27923/281241 [04:04<28:21, 148.91ex/s]preprocess train dataset:  10% 27941/281241 [04:04<27:11, 155.25ex/s]preprocess train dataset:  10% 27960/281241 [04:05<25:42, 164.24ex/s]preprocess train dataset:  10% 27982/281241 [04:05<23:34, 179.04ex/s]preprocess train dataset:  10% 28001/281241 [04:07<3:14:27, 21.70ex/s]preprocess train dataset:  10% 28020/281241 [04:07<2:22:58, 29.52ex/s]preprocess train dataset:  10% 28038/281241 [04:08<1:48:47, 38.79ex/s]preprocess train dataset:  10% 28057/281241 [04:08<1:22:38, 51.06ex/s]preprocess train dataset:  10% 28074/281241 [04:08<1:06:30, 63.45ex/s]preprocess train dataset:  10% 28091/281241 [04:08<54:50, 76.94ex/s]  preprocess train dataset:  10% 28109/281241 [04:08<45:27, 92.82ex/s]preprocess train dataset:  10% 28129/281241 [04:08<37:59, 111.04ex/s]preprocess train dataset:  10% 28152/281241 [04:08<31:23, 134.36ex/s]preprocess train dataset:  10% 28171/281241 [04:08<28:48, 146.38ex/s]preprocess train dataset:  10% 28190/281241 [04:08<27:52, 151.32ex/s]preprocess train dataset:  10% 28209/281241 [04:08<27:30, 153.28ex/s]preprocess train dataset:  10% 28227/281241 [04:09<27:33, 153.04ex/s]preprocess train dataset:  10% 28244/281241 [04:09<27:02, 155.97ex/s]preprocess train dataset:  10% 28261/281241 [04:09<26:29, 159.12ex/s]preprocess train dataset:  10% 28278/281241 [04:09<26:52, 156.90ex/s]preprocess train dataset:  10% 28295/281241 [04:09<26:23, 159.76ex/s]preprocess train dataset:  10% 28312/281241 [04:09<26:01, 162.03ex/s]preprocess train dataset:  10% 28330/281241 [04:09<25:23, 165.99ex/s]preprocess train dataset:  10% 28347/281241 [04:09<25:59, 162.14ex/s]preprocess train dataset:  10% 28364/281241 [04:09<26:12, 160.84ex/s]preprocess train dataset:  10% 28384/281241 [04:10<24:51, 169.52ex/s]preprocess train dataset:  10% 28402/281241 [04:10<24:38, 170.98ex/s]preprocess train dataset:  10% 28422/281241 [04:10<23:47, 177.07ex/s]preprocess train dataset:  10% 28440/281241 [04:10<24:41, 170.61ex/s]preprocess train dataset:  10% 28458/281241 [04:10<24:27, 172.24ex/s]preprocess train dataset:  10% 28476/281241 [04:10<25:32, 164.98ex/s]preprocess train dataset:  10% 28495/281241 [04:10<24:33, 171.58ex/s]preprocess train dataset:  10% 28514/281241 [04:10<23:56, 175.93ex/s]preprocess train dataset:  10% 28533/281241 [04:10<23:47, 177.06ex/s]preprocess train dataset:  10% 28551/281241 [04:11<25:05, 167.90ex/s]preprocess train dataset:  10% 28569/281241 [04:11<25:00, 168.43ex/s]preprocess train dataset:  10% 28586/281241 [04:11<25:15, 166.76ex/s]preprocess train dataset:  10% 28603/281241 [04:11<25:27, 165.40ex/s]preprocess train dataset:  10% 28620/281241 [04:11<25:22, 165.96ex/s]preprocess train dataset:  10% 28639/281241 [04:11<24:25, 172.35ex/s]preprocess train dataset:  10% 28659/281241 [04:11<23:36, 178.36ex/s]preprocess train dataset:  10% 28679/281241 [04:11<23:07, 182.07ex/s]preprocess train dataset:  10% 28698/281241 [04:11<23:28, 179.31ex/s]preprocess train dataset:  10% 28716/281241 [04:11<23:51, 176.38ex/s]preprocess train dataset:  10% 28735/281241 [04:12<23:41, 177.58ex/s]preprocess train dataset:  10% 28753/281241 [04:12<23:46, 176.99ex/s]preprocess train dataset:  10% 28771/281241 [04:12<24:34, 171.21ex/s]preprocess train dataset:  10% 28789/281241 [04:12<24:31, 171.61ex/s]preprocess train dataset:  10% 28807/281241 [04:12<25:36, 164.32ex/s]preprocess train dataset:  10% 28824/281241 [04:12<26:16, 160.09ex/s]preprocess train dataset:  10% 28841/281241 [04:12<26:28, 158.93ex/s]preprocess train dataset:  10% 28857/281241 [04:12<26:36, 158.07ex/s]preprocess train dataset:  10% 28875/281241 [04:12<26:05, 161.20ex/s]preprocess train dataset:  10% 28892/281241 [04:13<26:47, 157.00ex/s]preprocess train dataset:  10% 28910/281241 [04:13<26:14, 160.29ex/s]preprocess train dataset:  10% 28927/281241 [04:13<25:54, 162.28ex/s]preprocess train dataset:  10% 28944/281241 [04:13<25:48, 162.96ex/s]preprocess train dataset:  10% 28964/281241 [04:13<24:25, 172.14ex/s]preprocess train dataset:  10% 28983/281241 [04:13<23:50, 176.32ex/s]preprocess train dataset:  10% 29001/281241 [04:16<3:32:08, 19.82ex/s]preprocess train dataset:  10% 29017/281241 [04:16<2:41:33, 26.02ex/s]preprocess train dataset:  10% 29034/281241 [04:16<2:01:45, 34.52ex/s]preprocess train dataset:  10% 29050/281241 [04:16<1:34:59, 44.25ex/s]preprocess train dataset:  10% 29066/281241 [04:16<1:15:17, 55.82ex/s]preprocess train dataset:  10% 29084/281241 [04:16<59:08, 71.06ex/s]  preprocess train dataset:  10% 29100/281241 [04:17<49:56, 84.15ex/s]preprocess train dataset:  10% 29119/281241 [04:17<40:57, 102.59ex/s]preprocess train dataset:  10% 29139/281241 [04:17<34:52, 120.50ex/s]preprocess train dataset:  10% 29158/281241 [04:17<30:56, 135.79ex/s]preprocess train dataset:  10% 29176/281241 [04:17<29:20, 143.19ex/s]preprocess train dataset:  10% 29195/281241 [04:17<27:13, 154.27ex/s]preprocess train dataset:  10% 29213/281241 [04:17<26:11, 160.33ex/s]preprocess train dataset:  10% 29232/281241 [04:17<25:02, 167.72ex/s]preprocess train dataset:  10% 29253/281241 [04:17<23:30, 178.69ex/s]preprocess train dataset:  10% 29274/281241 [04:17<22:49, 183.95ex/s]preprocess train dataset:  10% 29294/281241 [04:18<22:45, 184.47ex/s]preprocess train dataset:  10% 29313/281241 [04:18<23:50, 176.10ex/s]preprocess train dataset:  10% 29331/281241 [04:18<24:08, 173.94ex/s]preprocess train dataset:  10% 29349/281241 [04:18<24:36, 170.65ex/s]preprocess train dataset:  10% 29368/281241 [04:18<23:54, 175.63ex/s]preprocess train dataset:  10% 29386/281241 [04:18<23:49, 176.16ex/s]preprocess train dataset:  10% 29405/281241 [04:18<23:35, 177.89ex/s]preprocess train dataset:  10% 29423/281241 [04:18<23:56, 175.30ex/s]preprocess train dataset:  10% 29441/281241 [04:18<24:09, 173.70ex/s]preprocess train dataset:  10% 29461/281241 [04:19<23:23, 179.38ex/s]preprocess train dataset:  10% 29479/281241 [04:19<23:30, 178.54ex/s]preprocess train dataset:  10% 29500/281241 [04:19<22:30, 186.39ex/s]preprocess train dataset:  10% 29519/281241 [04:19<23:52, 175.73ex/s]preprocess train dataset:  11% 29537/281241 [04:19<24:00, 174.72ex/s]preprocess train dataset:  11% 29555/281241 [04:19<24:32, 170.93ex/s]preprocess train dataset:  11% 29574/281241 [04:19<23:58, 174.96ex/s]preprocess train dataset:  11% 29592/281241 [04:19<24:01, 174.61ex/s]preprocess train dataset:  11% 29610/281241 [04:19<24:41, 169.84ex/s]preprocess train dataset:  11% 29628/281241 [04:19<24:59, 167.75ex/s]preprocess train dataset:  11% 29649/281241 [04:20<23:50, 175.94ex/s]preprocess train dataset:  11% 29667/281241 [04:20<24:06, 173.92ex/s]preprocess train dataset:  11% 29686/281241 [04:20<23:32, 178.10ex/s]preprocess train dataset:  11% 29709/281241 [04:20<21:58, 190.72ex/s]preprocess train dataset:  11% 29729/281241 [04:20<23:01, 182.00ex/s]preprocess train dataset:  11% 29748/281241 [04:20<23:23, 179.20ex/s]preprocess train dataset:  11% 29766/281241 [04:20<24:04, 174.11ex/s]preprocess train dataset:  11% 29784/281241 [04:20<25:55, 161.67ex/s]preprocess train dataset:  11% 29801/281241 [04:20<26:21, 158.95ex/s]preprocess train dataset:  11% 29819/281241 [04:21<25:33, 164.00ex/s]preprocess train dataset:  11% 29836/281241 [04:21<26:02, 160.95ex/s]preprocess train dataset:  11% 29853/281241 [04:21<27:37, 151.64ex/s]preprocess train dataset:  11% 29869/281241 [04:21<28:10, 148.67ex/s]preprocess train dataset:  11% 29885/281241 [04:21<27:55, 149.98ex/s]preprocess train dataset:  11% 29903/281241 [04:21<26:34, 157.66ex/s]preprocess train dataset:  11% 29920/281241 [04:21<26:23, 158.69ex/s]preprocess train dataset:  11% 29937/281241 [04:21<26:20, 159.03ex/s]preprocess train dataset:  11% 29955/281241 [04:21<25:26, 164.63ex/s]preprocess train dataset:  11% 29972/281241 [04:22<25:14, 165.90ex/s]preprocess train dataset:  11% 29989/281241 [04:22<26:00, 160.98ex/s]preprocess train dataset:  11% 30006/281241 [04:26<5:56:18, 11.75ex/s]preprocess train dataset:  11% 30023/281241 [04:26<4:17:19, 16.27ex/s]preprocess train dataset:  11% 30040/281241 [04:26<3:07:56, 22.28ex/s]preprocess train dataset:  11% 30057/281241 [04:27<2:19:20, 30.04ex/s]preprocess train dataset:  11% 30075/281241 [04:27<1:43:41, 40.37ex/s]preprocess train dataset:  11% 30093/281241 [04:27<1:19:08, 52.89ex/s]preprocess train dataset:  11% 30111/281241 [04:27<1:02:04, 67.42ex/s]preprocess train dataset:  11% 30129/281241 [04:27<50:40, 82.59ex/s]  preprocess train dataset:  11% 30149/281241 [04:27<41:17, 101.35ex/s]preprocess train dataset:  11% 30172/281241 [04:27<33:37, 124.44ex/s]preprocess train dataset:  11% 30192/281241 [04:27<29:55, 139.82ex/s]preprocess train dataset:  11% 30214/281241 [04:27<26:34, 157.38ex/s]preprocess train dataset:  11% 30234/281241 [04:28<25:19, 165.22ex/s]preprocess train dataset:  11% 30254/281241 [04:28<24:27, 171.09ex/s]preprocess train dataset:  11% 30274/281241 [04:28<24:44, 169.11ex/s]preprocess train dataset:  11% 30293/281241 [04:28<24:46, 168.78ex/s]preprocess train dataset:  11% 30311/281241 [04:28<24:49, 168.52ex/s]preprocess train dataset:  11% 30329/281241 [04:28<25:11, 166.01ex/s]preprocess train dataset:  11% 30348/281241 [04:28<24:21, 171.66ex/s]preprocess train dataset:  11% 30367/281241 [04:28<23:55, 174.79ex/s]preprocess train dataset:  11% 30385/281241 [04:28<24:44, 168.98ex/s]preprocess train dataset:  11% 30403/281241 [04:29<24:42, 169.21ex/s]preprocess train dataset:  11% 30421/281241 [04:29<24:44, 168.98ex/s]preprocess train dataset:  11% 30439/281241 [04:29<24:49, 168.41ex/s]preprocess train dataset:  11% 30457/281241 [04:29<24:27, 170.93ex/s]preprocess train dataset:  11% 30475/281241 [04:29<24:27, 170.90ex/s]preprocess train dataset:  11% 30494/281241 [04:29<23:42, 176.21ex/s]preprocess train dataset:  11% 30512/281241 [04:29<23:42, 176.30ex/s]preprocess train dataset:  11% 30530/281241 [04:29<24:41, 169.21ex/s]preprocess train dataset:  11% 30549/281241 [04:29<24:12, 172.59ex/s]preprocess train dataset:  11% 30567/281241 [04:29<24:16, 172.10ex/s]preprocess train dataset:  11% 30586/281241 [04:30<23:40, 176.42ex/s]preprocess train dataset:  11% 30604/281241 [04:30<23:51, 175.06ex/s]preprocess train dataset:  11% 30622/281241 [04:30<24:04, 173.48ex/s]preprocess train dataset:  11% 30640/281241 [04:30<27:04, 154.25ex/s]preprocess train dataset:  11% 30656/281241 [04:30<27:21, 152.63ex/s]preprocess train dataset:  11% 30672/281241 [04:30<27:22, 152.57ex/s]preprocess train dataset:  11% 30689/281241 [04:30<26:40, 156.58ex/s]preprocess train dataset:  11% 30707/281241 [04:30<25:37, 162.90ex/s]preprocess train dataset:  11% 30724/281241 [04:30<25:23, 164.48ex/s]preprocess train dataset:  11% 30742/281241 [04:31<24:56, 167.36ex/s]preprocess train dataset:  11% 30762/281241 [04:31<23:45, 175.69ex/s]preprocess train dataset:  11% 30784/281241 [04:31<22:35, 184.84ex/s]preprocess train dataset:  11% 30803/281241 [04:31<22:47, 183.09ex/s]preprocess train dataset:  11% 30822/281241 [04:31<22:58, 181.62ex/s]preprocess train dataset:  11% 30841/281241 [04:31<23:31, 177.45ex/s]preprocess train dataset:  11% 30860/281241 [04:31<23:09, 180.25ex/s]preprocess train dataset:  11% 30879/281241 [04:31<23:04, 180.85ex/s]preprocess train dataset:  11% 30898/281241 [04:31<23:20, 178.78ex/s]preprocess train dataset:  11% 30916/281241 [04:31<23:58, 174.00ex/s]preprocess train dataset:  11% 30936/281241 [04:32<23:10, 179.97ex/s]preprocess train dataset:  11% 30955/281241 [04:32<23:03, 180.94ex/s]preprocess train dataset:  11% 30974/281241 [04:32<23:39, 176.36ex/s]preprocess train dataset:  11% 30992/281241 [04:32<24:36, 169.48ex/s]preprocess train dataset:  11% 30992/281241 [04:50<24:36, 169.48ex/s]preprocess train dataset:  11% 31000/281241 [07:34<245:19:28,  3.53s/ex]preprocess train dataset:  11% 31015/281241 [07:34<173:35:40,  2.50s/ex]preprocess train dataset:  11% 31032/281241 [07:34<117:53:41,  1.70s/ex]preprocess train dataset:  11% 31049/281241 [07:35<80:54:15,  1.16s/ex] preprocess train dataset:  11% 31066/281241 [07:35<55:55:42,  1.24ex/s]preprocess train dataset:  11% 31083/281241 [07:35<38:53:26,  1.79ex/s]preprocess train dataset:  11% 31099/281241 [07:35<27:39:20,  2.51ex/s]preprocess train dataset:  11% 31115/281241 [07:35<19:39:15,  3.54ex/s]preprocess train dataset:  11% 31132/281241 [07:35<13:42:43,  5.07ex/s]preprocess train dataset:  11% 31149/281241 [07:35<9:38:35,  7.20ex/s] preprocess train dataset:  11% 31165/281241 [07:35<6:57:29,  9.98ex/s]preprocess train dataset:  11% 31181/281241 [07:35<5:02:26, 13.78ex/s]preprocess train dataset:  11% 31200/281241 [07:35<3:29:12, 19.92ex/s]preprocess train dataset:  11% 31217/281241 [07:36<2:34:08, 27.03ex/s]preprocess train dataset:  11% 31235/281241 [07:36<1:53:34, 36.69ex/s]preprocess train dataset:  11% 31252/281241 [07:36<1:27:40, 47.52ex/s]preprocess train dataset:  11% 31269/281241 [07:36<1:11:09, 58.54ex/s]preprocess train dataset:  11% 31285/281241 [07:36<59:03, 70.55ex/s]  preprocess train dataset:  11% 31301/281241 [07:36<50:43, 82.13ex/s]preprocess train dataset:  11% 31316/281241 [07:36<44:22, 93.88ex/s]preprocess train dataset:  11% 31331/281241 [07:36<40:35, 102.61ex/s]preprocess train dataset:  11% 31346/281241 [07:36<37:01, 112.47ex/s]preprocess train dataset:  11% 31362/281241 [07:37<33:43, 123.46ex/s]preprocess train dataset:  11% 31377/281241 [07:37<32:22, 128.66ex/s]preprocess train dataset:  11% 31392/281241 [07:37<32:06, 129.66ex/s]preprocess train dataset:  11% 31407/281241 [07:37<31:33, 131.92ex/s]preprocess train dataset:  11% 31422/281241 [07:37<30:54, 134.70ex/s]preprocess train dataset:  11% 31439/281241 [07:37<29:08, 142.84ex/s]preprocess train dataset:  11% 31459/281241 [07:37<26:23, 157.73ex/s]preprocess train dataset:  11% 31476/281241 [07:37<25:50, 161.08ex/s]preprocess train dataset:  11% 31494/281241 [07:37<25:07, 165.64ex/s]preprocess train dataset:  11% 31511/281241 [07:38<25:54, 160.65ex/s]preprocess train dataset:  11% 31528/281241 [07:38<27:48, 149.67ex/s]preprocess train dataset:  11% 31544/281241 [07:38<29:02, 143.27ex/s]preprocess train dataset:  11% 31559/281241 [07:38<29:19, 141.94ex/s]preprocess train dataset:  11% 31574/281241 [07:38<29:21, 141.72ex/s]preprocess train dataset:  11% 31589/281241 [07:38<30:15, 137.51ex/s]preprocess train dataset:  11% 31604/281241 [07:38<29:48, 139.55ex/s]preprocess train dataset:  11% 31619/281241 [07:38<29:34, 140.64ex/s]preprocess train dataset:  11% 31635/281241 [07:38<28:56, 143.71ex/s]preprocess train dataset:  11% 31651/281241 [07:39<28:17, 147.04ex/s]preprocess train dataset:  11% 31666/281241 [07:39<29:02, 143.20ex/s]preprocess train dataset:  11% 31681/281241 [07:39<28:41, 144.95ex/s]preprocess train dataset:  11% 31696/281241 [07:39<28:35, 145.50ex/s]preprocess train dataset:  11% 31711/281241 [07:39<29:19, 141.84ex/s]preprocess train dataset:  11% 31728/281241 [07:39<28:15, 147.20ex/s]preprocess train dataset:  11% 31743/281241 [07:39<28:49, 144.29ex/s]preprocess train dataset:  11% 31759/281241 [07:39<27:58, 148.64ex/s]preprocess train dataset:  11% 31774/281241 [07:39<28:33, 145.59ex/s]preprocess train dataset:  11% 31789/281241 [07:39<29:19, 141.78ex/s]preprocess train dataset:  11% 31804/281241 [07:40<29:17, 141.89ex/s]preprocess train dataset:  11% 31820/281241 [07:40<28:41, 144.84ex/s]preprocess train dataset:  11% 31835/281241 [07:40<28:43, 144.71ex/s]preprocess train dataset:  11% 31852/281241 [07:40<27:51, 149.20ex/s]preprocess train dataset:  11% 31868/281241 [07:40<27:51, 149.20ex/s]preprocess train dataset:  11% 31883/281241 [07:40<27:51, 149.15ex/s]preprocess train dataset:  11% 31900/281241 [07:40<27:03, 153.57ex/s]preprocess train dataset:  11% 31919/281241 [07:40<25:20, 163.92ex/s]preprocess train dataset:  11% 31936/281241 [07:40<25:38, 162.05ex/s]preprocess train dataset:  11% 31953/281241 [07:41<25:32, 162.65ex/s]preprocess train dataset:  11% 31970/281241 [07:41<25:55, 160.21ex/s]preprocess train dataset:  11% 31987/281241 [07:41<26:42, 155.52ex/s]preprocess train dataset:  11% 31999/281241 [07:44<1:00:15, 68.94ex/s]
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-5bcd522a0f1116c8.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-148286b6e8c7c55a.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-6afe8daa3edc3979.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-fb71416814467da1.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-c4d90e72e7945373.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-1441a1a362f45f74.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-86716240f0d5e9ce.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-567649d38b4eb4b9.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-a0253d3135dc5a4b.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-90f3995b6106b9f2.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-c1105482a786c706.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-2c5d0ae89484568c.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-e43260f16a4667dc.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-d1485c81a0cbb06c.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-a791cf68d9739c69.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-94bc2d5136fdbae7.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-61413d2b04061247.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-5b531145a5727e3e.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-eef5cb2925240576.arrow
+05/30/2022 18:00:06 - WARNING - datasets.arrow_dataset - Loading cached processed dataset at /home/sanchitgandhi/cache/huggingface/datasets/librispeech_asr/all/2.1.0/14c8bffddb861b4b3a4fcdff648a56980dbb808f3fc56f5a3d56b18ee88458eb/cache-dc7710d750f9cc97.arrow
+Feature extractor saved in ./preprocessor_config.json
+tokenizer config file saved in ./tokenizer_config.json
+Special tokens file saved in ./special_tokens_map.json
+Configuration saved in ./config.json
+loading feature extractor configuration file ./preprocessor_config.json
+loading configuration file ./config.json
+Model config SpeechEncoderDecoderConfig {
+  "_name_or_path": "./",
+  "architectures": [
+    "SpeechEncoderDecoderModel"
+  ],
+  "decoder": {
+    "_name_or_path": "",
+    "activation_dropout": 0.1,
+    "activation_function": "gelu",
+    "add_bias_logits": false,
+    "add_cross_attention": true,
+    "add_final_layer_norm": false,
+    "architectures": [
+      "BartModel"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 0,
+    "chunk_size_feed_forward": 0,
+    "classif_dropout": 0.1,
+    "classifier_dropout": 0.0,
+    "cross_attention_hidden_size": null,
+    "d_model": 1024,
+    "decoder_attention_heads": 16,
+    "decoder_ffn_dim": 4096,
+    "decoder_layerdrop": 0.0,
+    "decoder_layers": 12,
+    "decoder_start_token_id": 2,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "dropout": 0.1,
+    "early_stopping": true,
+    "encoder_attention_heads": 16,
+    "encoder_ffn_dim": 4096,
+    "encoder_layerdrop": 0.0,
+    "encoder_layers": 12,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "finetuning_task": null,
+    "forced_bos_token_id": 0,
+    "forced_eos_token_id": 2,
+    "fuse_matmuls": false,
+    "gradient_checkpointing": true,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1",
+      "2": "LABEL_2"
+    },
+    "init_std": 0.02,
+    "is_decoder": true,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1,
+      "LABEL_2": 2
+    },
+    "length_penalty": 1.0,
+    "max_length": 20,
+    "max_position_embeddings": 1024,
+    "min_length": 0,
+    "model_type": "bart",
+    "no_repeat_ngram_size": 3,
+    "normalize_before": false,
+    "num_beam_groups": 1,
+    "num_beams": 4,
+    "num_hidden_layers": 12,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 1,
+    "prefix": null,
+    "problem_type": null,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "scale_embedding": false,
+    "sep_token_id": null,
+    "task_specific_params": {
+      "summarization": {
+        "length_penalty": 1.0,
+        "max_length": 128,
+        "min_length": 12,
+        "num_beams": 4
+      },
+      "summarization_cnn": {
+        "length_penalty": 2.0,
+        "max_length": 142,
+        "min_length": 56,
+        "num_beams": 4
+      },
+      "summarization_xsum": {
+        "length_penalty": 1.0,
+        "max_length": 62,
+        "min_length": 11,
+        "num_beams": 6
+      }
+    },
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": "float32",
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_cache": true,
+    "use_scan": true,
+    "vocab_size": 50265
+  },
+  "decoder_start_token_id": 0,
+  "encoder": {
+    "_name_or_path": "",
+    "activation_dropout": 0.1,
+    "adapter_kernel_size": 3,
+    "adapter_stride": 2,
+    "add_adapter": true,
+    "add_cross_attention": false,
+    "apply_spec_augment": true,
+    "architectures": [
+      "Wav2Vec2ForPreTraining"
+    ],
+    "attention_dropout": 0.1,
+    "bad_words_ids": null,
+    "bos_token_id": 1,
+    "chunk_size_feed_forward": 0,
+    "classifier_proj_size": 256,
+    "codevector_dim": 768,
+    "contrastive_logits_temperature": 0.1,
+    "conv_bias": true,
+    "conv_dim": [
+      512,
+      512,
+      512,
+      512,
+      512,
+      512,
+      512
+    ],
+    "conv_kernel": [
+      10,
+      3,
+      3,
+      3,
+      3,
+      2,
+      2
+    ],
+    "conv_stride": [
+      5,
+      2,
+      2,
+      2,
+      2,
+      2,
+      2
+    ],
+    "cross_attention_hidden_size": null,
+    "ctc_loss_reduction": "sum",
+    "ctc_zero_infinity": false,
+    "decoder_start_token_id": null,
+    "diversity_loss_weight": 0.1,
+    "diversity_penalty": 0.0,
+    "do_sample": false,
+    "do_stable_layer_norm": true,
+    "early_stopping": false,
+    "encoder_no_repeat_ngram_size": 0,
+    "eos_token_id": 2,
+    "exponential_decay_length_penalty": null,
+    "feat_extract_activation": "gelu",
+    "feat_extract_dropout": 0.0,
+    "feat_extract_norm": "layer",
+    "feat_proj_dropout": 0.0,
+    "feat_quantizer_dropout": 0.0,
+    "final_dropout": 0.0,
+    "finetuning_task": null,
+    "forced_bos_token_id": null,
+    "forced_eos_token_id": null,
+    "fuse_matmuls": false,
+    "gradient_checkpointing": true,
+    "hidden_act": "gelu",
+    "hidden_dropout": 0.1,
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 1024,
+    "id2label": {
+      "0": "LABEL_0",
+      "1": "LABEL_1"
+    },
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "is_decoder": false,
+    "is_encoder_decoder": false,
+    "label2id": {
+      "LABEL_0": 0,
+      "LABEL_1": 1
+    },
+    "layer_norm_eps": 1e-05,
+    "layerdrop": 0.0,
+    "length_penalty": 1.0,
+    "mask_feature_length": 10,
+    "mask_feature_min_masks": 0,
+    "mask_feature_prob": 0.0,
+    "mask_time_length": 10,
+    "mask_time_min_masks": 2,
+    "mask_time_prob": 0.1,
+    "max_length": 20,
+    "min_length": 0,
+    "model_type": "wav2vec2",
+    "no_repeat_ngram_size": 0,
+    "num_adapter_layers": 3,
+    "num_attention_heads": 16,
+    "num_beam_groups": 1,
+    "num_beams": 1,
+    "num_codevector_groups": 2,
+    "num_codevectors_per_group": 320,
+    "num_conv_pos_embedding_groups": 16,
+    "num_conv_pos_embeddings": 128,
+    "num_feat_extract_layers": 7,
+    "num_hidden_layers": 24,
+    "num_negatives": 100,
+    "num_return_sequences": 1,
+    "output_attentions": false,
+    "output_hidden_size": 1024,
+    "output_hidden_states": false,
+    "output_scores": false,
+    "pad_token_id": 0,
+    "prefix": null,
+    "problem_type": null,
+    "proj_codevector_dim": 768,
+    "pruned_heads": {},
+    "remove_invalid_values": false,
+    "repetition_penalty": 1.0,
+    "return_dict": true,
+    "return_dict_in_generate": false,
+    "sep_token_id": null,
+    "task_specific_params": null,
+    "tdnn_dilation": [
+      1,
+      2,
+      3,
+      1,
+      1
+    ],
+    "tdnn_dim": [
+      512,
+      512,
+      512,
+      512,
+      1500
+    ],
+    "tdnn_kernel": [
+      5,
+      3,
+      3,
+      1,
+      1
+    ],
+    "temperature": 1.0,
+    "tie_encoder_decoder": false,
+    "tie_word_embeddings": true,
+    "tokenizer_class": null,
+    "top_k": 50,
+    "top_p": 1.0,
+    "torch_dtype": null,
+    "torchscript": false,
+    "transformers_version": "4.18.0.dev0",
+    "typical_p": 1.0,
+    "use_bfloat16": false,
+    "use_scan": true,
+    "use_weighted_layer_sum": false,
+    "vocab_size": 32,
+    "xvector_output_dim": 512
+  },
+  "eos_token_id": 2,
+  "is_encoder_decoder": true,
+  "max_length": 40,
+  "model_type": "speech-encoder-decoder",
+  "pad_token_id": 1,
+  "processor_class": "Wav2Vec2Processor",
+  "tie_word_embeddings": false,
+  "transformers_version": null,
+  "use_cache": false
+}
+
+loading feature extractor configuration file ./preprocessor_config.json
+Feature extractor Wav2Vec2FeatureExtractor {
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}
+
+Didn't find file ./added_tokens.json. We won't load it.
+loading file ./vocab.json
+loading file ./merges.txt
+loading file ./tokenizer.json
+loading file None
+loading file ./special_tokens_map.json
+loading file ./tokenizer_config.json
+05/30/2022 18:00:07 - WARNING - __main__ - Unable to display metrics through TensorBoard because the package is not installed: Please run `pip install tensorboard` to enable.
+/home/sanchitgandhi/flax-wav2vec2-2-bart-large-ls-960h-feature-encoder/./ is already a clone of https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-ls-960h-feature-encoder. Make sure you pull the latest changes with `repo.git_pull()`.
+05/30/2022 18:00:11 - WARNING - huggingface_hub.repository - /home/sanchitgandhi/flax-wav2vec2-2-bart-large-ls-960h-feature-encoder/./ is already a clone of https://huggingface.co/sanchit-gandhi/flax-wav2vec2-2-bart-large-ls-960h-feature-encoder. Make sure you pull the latest changes with `repo.git_pull()`.
+05/30/2022 18:00:14 - INFO - __main__ - ***** Running training *****
+05/30/2022 18:00:14 - INFO - __main__ -   Num examples = 281186
+05/30/2022 18:00:14 - INFO - __main__ -   Num Epochs = 12
+05/30/2022 18:00:14 - INFO - __main__ -   Instantaneous batch size per device = 4
+05/30/2022 18:00:14 - INFO - __main__ -   Num gradient accumulation steps = 2
+05/30/2022 18:00:14 - INFO - __main__ -   Total train batch size (w. parallel & distributed) = 64
+05/30/2022 18:00:14 - INFO - __main__ -   Total optimization steps = 50000
+05/30/2022 18:00:14 - INFO - __main__ -   Gradient checkpointing: True
+05/30/2022 18:00:14 - INFO - __main__ -   Use scan: True
+05/30/2022 18:00:14 - INFO - __main__ -   Fuse matmuls: False
+Epoch ... (1/12):   0% 0/12 [00:00<?, ?it/s]
+Training...:   0% 0/4393 [00:00<?, ?it/s][ATraining...:   0% 0/4393 [00:07<?, ?it/s]
+Epoch ... (1/12):   0% 0/12 [00:15<?, ?it/s]
 Traceback (most recent call last):
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 2358, in _map_single
-    writer.write(example)
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 456, in write
-    self.write_examples_on_file()
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 414, in write_examples_on_file
-    self.write_batch(batch_examples=batch_examples)
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 511, in write_batch
-    self.write_table(pa_table, writer_batch_size)
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 528, in write_table
-    self.pa_writer.write_batch(batch)
-  File "pyarrow/ipc.pxi", line 429, in pyarrow.lib._CRecordBatchWriter.write_batch
-  File "pyarrow/error.pxi", line 112, in pyarrow.lib.check_status
-OSError: [Errno 28] Error writing bytes to file. Detail: [errno 28] No space left on device
+  File "run_flax_speech_recognition_seq2seq.py", line 1507, in <module>
+    main()
+  File "run_flax_speech_recognition_seq2seq.py", line 1400, in main
+    state, train_metric = p_train_step(state, batch)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/traceback_util.py", line 162, in reraise_with_filtered_traceback
+    return fun(*args, **kwargs)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/api.py", line 2013, in cache_miss
+    out_tree, out_flat = f_pmapped_(*args, **kwargs)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/api.py", line 1889, in pmap_f
+    out = pxla.xla_pmap(
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/core.py", line 1863, in bind
+    return map_bind(self, fun, *args, **params)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/core.py", line 1895, in map_bind
+    outs = primitive.process(top_trace, fun, tracers, params)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/core.py", line 1866, in process
+    return trace.process_map(self, fun, tracers, params)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/core.py", line 660, in process_call
+    return primitive.impl(f, *tracers, **params)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/interpreters/pxla.py", line 801, in xla_pmap_impl
+    compiled_fun, fingerprint = parallel_callable(
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/linear_util.py", line 285, in memoized_fun
+    ans = call(fun, *args)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/interpreters/pxla.py", line 829, in parallel_callable
+    pmap_computation = lower_parallel_callable(
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/profiler.py", line 206, in wrapper
+    return func(*args, **kwargs)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/interpreters/pxla.py", line 1002, in lower_parallel_callable
+    jaxpr, consts, replicas, parts, shards = stage_parallel_callable(
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/interpreters/pxla.py", line 909, in stage_parallel_callable
+    jaxpr, out_sharded_avals, consts = pe.trace_to_jaxpr_final(
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/_src/profiler.py", line 206, in wrapper
+    return func(*args, **kwargs)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/interpreters/partial_eval.py", line 1844, in trace_to_jaxpr_final
+    jaxpr, out_avals, consts = trace_to_subjaxpr_dynamic(
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/interpreters/partial_eval.py", line 1816, in trace_to_subjaxpr_dynamic
+    ans = fun.call_wrapped(*in_tracers_)
+  File "/home/sanchitgandhi/hf/lib/python3.8/site-packages/jax/linear_util.py", line 168, in call_wrapped
+    ans = self.f(*args, **dict(self.params, **kwargs))
+  File "run_flax_speech_recognition_seq2seq.py", line 1174, in train_step
+    if gradient_accumulation_steps == 1 or training_args.multisteps:
+jax._src.traceback_util.UnfilteredStackTrace: AttributeError: 'FlaxSeq2SeqTrainingArguments' object has no attribute 'multisteps'
+
+The stack trace below excludes JAX-internal frames.
+The preceding is the original exception that occurred, unmodified.
+
+--------------------
 
-During handling of the above exception, another exception occurred:
+The above exception was the direct cause of the following exception:
 
 Traceback (most recent call last):
   File "run_flax_speech_recognition_seq2seq.py", line 1507, in <module>
     main()
-  File "run_flax_speech_recognition_seq2seq.py", line 949, in main
-    vectorized_datasets = raw_datasets.map(
-  File "/home/sanchitgandhi/datasets/src/datasets/dataset_dict.py", line 443, in map
-    {
-  File "/home/sanchitgandhi/datasets/src/datasets/dataset_dict.py", line 444, in <dictcomp>
-    k: dataset.map(
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 1980, in map
-    return self._map_single(
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 521, in wrapper
-    out: Union["Dataset", "DatasetDict"] = func(self, *args, **kwargs)
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 488, in wrapper
-    out: Union["Dataset", "DatasetDict"] = func(self, *args, **kwargs)
-  File "/home/sanchitgandhi/datasets/src/datasets/fingerprint.py", line 458, in wrapper
-    out = func(self, *args, **kwargs)
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_dataset.py", line 2392, in _map_single
-    writer.finalize()
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 537, in finalize
-    self.write_examples_on_file()
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 414, in write_examples_on_file
-    self.write_batch(batch_examples=batch_examples)
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 511, in write_batch
-    self.write_table(pa_table, writer_batch_size)
-  File "/home/sanchitgandhi/datasets/src/datasets/arrow_writer.py", line 528, in write_table
-    self.pa_writer.write_batch(batch)
-  File "pyarrow/ipc.pxi", line 429, in pyarrow.lib._CRecordBatchWriter.write_batch
-  File "pyarrow/error.pxi", line 112, in pyarrow.lib.check_status
-OSError: [Errno 28] Error writing bytes to file. Detail: [errno 28] No space left on device
+  File "run_flax_speech_recognition_seq2seq.py", line 1400, in main
+    state, train_metric = p_train_step(state, batch)
+  File "run_flax_speech_recognition_seq2seq.py", line 1174, in train_step
+    if gradient_accumulation_steps == 1 or training_args.multisteps:
+AttributeError: 'FlaxSeq2SeqTrainingArguments' object has no attribute 'multisteps'
 wandb: Waiting for W&B process to finish... (failed 1). Press Control-C to abort syncing.
-wandb: - 0.002 MB of 0.002 MB uploaded (0.000 MB deduped)wandb: \ 0.002 MB of 0.002 MB uploaded (0.000 MB deduped)wandb: | 0.002 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: / 0.002 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: - 0.018 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: \ 0.018 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: | 0.021 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: / 0.021 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: - 0.021 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: \ 0.021 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: | 0.021 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: / 0.021 MB of 0.021 MB uploaded (0.000 MB deduped)wandb: - 0.021 MB of 0.021 MB uploaded (0.000 MB deduped)wandb:                                                                                
-wandb: Synced flax-wav2vec2-2-bart-large-ls-960h-feature-encoder: https://wandb.ai/sanchit-gandhi/librispeech_960h/runs/2k01y1ky
+wandb: - 0.002 MB of 0.002 MB uploaded (0.000 MB deduped)wandb: \ 0.002 MB of 0.002 MB uploaded (0.000 MB deduped)wandb: | 0.002 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: / 0.002 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: - 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: \ 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: | 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: / 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: - 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: \ 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: | 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb: / 0.034 MB of 0.034 MB uploaded (0.000 MB deduped)wandb:                                                                                
+wandb: Synced flax-wav2vec2-2-bart-large-ls-960h-feature-encoder: https://wandb.ai/sanchit-gandhi/librispeech_960h/runs/2nzi0chc
 wandb: Synced 5 W&B file(s), 0 media file(s), 0 artifact file(s) and 0 other file(s)
-wandb: Find logs at: ./wandb/run-20220530_120145-2k01y1ky/logs
+wandb: Find logs at: ./wandb/run-20220530_175928-2nzi0chc/logs